Master II livello
DATA SCIENCE

Metodologie, analisi, progettazione, soluzioni

Edizione A.A. 2023/2024



Il Master è attivato congiuntamente dal Dipartimento di Informatica dell'Università degli Studi di Bari Aldo Moro e dal Dipartimento di Ingegneria Elettrica e dell'Informazione del Politecnico di Bari al fine di mettere a disposizione il massimo dell’eccellenza formativa dei due Atenei. È proposto un percorso formativo finalizzato alla formazione del Data Scientist. Tale figura professionale costituisce il trait d'union tra l’analista e l’esperto di statistica; è fornita una preparazione trasversale ed integrata di natura economica, giuridica e organizzazione aziendale oltre che di natura informatica. Al termine dei corsi, a fronte del superamento di un esame finale, è rilasciato il titolo di Master Universitario di II livello.






Durata
60 CFU
12 Mesi

Tipologia
Executive


Inizio
Gen/Feb
2024

Stage
aziendale
300 ore



       News


Presentazione

La figura del Data Scientist si rivela sempre più decisiva per lo sviluppo di azioni competitive da parte delle imprese nei mercati globali. Costituisce una delle figure più ricercate nel mercato del lavoro, essendo trasversale a manager, analisti, informatici, e, più in generale, a quelle figure che possiedono un importante know how aziendale. La professionalità del Data Scientist coniuga competenze multidisciplinari in grado di gestire grandi quantità di dati, estrarre conoscenza e presentarla in forma organizzata, leggibile ed efficace, applicando policy etiche e legali a stato dell’arte, garantendo un efficace sistema di supporto alle decisioni. La sfida nella formazione del Data Scientist consiste nel fornire una conoscenza integrata di discipline e competenze diversificate: statistica, data mining, machine learning, analisi dei dati e loro visualizzazione, gestione di dati non strutturati, compresi gli effetti di natura legale che il loro utilizzo comporta. Al termine della formazione, il Data Scientist, essendo il raccordo tra diverse funzioni aziendali, rappresenterà quindi una figura manageriale che avrà conoscenza delle dinamiche dell’impresa e ne potrà quindi indicare e favorire la crescita.

Le opinioni dei nostri studenti

Obiettivi del master

Valorizzazione del dato grezzo

Studio di tecniche, strumenti e soluzioni innovativi per la gestione e la valorizzazione di dati di nuova generazione. Utilizzo di tecniche di machine learning per predire e classificare nuovi dati osservati

Apprendimento di nuovi paradigmi per l'analisi dei big data

Studio di tecniche e strumenti per l'elaborazione di grandi quantità di dati, sia di tipo strutturato che di tipo non strutturato

Adeguata comunicazione dell'informazione

Studio di tecniche di data extraction e visualization per l'interpretazione e valorizzazione del dato, in accordo a politiche etiche e legali opportune

Realizzazione di servizi di Social Data Science

Studio di tecniche innovative per la realizzazione di servizi avanzati di analisi dei social media, opinion mining e sentiment analysis e natural language processing

Didattica e corsi

Il master prevede 1500 ore complessive di apprendimento in 12 mesi di studio
Non sono richieste specifiche o approfondite competenze di settore.

Esamina il contenuto dei corsi




A1 - Elementi di informatica per la data science


Ha la funzione di fornire il background di base ai partecipanti, necessario alla fruizione dei moduli del corso:
  • Pensiero computazionale
  • Stutture dati e algoritmi
  • Laboratorio di programmazione in Python


A2 - Data, Big Data e Open Data


"Big data" e "data science" possono essere alcune delle parole d'ordine più importanti di questo decennio, ma non sono necessariamente concetti nuovi. L'idea di data science abbraccia molti campi diversi, e si è lentamente fatta strada nel mainstream per oltre cinquant'anni. In questo modulo si svolgerà una overview sulla figura del data scientist con maggiore attenzione a:
  • Definizione di dato
  • Ciclo di vita del dato
  • Big Data
  • Open Data
  • Dati Geografici
  • Sistemi GIS


A3 - Data Management e Business Intelligence


La Business Intelligence è l’insieme dei processi, delle tecniche e degli strumenti basati sulla tecnologia dell’informazione e che supportano i processi decisionali di carattere economico. Ha l'obiettivo di avere sufficienti informazioni e conoscenze in modo tempestivo e fruibile cosicché da poter avere un impatto positivo sulle strategie, le tattiche e le operazioni aziendali:
  • DBMS e modello relazionale
  • SQL – ETL
  • Data Warehouse e Business Intelligence
  • Architetture distribuite
  • Analisi OLAP
  • Paradigma MapReduce
  • Database NoSQL
  • Esercitazioni su database NoSQL


A4 - Analisi Statistica dei Dati


A partire dal XXI° secolo, si assiste ad un evidente cambio di paradigma: la nascita delle tecniche di Data Science (e più in generale tutto il corpus teorico della disciplina nota come Machine Learning) si interseca in modo indivisibile con lo sviluppo teorico della Statistica. Il modulo coprirà i concetti di:
  • Variabili e correlazioni
  • Campioni e popolazioni
  • Intervalli di confidenza e test delle ipotesi
  • Test statistici parametrici e non parametrici
  • Regressione
  • Uso di tool e linguaggi per l'analisi statistica (R)


A5 - Data visualization e Visual Analytics


    Nel contesto della Business Intelligence (BI), la visualizzazione dei dati viene applicata in due modi. In primo luogo, la visualizzazione dei dati è una disciplina che copre una teoria completa di come rappresentare visivamente i dati. I concetti e i sistemi possono essere applicati nella progettazione di interfacce visive per la comunicazione delle informazioni. In secondo luogo, i concetti e le linee guida per la visualizzazione dei dati sono realizzati attraverso le funzionalità del software di BI, il che rende facile l'applicazione dei concetti:
  • Rappresentazioni Grafiche
  • Analisi Grafica Univariata, Bivariata e Multivaria
  • Strumenti per la Rappresentazione Grafica dei Dati
  • Uso di Strumenti di Visual Analytics (Tableau/R/Qlik Sense)


A6 - Machine Learning e Data Mining


L'apprendimento automatico è un'applicazione di Intelligenza Artificiale (AI) che fornisce ai sistemi la capacità di apprendere e migliorare automaticamente dall'esperienza senza essere esplicitamente programmato. L'apprendimento automatico si concentra sullo sviluppo di programmi per computer che possono accedere ai dati e utilizzarlo per se stessi. Il processo di apprendimento inizia con osservazioni o dati, come esempi, esperienze dirette o istruzioni, per cercare modelli nei dati e prendere decisioni migliori in futuro sulla base degli esempi che forniamo. L'obiettivo principale è quello di permettere ai computer di apprendere automaticamente senza l'intervento umano o l'assistenza e di adattare le azioni di conseguenza.
  • Approcci Supervisionati e Non Supervisionati
  • Classificazione
  • Regressione
  • Clustering
  • Analisi Serie Temporali
  • Riduzione della dimensionalità
  • Valutazione delle Performance
  • Esercitazioni (Scikit-Learn)
  • Deep Learning
  • CNN, RNN, Autoencoder, Reinforcement Learning
  • Keras, Tensorflow, PyTorch


A7 - Text Analytics, Search e Personalization


La Text Analytics, nota anche come text mining, è il processo di esaminare ampie raccolte di risorse testuali per generare nuove informazioni e trasformare il testo non strutturato in dati strutturati da utilizzare per ulteriori analisi. Il Text mining identifica fatti, relazioni e affermazioni che altrimenti rimarrebbero sepolti nella massa di grandi dati testuali. Questi fatti vengono estratti e trasformati in dati strutturati, per l'analisi, la visualizzazione (ad es. tramite tabelle html, mappe mentali, grafici), l'integrazione con dati strutturati in database o magazzini, e un ulteriore affinamento tramite sistemi di machine learning (ML):
  • Natural Language Processing
  • Elementi di Linguistica Computazionale
  • Modelli di Ritrovamento delle Informazioni
  • Question Answering
  • Information Filtering e Recommender Systems
  • Esercitazioni con Lucene/Elastic search
  • Esercitazioni con tool per la Definizione di Recommender Systems
  • Semantica distribuzionale
  • Agenti conversazionali


A8 - Proprietà e tutela del dato


Il regolamento generale dell'UE sulla protezione dei dati (GDPR) sostituisce la direttiva 95/46/CE sulla protezione dei dati ed è stato concepito per: armonizzare le leggi sulla privacy in tutta Europa, proteggere e responsabilizzare tutti i cittadini dell'UE in materia di riservatezza dei dati, ridisegnare il modo in cui le organizzazioni di tutta la regione si avvicinano alla riservatezza dei dati. GDPR rimodella il modo in cui i settori gestiscono i dati e ridefinisce i ruoli dei leader chiave nelle aziende, dai CIO ai CMO. I CIO devono assicurarsi di avere processi di gestione del consenso a tenuta stagna, mentre i CMO richiedono sistemi di gestione dei diritti di dati efficaci per garantire che non perdano il loro bene più prezioso: i dati:
  • Diritto d’autore
  • Licensing e Tutela Giuridica
  • Marchi e Brevetti
  • General Data Protection Regulation (GDPR)


A9 - Practing Data Science


I dati sociali generati digitalmente (ad esempio, dai social media, dalle piattaforme di comunicazione, dai dispositivi dell'Internet degli oggetti, dai sensori/indumenti e dai telefoni cellulari) offrono la possibilità di accumulare nuovi dati su larga scala, oltre ai dati esistenti che sono stati convertiti in formati digitali. Questi dati possono essere utilizzati per aiutarci a comprendere i grandi temi di interesse cruciale per le scienze sociali, l'industria e i responsabili politici, tra cui il comportamento sociale, economico e politico, le relazioni interpersonali, la progettazione del mercato, la formazione di gruppi, l'identità, il movimento internazionale, l'etica e i modi responsabili per accrescere il valore sociale dei dati e molti altri argomenti:
  • Opinion Mining
  • Sentiment Analysis
  • Social Network Analysis
  • Architetture distribuite per Data Science
  • Machine Learning e Deep Learning per la Social Data Science
  • Applicazioni per la Bioinformatica
  • Natural Language Processing
  • Analisi serie temporali
  • Regole di associazione
  • Semantic Web e Knowledge Graphs


A10 - Data Science nel contesto aziendale


I dati non sono mai stati così importanti come oggi. Si parla sempre di come sia al centro di ciò che rende preziosa un'azienda. Un'organizzazione tipica pone costantemente domande. "Come si fa a crescere? La risposta a tutte queste domande e più è sempre nei dati, più si può correlare, più si può analizzare e più si sfruttano questi numeri, più successo si avrà nel proprio business, soprattutto se si è un'azienda online (ad esempio, la vendita al dettaglio online):
  • Business Intelligence nel contesto aziendale
  • Trend e contesto di mercato sul mondo dei dati


STAGE, SEMINARI, PROVA FINALE


  • Stage di 300 ore in una delle nostre aziende partner
  • Seminari integrativi riguardanti le ultime novità sulla gestione dei dati direttamente dal mondo della ricerca
  • Prova finale con presentazione dell'elaborato finale e titolo accademico


Iscrizione e Costi

Requisiti

Possesso di una LAUREA di II livello (magistrale) o vecchio ordinamento conseguita entro la data di scadenza delle immatricolazioni. L’ammissione al master è subordinata all’esito positivo di una FASE DI SELEZIONE

FORMAT

Si prevede la didattica mista frontale. Le lezioni si svolgeranno presso il Dipartimento di Informatica dell'Università degli Studi di Bari.

Formula weekend
VENERDI' POMERIGGIO
SABATO INTERA GIORNATA
Inizio Corsi Gennaio/ Febbraio 2024

Lingua ITALIANO
Durata 60 CFU - 12 mesi

Costo e Agevolazioni

5.000 ,00 (IVA esente)

  • Possibilità di iscrizione alla frequenza di singoli moduli

  • * Tutti i dettagli riguardanti le AGEVOLAZIONI sono disponibili al seguente LINK

  • Scarica Brochure


  • Comitato tecnico scientifico


    Pierpaolo BASILE

    Coordinatore del Master
    Professore Associato
    Università degli Studi di Bari

    Donato MALERBA


    Professore Ordinario
    Università degli Studi di Bari

    Giovanni SEMERARO


    Professore Ordinario
    Università degli Studi di Bari

    Eugenio DI SCIASCIO


    Professore Ordinario
    Politecnico di Bari

    Tommaso DI NOIA


    Professore Ordinario
    Politecnico di Bari

    Marco de GEMMIS


    Professore Associato
    Università degli Studi di Bari

    Fedelucio NARDUCCI


    Professore Associato
    Politecnico di Bari

    Cataldo MUSTO


    Ricercatore Tempo Determinato - B
    Università degli Studi di Bari

    Francesco MORETTI

    Deputy CEO e CEO International Region
    Fincons Group

    Docenti


    Annalisa Appice

    Professore Associato
    Università di Bari

    Pierpaolo Basile

    Professore Associato
    Università di Bari

    Michelangelo Ceci

    Professore Associato
    Università di Bari

    Marco de Gemmis

    Professore Associato
    Università di Bari

    Pasquale
    Lops

    Professore Ordinario
    Università di Bari

    Cataldo
    Musto

    Ricercatore
    Università di Bari

    Giovanni Semeraro

    Professore Ordinario
    Università di Bari

    Massimo Bilancia

    Professore Associato
    Università di Bari

    Antonio Rizzelli

    Co-founder and R&D
    at Ethica System srl

    Vincenzo Patruno

    Project and Data Manager at ISTAT

    Morena Ragone

    Esperto giuridico
    Regione Puglia

    Tommaso Di Noia

    Professore Ordinario
    Politecnico di Bari

    In fase di definizione






    Ulteriori Contatti


    Contattaci per e-mail, scrivendo a:

    data.science.uniba@gmail.com

    Università degli Studi di Bari
    Dipartimento di Informatica

    Campus Universitario E. Quagliariello,
    Via E. Orabona 4, 70126 - Bari

    Politecnico di Bari
    Dipartimento di Ingegneria Elettrica e dell'Informazione

    Campus Universitario E. Quagliariello,
    Via E. Orabona 4, 70126 - Bari