Usi di un datawarehouse Ad esempio si può rispondere a domande quali: • Quali prodotti sono più diffusi tra le ragazze con età compresa tra 15-20 anni? • Quali sono i costi e i tempi impiegati per paziente nei laboratori della nostra azienda? • Quanti progetti rimangono bloccati nella fase contrattuale per più di 100 giorni? • Quali categorie di clienti hanno deciso di cambiare il contratto aderendo alla promozione? Strumenti di datawarehouse (OLAP) • OLAP, acronimo di On Line Analytical Processing, è un insieme di tecniche software per analizzare velocemente grandi quantità di dati, anche in modo complesso. • Il dw supporta molteplici formati di output che consentono in modo semplice e veloce di esaminare le informazioni e navigare sui dati a qualsiasi livello. Consente di generare report su diverse variabili e di confrontare gli indicatori (KPI) in diversi intervalli temporali secondo diversi livelli di approfondimento. Limiti del datawarehouse • Ha una natura temporale: Il datawarehouse rappresenta una istantanea ripetuta ad intervalli di tempo predeterminati. • Anche le specifiche di analisi devono essere predeterminate e ovviamente elaborate in precedenza • Non è real-time: non lavora sui dati operazionali • per il datawarehouse non sarebbe utile determinare le relazioni nascoste tra i dati, predire gli eventi futuri, marcare i dati errati e analizzare i dati in secondo specifiche non prevedibili a priori? Strumenti per il datawarehouse: DataMining • data mining (letteralmente: estrazione da una miniera di dati) è l'estrazione di informazione utile, eseguita in modo automatico o semiautomatico, da grandi quantità di dati • Tecnica che utilizza il datawarehouse come sorgente di informazioni per determinare i rapporti, predire gli eventi futuri, marcare i dati non corretti e analizzare i dati seguendo direzioni non prevedibili a priori Scopo del datamining • E’ possibile rispondere a domande quali: – – – – Cosa compreranno i clienti? Quali prodotti vendere insieme? Quali clienti sono a rischio di incidente? Come è possibile valutare i risultati di una campagna di marketing? – Come analizzare i dati non strutturati, quale il testo della libero? Considerazioni sul datamining • Oltre a fare previsioni sul futuro elaborando le informazioni del dw, il data mining consente di identificare relazioni nascoste tra i dati, calcolare le probabilità che certi prodotti vengano venduti, valutare le probabilità di perdita di clienti sulla base di offerte più vantaggiose da parte della concorrenza. Casi • Caso enel gas • Caso Wind • Caso BancaMarche Modulo 1 • • • • • I Sistemi informativi aziendali OLTP OLAP Sistemi di gestione della conoscenza Evoluzione vs. il datawarehouse I Sistemi informativi aziendali • Il sistema informativo aziendale raccoglie, organizza, elabora, gestisce ed utilizza tutta l’informazione necessaria per la conduzione dell’azienda. Tale informazione può: – nascere direttamente all’interno dell’azienda durante lo svolgimento dei vari processi aziendali. – essere acquisita come risultato delle relazioni con soggetti esterni. Similmente tale informazione può: – – • essere destinata al “consumo” interno. essere destinata a terzi. Il Sistema Informativo Aziendale si compone: – di una parte informatizzata chiamato Sistema Informatico Aziendale – una parte non automatizzata come le conversazioni frontali e telefoniche, i documenti cartacei strutturati e non strutturati, l’organigramma aziendale, la prassi operativa, la prassi decisionale ecc. Il Sistema Informativo Aziendale • Le componenti (sia informatizzate che non) di un Sistema Informativo Aziendale possono essere divise in due categorie a seconda della loro finalità. • Componenti per il supporto dell’attività operazionale. – Tale parte del sistema informativo si occupa di archiviare, gestire elaborare tutta l’informazione per lo svolgimento dell’attività quotidiana. Ad es. supporto informativo per le operazioni di acquisto, per le vendite, per la movimentazione del magazzino ecc. • • Componenti per il supporto decisionale. – Tale parte del sistemai informativo riguarda la gestione, la produzione e l’archiviazione per supportare i dirigenti nelle scelte strategiche. Ad es. supporto perla scelta di quali prodotti mettere in promozione, quali prodotti, aggiungere o rimuovere dal listino, a quale target rivolgere i messaggi pubblicitari ecc. Il Sistema Informatico Aziendale • E’ costituito dall’insieme di strumenti HW/SW che permettono di gestire in maniera automatizzata l’informazione aziendale. • Poiché le componenti del Sistema Informatico Aziendale sono un sottoinsieme del Sistema Informativo Aziendale non faremo distinzione tra i due. Anche esse divise nelle due categorie citate. • Applicazionali Transazionali: Sono i sistemi e le procedure informatiche di supporto all’attività operazionale quotidiana. Le applicazioni che rientrano in questa categoria sono i Sistemi Legacy e gli Enterprise Resource Planner (ERP). • Decision Support System (DSS): Sono i sistemi e le procedure informatiche di supporto alle scelte strategiche dei dirigenti. In questa categoria rientrano le applicazioni di reportistica statica, le applicazionidi DataWareHousing (o meglio le applicazioni OnLine Analitic Processing: OLAP) e le applicazioni di DataMining. Le parti del Sistema Informativo Aziendale Due Famiglie di Strumenti di Gestione dei Dati • Data Base per l’elaborazione delle transazioni – On Line Transactional Processing (OLTP) – Sistemi Transazionali o Operazionali( L’insieme delle applicazioni che supportano in tempo reale le attività giornaliere inerenti il business dell’azienda) • Data Base per il Supporto alle Decisioni – On Line Analytical Processing (OLAP) – Sistemi di Analisi dei Dati (Sono strumenti strategici in grado di incrementare la conoscenza aziendale, supportano i manager nelle decisioni) Gestione intelligente delle informazioni • I dati: sono grezzi e disadorni. Sono per esempio un singolo record in un database transazionale. • L’ informazione: è un dato accompagnato, in una certa misura, da un contesto e da un significato economico; le informazioni sono dati filtrati, sintetizzati, aggregati, esprimono dei concetti. • Sopra l’informazione, se l’organizzazione è in grado di gestirsi, si costruisce la“conoscenza”, un’attitudine che è il risultato di una gestione razionale e continuativa delle interazioni tra: – informazioni, azioni passate, esperienza, comprensione. La piramide della conoscenza Query standard, query ad hoc e reportistica • • • • • Il modo più semplice per fare analisi è poter disporre di query (interrogazioni) già preconfezionate ed eventualmente parametrizzabili. (Es. visualizza tutti i clienti che l’anno scorso hanno acquistato il prodotto X) In alternativa è possibile costruire query specifiche al presentarsi di situazioni particolari. Richiedono continue riprogettazioni che l’utente spesso non è in grado di fare. Per costruire una query occorre prima formulare un’ipotesi di ciò che voglio ricercare. Il ruolo dell’utente è principalmente passivo. La reportistica ha forma nota e aggiorna i valori alla richiesta dell’utente (vendite del mese per categorie di prodotto): in genere la presentazione o la parte cosmetica del report è in forma tabellare o grafica.