Usi di un datawarehouse
Ad esempio si può rispondere a domande quali:
• Quali prodotti sono più diffusi tra le ragazze con
età compresa tra 15-20 anni?
• Quali sono i costi e i tempi impiegati per paziente
nei laboratori della nostra azienda?
• Quanti progetti rimangono bloccati nella fase
contrattuale per più di 100 giorni?
• Quali categorie di clienti hanno deciso di cambiare
il contratto aderendo alla promozione?
Strumenti di datawarehouse
(OLAP)
• OLAP, acronimo di On Line Analytical
Processing, è un insieme di tecniche software per
analizzare velocemente grandi quantità di dati,
anche in modo complesso.
• Il dw supporta molteplici formati di output che
consentono in modo semplice e veloce di
esaminare le informazioni e navigare sui dati a
qualsiasi livello. Consente di generare report su
diverse variabili e di confrontare gli indicatori
(KPI) in diversi intervalli temporali secondo
diversi livelli di approfondimento.
Limiti del datawarehouse
• Ha una natura temporale: Il datawarehouse
rappresenta una istantanea ripetuta ad
intervalli di tempo predeterminati.
• Anche le specifiche di analisi devono essere
predeterminate e ovviamente elaborate in
precedenza
• Non è real-time: non lavora sui dati
operazionali
• per il datawarehouse non sarebbe utile
determinare le relazioni nascoste tra i
dati, predire gli eventi futuri, marcare i
dati errati e analizzare i dati in secondo
specifiche non prevedibili a priori?
Strumenti per il datawarehouse:
DataMining
• data mining (letteralmente: estrazione da una
miniera di dati) è l'estrazione di informazione
utile, eseguita in modo automatico o
semiautomatico, da grandi quantità di dati
• Tecnica che utilizza il datawarehouse come
sorgente di informazioni per determinare i
rapporti, predire gli eventi futuri, marcare i
dati non corretti e analizzare i dati seguendo
direzioni non prevedibili a priori
Scopo del datamining
• E’ possibile rispondere a domande quali:
–
–
–
–
Cosa compreranno i clienti?
Quali prodotti vendere insieme?
Quali clienti sono a rischio di incidente?
Come è possibile valutare i risultati di una
campagna di marketing?
– Come analizzare i dati non strutturati, quale il
testo della libero?
Considerazioni sul datamining
• Oltre a fare previsioni sul futuro elaborando
le informazioni del dw, il data mining
consente di identificare relazioni nascoste
tra i dati, calcolare le probabilità che certi
prodotti vengano venduti, valutare le
probabilità di perdita di clienti sulla base di
offerte più vantaggiose da parte della
concorrenza.
Casi
• Caso enel gas
• Caso Wind
• Caso BancaMarche
Modulo 1
•
•
•
•
•
I Sistemi informativi aziendali
OLTP
OLAP
Sistemi di gestione della conoscenza
Evoluzione vs. il datawarehouse
I Sistemi informativi aziendali
•
Il sistema informativo aziendale raccoglie, organizza, elabora, gestisce
ed utilizza tutta l’informazione necessaria per la conduzione
dell’azienda.
Tale informazione può:
–
nascere direttamente all’interno dell’azienda durante lo svolgimento dei vari
processi aziendali.
– essere acquisita come risultato delle relazioni con soggetti esterni.
Similmente tale informazione può:
–
–
•
essere destinata al “consumo” interno.
essere destinata a terzi.
Il Sistema Informativo Aziendale si compone:
– di una parte informatizzata chiamato Sistema Informatico Aziendale
– una parte non automatizzata come le conversazioni frontali e telefoniche, i
documenti cartacei strutturati e non strutturati, l’organigramma aziendale, la
prassi operativa, la prassi decisionale ecc.
Il Sistema Informativo
Aziendale
• Le componenti (sia informatizzate che non) di un Sistema
Informativo
Aziendale possono essere divise in due categorie a seconda della
loro finalità.
• Componenti per il supporto dell’attività operazionale.
– Tale parte del sistema informativo si occupa di archiviare, gestire
elaborare tutta l’informazione per lo svolgimento dell’attività
quotidiana. Ad es. supporto informativo per le operazioni di
acquisto, per le vendite, per la movimentazione del magazzino ecc.
• • Componenti per il supporto decisionale.
– Tale parte del sistemai informativo riguarda la gestione, la
produzione e l’archiviazione per supportare i dirigenti nelle scelte
strategiche. Ad es. supporto perla scelta di quali prodotti mettere in
promozione, quali prodotti, aggiungere o rimuovere dal listino, a
quale target rivolgere i messaggi pubblicitari ecc.
Il Sistema Informatico
Aziendale
• E’ costituito dall’insieme di strumenti HW/SW che permettono di
gestire in maniera automatizzata l’informazione aziendale.
• Poiché le componenti del Sistema Informatico Aziendale sono
un sottoinsieme del Sistema Informativo Aziendale non faremo
distinzione tra i due. Anche esse divise nelle due categorie
citate.
• Applicazionali Transazionali: Sono i sistemi e le procedure
informatiche di supporto all’attività operazionale quotidiana. Le
applicazioni che rientrano in questa categoria sono i Sistemi
Legacy e gli Enterprise Resource Planner (ERP).
• Decision Support System (DSS): Sono i sistemi e le
procedure informatiche di supporto alle scelte strategiche dei
dirigenti. In questa categoria rientrano le applicazioni di
reportistica statica, le applicazionidi DataWareHousing (o meglio
le applicazioni OnLine Analitic Processing: OLAP) e le
applicazioni di DataMining.
Le parti del Sistema
Informativo Aziendale
Due Famiglie di Strumenti di
Gestione dei Dati
• Data Base per l’elaborazione delle transazioni
– On Line Transactional Processing (OLTP)
– Sistemi Transazionali o Operazionali( L’insieme delle
applicazioni che supportano in tempo reale le attività
giornaliere inerenti il business dell’azienda)
• Data Base per il Supporto alle Decisioni
– On Line Analytical Processing (OLAP)
– Sistemi di Analisi dei Dati (Sono strumenti strategici
in grado di incrementare la conoscenza aziendale,
supportano i manager nelle decisioni)
Gestione intelligente delle
informazioni
• I dati: sono grezzi e disadorni. Sono per esempio
un singolo record in un database transazionale.
• L’ informazione: è un dato accompagnato, in una
certa misura, da un contesto e da un significato
economico; le informazioni sono dati filtrati,
sintetizzati, aggregati, esprimono dei concetti.
• Sopra l’informazione, se l’organizzazione è in grado
di gestirsi, si costruisce la“conoscenza”,
un’attitudine che è il risultato di una gestione
razionale e continuativa delle interazioni tra:
– informazioni, azioni passate, esperienza,
comprensione.
La piramide della conoscenza
Query standard, query ad hoc
e reportistica
•
•
•
•
•
Il modo più semplice per fare analisi è poter disporre di query
(interrogazioni) già preconfezionate ed eventualmente parametrizzabili.
(Es. visualizza tutti i clienti che l’anno scorso hanno acquistato il
prodotto X)
In alternativa è possibile costruire query specifiche al presentarsi di
situazioni particolari. Richiedono continue riprogettazioni che l’utente
spesso non è in grado di fare.
Per costruire una query occorre prima formulare un’ipotesi di ciò che
voglio ricercare.
Il ruolo dell’utente è principalmente passivo.
La reportistica ha forma nota e aggiorna i valori alla richiesta dell’utente
(vendite del mese per categorie di prodotto): in genere la presentazione
o la parte cosmetica del report è in forma tabellare o grafica.
Scarica

Usi di un datawarehouse