Paolo Giudici
Capitolo 15
ANALISI DELLE SEQUENZE DI VISITA
AD UN SITO DI E-COMMERCE*
*Questa presentazione,sviluppata in collaborazione con Erika Blanc,
illustra il caso illustrato nel capitolo.
Copyright 2001 - The McGraw-Hill Companies srl
WEB MINING
 NASCE DALL’UNIONE DI DUE AREE: INTERNET E IL DATA MINING
PER DATA MINING SI INTENDE:
UN PROCESSO DI SELEZIONE, ESPLORAZIONE E MODELLAZIONE
DI GRANDI BASI DI DATI PER SCOPRIRE RELAZIONI NON NOTE
A PRIORI
IL WEB MINING PERMETTE DI INDIVIDUARE:
 QUALI PAGINE OTTENGONO MAGGIORE O MINORE FREQUENZA
DI VISITE
 TEMPO DI PERMANENZA
 PUNTI DI ENTRATA E DI USCITA
 CLASSIFICAZIONE DEI VISITATORI
 ANALISI DELLE ASSOCIAZIONI E DELLE SEQUENZE
ANALISI DELLE ASSOCIAZIONI
E DELLE SEQUENZE
Obiettivo: individuare le aree dI un sito web che
un cliente, probabilmente, visiterà, in base alle
pagine che ha visitato.
Copyright 2001 - The McGraw-Hill Companies srl
I DATI
IL PRIMO DATASET
RISULTATO DELL’ELABORAZIONE DEI DATI RELATIVI
AD UN SITO DI E-COMMERCE (LOG FILE)
CONTIENE:
L’IDENTIFICATIVO UTENTE (C_VALUE): cookie
LA DATA E L’ISTANTE IN CUI IL VISITATORE VISUALIZZA
LE PAGINE (C_TIME)
LA PAGINA WEB VISUALIZZATA
DAL DATASET PRECEDENTE SI POSSONO RICAVARE:
 DATA E ORA D’INIZIO DELLA CONNESSIONE (C_TIME)
 DURATA COMPLESSIVA DELLA CONNESSIONE IN SECONDI (LENGTH)
 NUMERO DI CLICK EFFETTUATI (CLICKS)
 SE IL VISITATORE HA ACQUISTATO OPPURE NO (PURCHASE)
 GIORNO IN CUI E’ AVVENUTO IL COLLEGAMENTO (WEEK_DAY)
 TEMPO MEDIO TRA DUE CLICKS SUCCESSIVI (CLCKLGTH)
OBIETTIVI
DELL’ANALISI
 COPPIE DI PAGINE PIU ASSOCIATE (odds ratio)
ANALISI DELLE SEQUENZE (regole di collegamento)
 APPLICAZIONE ALLA RICERCA DEI PUNTI
DI INGRESSO E USCITA DAL SITO
(analisi degli abbandoni)
ODDS RATIO
PER CALCOLARE QUESTA MISURA E COSTRUIRE DEI MODELLI
ABBIAMO UTILIZZATO UN DATA SET COSI STRUTTURATO:
 LE COLONNE SONO STATE INTESTATE ALLE PAGINE WEB
 LE RIGHE AI SINGOLI VISITATORI (C_VALUE)
 I VALORI 0-1 INDICANO SE UNA DETERMINATA PAGINA E STATA
VISUALIZZATA OPPURE NO
PROBLEMA: PERDIAMO L’ORDINE DI VISITA
PAY_REQ
FREEZE
1
0
1
3814
1851
0
17
16845
(16845)(3815)
 2041,7209
ODDS RATIO =
(17)(1815)
IN GENERALE:
1
SE ODDS RATIO  1
ASSOCIAZIONE NEGATIVA
SE ODDS RATIO = 1
INDIPENDENZA
SE ODDS RATIO
ASSOCIAZIONE POSITIVA
Scarica

Demo Presentazione Capitolo 15