Paolo Giudici Capitolo 15 ANALISI DELLE SEQUENZE DI VISITA AD UN SITO DI E-COMMERCE* *Questa presentazione,sviluppata in collaborazione con Erika Blanc, illustra il caso illustrato nel capitolo. Copyright 2001 - The McGraw-Hill Companies srl WEB MINING NASCE DALL’UNIONE DI DUE AREE: INTERNET E IL DATA MINING PER DATA MINING SI INTENDE: UN PROCESSO DI SELEZIONE, ESPLORAZIONE E MODELLAZIONE DI GRANDI BASI DI DATI PER SCOPRIRE RELAZIONI NON NOTE A PRIORI IL WEB MINING PERMETTE DI INDIVIDUARE: QUALI PAGINE OTTENGONO MAGGIORE O MINORE FREQUENZA DI VISITE TEMPO DI PERMANENZA PUNTI DI ENTRATA E DI USCITA CLASSIFICAZIONE DEI VISITATORI ANALISI DELLE ASSOCIAZIONI E DELLE SEQUENZE ANALISI DELLE ASSOCIAZIONI E DELLE SEQUENZE Obiettivo: individuare le aree dI un sito web che un cliente, probabilmente, visiterà, in base alle pagine che ha visitato. Copyright 2001 - The McGraw-Hill Companies srl I DATI IL PRIMO DATASET RISULTATO DELL’ELABORAZIONE DEI DATI RELATIVI AD UN SITO DI E-COMMERCE (LOG FILE) CONTIENE: L’IDENTIFICATIVO UTENTE (C_VALUE): cookie LA DATA E L’ISTANTE IN CUI IL VISITATORE VISUALIZZA LE PAGINE (C_TIME) LA PAGINA WEB VISUALIZZATA DAL DATASET PRECEDENTE SI POSSONO RICAVARE: DATA E ORA D’INIZIO DELLA CONNESSIONE (C_TIME) DURATA COMPLESSIVA DELLA CONNESSIONE IN SECONDI (LENGTH) NUMERO DI CLICK EFFETTUATI (CLICKS) SE IL VISITATORE HA ACQUISTATO OPPURE NO (PURCHASE) GIORNO IN CUI E’ AVVENUTO IL COLLEGAMENTO (WEEK_DAY) TEMPO MEDIO TRA DUE CLICKS SUCCESSIVI (CLCKLGTH) OBIETTIVI DELL’ANALISI COPPIE DI PAGINE PIU ASSOCIATE (odds ratio) ANALISI DELLE SEQUENZE (regole di collegamento) APPLICAZIONE ALLA RICERCA DEI PUNTI DI INGRESSO E USCITA DAL SITO (analisi degli abbandoni) ODDS RATIO PER CALCOLARE QUESTA MISURA E COSTRUIRE DEI MODELLI ABBIAMO UTILIZZATO UN DATA SET COSI STRUTTURATO: LE COLONNE SONO STATE INTESTATE ALLE PAGINE WEB LE RIGHE AI SINGOLI VISITATORI (C_VALUE) I VALORI 0-1 INDICANO SE UNA DETERMINATA PAGINA E STATA VISUALIZZATA OPPURE NO PROBLEMA: PERDIAMO L’ORDINE DI VISITA PAY_REQ FREEZE 1 0 1 3814 1851 0 17 16845 (16845)(3815) 2041,7209 ODDS RATIO = (17)(1815) IN GENERALE: 1 SE ODDS RATIO 1 ASSOCIAZIONE NEGATIVA SE ODDS RATIO = 1 INDIPENDENZA SE ODDS RATIO ASSOCIAZIONE POSITIVA