L’analisi statistica nelle
ricerche di mercato
Relatore Dott. Mattia Arienti
1
l’analisi statistica nelle ricerche di mercato
Le applicazioni statistiche nelle ricerche di mercato
• Identificazione dell’influenza reciproca fra le variabili
• Riduzione  sintesi
• Rappresentazione  mapping
Focus sulle principali tecniche di analisi multivariata (scopi, esempi, considerazioni)
• L’influenza fra variabili
 Le correlazioni e un’importante analisi derivata: la driver analysis, mirata
all’individuazione di punti di forza e aree di opportunità per i prodotti
monitorati
• I metodi di riduzione dei dati
 L’analisi dei fattori
 La cluster analysis
• I modelli di posizionamento
 Il brand mapping e l’analisi delle corrispondenze
2
La statistica e
le ricerche di mercato
la statistica
LA STATISTICA E’ LA SCIENZA
DELL’INCERTO, DEL PROBABILE
E’ UN MODUS OPERANDI CHE
CONSENTE DI MUOVERSI ALL’INTERNO
DI SCENARI CIRCOSCRITTI
NELLA CONSAPEVOLEZZA DEL LIVELLO DI ALEATORIETA’
DELL’AMBIENTE IN CUI CI SI TROVA
“la statistica è la filosofia del numero, consente di dargli pensiero e voce;
permette di ascoltare anche ciò che non è stato esplicitamente detto”
4
le possibili applicazioni statistiche nelle
ricerche di mercato
IDENTIFICAZIONE DELL’INFLUENZA
RECIPROCA FRA VARIABILI
RIDUZIONE DELLE INFORMAZIONI
 SINTESI
RAPPRESENTAZIONE DELLE EVIDENZE
 MAPPING
5
L’identificazione dell’influenza
reciproca fra variabili:
la correlazione lineare
l’analisi di correlazione
L’ANALISI DI CORRELAZIONE
CONSENTE DI MISURARE LA RELAZIONE TRA COPPIE DI
VARIABILI QUANTITATIVE
RISPONDE A 2 DOMANDE:
• All’aumentare di una delle 2 variabili come si comporta l’altra?
Aumenta o diminuisce?
 se all’aumentare di una variabile anche l’altra aumenta
(in media) si dice che le due variabili hanno una
correlazione diretta o positiva (+), in caso contrario che
hanno correlazione inversa o negativa (-)
Esempi di correlazione diretta: dimensione di un appartamento e prezzo di
vendita, livello di istruzione e classe socio-economica,…
Esempio di correlazione inversa: classicamente, costo di un prodotto con
propensione all’acquisto,…
7
l’analisi di correlazione
• Di quanto aumenta/diminuisce una variabile
variabile aumenta/diminuisce di una unità?
se
l’altra
L’indicatore statistico che consente di rispondere a questa domanda è il
COEFFICIENTE DI CORRELAZIONE LINEARE
+1
-1
PERFETTA correlazione DIRETTA (o positiva) fra le due variabili
Al crescere unitario dell’una corrisponde una crescita unitaria dell’altra
PERFETTA correlazione INVERSA (o negativa) fra le due variabili
Al crescere unitario dell’una corrisponde una riduzione unitaria dell’altra
All’interno di questi due casi limite (molto rari nella realtà)…
… a valori negativi del coefficiente corrisponde una relazione inversa
… a valori prossimi allo 0 corrisponde una relazione nulla
… a valori positivi corrisponde una relazione diretta
…fra le 2 variabili
8
Un’ importante applicazione
della correlazione:
la driver analysis
driver analysis

QUANDO SI UTILIZZA? A COSA SERVE?

COME FUNZIONA?

QUALI DOMANDE DEVE CONTENERE IL QUESTIONARIO DI
INTERVISTA?

L’OUTPUT: COME NASCE, COME SI INTERPRETA, QUALI
RISPOSTE OPERATIVE FORNISCE
10
driver analysis:
quando si utilizza? a cosa serve?
ANALISI DI PRODOTTO
(A LIVELLO DI CONCETTO,
PERFORMANCE IN USE, PACK,…)
… per definire il livello di
importanza dei diversi attributi
che caratterizzano un brand, un
prodotto o un servizio
11
driver analysis:
come funziona?
La driver analysis si basa sulla lettura congiunta di 2 misurazioni:

l’impatto di ciascun aspetto del profilo di immagine sul gradimento
espresso per il prodotto  IMPORTANZA DERIVATA (coefficiente di
correlazione lineare): misura indiretta – non direttamente dichiarata
dall’intervistato - del peso di ciascun item sull’overall liking

la percentuale di rispondenti che associano ogni singolo item al
prodotto in test
La rappresentazione grafica di tali misurazioni consente di generare una mappa
bidimensionale (assi cartesiani) suddivisa in 4 quadranti, ognuno dei quali
raggruppa un sottoinsieme di items di immagine funzionalmente alle rispettive
“implicazioni di marketing”
12
driver analysis:
le domande del questionario
 Overall liking
mi può dire nel complesso quanto le piace questo prodotto? Per rispondere utilizzi un
punteggio da 1 a 10, dove 1 significa che il prodotto non le piace per niente e 10 che
le piace moltissimo
 Product profile
(batteria di item)
Le leggerò ora una serie di affermazioni che altre persone prima di lei hanno fatto
parlando di questo prodotto; lei dovrebbe dirmi quanto è in accordo o in disaccordo
con ognuna di esse. Per esprimere il suo giudizio utilizzi un punteggio da 1 a 10,
considerando che 1 significa che è completamente in disaccordo con l’affermazione e
10 che è completamente d’accordo”.
13
driver analysis:
la mappatura dei risultati
Ogni aspetto di prodotto – item – può essere posizionato su una mappa
attribuendogli le seguenti coordinate:
Ascissa (asse orizzontale)

IMPORTANZA DERIVATA
 rappresentata dal COEFFICIENTE DI CORRELAZIONE di ciascun item
rispetto
all’overall
liking
di
prodotto
(qual
è
l’impatto
dell’item
sull’apprezzamento complessivo del prodotto?)
Ordinata (asse verticale)

% CON CUI LO SPECIFICO ITEM E’ STATO ASSOCIATO AL
PRODOTTO
 grado di accordo registrato nel product profile (quanto l’item è linkato al
prodotto?)
14
driver analysis: esempio di output
OVERCLAIMED
% di associazione item/ prodotto
(TOP 2* BOXES – grado di accordo)
+
DRIVER
NOT RELEVANT
OPPORTUNITY
IMPORTANZA DERIVATA (correlazione item-overall liking)
+
15
driver analysis: 1° dimensione
importanza derivata (misurata attraverso il coefficiente di correlazione)
attributi meno
impattanti sul gradimento
–
attributi maggiormente
impattanti sulla
valutazione di prodotto
IMPORTANZA DERIVATA (correlazione item-overall liking)
+
16
driver analysis: 2° dimensione
% di associazione item/prodotto
% di associazione item/ prodotto
(TOP 2* BOXES – grado di accordo)
+
–
attributi maggiormente
riconosciuti al prodotto
attributi meno associati
al prodotto
* Funzionalmente al mercato in esame può essere preferibile considerare il TOP BOX
17
driver analysis: analisi dell’output
- i driver di prodotto: punti di forza DRIVER
% di associazione item/ prodotto
(TOP 2* BOXES – grado di accordo)
+


Impatto superiore alla media
Associazione superiore alla
media
Gli items appartenenti a questo
quadrante rappresentano i punti di forza
del prodotto  si tratta di aspetti
riconosciuti al prodotto e impattanti sul
gradimento
IMPORTANZA DERIVATA (correlazione item-overall liking)
+
18
% di associazione item/ prodotto
(TOP 2* BOXES – grado di accordo)
driver analysis: analisi dell’output
- opportunità / punti di debolezza -
–
OPPORTUNITY


Impatto superiore alla media
Associazione
inferiore
alla
media
Gli items appartenenti a questo quadrante
rappresentano
un’area
di
possibile
ottimizzazione  si tratta di aspetti
impattanti sul gradimento ma non
“comunicati” a sufficienza dal prodotto
IMPORTANZA DERIVATA (correlazione item-overall liking)
+
19
driver analysis: analisi dell’output
- overclaimed OVERCLAIMED


% di associazione item/ prodotto
(TOP 2* BOXES – grado di accordo)
+
Impatto inferiore alla media
Associazione
superiore
alla
media
Gli items appartenenti a questo quadrante
possono
rappresentare
un’area
di
“diseconomia”  si tratta di aspetti
riconosciuti al prodotto ma poco impattanti
sul gradimento.
Attenzione: in quest’area rientrano anche gli
item considerati come “dovuti” per i prodotti
appartenenti alla categoria in esame e che,
come tali, non possono mancare al ns
prodotto
IMPORTANZA DERIVATA (correlazione item-overall liking)
–
20
% di associazione item/ prodotto
(TOP 2* BOXES – grado di accordo)
driver analysis: analisi dell’output
- gli aspetti poco rilevanti -
–
NOT RELEVANT


Impatto inferiori alla media
Associazione
inferiori
alla
media
Gli items appartenenti a questo quadrante
non risultano impattanti sul gradimento
per il prodotto
IMPORTANZA DERIVATA (correlazione item-overall liking)
–
21
Analisi conoscitiva del
Centro Medico XXXX
24
Premessa e obiettivi della ricerca
Il Centro Medico XXXX nasce con l’intento di interpretare un bisogno sanitario emergente e diffuso:

una medicina specialistica di alto livello anche in aree attualmente poco coperte dal
servizio pubblico,

a costi accessibili,

rapida nell’intervento,

attenta ai bisogni anche relazionali del paziente
A qualche mese dall’inaugurazione della Struttura Sanitaria, la Società Proprietaria - avvertendo
l’esigenza di tracciare un primo bilancio sul Centro - ha commissionato una ricerca quantitativa
mirata ad indagare vissuto, percezioni ed intenzioni future del proprio bacino d’utenza.
Nel dettaglio, la ricerca ha perseguito i seguenti obiettivi conoscitivi:

profilare il parco pazienti

analizzare le dinamiche e le motivazioni che hanno comportato “l’approdo al Centro”

indagare l’immagine del Centro agli occhi dei propri utenti

monitorare il livello di soddisfazione, sia a livello complessivo che in relazione alle
diverse aree che compongono l’offerta  qualità dei servizi, personale medico,
accessibilità, servizio di informazione e accoglienza
25
Soddisfazione
dell’utenza
La soddisfazione per le diverse macro-aree
Dati %
BASE: totale campione (400)
D10 Nel complesso, secondo la sua esperienza personale, quanto è soddisfatto-a del Centro XXXX
D12 (qualità dei servizi offerti) - d14 (personale medico operante) - d16 (accessibilità) - d18 (servizi informazione e accoglienza)
VOTO
MEDIO
(1-10)
8.22
8.24
TOP 3
(8+9+10)
TOP 2
(9+10)
80%
38
44
48%
41%
35%
8.21
86%
41
46
36%
8.49
82%
81%
81%
45
8.25
36%
29
24
18
20
18
15
17
19
Soddisfazione
complessiva
Soddisfazione
complessiva
Soddisfazione
complessiva
Soddisfazione
complessiva
Soddisfazione
complessiva
CENTRO XXXX
QUALITÀ DEI
SERVIZI
PERSONALE
MEDICO
ACCESSIBILITÀ
INFORMAZIONE
E ACCOGLIENZA
25
Voto 10
27
11
Voto 9
Voto 8
La soddisfazione per la qualità dei servizi
Dati %
BASE: totale campione (400)
D12 Nel complesso quanto è soddisfatto-a della qualità dei servizi offerti dal centro?
D13 Le leggerò ora alcuni specifici aspetti inerenti la qualità dei servizi. Per ciascuno di essi mi dica quanto è soddisfatto
VOTO
MEDIO
(1-10)
8.24
8.19
8.24
8.05
8.03
7.98
Il livello di soddisfazione per la macro-area nel proprio complesso è superiore ai riscontri ottenuti dai
singoli aspetti che la compongono (“il tutto è più della somma delle sue parti”), sintomatico di un “positivo
alone” che enfatizza le performance del Centro agli occhi dei propri pazienti.
TOP 2
(9+10)
35%
35%
39%
20
22
23
15
13
16
Soddisfazione
complessiva
Soddisfazione
durata della
vista/esame
Soddisfazione
accuratezza della
visita
QUALITA’ DEI
SERVIZI
32%
28%
29%
23
19
18
9
9
11
Soddisfazione
attrezzature,
strumentazione
Voto 10
28
Soddisfazione
Soddisfazione
ampiezza e varietà abbinamento visita
delle prestazioni
medica e esame
diagnostico
Voto 9
La soddisfazione per il personale medico
Dati %
BASE: totale campione (400)
D14 Nel complesso quanto è soddisfatto-a del personale medico operante nel centro?
D15 Le leggerò ora alcuni specifici aspetti inerenti il personale medico che lavora nel Centro XXXX. Per ciascuno di essi mi dica quanto è soddisfatto
VOTO
MEDIO
(1-10)
TOP 2
(9+10)
8.25
8.36
46%
41%
8.60
8.27
8.26
8.20
42%
39%
37%
25
22
23
17
17
14
53%
27
24
30
17
16
Soddisfazione
complessiva
Soddisfazione
competenza
PERSONALE
MEDICO
26
Soddisfazione
gentilezza e
disponibilità
Miglior performance fra tutti gli aspetti monitorati
29
Soddisfazione
Soddisfazione
completezza delle
chiarezza delle
spiegazioni
spiegazioni fornite
fornite in sede di
durante la visita
visita
Voto 10
Voto 9
Soddisfazione
chiarezza delle
informazioni
relative all’intero
percorso di
prevenzione/cura
La soddisfazione per l’accessibilità
Dati %
BASE: totale campione (400)
D16 Nel complesso quanto è soddisfatto-a dell’accessibilità del centro (facilità con cui si può usufruire dei servizi offerti dal Centro)?
D17 Le leggerò ora alcuni specifici aspetti inerenti l’accessibilità del centro. Per ciascuno di essi mi dica quanto è soddisfatto
VOTO
MEDIO
(1-10)
TOP 2
(9+10)
8.49
48%
29
8.27
42%
26
8.47
8.35
47%
46%
29
29
8.24
50%
40%
25
26
19
16
18
17
14
Soddisfazione
complessiva
Soddisfazione
prezzi delle
prestazioni
Soddisfazione
facilità di
prenotazione
Soddisfazione
tempi per
ottenere un
appuntamento
Soddisfazione
orari di apertura
ACCESSIBILITA’
Voto 10
Voto 9
30
8.56
25
Soddisfazione
facilità di
raggiungere la sede
Dopo la “gentilezza e disponibilità” del
personale medico, risulta l’aspetto cui
vengono attribuiti i punteggi più elevati
La soddisfazione per il servizio di
informazione e accoglienza
Dati %
BASE: totale campione (400)
D18 Nel complesso quanto è soddisfatto-a dei servizi di informazione e accoglienza presenti all’interno del Centro XXXX?
D19 Le leggerò ora alcuni specifici aspetti inerenti i servizi di informazione e accoglienza del centro. Per ciascuno di essi mi dica quanto è soddisfatto
VOTO
MEDIO
(1-10)
TOP 2
(9+10)
8.21
36%
7.97
32%
8.21
8.04
37%
35%
24
24
25
22
11
10
13
11
Soddisfazione
complessiva
Soddisfazione
sportello di
informazione e
orientamento
Soddisfazione
reception/
accoglienza
Soddisfazione
servizio telefonico
INFORMAZIONE
E ACCOGLIENZA
Voto 10
31
Voto 9
I singoli aspetti:
l’analisi dei driver alla soddisfazione complessiva
Area della valorizzazione
Area del mantenimento
–
Area del controllo
Area del miglioramento
PERFORMANCE (top 2 boxes)
+
–
+
GRADO DI IMPORTANZA SULLA SODDISFAZIONE COMPLESSIVA
(correlazione)
33
I singoli aspetti:
l’analisi dei driver alla soddisfazione complessiva
+
Area della valorizzazione
Area del mantenimento
gentilezza e disponibilità
facilità di raggiungere la sede
PERFORMANCE (top 2 boxes)
tempi per ottenere un
appuntamento
facilità di prenotazione
competenza
completezza delle
spiegazioni fornite in sede di
visita
prezzi delle prestazioni
orari di apertura
chiarezza delle spiegazioni
fornite durante la visita accuratezza della visita
reception / accoglienza
durata della visita/esame chiarezza delle informazioni
sul percorso di
prevenzione/cura
servizio telefonico
sportello di informazione e
orientamento
attrezzature,
strumentazione
abbinamento di visita medica
e esame diagnostico
–
ampiezza e varietà delle
prestazioni offerte
Area del controllo
Area del miglioramento
–
+
GRADO DI IMPORTANZA SULLA SODDISFAZIONE COMPLESSIVA
QUALITA’ DEI SERVIZI
(correlazione)
PERSONALE MEDICO ACCESSIBILITA’
34
INFORMAZIONE E ACCOGLIENZA
La riduzione delle informazioni:
l’analisi fattoriale e
la cluster analysis
la riduzione dei dati:
dall’analisi alla sintesi
Il passaggio da
DATI
ANALITICI
a
DATI
SINTETICI
comporta necessariamente una PERDITA DI INFORMAZIONE
CONTRARIAMENTE ALL’ACCEZIONE COMUNE,
NON NECESSARIAMENTE UNA PERDITA DI INFORMAZIONE
CORRISPONDE AD UN EVENTO NEGATIVO!
se opportunamente effettuata, la riduzione dei dati comporta la
sottrazione solo delle informazioni di disturbo/ridondanti che possono
minare l’individuazione delle evidenze effettivamente rilevanti
38
la riduzione dei dati:
l’analisi fattoriale e la cluster
L’analisi dei fattori e la cluster analysis costituiscono 2 fra le
tecniche di statistica multivariata che permettono di effettuare una
opportuna riduzione dei dati.
In particolare…
LA FATTORIALE
HA L’OBIETTIVO
VARIABILI
DI
INDIVIDUARE
RELAZIONI
TRA
 RAGGRUPPA VARIABILI
LA CLUSTER
HA LO SCOPO DI CLASSIFICARE SOGGETTI IN GRUPPI
 RAGGRUPPA LE UNITA’ DI RILEVAZIONE
39
L’analisi fattoriale
analisi fattoriale:
scopi e fondamenta
Lo scopo principale dell'AF è l'individuazione di relazioni tra variabili: serve a
raggruppare e riassumere variabili.
L'idea è che un numero anche ampio di variabili possa essere adeguatamente
spiegato con un numero relativamente piccolo di costrutti:
fattori = variabili latenti (non direttamente dichiarate o esplicitate) che
influenzano le variabili in esame.
41
l’analisi fattoriale e la
correlazione fra le variabili
- L'AF si basa sulla correlazione esistente fra gli item
 l’assunto è che “se due item sono correlati fra loro allora esiste un fattore
(latente) comune a entrambi che ne spiega parte della variabilità”
- L’Analisi fattoriale non può pertanto prescindere dall’analisi delle correlazioni
in quanto il coefficiente di correlazione rappresenta la misura della
relazione tra due variabili quantitative (gli item in questo caso)
- I coefficienti della matrice fattoriale (factor loadings) sono i coefficienti di
correlazione tra item e fattore.
Componente
1
2
3
,751
d13.24 E' una emittente che mi rilassa
d13.17 Mi piacciono i personaggi che
,743
conducono i programmi su questa emittente
,401
42
analisi fattoriale:
considerazioni generali
• Nell'AF non ci sono variabili dipendenti e indipendenti (no causa-effetto).
• I fattori non sono osservabili direttamente e quindi richiedono una fase
interpretativa per essere identificati e “capiti”.
• E’ opportuno ricordare che la struttura fattoriale scelta è frutto di “compromessi” 
seppur minimo esiste sempre un margine di discrezionalità che deve essere
considerato, analizzato e controllato dal ricercatore che effettua l’analisi:
con meno fattori le linee guida sono spesso più chiare ed evidenti,
con più fattori il fenomeno è scandagliato in modo più analitico
43
analisi fattoriale:
considerazioni generali
IL CRITERIO CHE GUIDA L’ANALISI FATTORIALE E’ IL
PRINCIPIO DI PARSIMONIA SCIENTIFICA:
il modello ottimale è quello che si ottiene quando
inserendo ulteriori variabili non si ottiene un beneficio interpretativo
e, contemporaneamente,
sottraendo anche solo una variabile si ottiene uno svantaggio interpretativo
IN TERMINI PROSAICI:
Non complicare il modello oltre il dovuto!
44
analisi fattoriale:
gli step che conducono ai fattori
SELEZIONE DELLE VARIABILI
 Le variabili devono appartenere a un contesto omogeneo
es. valori o atteggiamenti o comportamenti
 Mescolare ambiti diversi può rendere i fattori difficilmente interpretabili
CALCOLO DELLA MATRICE DELLE CORRELAZIONI TRA LE VARIABILI ED ESTRAZIONE DEI FATTORI
 I fattori estratti sono ortogonali ovvero NON correlati fra loro
 Sono in ordine decrescente per varianza spiegata: il primo fattore è, fra tutti, quello che spiega
la maggior parte della variabilità degli item, e così via
QUANTI FATTORI ESTRARRE?
 Criterio della % di varianza spiegata  principio di parsimonia scientifica
 Il parametro più rilevante circa il numero di fattori da estrarre resta in ogni caso la leggibilità e
l’interpretazione dei fattori per poter fruire operativamente degli stessi
46
analisi fattoriale: esempio di output
vicinanza
utilità
servizio
film sport
famiglia
d13.24 E' una emittente che mi rilassa
d13.17 Mi piacciono i personaggi che conducono i programmi su questa emittente
d13.20 E' quella che preferisco perché rispecchia la mia personalita
d13.23 E' una emittente che mi offre argomenti e spunti di cui parlare
d13.25 E' una emittente con una 'visione del mondo' che condivido
d13.16 Trasmette i migliori programmi di intrattenimento
d13.22 E' una emittente che offre programmi divertenti
d13.13 Ci sono tanti programmi nuovi ed originali che non trovo sulle altre reti
d13.15 Spesso la guardo da solo, è uno spazio che ritaglio per miei interessi
d13.19 Guardo sempre cosa trasmette prima di scegliere cosa guardare
d13.6 Dà grande spazio ai programmi di utilita pubblica/servizio al cittadino
d13.5 Dà un grande risalto ai collegamenti in diretta in occasione di eventi importanti
d13.3 Spesso manda in onda programmi che mi fanno riflettere
d13.4 E' per me un punto di riferimento quando voglio formarmi un'opinione
d13.21 E' una emittente che offre programmi che parlano della realta in cui vivo
d13.14 I programmi di informazione sono condotti da personaggi noti e prestigiosi
d13.9 Si rivolge a un pubblico preciso/mirato/diverso dagli altri
d13.8 Trasmette molti film recenti
d13.18 Trasmette molti programmi per bambini
d13.10 E' una emittente molto adatta ai giovani
d13.2 Dà molto spazio allo sport
d13.1 Trasmette spesso film belli ed interessanti
d13.11 E' una emittente adatta a tutta la famiglia
Componente
1
2
3
,751
,743
,401
,732
,410
,716
,473
,714
,491
,697
,696
,472
,616
,585
,400
,457
,489
,571
,802
,775
,722
,672
,586
,554
,494
,464
,757
,736
,686
,651
,635
,556
23 item  3 fattori (75% della varianza)
47
Profilo del lavoro ideale:
analisi fattoriale e impatto dei macrofattori
Base: totale campione
32
P E R C O R S O D I C R E S C IT A
22
R A P ID IT A ' D I C A R R IE R A
N O ST R ESS
15
R E LA Z IO N I E C O N O S C E N Z E
12
10
9
A D E R E N Z A A IN T E R E S S I E B A C KG R O UN D
A UT O N O M IA
DESCRITTORI
PRIMARI
 Permettermi di
muovermi in un
contesto molto
competitivo
 Darmi gli strumenti
per diventare un buon
manager
 Aiutarmi a completare
la mia formazione
 Essere l’occasione per
ampliare le mie
conoscenze su altri
campi
 Darmi la possibilità
di fare carriera
velocemente
 Farmi guadagnare
da subito tanti soldi
 Darmi la possibilità di
rimanere nella mia città
 Essere stabile, darmi
sicurezza
 Lasciare spazio e
tempo alla mia vita
privata
 Permettermi di
spaziare tra diversi
dipartimenti/funzioni
 Assolutamente
attinente alla mia
formazione
 Permettermi di creare
una rete di conoscenze
 Assolutamente
attinente ai miei
interessi
 Lavoro di squadra
 Offrirmi una persona
di riferimento che mi
aiuti ad inserirmi
nell’attività lavorativa
 Farmi operare in
perfetta autonomia
 Permettermi di
distinguermi rispetto
agli altri
 Permettermi di
specializzarmi sempre di
più nel mio campo di
competenza
Permettermi di
sviluppare al massimo le
mie potenzialità
49
i principali utilizzi dei fattori
I fattori individuati posso essere utilizzati
• IN UN’OTTICA SINTETICA  PER INDIVIDUARE AGGREGAZIONI DI
VARIABILI minimizzando la perdita delle informazioni
• PER MONITORARE L’INFLUENZA DEI MACRO-FATTORI INDIVIDUATI
SU ALTRE VARIABILI CORE (es: correlazione fra i fattori e l’overall liking
di un prodotto)
• COME VARIABILI ATTRAVERSO CUI SEGMENTARE LA POPOLAZIONE
Come ingrediente della CLUSTER ANALYSIS
51
La cluster analysis
cluster analysis
definizione ed obiettivi
•
La Cluster Analysis è un’analisi statistica multivariata utilizzata per
classificare i rispondenti in gruppi - clusters.
•
La segmentazione, ovvero l’appartenenza ad un cluster, viene
realizzata facendo in modo che i gruppi siano il più possibile omogenei
al proprio interno, ma il più possibile disomogenei tra di loro.
•
L’identificazione dei diversi cluster viene solitamente realizzata
attraverso l’analisi delle attitudini (o dei comportamenti) espresse
dagli intervistati, rispondendo ad una batteria di item.
•
Ogni “cluster” viene descritto analizzando il profilo dei suoi
appartenenti.
53
cluster analysis
la segmentazione della popolazione
LA CLUSTER
HA LO SCOPO DI CLASSIFICARE SOGGETTI IN GRUPPI
 RAGGRUPPA LE UNITA’ DI RILEVAZIONE
KKKKKK
KKKKKK
KKKKKK
KKKKKK
KKKKKK
Cluster A
Cluster C
KKKK KKKK
KKKK KKKK
Cluster B
KKKK
KKK KKKK
KKK
54
cluster analysis
come funziona?
LA C.A. RAGGRUPPA NELLO STESSO CLUSTER CASI VICINI TRA LORO
NELLO SPAZIO DEFINITO
DALLE VARIABILI DI CLASSIFICAZIONE CONSIDERATE
 SE SI MODIFICA IL PANIERE DELLE VARIABILI SU CUI SI CREANO I
CLUSTER SI MODIFICANO ANCHE I CLUSTER CHE SI OTTENGONO
è quindi opportuno sapere che…
55
cluster analysis: un’opportuna scelta delle
variabili di classificazione (1/2)
•
Le variabili di classificazione su cui eseguire la CA devono essere scelte con cura
in quanto rappresentano gli ingredienti attraverso cui si definiscono i cluster
•
Le variabili selezionate devono essere buoni indicatori delle similarità tra i
soggetti rispetto al problema in esame (variabili attitudinali, comportamentali,
…)  l’inclusione di variabili irrilevanti può modificare (rendere meno
interpretabili) i risultati.
56
cluster analysis:
il processo di clusterizzazione
IL PROCESSO DI IDENTIFICAZIONE DEI CLUSTER
È INTERATTIVO E DINAMICO
SCELTA DELLE VARIABILI DI CLASSIFICAZIONE
1° formulazione del numero ipotetico di cluster
applicazione dell’algoritmo di estrazione dei cluster
analisi dei risultati dell’algoritmo
IDENTIFICAZIONE, PROFILAZIONE E NAMING DEI CLUSTER
58
cluster analysis:
l’analisi quantitativa e qualitativa
(1/2)
L’analisi quantitativa dei cluster consente di individuare solo i gruppi di
individui maggiormente partecipati (= numerosità consistente) all’interno
della popolazione oggetto di indagine  non permette di rilevare target
nicchia che abbiano una rappresentazione campionaria inferiore ai 75-100 casi
Questo comporta che non necessariamente i
CLUSTER QUANTITATIVI
e le
TIPOLOGIE QUALITATIVE
forniscano i medesimi risultati
 LE 2 LETTURE SONO COMPLEMENTARI, NON SOSTITUTIVE!!!
infatti…
63
cluster analysis:
l’analisi quantitativa e qualitativa
(2/2)
la ricerca qualitativa ha come obiettivo l’esplorazione di un fenomeno
( individuare le determinanti, spesso latenti, sottese a un’opinione o a un comportamento)
 approccio verticale  profondità di analisi su un numero
contenuto di interviste: obiettivo non è fare inferenza sulla
popolazione (rappresentanza vs rappresentatività)
la ricerca quantitativa ha come obiettivo la misurazione di un
fenomeno
( individuare relazioni di causa-effetto sulla base di “variazioni concomitanti” delle variabili
analizzate)
 approccio orizzontale  elevato numero di interviste in modo
da garantire una numerosità campionaria che consenta di
estendere i risultati ottenuti alla popolazione di riferimento
64
APPROCCIO AL BODY CARE
- le variabili di classificazione 1.
Credo che la bellezza interiore sia piu' importante che la bellezza esteriore
2.
Mi piace viziarmi con prodotti di bellezza
3.
Mi piace apparire come una persona curata
4.
Se non sono curata non sto bene con me stessa
5.
Mi piace avere un corpo tonico e in forma, per questo vado in palestra
6.
Mi curo per combattere i segni del tempo
7.
Ho troppo poco tempo per mettermi creme, truccarmi
8.
Anche se ho poco tempo cerco comunque di ritagliarmi degli spazi per prendermi cura di me
9.
Prendersi cura del proprio corpo (massaggi, creme, trucchi, profumi) è un momento di relax
10.
Ogni parte del corpo ha esigenze specifiche. Per questo uso diversi prodotti specifici
66
APPROCCIO AL BODY CARE
- i cluster Base: campione base (500 casi)
CURATE
MODERNE
PRAGMATICHE
DISINVESTITE
CURATE
TRADIZIONALI
67
cluster 1: le pragmatiche
- la descrizione qualitativa Base: campione base
LE PRAGMATICHE
Sono donne che non provano particolare piacere nel
prendersi cura di se stesse e che vivono la cura
del corpo come un’attività funzionale, mirata e
spesso mossa da un “dovere”. Curarsi per loro
significa raggiungere un adeguato stato di ordine e
pulizia senza investimento emotivo. Ricorrono a
prodotti mirati solo in caso di problemi specifici (che
cercano peraltro di evitare utilizzando strumenti – e
non prodotti – protettivi)
68
cluster 1: le pragmatiche
- la profilazione quantitativa Base: campione base
RELATIVAMENTE AL BODY CARE…
PRAGMATICHE
xx%
xx%
Il principale asset discriminante rispetto agli altri cluster è “ho troppo
poco tempo per mettermi creme, truccarmi”
RELATIVAMENTE ALLA CURA DELLE MANI...
Rispetto agli altri gruppi, risulta maggiormente accentuata l’adesione
ai seguenti aspetti
PROFILAZIONE SOCIO-DEMOGRAFICA
Le appartenenti a tale cluster registrano
valori superiori al dato medio in termini di:
•
Le mani non hanno bisogno di prodotti specifici
•
Utilizzo guanti per proteggere le mani dagli agenti atmosferici
•
Quando lavo i piatti proteggo le mie mani con i guanti
•
residenza nel nord est
•
età 45-54 anni
•
istruzione media superiore
RELATIVAMENTE ALLE CREME SPECIFICHE PER LE MANI...
•
condizione lavorativa full time
Per questo cluster la MARCA XX rappresenta il principale riferimento
in termini di usership, precedendo la MARCA YY a livello di “most
often used” (fenomeno imputabile in particolare al minor ricorso alla
referenza “prodotto ZZ” di quest’ultimo brand).
69
Rappresentazione delle evidenze:
il mapping attraverso
l’analisi delle corrispondenze
la rappresentazione dei dati:
gli scopi del mapping
Per mapping si intende una serie di tecniche statistiche il cui scopo è quello di
rappresentare elementi (brand, prodotti, item o qualunque altra cosa) in uno
spazio - tipicamente una mappa a 2 dimensioni su assi cartesiani - che metta in
evidenza grafica le relative similarità.
L'idea è che quanto più gli elementi si dispongono vicini quanto più sono simili
tra loro (relativamente alle dimensioni individuate)
L'ANALISI DELLE CORRISPONDENZE rappresenta la tecnica di
mapping più diffusa nelle analisi di mercato quantitative
71
analisi corrispondenze
definizione ed obiettivi
L’ANALISI DELLE CORRISPONDENZE è un metodo statistico multivariato che si
basa sull’associazione tra le marche/i prodotti e gli items permettendo di chiarire la
posizione relativa delle marche/prodotti.
Il risultato principale dell’analisi consiste nella creazione di una mappa di
posizionamento che mostra delle distanze: più un item risulta vicino ad una
marca/prodotto, più esso è associato a quella marca/prodotto dai rispondenti.
Inoltre la vicinanza tra marche/prodotti indica similarità, viceversa, quanto più lontano
sono le marche/prodotti fra loro, tanto più sono percepiti come diversi dai rispondenti.
Il contesto competitivo può essere, quindi, definito considerando la posizione relativa
degli items e delle marche/prodotti.
Naturalmente i risultati dell’analisi variano in funzione delle marche/prodotti e degli
items utilizzati.
72
analisi di corrispondenze:
la matrice di associazione e il calcolo delle distanze
Partendo da una matrice di associazione item/brand…
c colonne (brand)
r righe
(item)
…la tecnica elabora le distanze fra le diverse righe (gli item)
 righe/item con i profili più simili sono più vicine fra loro
e fra le diverse colonne (i brand)
 colonne/brand con i profili più simili sono più vicine fra loro
74
analisi di corrispondenze:
dalla matrice di associazione alla mappa
6
MARCA D
MARCA A
1
MARCA G
3
4
10
13
11
5
7
14
2
MARCA C
MARCA E
MARCA B
8
9
12
MARCA F
75
analisi di corrispondenze:
note sulla lettura del mapping
• le dimensioni della mappa sono un risultato dell'analisi  il significato degli assi
non è conosciuto a priori (come ad esempio nel caso della driver analysis) ma è
frutto dell’interpretazione ex post della mappatura emersa
• l’asse orizzontale per costruzione è sempre il piu’ esplicativo del fenomeno in
esame, ossia quello che spiega la maggior parte di variabilita’ dei dati acquisiti
diretta conseguenza di questo aspetto è che
• nell’interpretazione dei risultati, la lettura orizzontale è quella che fornisce la
prima leva utilizzata dal parco rispondenti per suddividere/raggruppare i brand
appartenenti allo scenario competitivo  l’asse delle ascisse rappresenta il
principale parametro nella similarita’ o differenza fra gli elementi mappati
• la suddivisione in quadranti ha il solo scopo di rendere piu’ appealing la mappa
ma ciò che deve essere interpretato sono le distanze/vicinanze fra i diversi punti
e non il quadrante di appartenenza
• il brand leader - che possiede perlopiù un profilo calibrato, senza criticità - cade
spesso al centro o in prossimità di una nube di punti/item piuttosto ampia
76
analisi di corrispondenze:
il naming degli assi
• circa gli assi non esiste una regola “matematica” che ne consenta il naming
 la denominazione degli assi deriva da una lettura complessiva dei dati
riportati in mappa, sia in termini di item che di brand
• tradizionalmente, i nomi degli assi sono rappresentati da sostantivi per
evitare di generare confusione  l’utilizzo di aggettivi (innovativi,
tradizionali,…) potrebbe erroneamente portare a scambiare il nome dell’asse
con una parte di popolazione: l’oggetto dell’analisi delle corrispondenze sono
i brand, non gli intervistati!!!
77
map positioning: analisi delle corrispondenze
- caratteristiche generiche TRADIZIONE
la conosco da sempre
MARCA B
si trova dappertutto
di fiducia
economica
MARCA A
buon rapporto qualità/prezzo
vasta gamma di prodotti
specifici
MARCA C - leader
MASS MARKET
adatta ad uso quotidiano
adatta a pelli sensibili/delicate
adatta a tutta la famiglia
consigliata dallo specialista
MARCA D
FARMACIA
venduta in farmacia
si trova spesso in promozione
adatta a esigenze femminili
MARCA F
MARCA E
adatta sia corpo che mani
venduta in profumeria
Var sp (X) = 63%
fa prodotti nuovi
MARCA G
NOVITA’
Var sp (Y) = 22%
79
Scarica

cluster analysis