Innovazione nelle Indagini
statistiche sui trasporti
Laura De Sandro
in collaborazione con Stefania Fegatelli
“Il trattamento delle mancate risposte:
utilizzo dei dati delle Capitanerie di porto”
Roma, 06 dicembre 2011
1
Innovazione nelle
indagini statistiche sui
trasporti
SOMMARIO
1.
2.
3.
4.
5.
Esplicitazione del problema
Trattamento Mancate Risposte
Record Linkage
L’ integrazione con dati delle capitanerie di porto
Utilizzo dei mirror data
Roma, 6 dicembre 2011
2
Innovazione nelle
indagini statistiche sui
trasporti
Esplicitazione del problema
LA CAUSA:
• Complessità organizzativa dell’indagine
• Difficoltà di individuare l’universo dei rispondenti
L’EFFETTO:
• dichiarazioni mancanti (non pervenute o non
effettuate) di Arrivo/Partenza
MANCATE RISPOSTE TOTALI
• dichiarazioni non complete di Arrivo/Partenza
L’evento nave A/P viene rilevato, ma senza dettagli
sul carico
MANCATE RISPOSTE PARZIALI
Roma, 6 dicembre 2011
3
Innovazione nelle
indagini statistiche sui
trasporti
Esplicitazione del problema
TRATTAMENTO MANCATE RISPOSTE
1. Utilizzo modelli delle capitanerie di porto
2. Utilizzo mirror data
Roma, 6 dicembre 2011
4
Innovazione nelle
indagini statistiche sui
trasporti
Esplicitazione del problema
• Il metodo di IMPUTAZIONE scelto:
Record Linkage (RL) tra la base dati Istat e
una fonte amministrativa
• La FONTE amministrativa UFFICIALE scelta:
il modello 61 delle CAPITANERIE DI PORTO,
trasmesso all’Istat dal Ministero delle
Infrastrutture e Trasporti
Roma, 6 dicembre 2011
5
Innovazione nelle
indagini statistiche sui
trasporti
RECORD LINKAGE
Perché un Record Linkage?
Perché la nave, dichiarata in ‘arrivo (partenza)’
dall’agente marittimo, viene registrata anche
in capitaneria di porto con il suo carico,
cioè con la sua merce e i suoi
passeggeri
Roma, 6 dicembre 2011
6
Innovazione nelle
indagini statistiche sui
trasporti
RECORD LINKAGE
Punti di forza dei modelli 61
stesso campo d’osservazione dell’indagine
fornisce
l’universo
delle
navi
arrivate/partite
permette di integrare eventuali MR, totali
e parziali, rispetto ai viaggi (navi
arrivate/partite), alla merce o ai
passeggeri
Roma, 6 dicembre 2011
7
Innovazione nelle
indagini statistiche sui
trasporti
RECORD LINKAGE
Punti di debolezza dei modelli 61
non sono generati da una procedura automatizzata,
quindi non sono immediatamente trattabili da Istat
contengono informazioni aggregate con riferimento
al numero di navi arrivate/partite e alle tonnellate di
merce e al numero di passeggeri sbarcati/imbarcati
Roma, 6 dicembre 2011
8
Innovazione nelle
indagini statistiche sui
trasporti
RECORD LINKAGE
Ipotesi di base
• le unità statistiche devono essere definite allo
stesso modo nelle diverse fonti o provenire dalla
stessa fonte
• le unità devono fare riferimento allo stesso
collettivo statistico
• il contenuto informativo delle variabili della fonte
“donatrice” deve essere identico a quello delle
variabili “oggetto” di indagine
• IPOTESI SODDISFATTE!!
Roma, 6 dicembre 2011
9
Innovazione nelle
indagini statistiche sui
trasporti
RECORD LINKAGE
Il match e la match key
•
Tecnica di exact matching con una chiave di
abbinamento che identifichi univocamente
l’evento ‘nave arrivata/partita’
•
Ad ogni evento (nel nostro caso l’evento nave
arrivata/partita) da integrare corrisponde un solo
record ‘donatore’
Roma, 6 dicembre 2011
10
Innovazione nelle
indagini statistiche sui
trasporti
RECORD LINKAGE
Il match e la match key
La chiave di abbinamento:
•
•
•
•
•
•
Numero
IMO
(International
Organization)
mese
direzione (arrivo/partenza)
porto dichiarante
porto di origine/destinazione
zona di origine/destinazione
Roma, 6 dicembre 2011
Maritime
11
Innovazione nelle
indagini statistiche sui
trasporti
RECORD LINKAGE
LA FORMALIZZAZIONE
Dall’insieme di tutte le coppie formate da
unità appartenenti alle fonti A e B,
A × B ={(a, b) : a є A, b є B},
si determinano due sottoinsiemi
disgiunti ed esaustivi M e u, per cui
M∩u =ø
Roma, 6 dicembre 2011
e
MUu
=A×B
12
Innovazione nelle
indagini statistiche sui
trasporti
RECORD LINKAGE
•
LA FORMALIZZAZIONE
M = unità rilevate in entrambe le fonti
“match”
• u=
unità rilevate in A e non presenti in B, e
viceversa
“non-match”
Roma, 6 dicembre 2011
13
Innovazione nelle
indagini statistiche sui
trasporti
RECORD LINKAGE
•
•
•
•
LA FORMALIZZAZIONE
A =
la base dati Istat
B =
la base dati delle capitanerie di porto;
IL RL VIENE EFFETTUATO SU SOTTOINSIEMI DELLE
2 FONTI, selezionati in base alla variabile ‘TIPO DI
NAVE’, per individuare correttamente il tipo di
carico da integrare
Gli insiemi finali M ed u sono pertanto l’unione di
tanti sottoinsiemi, le cui coppie contengono, in
entrambe le fonti, la merce e i passeggeri da
integrare
Roma, 6 dicembre 2011
14
Innovazione nelle
indagini statistiche sui
trasporti
L’integrazione della MERCE
TIPI DI CARICO INTEGRATI:
• merce in Rinfusa liquida attraverso il tipo nave
Portarinfuse liquide
• merce in Rinfusa solida attraverso il tipo nave
Portarinfuse solide
• merce in container attraverso tipo nave
Portacontainer
• merce in traghetto attraverso il tipo nave
Traghetto
• merce in Trasportatore non specializzato
attraverso l’omonimo tipo nave
15
Innovazione nelle
indagini statistiche sui
trasporti
L’integrazione di PASSEGGERI e NAVI
segue ALTRE INTEGRAZIONI:
Numero di passeggeri attraverso il tipo nave
Traghetto-Aliscafo
Movimenti di TUTTE le NAVI Arrivate/Partite
Roma, 6 dicembre 2011
16
Innovazione nelle
indagini statistiche sui
trasporti
L’ INTEGRAZIONE
RISULTATI DEL linkage
• l’evento Nave Arrivata/Partita si rileva nei modelli
61 e non nella fonte Istat
INTEGRAZIONE MR TOTALI
Roma, 6 dicembre 2011
17
Innovazione nelle
indagini statistiche sui
trasporti
L’ INTEGRAZIONE
l’evento Nave Arrivata/Partita si rileva in entrambe
le fonti, ma merce, passeggeri e/o il numero di navi
A/P non coincidono,
si tiene conto di quanto dichiarato nei modelli 61
INTEGRAZIONE MR PARZIALI
18
Roma, 6 dicembre 2011
Innovazione nelle
indagini statistiche sui
trasporti
ESEMPIO di integrazione delle tonn. merce
RINFUSA LIQUIDA
RINFUSA LIQUIDA
ISTAT
Fonte AMM.
RINFUSA SOLIDA
RINFUSA SOLIDA
ISTAT
Fonte AMM.
TRAGHETTI
ISTAT
TRAGHETTI
Fonte AMM.
PORTACONTAINER
PORTACONTAINER
ISTAT
Fonte AMM.
Roma, 6 dicembre 2011
19
Innovazione nelle
indagini statistiche sui
trasporti
L’utilizzo dei MIRROR DATA
Il Trattamento delle MR totali e parziali prevede
anche una integrazione utilizzando i mirror data.
Attualmente sono utilizzate entrambe le tecniche:
- RL per l’Integrazione con i
mirror data
- RL per l’Integrazione con dati
amministrativi delle capitanerie
di porto
Roma, 6 dicembre 2011
20
Innovazione nelle
indagini statistiche sui
trasporti
L’utilizzo dei MIRROR DATA
Ogni porto può avere al massimo 2 eventi (Nave
Arrivata/Partita) verificabili
per una coppia di porti AB il n. max = 4
Arrivo in B
da A
A
B
Partenza
da A per B
Roma, 6 dicembre 2011
21
Innovazione nelle
indagini statistiche sui
trasporti
RL e mirror data: la match key
La chiave differisce da quella utilizzata per integrare
con dati delle capit. di porto nella variabile
Direzione (Arrivo/Partenza):
•
•
•
•
•
•
Numero
IMO
(International
Organization)
mese
direzione (arrivo/partenza)
porto dichiarante
porto di origine/destinazione
zona di origine/destinazione
Roma, 6 dicembre 2011
Maritime
22
Innovazione nelle
indagini statistiche sui
trasporti
ESEMPI DI MIRROR
Civitavecchia
Olbia
Roma, 6 dicembre 2011
23
Innovazione nelle
indagini statistiche sui
trasporti
ESEMPI DI MIRROR
P.Empedocle
Linosa
Lampedusa
Roma, 6 dicembre 2011
24
Innovazione nelle
indagini statistiche sui
trasporti
Sviluppi futuri
a) INFORMATIZZAZIONE dei modelli 61, ad opera
del Ministero delle Infrastrutture e Trasporti
b) Procedure automatiche per l’individuazione e il
recupero dei ‘non rispondenti’, utilizzando anche
i risultati del RL
Roma, 6 dicembre 2011
25