Struttura e dinamica dei sistemi economici
Alcuni strumenti d’indagine
Fabio Pammolli [email protected]
QUALE MODELLO ORGANIZZATIVO
IMT LAB
RACCOLTA , INTEGRAZIONE ED ELABORAZIONE DATI
IMT Lab
Ambiti di applicazione (esempi)
Istituzioni
Demografia
Regioni
Micro dati longitudinali (lavoratori, famiglie, imprese, produzione,
commercio…)
Micro dati, Regioni, Istituzioni
Quale ruolo per analisi esplorative
Sistemi dipendenti dagli stati vs. sistemi che registrano cambiamenti
qualitativi e nelle leggi di trasformazione.
Metodi di pattern recognition in senso lato.
Assunzioni sulla razionalità degli agenti economici vs. modelli
stocastici.
Modelli distributivi consegnati dalla teoria vs. modelli distributivi reali.
Problemi di aggregazione, ruolo e status di eventi ‘rari’
Strumenti
Metodi topologici
Analisi esplorativa
Analisi di aggregazione e
distribuzione nei sistemi
economici
Analisi econometriche
Metodi grafici e
visualizzazione
Metodi stocastici
Test econometrici
Causalità
METODI TOPOLOGICI
Dulmage–Mendelsohn Decomposition
Principali proprietà strutturali del grafo
I
1981
C
C
1992
C
T
T
C
Rappresentazione stilizzata della dinamica della rete di accordi nel comparto
biotech, 1981-
METODI TOPOLOGICI
Studio della crescita di grafi (reti di contratti, flussi di commercio estero….)
Nodi trasversali e co-specializzati
H1
Core
CospDev
TransDev
CospOr
H2
Fringe
CospDev
TransOr
CospOr
METODI TOPOLOGICI
Dulmage–Mendelsohn Decomposition
Numero di imprese per categoria relazionale.
METODI GRAFICI E VISUALIZZAZIONE
Network dei brevetti co-assegnati
METODI GRAFICI E VISUALIZZAZIONE
Analisi delle corrispondenze: Detentori di brevetti europei e classi terapeutiche
METODI STOCASTICI
Analisi della dimensione e della crescita
METODI GRAFICI E VISUALIZZAZIONE
Analisi delle corrispondenze: Detentori di brevetti statunitensi e classi terapeutiche
METODI STOCASTICI
Analisi della dimensione e della crescita
Esempi di Zipf’s Law:
•
distribuzione della frequenza delle parole in un testo (Zipf, 1949)
•
distribuzione delle dimensioni delle città (Gabaix, 1999)
Zipf law: Distribuzione delle 200 città più grandi (USA)
Zipf law: Conteggio delle 200 parole più utilizzate in un testo in italiano
6.5
1
parole/graduatoria
interpolazione lineare
6
conteggio parole(scala logaritmica)
5 "che"(148)
4.5
4
3.5
3
2.5
"New York"
"LA"
0
"di"(220)
dimensione(scala logaritmica)
"e"(274)
5.5
"Chicago"
-1
beta = -1.0647
-2
-3
beta = -0.85694
-4
2
1.5
0
1
2
3
4
graduatoria parole(scala logaritmica)
5
6
-5
0
1
2
3
4
graduatoria città(scala logaritmica)
5
6
METODI STOCASTICI
Analisi della dimensione e della crescita
Dimensione e Crescita in letteratura:
Dimensione:
La dimensione ha distribuzione lognormale
Crescita: La crescita segue le ipotesi di Gibrat
Tasso di crescita:
Il tasso di crescita ha un distribuzione almeno esponenziale (Laplace) o addirittura con code più
pesanti.
Una distribuzione con code grasse associa a eventi rari (sulle code) una probabilità maggiore di
quella associata a un Gaussiana.
METODI STOCASTICI
Analisi della dimensione e della crescita
Modello di crescita proporzionale
Assunzioni del modello:
•
Al tempo t(0) ci sono N(0) (nell’esempio N(0)=2)
classi con n(0) unità( nell’esempio 5)
•
L’area di ogni cerchio è proporzionale alla
dimensione dell’unità e la dimensione di ogni classe
è la somma delle aree delle unità che la
costituiscono (see Assumption 5).
•
Al tempo t+1 si crea una una nuova unità.
•
Con probabilità b la nuova unità è assegnata ad una
nuova classe (classe 3 nell’esempio).
•
Con probabilità 1-b la nuova unità è assegnata a
una classe esistente con probabilità proporzionale al
numero di unità nella classe (nell’esempio una
nuova unità viene assegnata alla classe 1 con
probabilità 3/5 o alla classe 2 con prababilità 2/5.
METODI STOCASTICI
Analisi della dimensione e della crescita
Legge di Gibrat
METODI STOCASTICI
Analisi della dimensione e della crescita
-2
Vxi=1
Vxi=5.13
Vxi=50
-3
-4
Simulazione di P(g|K) in Matlab
P(g|K)
-5
-6
-7
-8
-9
-10
-2.5
-2
-1.5
-1
-0.5
0
0.5
(g-m)/sigma
1
1.5
2
2.5
METODI STOCASTICI
Analisi della dimensione e della crescita
Script in Matlab
%K number of units for class
%stgK2=(lgK2-mean(lgK2))*sqrt(K(2));
S1K1=xi1.*eta1;
%N number of classes
[yK2,xK2]=hist(lgK2,100);
gK1=sum(S1K1)./sum(SK1);
K=[10;100;1000];
yK2=yK2/sum(yK2);
[yK1,xK1]=hist(log(gK1),100);
sigmaxi=[1;sqrt(5.13);sqrt(100)];
%stx2= xK2-mean(xK2);
yK1=yK1/sum(yK1);
N=10000;
plot(xK2,log(yK2),'b.')
plot(xK1,log(yK1),'r.')
muxi=2.44;
hold on
hold on
mueta=(0.016);
xi3 = (lognrnd(muxi,sigmaxi(1),K(3),N));
sigmaeta=sqrt(0.36);
eta3= (lognrnd(mueta,sigmaeta, K(3),N));
xi2 = (lognrnd(muxi,sigmaxi(2),K,N));
xi1 = (lognrnd(muxi,sigmaxi(1),K(1),N));
SK3=xi3;
eta2= (lognrnd(mueta,sigmaeta, K,N));
eta1= (lognrnd(mueta,sigmaeta, K(1),N));
S1K3=xi3.*eta3;
SK2=xi2;
SK1=xi1;
gK3=sum(S1K3)./sum(SK3);
S1K2=xi2.*eta2;
S1K1=xi1.*eta1;
lgK3=log(gK3);
gK2=sum(S1K2)./sum(SK2);
gK1=sum(S1K1)./sum(SK1);
%stgK3=(lgK3-mean(lgK3))*sqrt(K(3));
[yK2,xK2]=hist(log(gK2),100);
lgK1=log(gK1);
[yK3,xK3]=hist(lgK3,100);
yK2=yK2/sum(yK2);
%stgK1=(lgK1-mean(lgK1))*sqrt(K(1));
yK3=yK3/sum(yK3);
plot(xK2,log(yK2),'b.')
[yK1,xK1]=hist(lgK1,100);
plot(xK3,log(yK3),'g.')
hold on
yK1=yK1/sum(yK1);
legend('K=10','K=100','K=1000')
%stx1= (xK1-mean(gK1))*sqrt(K(1));
hold off
xi3 = (lognrnd(muxi,sigmaxi(3),K,N));
plot(xK1,log(yK1),'r.')
K=100;
eta3= (lognrnd(mueta,sigmaeta, K,N));
hold on
N=10000;
SK3=xi3;
xi2 = (lognrnd(muxi,sigmaxi(1),K(2),N));
muxi=2.44;
S1K3=xi3.*eta3;
eta2= (lognrnd(mueta,sigmaeta, K(2),N));
mueta=(0.016);
gK3=sum(S1K3)./sum(SK3);
SK2=xi2;
sigmaeta=sqrt(0.36);
[yK3,xK3]=hist(log(gK3),100);
S1K2=xi2.*eta2;
xi1 = (lognrnd(muxi,sigmaxi(1),K,N));
yK3=yK3/sum(yK3);
gK2=sum(S1K2)./sum(SK2);
eta1= (lognrnd(mueta,sigmaeta, K,N));
plot(xK3,log(yK3),'g.')
lgK2=log(gK2);
SK1=xi1;
legend('Vxi=1','Vxi=5.13','Vxi=50')
METODI STOCASTICI
Analisi della dimensione e della crescita
PDF del tasso di crescita standardizzato per quattro diversi livelli di aggregazione: PIL per paese,
imprese farmaceutiche, imprese manifatturiere, prodotti farmaceutici.
Fitting attraverso una mistura esponenziale di gaussiane.
METODI STOCASTICI
Analisi della dimensione e della crescita
Modello teorico per il tasso di crescita
METODI STOCASTICI
Analisi della dimensione e della crescita
Code della distribuzione del tasso di crescita standardizzato per quattro diversi livelli di
aggregazione: PIL per paese, imprese farmaceutiche, imprese manifatturiere, prodotti
farmaceutici.
Le code della distribuzione del tasso di crescita possono essere approssimate (ad ogni
livello di aggregazione) da una power law con esponente = 3
METODI STOCASTICI
Analisi della dimensione e della crescita
Corpo della distribuzione del tasso di crescita standardizzato per quattro diversi livelli di
aggregazione: PIL per paese, imprese farmaceutiche, imprese manifatturiere, prodotti
farmaceutici.
La distribuzione Laplace si adatta al tasso di crescita empirico solo
per un range ristretto.
METODI STOCASTICI
Analisi della dimensione e della crescita
Variabilità cross country: il tasso di crescita
Prodotti
Prodotti
Prodotti
2
2
2
EU15+USA
ITA
FRA
0
EU15+USA
SWE
NET
GER
0
0
-2
-2
-4
-4
-4
P(g)
P(g)
P(g)
-2
-6
-6
-6
-8
-8
-8
-10
-10
-10
-12
-15
-10
-5
0
5
Tasso di crescita standardizzato
10
15
EU15+USA
USA
UK
-12
-15
-10
-5
0
5
Tasso di crescita standardizzato
10
15
-12
-15
-10
-5
0
5
Tasso di crescita standardizzato
10
15
METODI STOCASTICI
Analisi della dimensione e della crescita
Variabilità cross country: la dimensione
Prodotti
Prodotti
0
-2
0
EU15+USA
USA
UK
GER
-2
-4
-6
Log PDF
Log PDF
-4
EU15+USA
SWE
ITA
NET
FRA
-8
-6
-8
-10
-10
-12
-8
-6
0
-2
-4
Dimensione Standardizzata
2
4
-12
-8
-6
0
-2
-4
Dimensione standardizzata
2
4
METODI STOCASTICI
Analisi della dimensione e della crescita
Dati empirici: Dimensione dei prodotti e delle aziende nel settore farmaceutico
Si nota che, a differenza di quanto avviene per i prodotti, per le aziende la distribuzione lognormale
(γ=0) non non riesce a spiegare il fenomeno della coda pesante nella distribuzione della dimensione.
METODI STOCASTICI
Analisi della dimensione e della crescita
Relazione tra dimensione e varianza del tasso di crescita
La relazione tra varianza e tasso di crescita ha un comportamento approssimativamente
power-law σ (S) ≈ S-β (S) dove S è la dimensione delle imprese e β (S) ≈ 0.2 è un esponente
che dipende da S.
β (S) mostra crossover da β(0) = 0 a β (∞) = 1/2. Per un insieme realistico di β(S) è
approssimativamente costante e può variare tra 0.14 a 0.2 a seconda del numero medio di
unità nelle imprese.
ANALISI ECONOMETRICA
Identificazione dell’effetto causale
. Il problema della selezione
Per valutare l’effetto causale di un programma di trattamento (una riforma scolastica, una cura medica,
un sostegno ai disoccupati) sugli individui è possibile confrontare i risultati degli individui «trattati» con
i «non trattati».
ESEMPIO ->
Domanda di ricerca: Trascorrere un periodo in ospedale migliora lo stato di salute dell’individuo?
Risposta: Se confrontiamo lo stato di salute degli individui usciti dall’ospedale con quelli mai entrati in
ospedale, possiamo trarre un’indicazione dell’effetto del «trattamento» a condizione che non ci sia un
selection bias. È tuttavia altamente probabile che il sottoporsi alle cure ospedaliere sia influenzato in
primo luogo dallo stato di salute iniziale, quindi anche se l’ospedalizzazione migliora effettivamente lo
stato di salute, un semplice confronto fra individui trattati e non trattati non consente di identificare
l’effetto causale.
. Soluzione al problema della selezione: assegnamento casuale
Se attraverso un esperimento naturale fosse possibile selezionare in modo casuale gli individui
sottoposti al trattamento, l’effetto causale sarebbe identificabile in quanto l’assegnamento casuale
renderebbe il trattamento indipendente dai risultati possibili.
ANALISI ECONOMETRICA
Identificazione dell’effetto causale
Strumenti fondamentali per l’econometria applicata
1. Modelli di regressione con variabili di controllo
2. Metodi con variabili strumentali
3. Strategie difference-in-differences
ANALISI ECONOMETRICA
Identificazione dell’effetto causale
1) Modelli di regressione con variabili di controllo
Sotto quali condizioni un coefficiente di regressione può essere interpretato come effetto
causale?
- Ipotesi di indipendenza condizionale: Condizionatamente alle caratteristiche osservabili
l’assegnazione al trattamento è indipendente sia dall’outcome sotto trattamento che
dall’outcome senza trattamento. In altre parole le variabili di controllo devono essere scelte in
modo da isolare l’effetto della variabile oggetto di studio dalle interdipendenze con le altre.
ANALISI ECONOMETRICA
Identificazione dell’effetto causale
2) Metodi di variabili strumentali
Se la variabile di cui si vuole stimare l’effetto è «endogena», ovvero è correlata a una variabile
rilevante nel determinare l’outcome ma non inclusa nella regressione (per esempio perché
non osservabile), la stima del coefficiente di regressione è distorta e l’effetto causale non è
identificato.
Per identificare l’effetto causale si ricorre ad uno «strumento», ovvero una variabile correlata
alla variabile endogena ma incorrelata alla variabile omessa.
ESEMPIO ->
Si vuole stimare l’effetto degli anni di scuola sul salario. Gli anni di scuola potrebbero essere
correlati all’abilità, variabile non osservabile che influenza il salario. Un possibile strumento è
rappresentato dal trimestre di nascita: negli USA alcune persone possono essere costrette ad
andare a scuola per un tempo superiore ad altre, e questo potrebbe essere funzione del
trimestre di nascita (Angrist-Kruger, 1991).
ANALISI ECONOMETRICA
Identificazione dell’effetto causale
3) Strategie Difference-in-Differences
Si utilizzano per identificare l’effetto di un intervento/una misura attraverso il confronto fra un
gruppo di trattamento ed un gruppo di controllo. Si calcola la media della variabile outcome
(y) per entrambi i gruppi (yT, yC), prima e dopo l’entrata in vigore della riforma (y0, y1), poi si
procede a calcolare la differenza fra le differenze delle medie:
EFFETTO CAUSALE: (yT1 – yC1) – (yT0 – yC0).
ESEMPIO ->
Si vuole stimare l’effetto di un irrigidimento delle condizioni di accesso ai sussidi di disoccupazione sui flussi
in uscita dal claimant pool: l’esempio del Regno Unito con l’introduzione del «Jobseeker’s Allowance»,
Ottobre 1996 (Manning 2009, Petrongolo 2010).
Gruppo di treatment: percettori di sussidio nel terzo trimestre 1996 che fuoriescono dal pool nel trimestre
successivo (dopo l’introduzione della riforma).
Gruppo di controllo: percettori di sussidio nel secondo trimestre 1996 che fuoriescono dal pool nel trimestre
successivo (prima ancora della riforma).
Si sottrae al tasso di flusso in uscita relativo al gruppo di trattamento quello relativo al gruppo di controllo.
Al risultato di questa differenza si sottrae la medesima differenza calcolata sul 1995 (o sul 1997 o su
entrambi) per eliminare possibili effetti di stagionalità.
Scarica

presentazione