Struttura e dinamica dei sistemi economici Alcuni strumenti d’indagine Fabio Pammolli [email protected] QUALE MODELLO ORGANIZZATIVO IMT LAB RACCOLTA , INTEGRAZIONE ED ELABORAZIONE DATI IMT Lab Ambiti di applicazione (esempi) Istituzioni Demografia Regioni Micro dati longitudinali (lavoratori, famiglie, imprese, produzione, commercio…) Micro dati, Regioni, Istituzioni Quale ruolo per analisi esplorative Sistemi dipendenti dagli stati vs. sistemi che registrano cambiamenti qualitativi e nelle leggi di trasformazione. Metodi di pattern recognition in senso lato. Assunzioni sulla razionalità degli agenti economici vs. modelli stocastici. Modelli distributivi consegnati dalla teoria vs. modelli distributivi reali. Problemi di aggregazione, ruolo e status di eventi ‘rari’ Strumenti Metodi topologici Analisi esplorativa Analisi di aggregazione e distribuzione nei sistemi economici Analisi econometriche Metodi grafici e visualizzazione Metodi stocastici Test econometrici Causalità METODI TOPOLOGICI Dulmage–Mendelsohn Decomposition Principali proprietà strutturali del grafo I 1981 C C 1992 C T T C Rappresentazione stilizzata della dinamica della rete di accordi nel comparto biotech, 1981- METODI TOPOLOGICI Studio della crescita di grafi (reti di contratti, flussi di commercio estero….) Nodi trasversali e co-specializzati H1 Core CospDev TransDev CospOr H2 Fringe CospDev TransOr CospOr METODI TOPOLOGICI Dulmage–Mendelsohn Decomposition Numero di imprese per categoria relazionale. METODI GRAFICI E VISUALIZZAZIONE Network dei brevetti co-assegnati METODI GRAFICI E VISUALIZZAZIONE Analisi delle corrispondenze: Detentori di brevetti europei e classi terapeutiche METODI STOCASTICI Analisi della dimensione e della crescita METODI GRAFICI E VISUALIZZAZIONE Analisi delle corrispondenze: Detentori di brevetti statunitensi e classi terapeutiche METODI STOCASTICI Analisi della dimensione e della crescita Esempi di Zipf’s Law: • distribuzione della frequenza delle parole in un testo (Zipf, 1949) • distribuzione delle dimensioni delle città (Gabaix, 1999) Zipf law: Distribuzione delle 200 città più grandi (USA) Zipf law: Conteggio delle 200 parole più utilizzate in un testo in italiano 6.5 1 parole/graduatoria interpolazione lineare 6 conteggio parole(scala logaritmica) 5 "che"(148) 4.5 4 3.5 3 2.5 "New York" "LA" 0 "di"(220) dimensione(scala logaritmica) "e"(274) 5.5 "Chicago" -1 beta = -1.0647 -2 -3 beta = -0.85694 -4 2 1.5 0 1 2 3 4 graduatoria parole(scala logaritmica) 5 6 -5 0 1 2 3 4 graduatoria città(scala logaritmica) 5 6 METODI STOCASTICI Analisi della dimensione e della crescita Dimensione e Crescita in letteratura: Dimensione: La dimensione ha distribuzione lognormale Crescita: La crescita segue le ipotesi di Gibrat Tasso di crescita: Il tasso di crescita ha un distribuzione almeno esponenziale (Laplace) o addirittura con code più pesanti. Una distribuzione con code grasse associa a eventi rari (sulle code) una probabilità maggiore di quella associata a un Gaussiana. METODI STOCASTICI Analisi della dimensione e della crescita Modello di crescita proporzionale Assunzioni del modello: • Al tempo t(0) ci sono N(0) (nell’esempio N(0)=2) classi con n(0) unità( nell’esempio 5) • L’area di ogni cerchio è proporzionale alla dimensione dell’unità e la dimensione di ogni classe è la somma delle aree delle unità che la costituiscono (see Assumption 5). • Al tempo t+1 si crea una una nuova unità. • Con probabilità b la nuova unità è assegnata ad una nuova classe (classe 3 nell’esempio). • Con probabilità 1-b la nuova unità è assegnata a una classe esistente con probabilità proporzionale al numero di unità nella classe (nell’esempio una nuova unità viene assegnata alla classe 1 con probabilità 3/5 o alla classe 2 con prababilità 2/5. METODI STOCASTICI Analisi della dimensione e della crescita Legge di Gibrat METODI STOCASTICI Analisi della dimensione e della crescita -2 Vxi=1 Vxi=5.13 Vxi=50 -3 -4 Simulazione di P(g|K) in Matlab P(g|K) -5 -6 -7 -8 -9 -10 -2.5 -2 -1.5 -1 -0.5 0 0.5 (g-m)/sigma 1 1.5 2 2.5 METODI STOCASTICI Analisi della dimensione e della crescita Script in Matlab %K number of units for class %stgK2=(lgK2-mean(lgK2))*sqrt(K(2)); S1K1=xi1.*eta1; %N number of classes [yK2,xK2]=hist(lgK2,100); gK1=sum(S1K1)./sum(SK1); K=[10;100;1000]; yK2=yK2/sum(yK2); [yK1,xK1]=hist(log(gK1),100); sigmaxi=[1;sqrt(5.13);sqrt(100)]; %stx2= xK2-mean(xK2); yK1=yK1/sum(yK1); N=10000; plot(xK2,log(yK2),'b.') plot(xK1,log(yK1),'r.') muxi=2.44; hold on hold on mueta=(0.016); xi3 = (lognrnd(muxi,sigmaxi(1),K(3),N)); sigmaeta=sqrt(0.36); eta3= (lognrnd(mueta,sigmaeta, K(3),N)); xi2 = (lognrnd(muxi,sigmaxi(2),K,N)); xi1 = (lognrnd(muxi,sigmaxi(1),K(1),N)); SK3=xi3; eta2= (lognrnd(mueta,sigmaeta, K,N)); eta1= (lognrnd(mueta,sigmaeta, K(1),N)); S1K3=xi3.*eta3; SK2=xi2; SK1=xi1; gK3=sum(S1K3)./sum(SK3); S1K2=xi2.*eta2; S1K1=xi1.*eta1; lgK3=log(gK3); gK2=sum(S1K2)./sum(SK2); gK1=sum(S1K1)./sum(SK1); %stgK3=(lgK3-mean(lgK3))*sqrt(K(3)); [yK2,xK2]=hist(log(gK2),100); lgK1=log(gK1); [yK3,xK3]=hist(lgK3,100); yK2=yK2/sum(yK2); %stgK1=(lgK1-mean(lgK1))*sqrt(K(1)); yK3=yK3/sum(yK3); plot(xK2,log(yK2),'b.') [yK1,xK1]=hist(lgK1,100); plot(xK3,log(yK3),'g.') hold on yK1=yK1/sum(yK1); legend('K=10','K=100','K=1000') %stx1= (xK1-mean(gK1))*sqrt(K(1)); hold off xi3 = (lognrnd(muxi,sigmaxi(3),K,N)); plot(xK1,log(yK1),'r.') K=100; eta3= (lognrnd(mueta,sigmaeta, K,N)); hold on N=10000; SK3=xi3; xi2 = (lognrnd(muxi,sigmaxi(1),K(2),N)); muxi=2.44; S1K3=xi3.*eta3; eta2= (lognrnd(mueta,sigmaeta, K(2),N)); mueta=(0.016); gK3=sum(S1K3)./sum(SK3); SK2=xi2; sigmaeta=sqrt(0.36); [yK3,xK3]=hist(log(gK3),100); S1K2=xi2.*eta2; xi1 = (lognrnd(muxi,sigmaxi(1),K,N)); yK3=yK3/sum(yK3); gK2=sum(S1K2)./sum(SK2); eta1= (lognrnd(mueta,sigmaeta, K,N)); plot(xK3,log(yK3),'g.') lgK2=log(gK2); SK1=xi1; legend('Vxi=1','Vxi=5.13','Vxi=50') METODI STOCASTICI Analisi della dimensione e della crescita PDF del tasso di crescita standardizzato per quattro diversi livelli di aggregazione: PIL per paese, imprese farmaceutiche, imprese manifatturiere, prodotti farmaceutici. Fitting attraverso una mistura esponenziale di gaussiane. METODI STOCASTICI Analisi della dimensione e della crescita Modello teorico per il tasso di crescita METODI STOCASTICI Analisi della dimensione e della crescita Code della distribuzione del tasso di crescita standardizzato per quattro diversi livelli di aggregazione: PIL per paese, imprese farmaceutiche, imprese manifatturiere, prodotti farmaceutici. Le code della distribuzione del tasso di crescita possono essere approssimate (ad ogni livello di aggregazione) da una power law con esponente = 3 METODI STOCASTICI Analisi della dimensione e della crescita Corpo della distribuzione del tasso di crescita standardizzato per quattro diversi livelli di aggregazione: PIL per paese, imprese farmaceutiche, imprese manifatturiere, prodotti farmaceutici. La distribuzione Laplace si adatta al tasso di crescita empirico solo per un range ristretto. METODI STOCASTICI Analisi della dimensione e della crescita Variabilità cross country: il tasso di crescita Prodotti Prodotti Prodotti 2 2 2 EU15+USA ITA FRA 0 EU15+USA SWE NET GER 0 0 -2 -2 -4 -4 -4 P(g) P(g) P(g) -2 -6 -6 -6 -8 -8 -8 -10 -10 -10 -12 -15 -10 -5 0 5 Tasso di crescita standardizzato 10 15 EU15+USA USA UK -12 -15 -10 -5 0 5 Tasso di crescita standardizzato 10 15 -12 -15 -10 -5 0 5 Tasso di crescita standardizzato 10 15 METODI STOCASTICI Analisi della dimensione e della crescita Variabilità cross country: la dimensione Prodotti Prodotti 0 -2 0 EU15+USA USA UK GER -2 -4 -6 Log PDF Log PDF -4 EU15+USA SWE ITA NET FRA -8 -6 -8 -10 -10 -12 -8 -6 0 -2 -4 Dimensione Standardizzata 2 4 -12 -8 -6 0 -2 -4 Dimensione standardizzata 2 4 METODI STOCASTICI Analisi della dimensione e della crescita Dati empirici: Dimensione dei prodotti e delle aziende nel settore farmaceutico Si nota che, a differenza di quanto avviene per i prodotti, per le aziende la distribuzione lognormale (γ=0) non non riesce a spiegare il fenomeno della coda pesante nella distribuzione della dimensione. METODI STOCASTICI Analisi della dimensione e della crescita Relazione tra dimensione e varianza del tasso di crescita La relazione tra varianza e tasso di crescita ha un comportamento approssimativamente power-law σ (S) ≈ S-β (S) dove S è la dimensione delle imprese e β (S) ≈ 0.2 è un esponente che dipende da S. β (S) mostra crossover da β(0) = 0 a β (∞) = 1/2. Per un insieme realistico di β(S) è approssimativamente costante e può variare tra 0.14 a 0.2 a seconda del numero medio di unità nelle imprese. ANALISI ECONOMETRICA Identificazione dell’effetto causale . Il problema della selezione Per valutare l’effetto causale di un programma di trattamento (una riforma scolastica, una cura medica, un sostegno ai disoccupati) sugli individui è possibile confrontare i risultati degli individui «trattati» con i «non trattati». ESEMPIO -> Domanda di ricerca: Trascorrere un periodo in ospedale migliora lo stato di salute dell’individuo? Risposta: Se confrontiamo lo stato di salute degli individui usciti dall’ospedale con quelli mai entrati in ospedale, possiamo trarre un’indicazione dell’effetto del «trattamento» a condizione che non ci sia un selection bias. È tuttavia altamente probabile che il sottoporsi alle cure ospedaliere sia influenzato in primo luogo dallo stato di salute iniziale, quindi anche se l’ospedalizzazione migliora effettivamente lo stato di salute, un semplice confronto fra individui trattati e non trattati non consente di identificare l’effetto causale. . Soluzione al problema della selezione: assegnamento casuale Se attraverso un esperimento naturale fosse possibile selezionare in modo casuale gli individui sottoposti al trattamento, l’effetto causale sarebbe identificabile in quanto l’assegnamento casuale renderebbe il trattamento indipendente dai risultati possibili. ANALISI ECONOMETRICA Identificazione dell’effetto causale Strumenti fondamentali per l’econometria applicata 1. Modelli di regressione con variabili di controllo 2. Metodi con variabili strumentali 3. Strategie difference-in-differences ANALISI ECONOMETRICA Identificazione dell’effetto causale 1) Modelli di regressione con variabili di controllo Sotto quali condizioni un coefficiente di regressione può essere interpretato come effetto causale? - Ipotesi di indipendenza condizionale: Condizionatamente alle caratteristiche osservabili l’assegnazione al trattamento è indipendente sia dall’outcome sotto trattamento che dall’outcome senza trattamento. In altre parole le variabili di controllo devono essere scelte in modo da isolare l’effetto della variabile oggetto di studio dalle interdipendenze con le altre. ANALISI ECONOMETRICA Identificazione dell’effetto causale 2) Metodi di variabili strumentali Se la variabile di cui si vuole stimare l’effetto è «endogena», ovvero è correlata a una variabile rilevante nel determinare l’outcome ma non inclusa nella regressione (per esempio perché non osservabile), la stima del coefficiente di regressione è distorta e l’effetto causale non è identificato. Per identificare l’effetto causale si ricorre ad uno «strumento», ovvero una variabile correlata alla variabile endogena ma incorrelata alla variabile omessa. ESEMPIO -> Si vuole stimare l’effetto degli anni di scuola sul salario. Gli anni di scuola potrebbero essere correlati all’abilità, variabile non osservabile che influenza il salario. Un possibile strumento è rappresentato dal trimestre di nascita: negli USA alcune persone possono essere costrette ad andare a scuola per un tempo superiore ad altre, e questo potrebbe essere funzione del trimestre di nascita (Angrist-Kruger, 1991). ANALISI ECONOMETRICA Identificazione dell’effetto causale 3) Strategie Difference-in-Differences Si utilizzano per identificare l’effetto di un intervento/una misura attraverso il confronto fra un gruppo di trattamento ed un gruppo di controllo. Si calcola la media della variabile outcome (y) per entrambi i gruppi (yT, yC), prima e dopo l’entrata in vigore della riforma (y0, y1), poi si procede a calcolare la differenza fra le differenze delle medie: EFFETTO CAUSALE: (yT1 – yC1) – (yT0 – yC0). ESEMPIO -> Si vuole stimare l’effetto di un irrigidimento delle condizioni di accesso ai sussidi di disoccupazione sui flussi in uscita dal claimant pool: l’esempio del Regno Unito con l’introduzione del «Jobseeker’s Allowance», Ottobre 1996 (Manning 2009, Petrongolo 2010). Gruppo di treatment: percettori di sussidio nel terzo trimestre 1996 che fuoriescono dal pool nel trimestre successivo (dopo l’introduzione della riforma). Gruppo di controllo: percettori di sussidio nel secondo trimestre 1996 che fuoriescono dal pool nel trimestre successivo (prima ancora della riforma). Si sottrae al tasso di flusso in uscita relativo al gruppo di trattamento quello relativo al gruppo di controllo. Al risultato di questa differenza si sottrae la medesima differenza calcolata sul 1995 (o sul 1997 o su entrambi) per eliminare possibili effetti di stagionalità.