XI Conferenza nazionale di Statistica 20-21 febbraio 2013 Pillole formative di statistica Introduzione a In 90 minuti: 1. L’ambiente R: il sito CRAN, il linguaggio, i pacchetti, le interfacce (Rstudio) 2. L’utilizzo del pacchetto Rcmdr per l’analisi statistica di base 3. Breve esercitazione 1993-2013: R ha venti anni • • • • • • 1991 - Ross Ihaka e Robert Gentleman («R&R») iniziano a lavorare al nuovo progetto che verrà chiamato «R» 1993 - Primo rilascio di R 1995 - R diventa disponibile con la licenza General Public License (GPL) 1997 - Viene fondato il gruppo di sviluppo «R core» 2002 - Viene creata la «R foundation for Statistical computing» (Vienna) 2012 - Situazione attuale: – – – – 2 milioni di utenti 2000 sviluppatori di pacchetti R 4000 pacchetti R disponibili sui siti CRAN e Bioconductor 1200 progetti in corso su R-forge La diffusione e lo sviluppo di R Fonte: The Popularity of Data Analysis Software by Robert Muenchen http://r4stats.com/articles/popularity/ La diffusione e lo sviluppo di R Fonte: The Popularity of Data Analysis Software by Robert Muenchen http://r4stats.com/articles/popularity/ Che cos’è R • R è sia un linguaggio di programmazione, che un ambiente di elaborazione • Come linguaggio, appartiene alla famiglia dei linguaggi funzionali, ma è anche utilizzabile per la programmazione ad oggetti • Come ambiente, offre agli utenti – una serie di librerie di base (associate alla distribuzione); – librerie aggiuntive (4000 pacchetti) per particolari esigenze di analisi e elaborazione; – interfacce amichevoli. Il sito ufficiale di R e CRAN R ha un suo sito ufficiale: http://www.r-project.org/ CRAN (Comprehensive R Archive Network) è il sito gestito da «R core team»: http://cran.r-project.org/ In esso è possibile: effettuare il download della distribuzione R (Windows, Linux o Apple); visualizzare i package di interesse (organizzati secondo le «task views») e scaricare quelli di interesse; reperire la documentazione (manuali) di base e avanzata. CRAN: il sito ufficiale di R RStudio: una interfaccia IDE per R Rstudio è una delle interfacce più utilizzate, dopo quella disponibile nativamente in R. E’ di tipo IDE (Integrated Development Environment). E’ anch’essa open source, scaricabile dal sito: http://www.rstudio.com/ Consente di: • scrivere codice usufruendo di tutte le funzionalità più avanzate (syntax highlighting, code completion, and smart indentation); • eseguire direttamente il codice; • visualizzare dati e oggetti nella workspace; • installare i package R e consultarne l’help online; • e altro ancora… RStudio: una interfaccia IDE per R Rcmdr: una interfaccia per l’analisi dei dati Rcmdr è un pacchetto R che dispone di una interfaccia che consente all’utente di condurre analisi statistiche dei dati senza dover sviluppare codice R. E’ installabile da CRAN, o direttamente da Rstudio. Rcmdr: una interfaccia per l’analisi dei dati