Curriculum dell’Attività Scientifica e Didattica Riccardo Martoglia 1. Informazioni generali 1.1.
Dati anagrafici e recapiti Luogo di nascita: Modena Data di nascita: 8 novembre 1976 Codice fiscale: MRTRCR76S08F257S Nazionalità: Italiana Residenza: via Galilei, 34 41030 Bastiglia (MO) Indirizzo ufficio: DII (Dipartimento di Ingegneria dell’Informazione) Università di Modena e Reggio Emilia Via Vignolese, 905/b 41100, Modena Tel.: +39‐059‐2056142 Fax: +39‐059‐2056129 E‐mail: [email protected] Web: http://www.isgroup.unimo.it/riccardo 1.2.
Posizione attuale Dal 1° novembre 2005 è Ricercatore Universitario presso la Facoltà di Scienze Matematiche, Fisiche e Naturali (sede di Modena) dell'Università degli studi di Modena e Reggio Emilia, nel settore scientifico disciplinare ING‐INF/05 e afferisce al Dipartimento di Ingegneria dell'Informazione. 1.3.
Curriculum Vitæ •
Nel marzo 2002 ha conseguito la Laurea in Ingegneria Informatica, con voti 110 su 110 e lode, presso l’Università degli Studi di Modena e Reggio Emilia, discutendo la Tesi: Progetto e Sviluppo di un Ambiente per Traduzioni Multilingua Assistite (relatore: Prof. Paolo Tiberio); •
Nell’aprile 2002 ha vinto il Premio Miglior tesi sperimentale in Ingegneria discussa nell’anno 2001/2002 presso l’Università di Modena e Reggio Emilia (Fondazione Cassa di Risparmio di Carpi); •
Nel giugno 2002 ha sostenuto con esito positivo l’Esame di abilitazione alla Professione di Ingegnere, presso l’Università degli Studi di Modena e Reggio Emilia; •
Da maggio 2002 ad agosto 2002 ha collaborato con il Dipartimento di Ingegneria dell’Informazione dell’Università di Modena e Reggio Emilia con un contratto di ricerca sul tema “Studio delle specifiche funzionali e realizzazione di un prototipo di un sistema per la ricerca di similarità su dati testuali”; •
Da settembre 2002 a dicembre 2002 ha collaborato con il Dipartimento di Ingegneria dell’Informazione dell’Università di Modena e Reggio Emilia con un contratto di ricerca sul tema “Studio delle specifiche funzionali e realizzazione di un prototipo di un sistema per la ricerca di similarità su dati XML”; •
Nel gennaio 2003 ha vinto il concorso per il corso di Dottorato di Ricerca in Ingegneria dell’Informazione presso l’Università di Modena e Reggio Emilia, cui attualmente è iscritto al terzo anno; •
Nel 2003 ha progettato e realizzato il sito web del gruppo di ricerca di cui è membro, l’Information Systems Group, e dei Corsi di Fondamenti di Informatica A, Fondamenti di Informatica B e Sistemi Informativi per il Dipartimento di Ingegneria dell’Informazione, Università di Modena e Reggio Emilia. Da allora ne cura anche il continuo aggiornamento tecnologico e contenutistico; •
Dal 2003 ha curato per la Facoltà di Ingegneria, Università di Modena e Reggio Emilia, la realizzazione di uno strumento software per la gestione delle conversioni degli esami dal Vecchio al Nuovo Ordinamento e per il calcolo delle medie; 1
•
Nei mesi di novembre e dicembre 2003 ha svolto, per l’Università degli studi di Modena e Reggio Emilia, attività di predisposizione di software per l’acquisizione destrutturata dei dati dell’Anagrafe delle Pubblicazioni del personale docente; •
Nel febbraio 2006 ha conseguito il titolo di Dottore di Ricerca in Ingegneria dell’Informazione discutendo la tesi Information Retrieval Techniques for Pattern Matching (relatore: Prof. Paolo Tiberio). •
Ha le seguenti conoscenze linguistiche: ottima conoscenza della lingua inglese, discreta conoscenza della lingua francese. 1.4.
Incarichi istituzionali Ha svolto o svolge tuttora le seguenti attività istituzionali: •
Referente per l'attività di redazione degli orari e gestione delle aule per il C.d.L. triennale in Informatica per gli AA. 2008/2009 e 2007/2008; •
Referente per l'attività di redazione degli orari e gestione delle aule per il C.d.L. magistrale in Informatica per l’AA. 2008/2009; •
Referente per l'attività di redazione degli orari e gestione delle aule per il C.d.L. triennale in Scienze dell’Informazione per gli AA. 2006/2007 e 2005/2006; •
Responsabile delle attività di Tirocinio per il C.d.L. triennale in Informatica per gli A.A. 2008/2009 e 2007/2008; •
Componente del Collegio della Scuola di Dottorato in Information and Communication Technology nella quale afferisce al corso in Computer Engineering and Science dall' AA. 2005/2006. 1.5.
Partecipazione a commissioni esaminatrici Ha partecipato alle seguenti commissioni: •
Membro esperto della commissione esaminatrice per l'Esame di Stato per l'abilitazione alla professione di Ingegnere e Ingegnere junior presso la Facoltà di Ingegneria (sede di Modena) dell'Università degli Studi di Modena e Reggio Emilia nella I sessione del 2008; •
Membro esperto della commissione esaminatrice per l'Esame di Stato per l'abilitazione alla professione di Ingegnere e Ingegnere junior presso la Facoltà di Ingegneria (sede di Modena) dell'Università degli Studi di Modena e Reggio Emilia nella I e II sessione del 2007. 2.
Attività Didattica 2.1.
Attività di docenza L’attività didattica di Riccardo Martoglia si è svolta prevalentemente presso la Facoltà di Scienze Matematiche, Fisiche e Naturali e presso la Facoltà di Ingegneria, Università degli Studi di Modena e Reggio Emilia, sede di Modena. •
È titolare del corso di Basi di Dati (9 CFU) per il C.d.L. Triennale in Informatica, Università degli Studi di Modena e Reggio Emilia, dall’anno accademico 2008/2009; •
È titolare del corso di Tecniche Evolute per la Gestione dei Dati (9 CFU) per il C.d.L. Magistrale in Informatica, Università degli Studi di Modena e Reggio Emilia, dall’anno accademico 2008/2009; •
È stato titolare dei corsi di Basi di Dati (6 CFU) e Progetto di Basi di Dati (6 CFU) per il C.d.L. Triennale in Informatica, Università degli Studi di Modena e Reggio Emilia, per l’anno accademico 2007/2008; •
È stato titolare del corso di Basi di Dati (8 CFU) per il C.d.L. Triennale in Scienze dell’Informazione, Università degli Studi di Modena e Reggio Emilia, per gli anni accademici 2006/2007 e 2005/2006; •
È stato supplente, per un totale di 18 ore di lezione, del corso di Sistemi di Information Retrieval per il C.d.L. Specialistica in Ingegneria Informatica (Nuovo Ordinamento), Università degli Studi di Modena e Reggio Emilia, titolare Prof. Federica Mandreoli, anno accademico 2005/2006; •
È stato tutor del corso di Fondamenti di Informatica A per il Corso Ingegneri dell’Esercito Italiano, Accademia Militare di Modena, Università degli Studi di Modena e Reggio Emilia, titolare Prof. Paolo Tiberio, anni accademici 2008/2009 e 2007/2008; •
È stato tutor del corso di Fondamenti di Informatica A per i CC.d.L. in Ingegneria Elettronica e Telecomunicazioni e per il Corso Ingegneri dell’Esercito Italiano, Accademia Militare di Modena, Università degli Studi di Modena e Reggio Emilia, titolare Prof. Paolo Tiberio, anni accademici 2003/2004 e 2002/2003; •
È stato tutor del corso di Fondamenti di Informatica B per i CC.d.L. in Ingegneria Elettronica e Telecomunicazioni (Nuovo Ordinamento), Università degli Studi di Modena e Reggio Emilia, titolare Dott. Federica Mandreoli, anno accademico 2002/2003; •
Ha tenuto cicli di lezione riguardanti le caratteristiche e le applicazioni del linguaggio XML per i seguenti corsi: -
corso di Sistemi di Information Retrieval per il C.d.L. Specialistica in Ingegneria Informatica (Nuovo Ordinamento), Università degli Studi di Modena e Reggio Emilia, titolare Prof. Federica Mandreoli, anni accademici 2007/2008, 2006/2007, 2005/2006 e 2004/2005; -
corso di Sistemi Informativi per i CC.d.L. in Ingegneria Informatica (Vecchio Ordinamento) e Specialistica in Ingegneria Informatica (Nuovo Ordinamento), Università degli Studi di Modena e Reggio Emilia, titolare Prof. Paolo Tiberio, anno accademico 2003/2004; -
corso di Sistemi Informativi per il C.d.L. in Ingegneria Informatica (Vecchio Ordinamento), Università degli Studi di Modena e Reggio Emilia, titolare Prof. Paolo Tiberio, anno accademico 2002/2003; •
Ha tenuto cicli di lezione riguardanti Similarità e Ricerca approssimata su dati testuali per il corso di Sistemi Informativi, C.d.L. (Vecchio Ordinamento) in Ingegneria Informatica, Università degli Studi di Modena e Reggio Emilia, titolare Prof. Paolo Tiberio, anno accademico 2003/2004; •
Ha tenuto lezioni introduttive all’uso del computer, al linguaggio C e all’uso di ambienti di programmazione integrati per studenti stranieri del corso di Fondamenti di Informatica A, CC.d.L. in Ingegneria Informatica, Elettronica e Telecomunicazioni (Nuovo Ordinamento), Università degli Studi di Modena e Reggio Emilia, titolare Prof. Paolo Tiberio, anno accademico 2004/2005; •
Ha tenuto lezioni su funzioni di libreria, record di attivazione, matrici, file, allocazione dinamica e algoritmi di ordinamento nel corso di Fondamenti di Informatica B per i CC.d.L. in Ingegneria Elettronica e Telecomunicazioni (Nuovo Ordinamento), Università degli Studi di Modena e Reggio Emilia, titolare Dott. Federica Mandreoli, anno accademico 2003/2004. 2.2.
Tesi di Laurea •
È stato relatore di 6 Tesi di Laurea di primo livello in Informatica e Scienze dell’Informazione per l’Università di Modena e Reggio Emilia su diversi argomenti, tra cui: word sense disambiguation di informazioni strutturali e multilingua; gestione via web di basi di dati di pubblicazioni scientifiche; approximate sequence matching di informazioni testuali; progettazione di sistemi informativi in ambito ospedaliero; •
È stato correlatore di 12 Tesi di Laurea di secondo livello in Ingegneria Informatica per l’Università di Modena e Reggio Emilia e per l’Università di Bologna su diversi argomenti, tra cui: information retrieval e ricerca di similarità su dati testuali; risoluzione di ambiguità semantiche su dati testuali; sistemi per traduzione assistita; interrogazione approssimata e riscrittura di query su dati XML; interrogazione efficiente di documenti XML temporali; routing di interrogazioni in PDMS; •
È stato correlatore di 2 Tesi di Laurea di primo livello in Ingegneria Informatica per l’Università di Modena e Reggio Emilia. 3.
Attività Scientifica L’attività scientifica di Riccardo Martoglia ha avuto inizio nel 2002 e si è svolta presso il Dipartimento di Ingegneria dell’Informazione dell’Università di Modena e Reggio Emilia, sede di Modena. Nel 2002 Riccardo Martoglia ha svolto la propria attività scientifica presso tale dipartimento in qualità di collaboratore a progetti di ricerca, occupandosi di tecniche di ricerca di similartità su dati testuali, con particolare riferimento al contesto della traduzione assistita basata su esempi, e iniziando lo studio relativo a ricerche su dati semi‐strutturati. Nel 2003 Riccardo Martoglia ha vinto il concorso per il dottorato in Ingegneria dell’Informazione presso la stessa università, concluso con l’ottenimento del titolo nel febbraio 2006. Dal novembre 2005 è ricercatore presso il Dipartimento di Ingegneria dell’Informazione dell’Università di Modena e Reggio Emilia e, da allora, ha proseguito la propria attività di ricerca, volta allo studio di nuovi algoritmi e strutture dati che permettano di gestire e di realizzare ricerche in modo efficace ed efficiente sfruttando appieno le enormi potenzialità di repository di grandi quantità di dati distribuiti ed eterogenei. La produzione scientifica di Riccardo Martoglia è documentata dalle pubblicazioni riguardanti i temi di ricerca descritti in Sezione 3.1. L’attività scientifica svolta è dimostrata anche dall’elenco dei progetti di ricerca a cui Riccardo Martoglia ha partecipato e sta partecipando (Sezione 3.2) e dall’attività di revisione descritta in Sezione 3.3. Per quanto riguarda l’apporto individuale di Riccardo Martoglia nei lavori in collaborazione, in ciascuna pubblicazione il contributo di ogni singolo autore è da considerarsi paritetico a quello degli altri co‐autori, come dichiarato all’interno dell’atto di notorietà. È da sottolineare che Riccardo Martoglia ha personalmente partecipato alla maggior parte delle conferenze nelle quali sono stati pubblicati i suoi lavori, effettuando la presentazione dei lavori pubblicati. Riccardo Martoglia ha inoltre partecipato ad un elevato numero di conferenze e scuole nazionali e internazionali per approfondire gli argomenti di ricerca oggetto della sua attività, tra cui la 6th European Conference on Digital Libraries (ECDL 02), tenutasi a Roma nel settembre 2002, il 6th DELOS Thematic Workshop on Digital Library Architectures, tenutosi a S. Margherita di Pula nel giugno 2004 e la 7th EDBT Summer School on XML and Databases, tenutasi a S. Margherita di Pula nel settembre 2004. È inoltre da notare che Riccardo Martoglia si è anche occupato, per ognuna delle tematiche affrontate nella sua ricerca, della progettazione e dell’implementazione di una serie di sistemi, curandone personalmente tutti gli aspetti tecnici. Tali sistemi sono stati indispensabili per permettere di valutare sperimentalmente l’efficacia e l’efficienza delle varie tecniche proposte negli articoli. 3.1.
Temi di Ricerca e Descrizione Sintetica delle Pubblicazioni Il lavoro di ricerca di Riccardo Martoglia concerne lo studio di nuove metodologie per la ricerca efficace ed efficiente in grandi repository distribuiti, lo sviluppo di nuovi strumenti per l’integrazione e la fruizione di risorse informative distribuite, incluse tecniche per il recupero di informazioni semanticamente approssimate e/o personalizzate. In particolare, sono state approfondite tecniche per: query processing in ambienti eterogenei e distribuiti (PDMS, Sezione 3.1.1, e digital library, Sezione 3.1.2), disambiguation di dati semi‐strutturati e a grafo (Sezione 3.1.3), gestione di documenti XML temporali (Sezione 3.1.4) e multi‐versione (Sezione 3.1.5), twig query processing su dati semi‐strutturati e multimediali (Sezione 3.1.6), ricerca di similarità su frasi (Sezione 3.1.7) e documenti (Sezione 3.1.8). 3.1.1. Query processing e network construction in ambienti PDMS [MMP+09b] Federica Mandreoli, Riccardo Martoglia, Wilma Penzo, Giorgio Villani. SFlexible Query Answering on Graph‐modeled Data. In Proc. of the 12th International Conference on Extending Database Technology (EDBT), St. Petersburg, Russia, Marzo 2009. [MMP+09a] Federica Mandreoli, Riccardo Martoglia, Wilma Penzo, Simona Sassatelli. Data‐Sharing P2P Networks with Semantic Approximation Capabilities. Accettato per la pubblicazione in IEEE Internet Computing, 2009. [MMS+08] Federica Mandreoli, Riccardo Martoglia, Simona Sassatelli, Paolo Tiberio, Wilma Penzo, Claudio Gennaro, Matteo Mordacchini, Salvatore Orlando. Toward an Effective and Efficient Query Processing in the NeP4B Project. In Proc. of the V Conference of the Italian Chapter of AIS (itAIS), Paris, France, Dicembre 2008. [MMP+08a] Federica Mandreoli, Riccardo Martoglia, Wilma Penzo, Simona Sassatelli, Giorgio Villani. Paving the Way to an Effective and Efficient Retrieval of Data over Semantic Overlay Networks. In The Semantic Web for Knowledge and Data Management: Technologies and Practices, Zhongmin Ma (Ed.), IGI Global, 2008. [MMP+08e] Federica Mandreoli, Riccardo Martoglia, Wilma Penzo, Simona Sassatelli, Giorgio Villani. Efficient and Effective Query Answering in a PDMS with SUNRISE. In Proc. of the 16th Italian Symposium on Advanced Database Technologies (SEBD), Mondello (PA), Italia, Giugno 2008. [MMP+08d] Federica Mandreoli, Riccardo Martoglia, Wilma Penzo, Simona Sassatelli, Stefano Lodi. Boosting a Network of Semantic Peers. In Proc. of the 16th Italian Symposium on Advanced Database Technologies (SEBD), Mondello (PA), Italia, Giugno 2008. [MMP+08b] Federica Mandreoli, Riccardo Martoglia, Wilma Penzo, Simona Sassatelli, Stefano Lodi. Semantic Peer, Here are the Neighbors You Want! In Proc. of the 11th International Conference on Extending Database Technology (EDBT), Nantes, France, Marzo 2008. [MMP+08c] Federica Mandreoli, Riccardo Martoglia, Wilma Penzo, Simona Sassatelli, Giorgio Villani. Building a PDMS Infrastructure for XML Data Sharing with SUNRISE. In Proc. of the 3rd International EDBT Workshop on Database Technologies for Handling XML Information on the Web (DATAX), Nantes, France, Marzo 2008. [MMP+07a] Federica Mandreoli, Riccardo Martoglia, Wilma Penzo, Simona Sassatelli, Giorgio Villani. SRI@work: Efficient and Effective Routing Strategies in a PDMS. In Proc. of the 8th International Conference on Web Information Systems Engineering (WISE 2007), Nancy, France, Dicembre 2007. [MMP+07b] Federica Mandreoli, Riccardo Martoglia, Wilma Penzo, Simona Sassatelli, Giorgio Villani. SUNRISE: Exploring PDMS Networks with Semantic Routing Indexes. In Proc. of the 4th European Sematic Web Conference (ESWC), Innsbruck, Austria, Giugno 2007. [MMS+06b] Federica Mandreoli, Riccardo Martoglia, Simona Sassatelli, Wilma Penzo. Semantic Query Routing Experiences in a PDMS. In Proc. of the 3rd Italian Semantic Web Workshop (SWAP), Pisa, Italia, Dicembre 2006. [MMS+06a] Federica Mandreoli, Riccardo Martoglia, Simona Sassatelli, Wilma Penzo. SRI: Exploiting Semantic Information for Effective Query Routing in a PDMS. In Proc. of the 8th ACM CIKM International Workshop on Web Information and Data Management (ACM WIDM 2006), Arlington, USA, Novembre 2006. [MMT+06c] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio, Simona Sassatelli, W. Penzo. Using Semantic Mappings for Query Routing in a PDMS Environment. In Proc. of the 14th Italian Symposium on Advanced Database Technologies (SEBD), Portonovo (AN), Italia, Giugno 2006. [TR5] Ilaria Bartolini, Domenico Beneventano, Paolo Ciaccia, Alessandro Linari, Federica Mandreoli, Riccardo Martoglia, Marco Patella, Wilma Penzo, Andrea Proli, Stefano Rizzi. Definition of the ontology‐based query language and query processing techniques. Progetto WISDOM, 2006. [TR4] Matteo Golfarelli, Federica Mandreoli, Riccardo Martoglia, Andrea Proli, Stefano Rizzi, Paolo Tiberio. Critical analysis of query languages and ontology‐based query rewriting techniques. Progetto WISDOM, 2005. Una delle più importanti sfide di ricerca attuali nell’ambito dell’Information Managament riguarda la necessità di governare e accedere in maniera efficace ed efficiente a grandi risorse di dati eterogenee e distribuite. In particolare, le reti peer‐to‐peer per il data sharing e i sistemi Peer Data Management System (PDMS) sono state proposti come una valida soluzione architetturale per la realizzazione del cosiddetto semantic web. In queste reti, i peer sono dotati di schemi in senso lato (solitamente ontologie) e sono connessi semanticamente da mapping che pongono in collegamento gli elementi dei diversi schemi. In questo ambito, sono stati affrontati problemi fondamentali quali organizzazione logica della rete sulla base del contenuto semantico memorizzato in ogni nodo, query routing che sfrutti la semantica rappresentata dalle ontologie e dalle caratteristiche dei dati e della rete di peer, ed interrogazione flessibile di dati strutturati a grafo. In questo modo si è fatto in modo da garantire la massima efficienza ed efficacia nel recupero delle informazioni stesse. In particolare, per quanto riguarda il query routing è stato proposto un meccanismo distribuito e scalabile che consente ad ogni peer che riceve una interrogazione di indirizzarla verso i vicini le cui sottoreti meglio approssimano la query dal punto di vista semantico. Il meccanismo si fonda su indici, denominati Semantic Routing Index (SRI), che risiedono localmente sui peer. L’evoluzione degli SRI segue l’evoluzione della rete. A questo proposito, è stato introdotto un meccanismo che consente di modificare gli SRI in maniera consistente, applicando funzioni di aggregazione e composizione derivanti dalla logica fuzzy. In ultimo, è stato mostrato come gli SRI possono essere sfruttati per effettuare query routing semantico. Per quanto riguarda l’organizzazione logica della rete, sono state affinate tecniche, basate su indici denominati Semantic Clustering Index (SCI), per aumentare le probabilità che peer adiacenti siano rilevanti per le stesse richieste e in cui il raggruppamento dei nodi sia guidato dalla semantica delle funzionalità descritte nell’ontologia locale ad ogni nodo. Infine, per quanto riguarda l’interrogazione, sono stati eseguiti studi relativi all’introduzione di linguaggi e modelli per l’espressione di interrogazioni “miste”, contenenti cioè sia una parte non strutturata (“keyword”) sia una parte strutturata, sui dati in forma di grafo. Tutti gli approcci e gli indici proposti sono stati ampiamente testati in un ambiente di simulazione peer‐to‐peer e sono state implementati in un sistema, denominato SUNRISE, dove ne è stata dimostrata anche sperimentalmente la validità in casi applicativi reali. 3.1.2. Query processing in digital library distribuite [MMS+07] Federica Mandreoli, Riccardo Martoglia, Simona Sassatelli, Wilma Penzo. Semantic Routing for Effective Search in Heterogeneous and Distributed Digital Libraries. In Proc. of the 3rd Italian Research Conference on Digital Library Management Systems (IRCDL), Padova, Italia, Gennaio 2007. [MMT04a] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio. Approximate Query Answering for a Heterogeneous XML Document Base. In Proc. of the The 5th International Conference on Web Information Systems Engineering (WISE 2004), Brisbane, Australia, Novembre 2004, Springer Verlag Heidelberg. [MM04] Federica Mandreoli, Riccardo Martoglia. Exploiting related digital library corpora with query rewriting. In Atti del 12° Convegno Nazionale su Sistemi Evoluti per Basi di Dati (SEBD 2004), S.Margherita di Pula, Italy, Giugno 2004. [TR1] Sonia Bergamaschi, Domenico Beneventano, Federica Mandreoli, Riccardo Martoglia, Daniele Miselli, Paolo Tiberio, Maurizio Vincini. Definizione di un servizio di supporto per la costruzione di una ontologia comune per i diversi metadati in biblioteche digitali aperte, Progetto ECD, Luglio 2003. [TR2] Sonia Bergamaschi, Domenico Beneventano, Francesco Guerra, Alain Fergnani, Federica Mandreoli, Riccardo Martoglia, Sandro Bernardini. Specification of the general framework for the multilingual semantic enrichment processes and of the semantically enriched data stores, D2.1, Progetto SEWASIE, Febbraio 2003. Nell’ambito delle digital library distribuite sono state proposte tecniche efficaci per il matching di schemi XML utilizzati per codificare l’informazione e algoritmi efficienti per l’esecuzione di interrogazioni. Le tecniche di matching proposte sono in grado di mettere in corrispondenza elementi di schemi XML differenti sfruttando la semantica delle label che li descrivono e il contesto degli elementi determinato dall’albero. Tali corrispondenze sono caratterizzate da valori numerici che quantificano la forza del legame. Gli algoritmi per l’esecuzione di interrogazioni sfruttano i matching per riscrivere le interrogazioni in una rete di digital library e per associare ad ogni riscrittura un punteggio di similarità. La combinazione delle tecniche descritte sopra permette quindi di sfruttare appieno il potenziale delle digital library, interrogando anche quei documenti utili all’utente ma basati su uno schema diverso da quello di riferimento per la query. Esse sono state implementate in un sistema, denominato XML S3MART, dove ne è stata dimostrata anche sperimentalmente la validità in casi applicativi reali. 3.1.3. Disambiguation di dati semi‐strutturati e a grafo [MMR07b] Federica Mandreoli, Riccardo Martoglia, Enrico Ronchetti. Disambiguation of Structure‐Based Information in the STRIDER System. In Proc. of the 15th Italian Symposium on Advanced Database Technologies (SEBD), Torre Canne (BR), Italia, Giugno 2007. [MMR06b] Federica Mandreoli, Riccardo Martoglia, Enrico Ronchetti. STRIDER: a Versatile System for Structural Disambiguation. In Proc. of the 10th International Conference on Extending Database Technology (EDBT 2006), Munich, Germany, Marzo 2006. [MMR05b] Federica Mandreoli, Riccardo Martoglia, Enrico Ronchetti. Improving Semantic Awareness of Knowledge‐based Applications through Structural Disambiguation. In Proc. of the 2nd Italian Semantic Web Workshop (SWAP), Trento, Italia, Dicembre 2005. [MMR05a] Federica Mandreoli, Riccardo Martoglia, Enrico Ronchetti. Versatile Structural Disambiguation for Semantic‐aware Applications. In Proc. of the 14th ACM International Conference on Information Knowledge and Management (ACM CIKM 2005), Bremen, Germany, Novembre 2005. La necessità di gestire la semantica degli schemi che descrivono i dati, sia essa ad esempio per il matching di schemi o per il clustering di dati, ha fatto emergere in modo evidente il problema di comprendere il significato dei termini usati per descrivere gli schemi stessi. Solitamente questa operazione viene fatta “a mano” attraverso un processo di annotazione manuale o al più semi‐automatico. In questo ambito, ci si è focalizzati sul problema dello “structural disambiguation”, il cui scopo è quello di associare ad ogni label di uno schema un significato estratto da un’ontologia lessicale di riferimento, come ad esempio WordNet. L’approccio proposto consente di “disambiguare” grafi in generale e quindi anche alberi come web directory, schemi XML o documenti RDF. Gli algoritmi alla base si fondano su tecniche derivanti dal natural language processing dove il problema del “disambiguation” è affrontato da anni. Per ogni termine dello schema e per ogni significato offerto dall’ontologia di riferimento, gli algoritmi associano un valore che esprime il grado di confidenza con cui quel significato è effettivamente corretto per il termine. Questi valori vengono calcolati tenendo conto del contesto fornito dal grafo e di informazioni aggiuntive fornite eventualmente dall’ontologia. L’approccio è stato implementato in un sistema, STRIDER, che attualmente è in grado di gestire alberi, grafi e dati relazionali. La qualità dell’approccio proposto è stato quindi verificato su gruppi di schemi XML, RDF ed SQL con caratteristiche profondamente diverse attraverso l’introduzione di una serie di misure di efficacia. 3.1.4. Gestione di documenti XML temporali [GMM+08] Fabio Grandi, Federica Mandreoli, Riccardo Martoglia, Enrico Ronchetti, Maria Rita Scalas, Paolo Tiberio. Ontology‐based Personalization of e‐Government Services. In Intelligent User Interfaces: Adaptation and Personalization Systems and Technologies, Constantinos Mourlas and Panagiotis Germanakos (Ed.), IGI Global, 2008. [MMR08] Federica Mandreoli, Riccardo Martoglia, Enrico Ronchetti. Native Temporal Slicing Support for XML Databases. Accettato per la pubblicazione in The Open Information Science Journal, 2008. [MMR07a] Federica Mandreoli, Riccardo Martoglia, Enrico Ronchetti. Native Temporal Slicing Support for XML Databases. In Proc. of the International Conference on Internet Computing (ICOMP) ‐ XmlTech'07 Workshop, Las Vegas, USA, Giugno 2007. [MMT+06b] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio, Fabio Grandi, Maria Rita Scalas, Enrico Ronchetti. An eGovernment System for Temporal‐ and Semantic‐Aware Access to Norms. In Proc. of the AAAI Spring Symposium Semantic Web meets eGovernment Symposium (SWEG). Stanford University (CA), USA, Marzo 2006. [MMR06a] Federica Mandreoli, Riccardo Martoglia, Enrico Ronchetti. Supporting temporal slicing in XML databases. In Proc. of the 10th International Conference on Extending Database Technology (EDBT 2006), Munich, Germany, Marzo 2006. L’obiettivo dell’attività di ricerca in questo contesto è stato quello di definire modelli per la rappresentazione e l’interrogazione di documenti XML temporali e di introdurre meccanismi efficienti per l’aggiornamento e l’accesso a documenti di questo tipo. In primo luogo è stato definito un modello che consente di aggiungere annotazioni temporali ai documenti XML, annotazioni che ne definiscono il periodo di applicabilità. Le dimensioni supportate sono molteplici, dal transaction time a diversi tipi di valid time e all’event time. Il modello è stato definito formalmente ed è completato da un linguaggio che consente di specificare interrogazioni che contengono espressioni temporali. Per l’accesso a documenti temporali sono stati proposti due approcci. Il primo approccio si basa su una architettura a strati: lo strato superiore riceve la richiesta inoltrata dall’utente e si occupa di gestire gli aspetti temporali, al fine di trasformare l’intera query in una query XQuery standard. Il risultato viene passato allo strato sottostante che realizza un sistema di query processing XML convenzionale. Il secondo approccio, invece, è un approccio nativo dove l’engine XML viene reso temporal‐aware, ovvero cosciente del fatto che ogni risultato di un’interrogazione XML temporale deve soddisfare non solo i requisiti strutturali ma anche quelli temporali e deve essere temporalmente consistente. Tale approccio introduce un meccanismo di indicizzazione temporale dei documenti XML ed estende algoritmi per l’esecuzione di twig query basati su stack intervenendo ai diversi livelli dell’esecuzione, dall’accesso ai dati basato su indici alla ricostruzione dei risultati. Le varie alternative possono essere combinate e danno luogo a diversi scenari che sono stati ampiamente testati e valutati su grandi quantità di documenti XML temporali. 3.1.5. Accesso personalizzato a documenti XML basato su ontologie [GMM+08] Fabio Grandi, Federica Mandreoli, Riccardo Martoglia, Enrico Ronchetti, Maria Rita Scalas, Paolo Tiberio. Ontology‐based Personalization of e‐Government Services. In Intelligent User Interfaces: Adaptation and Personalization Systems and Technologies, Constantinos Mourlas and Panagiotis Germanakos (Ed.), IGI Global, 2008. [GMM08] Fabio Grandi, Federica Mandreoli, Riccardo Martoglia. Issues in Personalized Access to Multi‐Version XML Documents. In Open and Novel Issues in XML Database Applications: Future Directions and Advanced Technologies, Eric Pardede (Ed.), IGI Global, 2008. [MMG+07] Federica Mandreoli, Riccardo Martoglia, Fabio Grandi, Maria Rita Scalas. Efficient Management of Multi‐Version XML Documents for eGovernment Applications. In Web Information Systems and Technologies, International Conferences, WEBIST 2005 and WEBIST 2006, Revised Selected Papers. Lecture Notes in Business Information Processing 1, Springer, 2007. [MMT+06a] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio, Fabio Grandi, Maria Rita Scalas, Enrico Ronchetti. Semantic Web Techniques for Personalization of eGovernment Services. In Proceedings of the 1st ER International Workshop on Semantic Web Applications: Theory and Practice (SemWAT@ER). Tucson (AZ), USA, Novembre 2006. [MMT+06b] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio, Fabio Grandi, Maria Rita Scalas, Enrico Ronchetti. An eGovernment System for Temporal‐ and Semantic‐Aware Access to Norms. In Proc. of the AAAI Spring Symposium Semantic Web meets eGovernment Symposium (SWEG). Stanford University (CA), USA, Marzo 2006. [GMM+05] Fabio Grandi, Federica Mandreoli, Riccardo Martoglia, Enrico Ronchetti, Maria Rita Scalas, Paolo Tiberio. Enhanced Access to eGovernment Services: Temporal and Semantics‐Aware Retrieval of Norms. In Proc. of the 2nd Italian Semantic Web Workshop (SWAP), Trento, Italia, Dicembre 2005. [MMT+05b] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio, Enrico Ronchetti, Fabio Grandi, Maria Rita Scalas. Accesso Personalizzato a Documenti Multiversione per Applicazioni nel Settore dell’E‐
Government. In Atti del Congresso Annuale AICA, Udine, Italia, Ottobre 2005. [MMT+05a] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio, Fabio Grandi, Maria Rita Scalas, Enrico Ronchetti. Personalized Access to Multi‐version Norm Texts in an eGovernment Scenario. In Proc. of the International Conference on E‐Government (EGOV@DEXA), Copenhagen, Denmark, Agosto 2005. [GSM+05] Fabio Grandi, Maria Rìta Scalas, Federica Mandreoli, Riccardo Martoglia. Personalized Access to Multi‐Version Documents for E‐Government Applications. In Proc. of the IADIS International Conference E‐Society, Qawra, Malta, Luglio 2005. [MMT+05c] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio, Fabio Grandi, Maria Rita Scalas, Enrico Ronchetti. Personalized Access to Multi‐Version XML Documents in an eGovernment Scenario. In Proc. of the 13th Italian Symposium on Advanced Database Technologies (SEBD), Bressanone (BZ), Italia, Giugno 2005. [MMG+05] Federica Mandreoli, Riccardo Martoglia, Fabio Grandi, Maria Rita Scalas. Efficient Management of Multi‐Version XML Documents for eGovernment Applications. In Proc. of the 1st International Conference on Web Information Systems and Technologies (WEBIST), Miami (FL), USA, Maggio 2005. L’attività di ricerca a questo riguardo si è principalmente concentrata sull’uso di ontologie sviluppate in ambito di eGovernment per garantire l’accesso in modo personalizzato a grandi quantità di documenti, come ad esempio leggi o circolari della pubblica amministrazione, rappresentati in XML. A tale scopo è stata introdotta un’infrastruttura che, sfruttando l’identità digitale, è in grado di effettuare una classificazione ontologica del cittadino che accede ai documenti della pubblica amministrazione e, quindi, di presentare al cittadino solo le porzioni dei documenti che gli possono interessare. Tale infrastruttura è basata su un modello di dati XML che introduce tag per la specifica dei contesti di applicabilità dei nodi e un opportuno meccanismo di ereditarietà. L’infrastruttura è stata implementata in un sistema efficiente che suddivide i documenti XML in tuple, arricchite dai contesti di applicabilità e memorizzate in un database. In questo contesto, l’esecuzione delle interrogazioni è stata realizzata estendendo algoritmi basati su stack, con approcci che sfruttano le proprietà topologiche delle classi coinvolte dalla query. L’ambiente proposto è stato poi esteso alle problematiche di accesso temporale di documenti XML, argomento particolarmente sentito in ambito eGovernment. Il risultato è un’infrastruttura completa che consente al cittadino di accedere ai documenti messi a disposizione dalla pubblica amministrazione sulla base di due coordinate, quella semantica codificata dall’ontologia e quella temporale rappresentata da un numero elevato di dimensioni. 3.1.6. Twig query processing su dati semi‐strutturati e multimediali [MMT+06d] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio, Mattia Righini. A Native Extensible XML Query Processor Towards Efficient and Effective MPEG‐7 Querying. In Proc. of the 2nd Italian Research Conference on Digital Library Management Systems (IRCDL), Padova, Italia, Gennaio 2006. [ZMM04b] Pavel Zezula, Federica Mandreoli, Riccardo Martoglia. Unordered XML Pattern Matching with Tree Signatures In Atti del 12° Convegno Nazionale su Sistemi Evoluti per Basi di Dati (SEBD 2004), S.Margherita di Pula, Italia, Giugno 2004. [ZMM04a] Pavel Zezula, Federica Mandreoli, Riccardo Martoglia. Tree Signatures and Unordered XML Pattern Matching. Invited talk. In Proc. of 30th Conference on Current Trends in Theory and Practice of Computer Science (SOFSEM 2004), Merin, Czech Republic, Gennaio 2004. [TR3] Paolo Tiberio, Federica Mandreoli, Riccardo Martoglia. Query & Semantic Retrieval Languages ‐ XQuery, in State of the Art in Audiovisual Content – Based Retrieval, Information Universal Access & Interaction including Datamodels & Languages, WP3 Task 4, Progetto DELOS, 2004. Lo standard XML sta conoscendo una popolarità sempre maggiore per la rappresentazione dei dati e, in particolare, si è potuto assistere ad un conseguente crescente interesse per l’elaborazione di interrogazioni strutturali (twig query processing) conformi al modello “labelled‐tree”. In particolare, sono state studiate tecniche di twig query processing che prevedono metodi di interrogazione strutturale flessibili, sia per problemi di tipo ordered (l’ordine dei nodi sibling di una query è da rispettare) sia unordered (l’ordine dei nodi sibling non è influente), unitamente ad algoritmi e strutture dati che ne permettano un’esecuzione efficiente anche su notevoli quantità di dati. Utilizzando una rappresentazione di tipo tree signature dei documenti XML originari, basata sui soli valori di pre‐ordine e post‐ordine degli elementi e quindi molto compatta, e una serie di strutture dati aggiuntive accuratamente progettate, quali indici di contenuto e indici dei tag, sono stati definiti nuovi algoritmi basati su stack per risolvere efficientemente ordered e unordered twig query processing. Il caso unordered è di particolare complessità ed è stato risolto utilizzando una scomposizione della query in una sequenza di path radice‐foglia, seguita dalla ricerca dell’embedding dei path nell’albero dati e dal join strutturalmente consistente delle soluzioni trovate. I fondamenti di tali algoritmi sono stati applicati anche allo scenario delle digital library multimediali, fornendo la possibilità di effettuare rapide ricerche tra i metadati (tipicamente espressi in XML e, in particolare, in MPEG‐7) riguardanti gli oggetti audio‐visivi. Le tecniche viste sono state integralmente implementate in un sistema, chiamato X‐SITER, per la memorizzazione e l’interrogazione efficiente di repository costituiti da grandi quantità di documenti semi‐strutturati, anche di dimensioni molto elevate. Tale sistema integra e dimostra anche nuove tecniche di buffering e di filtering per la riduzione della complessità computazionale e delle operazioni di input/output richieste dalle operazioni di interrogazione. 3.1.7. Ricerca di similarità su frasi e sequenze testuali [MMT06] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio. EXTRA: a system for example‐based translation assistance. Machine Translation, Volume 20, Number 3. Settembre 2006. [MMT03a] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio, Exploiting multi‐lingual Text Potentialities in EBMT Systems. In Proc. of the 13th International Workshop on Research Issues on Data Engineering: Multi‐lingual Information Management (RIDE‐MLIM 03), Hyderabad, India, Marzo 2003. [MMT02b] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio, A Syntactic Approach for Searching Similarities within Sentences. In Proc. of the 11th International Conference on Information and Knowledge Management (CIKM 02), McLean, Virginia, USA, Novembre 2002. [MMT02a] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio, Searching Similar (Sub)Sentences for Example‐Based Machine Translation. In Atti del 10° Convegno su Sistemi Evoluti per Basi di Dati (SEBD'02), Portoferraio, Italia, Giugno 2002. Le informazioni testuali rappresentano la principale forma di rappresentazione elettronica delle informazioni. Essendo la frase (o sequenza) l’unità fondamentale di un testo, per sfruttare appieno le potenzialità di tali repository di dati, è stato necessario identificare tecniche per effettuare ricerche in modo efficace ed efficiente tra le frasi o sequenze. In ambito generale, si sono approfondite tecniche di ricerca di similarità, che permettono di andare oltre la semplice ricerca esatta, e sono state definite metriche di similarità sintattiche adatte per sequenze testuali di qualunque tipo, siano esse sequenze di parole (frasi) o generiche sequenze di simboli (come codici genetici). Inoltre, nuovi algoritmi di matching che agiscono non solo a livello delle sequenze complete ma anche all’interno di parti di esse sono state implementate sfruttando le potenzialità offerte dai DBMS unite a funzioni e a filtri programmati ad hoc. In particolar modo, è stato approfondito l’ambito della traduzione assistita basata su esempi o EBMT (Example Based Machine Translation), in cui le tecniche di approximate matching vengono applicate alle frasi, tenendo conto anche di tutta una serie di problematiche aggiuntive quali il multi‐linguismo. Il sistema EXTRA, sviluppato conseguentemente, integra e affina gli algoritmi per ricerca di similarità e presenta nuove tecniche di multi‐lingual IR (MLIR), in modo da risolvere problemi complessi riguardanti l’utilizzo e l’allineamento dei dati multi‐linguistici. Utilizzando EXTRA sono state svolte numerose prove sperimentali, dimostrandone l’efficacia e l’efficienza sia su translation memory di grandi dimensioni e consolidate sia su translation memory piccole e quindi poco consolidate. Inoltre, ci si è occupati anche di estendere la similarità sintattica tra frasi all’ambito semantico, mediante lo studio di tecniche di risoluzione di ambiguità semantica basate sull’utilizzo di WordNet. 3.1.8. Ricerca di similarità in repository testuali di documenti [MMT05] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio. Text Clustering as a Mining Task. In Text Mining and its Applications to Intelligence, CRM and Knowledge Management, ed. Alessandro Zanasi, WIT Press, Gennaio 2005. [MMT04b] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio. A Document Comparison Scheme for Secure Duplicate Detection. International Journal of Digital Libraries, special issue on Security in Digital Library, co‐editors Vijay Atluri, Indrakshi Ray, Volume 4, Issue 3, Springer Verlag Heidelberg, Novembre 2004. [MMT03b] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio. Un Metodo per il Riconoscimento di Duplicati in Collezioni di Documenti. In Atti dell’ 11° Convegno su Sistemi Evoluti per Basi di Dati (SEBD'03), Cetraro, Italia, Giugno 2003. Sempre in ambito di ricerca di similarità su dati testuali, ci si è occupati delle problematiche relative alla ricerca e alla gestione di interi documenti in grandi repository quali digital library. La ricerca di similarità sul contenuto testuale dei documenti ha svariate applicazioni, quali l’identificazione – e la rimozione – di duplicati non intenzionali dalle collezioni di documenti (duplicate detection), l’identificazione di violazioni, anche parziali, della proprietà intellettuale (copyright‐violation detection) o il miglioramento dell’efficiacia e dell’efficienza di ricerca offerta da search engine avanzati. Con “duplicato” si intende un documento, o una parte di esso, che contiene approssimativamente le stesse informazioni di un altro. In questo scenario, è stato presentato un nuovo schema per l’individuazione efficace ed efficiente di duplicati in grandi collezioni di documenti. La tecnica proposta presenta un’accuratezza (sicurezza) particolarmente elevata ed inedita per questo tipo di applicazioni: il documento viene suddiviso in chunk (tipicamente frasi, paragrafi) e la similarità all’interno di essi viene calcolata utilizzando tecniche basate su edit distance. L’efficienza è presa altresì in considerazione e sono state ricercate in dettaglio numerose nuove tecniche di data reduction, quali filtri e algoritmi di clustering inter e intra‐documento, che permettono di accelerare i calcoli di similarità senza rinunciare all’accuratezza del risultato. Le tecniche proposte sono state implementate in un sistema completo, chiamato DANCER, per la gestione di collezioni di documenti e la ricerca di duplicati. L’utilità di un tale sistema, sia nel fornire schemi di copyright violation detection più sicuri sia nell’offrire migliori prestazioni nell’ambito di search engine avanzati, è stata dimostrata mediante numerose prove sperimentali. 3.2.
Partecipazione a Progetti Progetto FIRB, co‐finanziato MIUR: “NeP4B: Networked Peers for Business” (2006/2008); componente dell’Unità di Ricerca di Modena, responsabile del Work Package 3 per l’Unità di Modena. Il progetto si concentra sullo sviluppo di un'infrastruttura tecnologica avanzata per consentire alle aziende di qualsiasi natura, dimensione e posizione geografica di cercare partner, scambiarsi informazioni e conoscenza, negoziare e collaborare senza limitazioni o vincoli. In particolare, l’Unità di Ricerca di Modena si occupa di studiare e progettare una tecnologia in grado di creare una rete di peer semantici, fornendo servizi semantici avanzati per le applicazioni B2B. Progetto di Ricerca Triennale del Dipartimento di Ingegneria dell’Informazione: “Reti Mobili Semantiche Auto‐
Organizzanti di Sensori Radio” (2006/2008). La linea di ricerca mira al tema delle reti di sensori a connessione radio e ad integrare aspetti legati alle tecnologie ed ai sistemi microelettronici e progettazione di sistemi di interconnessione via radio ad hoc, comunicazione radio, organizzazione dell’informazione digitale, formulazione ed esecuzione efficiente di interrogazioni basate sulla semantica. In particolare, l’attività di ricerca in campo informatico si occupa di fornire da un lato capacità di connessione e auto‐organizzazione, dall’altro opportuni algoritmi per reperire e gestire informazioni, in un ambiente mobile distribuito. Progetto FIT‐ICT in collaborazione con IDEA s.r.l.: “Nuovo Sistema Informatico Dedicato alla Ideazione, Produzione e Controllo di Etichette Wide ‐ Sense” (2006/2007). Il programma di ricerca ha avuto come tema lo sviluppo di nuovi strumenti hardware e software relativi al ciclo di ideazione e a quello produttivo, di tipo flessibile, per etichette di tipo wide‐sense, in grado cioè di comunicare con i clienti ed i fruitori dei prodotti in modo completo coinvolgendone il maggior numero di sensi. In particolare, l’attività di ricerca si è concentrata sulla proposta di una nuova modalità di ideazione e progettazione delle etichette, sia tradizionali sia wide‐sense, secondo schemi di cooperazione interattiva. Collaborazione con INALCA S.p.a.: “Definizione di strumenti, ambienti e infrastrutture per il nuovo sistema informatico” (2006). Il progetto ha previsto la reingegnerizzazione del sistema informatico della ditta INALCA e in particolare la connessione, accanto a sistemi AS400 e Server Intel Swisslog, di dispositivi periferici specifici (stazioni di lavoro, stampanti, dispositivi a lettura ottica/RFID e bilance). La finalità ultima è stata di offrire la possibilità di avere la completa rintracciabilità di ogni singolo prodotto. In particolare, l’attività di ricerca si è concentrata sullo studio relativo ai dispositivi RFID e alla loro applicabilità in questo scenario. Progetto PRIN, co‐finanziato MIUR: “WISDOM: Ricerca Intelligente su Web basata su Ontologie di Dominio” (2005/2006). Il progetto si è posto nell'ambito di ricerca del Semantic Web e ha avuto come obiettivo principale lo sviluppo di tecniche e strumenti intelligenti, basati su ontologie di dominio, per la ricerca di informazione su Web. In particolare, ci si è occupati di reperire informazione in modo integrato ed efficiente sia da siti di tipo data‐
intensive che da siti e pagine web con contenuto scarsamente strutturato. MIUR ex 40%: Tecniche di Semantic Web per la gestione dell’identità digitale e l’accesso alle norme (2004/2006); componente dell’Unità di Ricerca di Modena. Il progetto ha avuto lo scopo di gestire l’identità digitale del cittadino su Internet, facilitandone il coinvolgimento nei processi governativi elettronici. Ogni porzione di informazione riguardante il cittadino, immagazzinata nei database della Pubblica Amministrazione e disponibile on‐line, è un frammento dell’identità digitale che si è potuto utilizzare per migliorare la partecipazione del cittadino stesso ai servizi governativi elettronici. Obiettivo del progetto è stato, in particolare, fornire un servizio di accesso selettivo ai testi normativi, tramite reperimento e ricostruzione di tutte e solo le norme valide ed applicabili al cittadino, in accordo con la sua identità digitale. Sixth Framework Programme Priority IST‐2002‐2.3.1.12: DELOS ‐ a Network of Excellence on Digital Libraries (2004/2006); componente del Partecipante Università degli Studi di Modena e Reggio Emilia. Lo scopo del DELOS network è stato di definire e condurre un programma unificato di attività volto a coordinare le future attività di ricerca nel campo delle digital library, allo scopo di sviluppare una nuova generazione di tecnologie per la gestione di biblioteche digitali. In particolare, l’attività dell’Unità di Ricerca di Modena si è concentrata sulle problematiche connesse alla gestione e all’interrogazione approssimata di oggetti audio‐visivi e non convenzionali. MIUR Progetti Strategici Legge 449/97: ECD – Enhanced Content Delivery ‐ Settore Società dell’Informazione Progetto SP2 Tecnologie per arricchire e fornire accesso a contenuti (2002/2004); componente dell’Unità di Ricerca di Modena. Il progetto è stato avviato nel marzo 2002 e si è concentrato sullo sviluppo di tecnologie e strumenti per offrire contenuti arricchiti agli utenti finali. In particolare, l’attività dell’Unità di Ricerca di Modena si è concentrata sulle problematiche connesse alla interrogazione approssimata di biblioteche digitali contenenti dati eterogenei. Convenzione con LOGOS Group: Contratto di Ricerca tra il Dipartimento di Ingegneria dell’Informazione dell’Università degli Studi di Modena e Reggio Emilia e LOGOS Group per lo sviluppo di uno studio su Metodologie informatiche applicate al campo linguistico (2002). Obiettivi dello studio sono stati la definizione di nuove tecniche per l’assistenza alla traduzione, in particolare nuovi approcci alla ricerca di similarità su frasi nell’ambito della traduzione assistita basata su esempi (EBMT, Example‐Based Machine Translation). IST RTD project Contract Number IST‐2001‐34825: SEWASIE – SEmantic Webs and AgentS in Integrated Economies (2002/2004); componente del Partecipante Università degli Studi di Modena e Reggio Emilia. Il progetto, di cui il suddetto partecipante è coordinatore, è iniziato ufficialmente il primo maggio 2002. Obiettivo del progetto sono stati la progettazione e lo sviluppo di un search engine avanzato basato sulla tecnologia ad agenti che consentisse accessi intelligenti a sorgenti dati eterogenei sul web attraverso l’arricchimento semantico. 3.3.
Attività di Revisione Riccardo Martoglia ha svolto le seguenti attività di revisione: •
Revisore per Journal of Data and Knowledge Engineering; •
Revisore per International Journal of Web Engineering and Technology; •
Revisore per Journal of Systems and Software; •
Revisore per capitoli del libro “Open and Novel Issues in XML Database Applications: Future Directions and Advanced Technologies”, 2008; •
Revisore per International Workshop on Evolution and Change in Data Management (ECDM), edizione 2008; •
Revisore per International XML Database Symposium (XSYM), edizione 2008; •
Revisore per International Conference on Web Information Systems and Technologies (WEBIST), edizioni 2008 e 2006. •
Revisore per International Workshop On Semantic Extensions to Middleware: Enabling Large Scale Knowledge Applications (SEMELS), edizione 2008; •
Revisore per Convegno su Sistemi Evoluti per Basi di Dati (SEBD), edizioni 2008, 2007, 2006, 2005, 2004 e 2003; •
Revisore per International Conference on Conceptual Modeling (ER), edizione 2007; •
Revisore per International Conference on Web Intelligence (WI), edizioni 2007 e 2004; •
Revisore per International World Wide Web Conference (WWW), edizioni 2005 e 2004; •
Revisore per International Conference on Databases and Applications (IASTED‐DBA), edizione 2005; •
Revisore per International Conference on Artificial Intelligence: Methodology, Systems, Applications (AIMSA), edizione 2004; •
Revisore per Euro‐Par International Conference, edizione 2004; •
Revisore per International Semantic Web Conference (ISWC), edizione 2003; •
Revisore per International Workshop on Data Warehousing and OLAP (DOLAP), edizione 2003. 4.
4.1.
Elenco completo delle pubblicazioni Capitoli di Libri [GMM08] Fabio Grandi, Federica Mandreoli, Riccardo Martoglia. Issues in Personalized Access to Multi‐Version XML Documents. In Open and Novel Issues in XML Database Applications: Future Directions and Advanced Technologies, Eric Pardede (Ed.), IGI Global, 2008. [GMM+08] Fabio Grandi, Federica Mandreoli, Riccardo Martoglia, Enrico Ronchetti, Maria Rita Scalas, Paolo Tiberio. Ontology‐based Personalization of e‐Government Services. In Intelligent User Interfaces: Adaptation and Personalization Systems and Technologies, Constantinos Mourlas and Panagiotis Germanakos (Ed.), IGI Global, 2008. [MMP+08a] Federica Mandreoli, Riccardo Martoglia, Wilma Penzo, Simona Sassatelli, Giorgio Villani. Paving the Way to an Effective and Efficient Retrieval of Data over Semantic Overlay Networks. In The Semantic Web for Knowledge and Data Management: Technologies and Practices, Zhongmin Ma (Ed.), IGI Global, 2008. [MMT05] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio. Text Clustering as a Mining Task. In Text Mining and its Applications to Intelligence, CRM and Knowledge Management, Alessandro Zanasi (Ed.), WIT Press, Gennaio 2005. 4.2.
Riviste Internazionali [MMP+09a] Federica Mandreoli, Riccardo Martoglia, Wilma Penzo, Simona Sassatelli. Data‐Sharing P2P Networks with Semantic Approximation Capabilities. Accettato per la pubblicazione in IEEE Internet Computing, 2009. [MMR08] Federica Mandreoli, Riccardo Martoglia, Enrico Ronchetti. Native Temporal Slicing Support for XML Databases. Accettato per la pubblicazione in The Open Information Science Journal, 2008. [MMG+07] Federica Mandreoli, Riccardo Martoglia, Fabio Grandi, Maria Rita Scalas. Efficient Management of Multi‐Version XML Documents for eGovernment Applications. In Web Information Systems and Technologies, International Conferences, WEBIST 2005 and WEBIST 2006, Revised Selected Papers. Lecture Notes in Business Information Processing 1, Springer, 2007. [MMT06] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio. EXTRA: a system for example‐based translation assistance. Machine Translation, Volume 20, Number 3. Settembre 2006. [MMT04b] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio. A Document Comparison Scheme for Secure Duplicate Detection. International Journal of Digital Libraries, special issue on Security in Digital Library, co‐editors Vijay Atluri, Indrakshi Ray, Volume 4, Issue 3, Springer. Novembre 2004. 4.3.
Conferenze e Workshop Internazionali [MMP+09b] Federica Mandreoli, Riccardo Martoglia, Wilma Penzo, Giorgio Villani. SFlexible Query Answering on Graph‐modeled Data. In Proc. of the 12th International Conference on Extending Database Technology (EDBT), St. Petersburg, Russia, Marzo 2009. [MMP+08b] Federica Mandreoli, Riccardo Martoglia, Wilma Penzo, Simona Sassatelli, Stefano Lodi. Semantic Peer, Here are the Neighbors You Want! In Proc. of the 11th International Conference on Extending Database Technology (EDBT), Nantes, France, Marzo 2008. [MMP+08c] Federica Mandreoli, Riccardo Martoglia, Wilma Penzo, Simona Sassatelli, Giorgio Villani. Building a PDMS Infrastructure for XML Data Sharing with SUNRISE. In Proc. of the 3rd International EDBT Workshop on Database Technologies for Handling XML Information on the Web (DATAX), Nantes, France, Marzo 2008. [MMP+07a] Federica Mandreoli, Riccardo Martoglia, Wilma Penzo, Simona Sassatelli, Giorgio Villani. SRI@work: Efficient and Effective Routing Strategies in a PDMS. In Proc. of the 8th International Conference on Web Information Systems Engineering (WISE 2007), Nancy, France, Dicembre 2007. [MMP+07b] Federica Mandreoli, Riccardo Martoglia, Wilma Penzo, Simona Sassatelli, Giorgio Villani. SUNRISE: Exploring PDMS Networks with Semantic Routing Indexes. In Proc. of the 4th European Sematic Web Conference (ESWC), Innsbruck, Austria, Giugno 2007. [MMR07a] Federica Mandreoli, Riccardo Martoglia, Enrico Ronchetti. Native Temporal Slicing Support for XML Databases. In Proc. of the International Conference on Internet Computing (ICOMP) ‐ XmlTech'07 Workshop, Las Vegas, USA, Giugno 2007. [MMS+06a] Federica Mandreoli, Riccardo Martoglia, Simona Sassatelli, Wilma Penzo. SRI: Exploiting Semantic Information for Effective Query Routing in a PDMS. In Proc. of the 8th ACM CIKM International Workshop on Web Information and Data Management (ACM WIDM 2006), Arlington, USA, Novembre 2006. [MMT+06a] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio, Fabio Grandi, Maria Rita Scalas, Enrico Ronchetti. Semantic Web Techniques for Personalization of eGovernment Services. In Proceedings of the 1st ER International Workshop on Semantic Web Applications: Theory and Practice (SemWAT@ER). Tucson (AZ), USA, Novembre 2006. [MMR06a] Federica Mandreoli, Riccardo Martoglia, Enrico Ronchetti. Supporting temporal slicing in XML databases. In Proc. of the 10th International Conference on Extending Database Technology (EDBT 2006), Munich, Germany, Marzo 2006. [MMR06b] Federica Mandreoli, Riccardo Martoglia, Enrico Ronchetti. STRIDER: a Versatile System for Structural Disambiguation. In Proc. of the 10th International Conference on Extending Database Technology (EDBT 2006), Munich, Germany, Marzo 2006. [MMT+06b] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio, Fabio Grandi, Maria Rita Scalas, Enrico Ronchetti. An eGovernment System for Temporal‐ and Semantic‐Aware Access to Norms. In Proc. of the AAAI Spring Symposium Semantic Web meets eGovernment Symposium (SWEG). Stanford University (CA), USA, Marzo 2006. [MMR05a] Federica Mandreoli, Riccardo Martoglia, Enrico Ronchetti. Versatile Structural Disambiguation for Semantic‐aware Applications. In Proc. of the 14th ACM International Conference on Information Knowledge and Management (ACM CIKM 2005), Bremen, Germany, Novembre 2005. [MMT+05a] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio, Fabio Grandi, Maria Rita Scalas, Enrico Ronchetti. Personalized Access to Multi‐version Norm Texts in an eGovernment Scenario. In Proc. of the International Conference on E‐Government (EGOV@DEXA), Copenhagen, Denmark, Agosto 2005. [GSM+05] Fabio Grandi, Maria Rìta Scalas, Federica Mandreoli, Riccardo Martoglia. Personalized Access to Multi‐Version Documents for E‐Government Applications. In Proc. of the IADIS International Conference E‐Society, Qawra, Malta, Luglio 2005. [MMG+05] Federica Mandreoli, Riccardo Martoglia, Fabio Grandi, Maria Rita Scalas. Efficient Management of Multi‐Version XML Documents for eGovernment Applications. In Proc. of the 1st International Conference on Web Information Systems and Technologies (WEBIST), Miami (FL), USA, Maggio 2005. [MMT04a] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio. Approximate Query Answering for a Heterogeneous XML Document Base. In Proc. of the The 5th International Conference on Web Information Systems Engineering (WISE 2004), Brisbane, Australia, Novembre 2004, Springer Verlag Heidelberg. [ZMM04a] Pavel Zezula, Federica Mandreoli, Riccardo Martoglia. Tree Signatures and Unordered XML Pattern Matching. Invited talk. In Proc. of 30th Conference on Current Trends in Theory and Practice of Computer Science (SOFSEM 2004), Merin, Czech Republic, Gennaio 2004. [MMT03a] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio. Exploiting multi‐lingual Text Potentialities in EBMT Systems. In Proc. of the 13th International Workshop on Research Issues on Data Engineering: Multi‐lingual Information Management (RIDE‐MLIM 03), Hyderabad, India, Marzo 2003. [MMT02b] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio. A Syntactic Approach for Searching Similarities within Sentences. In Proc. of the 11th International Conference on Information and Knowledge Management (CIKM 02), McLean, Virginia, USA, Novembre 2002. 4.4.
Conferenze Nazionali [MMS+08] Federica Mandreoli, Riccardo Martoglia, Simona Sassatelli, Paolo Tiberio, Wilma Penzo, Claudio Gennaro, Matteo Mordacchini, Salvatore Orlando. Toward an Effective and Efficient Query Processing in the NeP4B Project. In Proc. of the V Conference of the Italian Chapter of AIS (itAIS), Paris, France, Dicembre 2008. [MMP+08e] Federica Mandreoli, Riccardo Martoglia, Wilma Penzo, Simona Sassatelli, Giorgio Villani. Efficient and Effective Query Answering in a PDMS with SUNRISE. In Proc. of the 16th Italian Symposium on Advanced Database Technologies (SEBD), Mondello (PA), Italia, Giugno 2008. [MMP+08d] Federica Mandreoli, Riccardo Martoglia, Wilma Penzo, Simona Sassatelli, Stefano Lodi. Boosting a Network of Semantic Peers. In Proc. of the 16th Italian Symposium on Advanced Database Technologies (SEBD), Mondello (PA), Italia, Giugno 2008. [MMR07b] Federica Mandreoli, Riccardo Martoglia, Enrico Ronchetti. Disambiguation of Structure‐Based Information in the STRIDER System. In Proc. of the 15th Italian Symposium on Advanced Database Technologies (SEBD), Torre Canne (BR), Italia, Giugno 2007. [MMS+07] Federica Mandreoli, Riccardo Martoglia, Simona Sassatelli, Wilma Penzo. Semantic Routing for Effective Search in Heterogeneous and Distributed Digital Libraries. In Proc. of the 3rd Italian Research Conference on Digital Library Management Systems (IRCDL), Padova, Italia, Gennaio 2007. [MMS+06b] Federica Mandreoli, Riccardo Martoglia, Simona Sassatelli, Wilma Penzo. Semantic Query Routing Experiences in a PDMS. In Proc. of the 3rd Italian Semantic Web Workshop (SWAP), Pisa, Italia, Dicembre 2006. [MMT+06c] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio, Simona Sassatelli, W. Penzo. Using Semantic Mappings for Query Routing in a PDMS Environment. In Proc. of the 14th Italian Symposium on Advanced Database Technologies (SEBD), Portonovo (AN), Italia, Giugno 2006. [MMT+06d] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio, Mattia Righini. A Native Extensible XML Query Processor Towards Efficient and Effective MPEG‐7 Querying. In Proc. of the 2nd Italian Research Conference on Digital Library Management Systems (IRCDL), Padova, Italia, Gennaio 2006. [MMR05b] Federica Mandreoli, Riccardo Martoglia, Enrico Ronchetti. Improving Semantic Awareness of Knowledge‐based Applications through Structural Disambiguation. In Proc. of the 2nd Italian Semantic Web Workshop (SWAP), Trento, Italia, Dicembre 2005. [GMM+05] Fabio Grandi, Federica Mandreoli, Riccardo Martoglia, Enrico Ronchetti, Maria Rita Scalas, Paolo Tiberio. Enhanced Access to eGovernment Services: Temporal and Semantics‐Aware Retrieval of Norms. In Proc. of the 2nd Italian Semantic Web Workshop (SWAP), Trento, Italia, Dicembre 2005. [MMT+05b] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio, Enrico Ronchetti, Fabio Grandi, Maria Rita Scalas. Accesso Personalizzato a Documenti Multiversione per Applicazioni nel Settore dell’E‐
Government. In Atti del Congresso Annuale AICA, Udine, Italia, Ottobre 2005. [MMT+05c] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio, Fabio Grandi, Maria Rita Scalas, Enrico Ronchetti. Personalized Access to Multi‐Version XML Documents in an eGovernment Scenario. In Proc. of the 13th Italian Symposium on Advanced Database Technologies (SEBD), Bressanone (BZ), Italia, Giugno 2005. [MM04] Federica Mandreoli, Riccardo Martoglia. Exploiting related digital library corpora with query rewriting. In Atti del 12° Convegno Nazionale su Sistemi Evoluti per Basi di Dati (SEBD 2004), S.Margherita di Pula, Italy, Giugno 2004. [ZMM04b] Pavel Zezula, Federica Mandreoli, Riccardo Martoglia. Unordered XML Pattern Matching with Tree Signatures In Atti del 12° Convegno Nazionale su Sistemi Evoluti per Basi di Dati (SEBD 2004), S.Margherita di Pula, Italia, Giugno 2004. [MMT03b] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio. Un Metodo per il Riconoscimento di Duplicati in Collezioni di Documenti. In Atti dell’ 11° Convegno su Sistemi Evoluti per Basi di Dati (SEBD'03), Cetraro, Italia, Giugno 2003. [MMT02a] Federica Mandreoli, Riccardo Martoglia, Paolo Tiberio, Searching Similar (Sub)Sentences for Example‐Based Machine Translation. In Atti del 10° Convegno su Sistemi Evoluti per Basi di Dati (SEBD'02), Portoferraio, Italia, Giugno 2002. 4.5.
Rapporti Tecnici Internazionali e Nazionali [TR5] Ilaria Bartolini, Domenico Beneventano, Paolo Ciaccia, Alessandro Linari, Federica Mandreoli, Riccardo Martoglia, Marco Patella, Wilma Penzo, Andrea Proli, Stefano Rizzi. Definition of the ontology‐based query language and query processing techniques. Progetto WISDOM, 2006. [TR4] Matteo Golfarelli, Federica Mandreoli, Riccardo Martoglia, Andrea Proli, Stefano Rizzi, Paolo Tiberio. Critical analysis of query languages and ontology‐based query rewriting techniques. Progetto WISDOM, 2005. [TR3] Paolo Tiberio, Federica Mandreoli, Riccardo Martoglia. Query & Semantic Retrieval Languages – Xquery. In State of the Art in Audiovisual Content – Based Retrieval, Information Universal Access & Interaction including Datamodels & Languages, WP3 Task 4, Progetto DELOS, 2004. [TR2] Sonia Bergamaschi, Domenico Beneventano, Francesco Guerra, Alain Fergnani, Federica Mandreoli, Riccardo Martoglia, Sandro Bernardini. Specification of the general framework for the multilingual semantic enrichment processes and of the semantically enriched data stores. D2.1, Progetto SEWASIE, Febbraio 2003. [TR1] Sonia Bergamaschi, Domenico Beneventano, Federica Mandreoli, Riccardo Martoglia, Daniele Miselli, Paolo Tiberio, Maurizio Vincini. Definizione di un servizio di supporto per la costruzione di una ontologia comune per i diversi metadati in biblioteche digitali aperte. Progetto ECD, Luglio 2003. 5.
Short Curriculum / Curriculum breve Riccardo Martoglia was born in Modena the 8th of November, 1976 and is currently a ING‐INF/05 Research associate in the Faculty of “Scienze Matematiche Fisiche e Naturali”, University of Modena e Reggio Emilia. In March 2002, he got the Laurea Degree in Computer Engineering (cum Laude) from the same University. He has completed his Ph.D. in Computer Engineering in 2005, discussing the thesis “Information Retrieval Techniques for Pattern Matching”. His current research is about the Information Retrieval and Semantic Web fields, in particular his work concerns the study of new metodologies for efficiently and effectively searching in large and distributed (P2P) data repositories, the development of novel tools for the integration and the customizable fruition of informative distributed resources, including techniques for the semantically approximate and/or personalized retrieval of information. He is author of publications and book chapters and has participated to many national and international projects about the above mentioned topics. He has been reviewer for a number of international conferences and journals, such as the Journal of Data and Knowledge Engineering, International World Wide Web Conference and International Conference on Web Information Systems and Technologies. He is a member of ACM and IEEE Computer Society. Riccardo Martoglia è nato a Modena l’8 novembre 1976 ed è attualmente ricercatore universitario ING‐INF/05 presso la Facoltà di “Scienze Matematiche Fisiche e Naturali” dell’Università di Modena e Reggio Emilia. Nel marzo 2002 ha conseguito la Laurea in Ingegneria Informatica (cum Laude) presso la stessa Università, mentre nel 2005 ha conseguito il titolo di Dottore di Ricerca in Ingegneria informatica, discutendo la tesi “Tecniche di Information Retrieval per Pattern Matching”. I suoi attuali interessi di ricerca riguardano i campi dell’Information Retrieval e del Semantic Web, in particolare il suo lavoro concerne lo studio di nuove metodologie per la ricerca efficace ed efficiente in grandi repository distribuiti (P2P), lo sviluppo di nuovi strumenti per l’integrazione e la fruizione di risorse informative distribuite, incluse tecniche per il recupero di informazioni semanticamente approssimate e/o personalizzate. E’ autore di pubblicazioni e capitoli di libro ed ha partecipato a diversi progetti nazionali ed internazionali riguardanti gli argomenti summenzionati. E’ stato reviewer di numerose conferenze e riviste internazionali, quail “Journal of Data and Knowledge Engineering”, “International World Wide Web Conference” e International Conference on Web Information Systems and Technologies”. E’ un membro delle società ACM e IEEE. 
Scarica

Curriculum dell`Attività Scientifica e Didattica