Riunione conclusiva della prima fase del progetto Dipartimento di Scienze dell’Ingegneria dell’Università di Modena e Reggio Emilia Tema 1: Integrazione di dati provenienti da sorgenti eterogenee Fase 1 Scadenza: 30 aprile 2001 Obiettivi della Fase 1 Effettuare lo studio e l'analisi dei nuovi requisiti che emergono sulla integrazione di dati quando si considerano sorgenti fortemente eterogenee. Studiare i requisiti per nuovi metodi di rappresentazione dei dati, tenendo conto della presenza di sorgenti semistrutturate. Analizzare i requisiti per la scoperta e la rappresentazione di proprietà intra e inter-schema delle sorgenti, sia intensionali che estensionali. Indagare i metodi per definire e specificare parametri di qualità delle sorgenti e i metodi per la riconciliazione di dati provenienti da sorgenti eterogenee. Obiettivi della Fase 1 Analizzare il ruolo dei meta-dati e delle ontologie in un contesto in cui si integrano sorgenti strutturate e semistrutturate. Analizzare i metodi esistenti per il problema del query rewriting e del query answering using views. Studiare l'impatto che la presenza di diverse versioni dello schema di una sorgente può avere sul processo di integrazione. - definizione preliminare della struttura del metadata repository per descrivere le diverse tipologie di sorgenti e di relazioni intra ed inter-schema. Prodotti della Fase 1 Fase 2 Scadenza: 30 novembre 2001 TEMA 1: INTEGRAZIONE DI DATI PROVENIENTI DA SORGENTI ETEROGENEE • L'obiettivo è la produzione di risultati scientifici che definiscano un quadro metodologico per l'integrazione di dati provenienti da sorgenti fortemente eterogenee. • Si definirà una metodologia per la costruzione di viste riconciliate di dati semi-strutturati basata su tecniche intelligenti di tipo semi-automatico e su conoscenza di ontologie di dominio. • La metodologia prevede tecniche e passi specifici per la rappresentazione ed il trattamento di sorgenti semistrutturate • I risultati forniti includeranno la specifica architetturale di un prototipo che implementa la metodologia sviluppata. TEMA 1: INTEGRAZIONE DI DATI PROVENIENTI DA SORGENTI ETEROGENEE • Si definiranno metodi e tecniche per il trattamento di interrogazioni sulla vista integrata. • Si definiranno algoritmi per la riscrittura di interrogazioni rispetto a viste (query rewriting e query answering using views). • Si produrranno le specifiche funzionali di un "Query Manager" che supporti interrogazioni globali rispetto ad una vista virtuale integrata delle sorgenti. • La struttura del meta-data repository definita nella fase 1 verra` arricchita dalle tipologie di meta-dati e meta-relazioni individuate in questa fase, con riferimento alle interrogazioni globali e al loro mapping in interrogazioni locali alle sorgenti PRODOTTI DELLA FASE 2