Attivita’ di ricerca 2009-2010 Carlo Batini 1 Aree • Come costruire ed esprimere il contenuto informativo integrato di sistemi informativi complessi basati su DBMS Repositories di schemi concettuali e linguaggi ontologici light • Come far evolvere la architettura dati di una organizzazione? Metodologia e strumenti SMART • Come pianificare operativamente il progetto di servizi, ed in particolare servizi di eGovernment eGovernment • Come progettare servizi che abbiano valore per la PA, l’utente, il provider Servizi a valore aggiunto • Come estendere in concetto di qualita’ dai dati alla informazione? Non approfondito 2 The distribution issue is an example of data architecture and improvement of the efficiency of a data architecture among a set of data bases Employee Employee # Salary Distribute d DB Assigned-to Employee # Project # Role Centralized DB Project Project # Budget 3 Il problema della evoluzione della architettura di una base di dati Source 4 Source 1 Source 2 Source 5 Source 6 Source 7 Source 8 Source 3 Come integrarle a livello logico? Come integrarle a livello dati? 4 Livello logico concettuale 5 Why integration alone is not enough? ? Hundreds of schemas 6 Schema integration Goal: reconcile and obtain a common view Integrated schema Schema 1 Schema 2 7 Schema abstraction Goal: Provide a compact view of the reality represented by the schema Abstract schema Schema 8 Language Expressiveness Overall strategy for the use of the modeling languages OWL-DL Ontologies Integration Inference ER with generalization Thesauri Metadata Core Business Data & Knowledge Terminologies, Vocabularies Knowledge to be modeled 9 Representing, abstracting and integrating Web schemas in the large Problems with current approaches • Available languages lack loose integration/abstraction primitives • Light-weight languages such as RDFS cannot represent generic abstractions between schema concepts (Palmonari & Batini SSWS 2009) • Rich languages such as OWL-DL are “costly” to be used in the large • Integration Abstraction Primitives Conceptual Modeling Languages ER, UML M H - L L Web Ontologies and Semantic Web Languages Light (RDFS/DL-Lite) L M L H H Rich (OWL-DL/Lite) L L H H H ER/UML to OWL translations from the literature Light (DL-Lite) L M L H H Rich (OWL-DL) L L H H H • Understandability & Cost Effectiveness • Legacy Models Compliance • Web Compliance • Semantics & Reasoning 10 Livello dei dati 11 Tecnologie possibili 1. Integrazione nell’ interrogazione ai dati a) b) c) d) Application integration Consolidamento Data Warehouse Data Integration Application Int. Consolidamento. Data Warehouse Data Integration 2. Integrazione degli aggiornamenti a) Publish & Subscribe b) Consolidamento Publish&Subscribe Consolidamento 12 Consideriamo il seguente caso di basi di dati tutte centralizzate e indipendenti - 1 Mono architettura Source 4 Source 1 Source 2 Source 5 DI Source 6 Source 8 Source 7 Source 3 P&S Application Int. Per Interrogazioni Consolidamento. Data Warehouse Data Integration Per Aggiornamenti Publish & Subscribe Consolidamento. 13 Consideriamo il seguente caso di basi di dati tutte centralizzate e indipendenti - 2 Piu’ architetture Source 1 Source 4 P&S Source 6 DW Source 2 DI Source 5 Source 8 Source 7 Source 3 P&S Application Int. Per Interrogazioni Consolidamento. Data Warehouse Data Integration Per Aggioramenti Publish & Subscribe Consolidamento. 14 Consideriamo il seguente caso di basi di dati tutte centralizzate e indipendenti - 3 Mono architettura Source 4 Source 1 Source 2 Source 5 Source 6 Source 7 Source 8 Source 3 Application Int. Per Interrogazioni Consolidamento. Data Warehouse Data Integration Per Aggioramenti Publish & Subscribe Consolidamento. 15 Il problema Anagrafica Clienti1 Anagrafica Clienti2 Vendite retail Vendite On line Source 1 Source 2 Source 3 Source 4 ….. Altri Quale Integrazione? Nuova architettura Come decidere? Source n 16 Potential information content Global schema Boat has Tax payer declares Income Tax payer declares Find CF, Name of Tax Payer that declares <= 30.000 € and has >= 1 Boat Income Boat has Tax payer Sources 17 eGovernment 18 The old approach … and the eG4M approach Organizational Organizational Juridical Economic Technological Social Economic Juridical Technological Social 19 The eG4M social & organzational system Social system Services Requests Public Administration organizational system Organizational layer Organization Process layer Processes Resource layer Technological Resource layer Complementary Organizational Resources Information Technological infrastructures, Data, Applications, HW and Network Technologies 20 Libro eG4M 21