[ area beni culturali ] Pubblicare i beni culturali Saperi storici e nuove tecnologie Napoli, 18 febbraio 2003 Gianpaolo Mura grafica Isabella Ferrarin Informatica e Beni Culturali Scopi Catalogare Relazionare Pubblicare Competenze Archivistiche Umanistiche Informatiche Canali Internet è un canale privilegiato Internet una rete di reti Internet è una rete formata da altre reti che parlano tra di loro tramite protocolli Il Web è un modo di accedere a Internet tramite Http Internet comunicazione Il client è un programma che formula delle richieste ad un server utilizzando un protocollo di comunicazione accetta le risposte in uno o più formati le visualizza Il server è un programma che accetta le richieste da un client le interpreta prepara le risposte (interrogando anche altri server) le invia al client in uno o più formati Internet Comunicazione client Server Classica Il Client chiede al Server dei contenuti Browser <-> Web Server: e’ la più semplice e comune per il Web. Il browser è un Thin Client Oltre ad http può utilizzare: ftp (scambio file), smtp (mail),… Peer to peer è un’alternativa: ogni nodo ha uguale responsabilità Internet & C. multicanalità Multicanalità: gli stessi contenuti possono essere distribuiti verso client differenti usando rappresentazioni differenti Ogni client capisce uno o più protocolli ed uno o più linguaggi Banca: via web, mail, sms, wap, umts, telefono, … i contenuti sono gli stessi Multimedialità: gli stessi contenuti anche con differenti rappresentazioni Internet i client: Browser 1/2 Il client più importante del web Interpreta il linguaggio Html oltre a CSS e Javascript. Con i plug-in supporta audio, video, animazioni,… Internet i client: Browser 2/2 Permette di fruire di contenuti multimediali sincronizzati Problema: standard non sempre supportati pienamente Internet & C. i client: Wap Supportato da alcuni dispositivi mobili che integrano un browser Wap (Wireless Application Protocol): telefonini, palmari,… Interpreta il linguaggio Wml (Wireless Markup Language) Potenzialità ridotte rispetto ad un browser web Tratto da GsmWorld Internet & C. i client: Umts Sistema mobile di terza generazione Permette l'integrazione di testo, voce, video, multimedia, su terminali mobili Servizi come video-conferenze, video streaming on demand, integrazione tra voce e dati, possono essere fruiti anche dal cellulare In ritardo anche per i costi esorbitanti delle licenze pagati dagli operatori Tratto da UmtsArea I formati testuali Tutti i dispositivi (tranne quelli solo vocali) sono in grado di rappresentare informazioni testuali Il formato più semplice è un banale Txt Alcuni formati contengono anche le informazioni per la visualizzazione dei dati che contengono (Html, Wml, Pdf,…) Altri formati contengono i dati in forma strutturata (Xml e altri derivati da Sgml) ed è necessaria una trasformazione prima di poterli visualizzare I formati testuali: Xml 1/2 Utilizzato per descrivere qualsiasi base di dati in forma gerarchica (ad albero) Viene spesso usato anche come formato di scambio Applicandogli l’opportuno Xsl è possibile trasformarlo in qualunque altro formato non solo testuale (VoiceXml, Svg) Vedi W3 Consortium I formati testuali: Xml 2/2 Ad esempio si può trasformare Xml in Html xml html xsl xml html Vedi W3 Consortium xsl I formati le immagini Le immagini di tipo bit-mapped contengono una mappa con i colori da rappresentare, generalmente sono in formato compresso. Sono direttamente supportate dai browser Le immagini vettoriali contengono le istruzioni per il client che deve visualizzarle. Generalmente richiedono un plug-in La maggior parte delle immagini in internet sono bit-mapped e appartengono ai formati grafici Jpeg e Gif. Entrambi sono formati compressi. I formati le immagini : Jpeg 1/2 Apporta una compressione di tipo lossy all’immagine originale per ridurne le dimensioni L’algoritmo è progettato per eliminare l’informazione visiva non percepibile dall’occhio umano Indicato per foto, non è indicato per loghi e scritte semplici poiché i bordi possono essere sfumati dalla compressione Si può scegliere la qualità della compressione e quindi la sua dimensione Non è indicato per loghi e scritte semplici poiché i bordi possono essere sfumati dalla compressione Nuove specifiche: Jpeg 2000 Vedi Jpeg.org I formati le immagini : Jpeg 2/2 Bassa compressione 237 KB Vedi Jpeg.org Alta compressione 11 KB I formati le immagini : Gif Apporta una compressione di tipo lossless all’immagine usando l’algoritmo brevettato LZW Indicato per immagini con pochi e distinti colori (solo 256) come linee e piccoli testi Supporta la trasparenza Supporta le animazioni E’ interallacciato: l’immagine intera viene caricata gradualmente. I formati le immagini : Png Nato per superare i problemi di licenza del formato Gif Apporta una compressione di tipo lossless Compressione maggiore rispetto a Gif Supporta l’opacità Non supporta le animazioni E’ supportato dai browser più diffusi ma non da tutti Vedi BurnAllGifs I formati le immagini : Tiff Progettato per favorire l'interscambio di dati digitali Diffuso nel mondo dell'editoria Largamente supportato Supporta più tipi di compressione o anche nessuna Consente di mettere più immagini nello stesso file Consigliato per originali ad alta risoluzione Vedi Adobe I formati le immagini : Svg E’ un formato vettoriale E’ un vero e proprio linguaggio che descrive le immagini in Xml Il ridimensionamento delle immagini non ne modifica la qualità I browser più diffusi non lo supportano direttamente Interessante per creare o modificare dinamicamente immagini Vedi W3 Consortium I formati Flash E’ un contenitore di documenti multimediali Permette di integrare in un file testo, audiovisivi, immagini e di interagire con l’utente E’ ormai un diffusissimo standard de facto per il web Permette di superare le differenze di interpretazione tra diversi browser Richiede un plug-in E’ un formato proprietario di Macromedia Vedi Macromedia I formati audiovisivi Babele di formati Tecnologie e conoscenze del mondo televisivo si incontrano e scontrano con quelle del mondo internet Gli standard più largamente utilizzati per gli audiovisivi digitali sono definiti dal gruppo di lavoro Mpeg fondato da Leonardo Chiariglione nel 1988 Altri formati per internet sono definiti dalle case produttrici (Microsoft, Real e Apple) I formati audiovisivi: Mpeg – gruppo di lavoro Mpeg è un gruppo di lavoro dell’ISO Si occupa di definire standard per i formati audiovisivi Una volta definite le specifiche l’implementazione dei codec è effettuata da terze parti Mpeg ha rilasciato più standard: Mpeg-1 per video CD e MP3 Mpeg-2 per la tv digitale e DVD Mpeg-4 per le reti Mpeg-7 per la descrizione e la ricerca Mpeg-21 per l'interoperabilità (in divenire) Vedi Mpeg I formati audiovisivi: Mpeg - formato I formati aderenti alle specifiche Mpeg utilizzano un sistema di compressione di tipo lossy In breve: si cerca di immagazzinare solo le informazioni che cambiano rispetto ad alcuni punti fissati all’interno del file. L’informazione è poi encodata utilizzando la tecnica Dct Vengono rimosse le informazioni che si suppone l’occhio e l’orecchio umano non siano in grado di percepire La concorrenza tra produttori di codec (hardware e software) è incentrata sulla qualità del risultato e sulla percentuale di compressione Vedi Mpeg I formati audiovisivi: streaming E’ una tecnica che permette la fruizione di un documento remoto senza riceverlo tutto preventivamente ma scaricandolo mano a mano I documenti devono possedere la capacità di esere “srotolati” come un nastro Attualmente per la trasmissione in internet di documenti audiovisivi sono utilizzate principalmente tre piattaforme con I relativi formati principali: Real, Windows Media, QuickTime Real ed Apple stanno rilasciando dei prodotti open source Le tipologie di file sono quasi sempre proprietarie quindi tralasciamo i particolari tecnici Vedi StreamingMag Gestire e pubblicare architetture lato server Integrare server diversi Gestire e pubblicare streaming 1/2 Gestire e pubblicare streaming 2/2 Attualmente per la creazione trasmissione in internet di documenti audiovisivi sono utilizzate principalmente tre piattaforme con i relativi formati principali: Real Windows Media QuickTime Le piattaforme si compongono di un encoder per codificare i contenuti, un server per distribuirli, un player per vederli Vedi StreamingMag Gestire e pubblicare database: generalità Contenitori di informazioni e relazioni Db relazionali – i più diffusi Db ad oggetti Db Xml Db gerarchici Db multimediali – i più innovativi Gestire e pubblicare database relazionali L’informazione è strutturata in tabelle bidimensionali Le tabelle contengono dati logicamente correlati I più diffusi per il mondo internet sono Oracle, MySql, PostgreSql, Sql Server MySql e PostgreSql sono due progetti open source che si stanno imponendo anche presso grossi clienti In particolar modo MySql esiste per i più diffusi sistemi operativi ed è paragonabile ad Oracle per prestazioni Vedi MySql Gestire e pubblicare database multimediali Permettono di gestire immagini ed audiovisivi Ad ogni documento si associano dei metadati che lo descrivono e che non necessariamente sono di tipo testuale Ad esempio possiamo effettuare una ricerca su un archivio musicale impostando come query un brano fischiettato Possono essere costruiti a partire da un database tradizionale oppure essere un’applicazione stand-alone Gestire e pubblicare web server Accetta e serve le richieste degli utenti web Interpreta e serve direttamente solo le richieste di contenuti statici: pagine html, immagini, altri tipi di file Se la richiesta necessita di un elaborazione (ad esempio un semplice accesso a database) viene passata all’Application Server Spesso è l’unico componente che colloquia direttamente con internet Il più diffuso è il prodotto open source Apache Vedi Apache Gestire e pubblicare application Server 1/3 E’ l’ambiente nel quale vengono eseguiti i programmi di gestione delle informazioni Genera quelli che sono detti contenuti dinamici Esempio: vogliamo permettere ad un utente di visualizzare tutte le opere di un autore immettendone il nome: si prepara una pagina html per ogni autore, oppure si memorizzano le informazioni in un database, le si estrae su richiesta e si compone dinamicamente la pagina con le informazioni reperite La seconda ipotesi richiede l’utilizzo di un ambiente e di un linguaggio di programmazione Gestire e pubblicare application Server 2/3 Prima ancora di scegliere l’Application Server si deve decidere la tecnologia, le più diffuse sono: Java Php Asp e .Net Per Java si può scegliere sia il sistema operativo che l’As Per Php si può scegliere il sistema operativo ma si è legati al Web Server Apache Per Asp e .Net si è vincolati alla piattaforma Windows + Intel Vedi Apache Gestire e pubblicare application Server 3/3: Java Tecnologia molto diffusa per medi e grandi sistemi, probabilmente è anche la più difficile da padroneggiare Beneficia di una vastissima comunità di sviluppatori e di moltissime componenti open source Scalabile e portabile Gli AS più diffusi sono Bea WebLogic e Ibm WebSphere Un altro AS sempre più usato pur non essendo completo come gli altri è il prodotto open source Tomcat Vedi Tomcat Creare l’informazione content manager 1/2 Consento di aggregare contenuti di diversi tipi, di relazionarli e di pubblicarli Una delle caratteristiche principali che devono avere è di essere utilizzabili anche da personale non tecnico I più sofisticati, i Media Asset Manager, gestiscono anche i metadati dei contenuti multimediali; tipicamente sono usati negli studi televisivi Creare l’informazione content manager 2/2: edit(o) Esempio georeferenziazione