GdL-Enterprise 2.0 “Motori di ricerca e Reputation 2.0” 22-2-2010 SearchBySkill Come migliorare le ricerche sul Web profilando l’utente con as a Service Giulio Beltrami Sommario 1. EUCIP: Modello e servizio on-line (EUCIPaaS) 2. EUCIPaaS: eCCO, SearchBySkill 3. SearchBySkill: Prototipo, architettura e benefici 4. Web-Search: Migliorie, profilazione utenti, prospettive 1 EUCIP: Modello concettuale EUropean Certification of Informatics Professionals è lo standard di riferimento CEPIS, rappresentato in Italia da contribuisce allo sviluppo dell’ICT e della competitività delle Imprese e di Sistema, a livello nazionale ed europeo http://www.eucip.it/ Risponde alla domanda del responsabile di business, delle risorse umane e della formazione, e dell’IS-Manager: cosa bisogna sapere e saper fare, per contribuire alla fornitura ed alla progettazione, realizzazione e gestione del Sistema ICT, di una impresa o di un ente della PA. 2 EUCIP: Architettura dei profili e delle competenze Sistema dei 21+1 profili EUCIP raggruppati in 7 aree di professionalità Dizionario delle competenze (3.000 unità di conoscenza elementari raggruppate in 155 categorie, articolate in 6 classi riconosciute dai responsabili RU) IT Business Mgr & Professionals Solution Consultants e-Business & Innovation Agents Software Designers Technical Advisers Service Support Specialists Operational Managers Competenze informatiche e delle TLC (*) Competenze gestionali Competenze per l’innovazione (prodotto, processo organizzative) Competenze di contesto su mercato/normative/ sicurezza Competenze didattiche Competenze comportamentali (minime) (*) le competenze informatiche e delle TLC raggruppano unità di conoscenza elementari sia in ambito proprietario che in ambito libero (open source) 3 EUCIP: Syllabus (catalogo) BASIC ELECTIVE Areas Branch Categories Profiles Outcomes SubCategories Topics SubTopics EUCIP è basato su un Syllabus (catalogo), di oltre 3.000 unità elementari di conoscenza (topics + subtopics), costituenti 21+1 profili professionali, che raggruppano le principali figure professionali, operanti nell'ICT. 4 EUCIP: as a Service (EUCIPaaS) Sarebbe meglio che formazione, qualificazione e informazione professionali "emanassero" dall'uso quotidiano del sistema informativo d’impresa, invece di essere solo progettati a tavolino ed erogati oralmente e sulla carta: Sviluppare, mantenere e erogare EUCIP come servizio digitale (as a Service), fruibile in rete (on the Cloud), da qualsiasi persona, sistema o applicazione abilitata EUCIP as On the Cloud a Service Invero AICA ha già concepito e sviluppato servizi professionali EUCIP in rete, come la autovalutazione del “Profilo di Prossimità” (eCCO) e l’automazione dei TEST di certificazione. 5 EUCIPaaS: Auto-valutazione delle competenze ICT (eCCO)(*) eCCO (eCompetences and Certifications Observatory) consente di valutare on-line lo scostamento (gap) fra le competenze possedute dall’utente e quelle richieste per ciascun profilo professionale EUCIP. Nel “radar” riportato a titolo esemplificativo il Profilo Elettivo più prossimo è quello dell’IS Manager. Modello eCCO Alla base vi è una ontologia, sviluppata su una rete semantica, che collega tra loro competenze e skill, estratti dai profili EUCIP. Competenze del Profilo più prossimo Competenze Autovalutate Aree di competenza comuni Il sistema, utilizzando un algoritmo di corrispondenza (matching), può ricostruire i profili dei candidati, ricercando relazioni di sinonimia e inclusione, per valutare la reale corrispondenza con i profili standard. (*) Realizzato da AICA con la Fondazione Politecnico Milano 6 EUCIPaaS: Ricerca sul Web per competenze (SearchBySkill) (*) SearchBySkill-EUCIP assiste il professionista ICT nel trovare informazioni pertinenti al profilo professionale EUCIP prescelto, tramite il consueto motore di ricerca sul Web: Google Search Microsoft Bing Ecc. SearchBySkill-EUCIP sfrutta la “nomenclatura” del Syllabus EUCIP per: Completare i quesiti posti dall’utente al motore Precisare i risultati delle ricerche ottenuti dal motore in base agli interessi e competenze professionali ICT, indicati dall’utente stesso. (*) proposta allo studio. 7 SearchBySkill (prototipo): mashup di EUCIPaaS e GoogleSearch PROTOTIPO! Selezion a Profilo Seleziona Sub Categori a Mia Clausola Mia Ricerca Espansione ricerca Risultati: Web,Video, Blog, News, Libri, Immagini, Brevetti 8 SearchBySkill (prototipo): architettura logica GOOGLE FACTORY Google Indexes & Logs WEB Google Search Web-Service AICA •Editors •Auditors SYLLABUS Syllabus Web-Service SylEditor SYLLOG EUCIP FACTORY Search By Skill End Users SearchBySkill USERS 9 SearchBySkill (prototipo): funzionamento 1. 2. 3. 4. L’utente accede a SearchBySkill con il suo Browser. SearchBySkill accede ai Profili e Categorie EUCIP, con il Syllabus Web-Service (SOAP, WSDL). SearchBySkill accede a Google Search, con la Google Search API (AJAX). SearchBySkill chiama Google Search, precisando il quesito dell’utente con la SubCategoria del Profilo prescelta. INVOKE WSDL CONSUME Syllabus Web-Service SearchBySkill potrà gestire anche gli oltre 3000 Topics, che compongono le SubCategorie: Per focalizzare ulteriormente il quesito dell’utente. Per classificare i risultati di Google Search. 10 SearchBySkill: Benefici previsti Il servizio SearchBySkill prevede un triplice beneficio per l’utenza professionale ICT: 1. 2. 3. Fare esperienza on-line, sulla struttura e nomenclatura del Syllabus EUCIP, senza necessità di spulciare volumi di documenti. Scandagliare il Web su quanto pubblicato, inerente il Profilo EUCIP scelto, evidenziando le novità. Trovare nel Web quanto richiesto di specifico dall’utente, ma nel contempo congruente, rispetto al Profilo EUCIP adottato. E permette ad AICA di tenere aggiornato il Syllabus, avvalendosi del feedback di SearchBySkill, sulle statistiche d’uso e sui desiderata dell’utenza. 11 Web-Search: Apparati accessori, migliorativi la ricerca Fin dagli albori dell’Information Retrieval, sono noti gli apparati accessori, migliorativi la capacità e la precisione di ricerca per parole chiave, su grandi basi documentali, oltre la mera indicizzazione a testo pieno (indici invertiti, vettori binari, ecc.): a) Vocabolario, per aumentare la capacità di reperimento, mascherando le variazioni grammaticali dei termini (declinazione dei nomi e aggettivi, coniugazione dei verbi, plurali, femminili, ecc…). b) Thesaurus, per aumentare la capacità di reperimento, tenendo conto delle relazioni semantiche fra termini (gerarchia, preferenza o affinità/sinonimia). c) Profilo utente, per aumentare la precisione di reperimento, superando le ambiguità pragmatiche dei termini e delle espressioni (polisemie, metafore, ecc..). 12 Web-Search: Vantaggi della profilazione utente La capacità di reperimento degli attuali motori di ricerca è soddisfacente, semmai esuberante, per gli apparati linguistici e le potenze d’elaborazione messi in campo. La precisione di reperimento è perseguita con algoritmi di valutazione delle pagine (page ranking), basati sulle reciproche citazioni (hyperlink) nel Web; ma la conoscenza dell’utente, tramite profilazione (implicita o esplicita), offre ulteriori rilevanti vantaggi: a) Da un lato è possibile arricchire in modo automatico i quesiti dell’utente, con i dati presenti nel suo profilo, risparmiandogli le fasi di raffinamento delle ricerche, spesso trascurate, per mancanza di tempo o di conoscenza dello strumento. b) Dall’altro si possono ottenere, in risposta ai quesiti dell’utente, risultati personalizzati, confacenti alle caratteristiche del suo profilo. La nuova generazione di motori di ricerca dovrà quindi assumere come protagonista l’utente che chiede, invece della base informativa da cui attingere le risposte: a maggior ragione quando a domandare sarà un professionista competente ed a rispondere uno strumento di lavoro e/o di addestramento. 13 Web-Search: Cosa c’è dietro l’angolo L’evoluzione dei motori di ricerca sul Web, vede oggi due linee principali di progresso: a) Profilazione sofisticata dell’utente, fino alla “sentiment analysis” e oltre. b) Risposte precise ai quesiti dell’utente, invece di “pacchi” di risultati, da spulciare. E’ noto che i moderni motori analizzano “a valle” il gradimento dell’utente, per i risultati ottenuti, a fronte dei quesiti formulati, per scoprire classi d’interesse (cluster analysis) da soddisfare “ad hoc”; a maggior ragione resta utile profilare la utenza “a monte” del motore: con SearchBySkill e ancor meglio con sistemi WfM (Work-flow Management), che considerino il ruolo degli utenti al lavoro: chi fa cosa e come, nelle pratiche dell’impresa (SearchByRole).(*) Invece motori di ricerca in grado di dare risposte precise, alla maniera dei DBMS, sono previsti per il Web-Semantico o Web 3.0 (RDF, OWL e SPARQL), ma sono già disponibili o allo studio “anticipazioni”, in grado di operare col Web tradizionale: Google Squared Wolfram Alpha (con Microsoft Bing) AlterEgo (allo studio dell’autore !?!?) (*) Ruolo = competenza applicata (skill » role » task) 14 Web-Search: Morale della favola L’idea è creare piattaforme che consentano a gruppi di persone connesse a computer di agire più intelligentemente dei gruppi privi di computer e dei computer privi di persone. Ricercatori del “Centre for Collective Intelligence” del M.I.T. citati da Luca De Biase, su Nova del Sole24Ore 21-1-2010 [email protected] GdLENT20 20100222 SearchBySkill 15