GdL-Enterprise 2.0 “Motori di ricerca e Reputation 2.0” 22-2-2010
SearchBySkill
Come migliorare le ricerche sul Web
profilando l’utente con
as a Service
Giulio Beltrami
Sommario
1.
EUCIP: Modello e servizio on-line (EUCIPaaS)
2.
EUCIPaaS: eCCO, SearchBySkill
3.
SearchBySkill: Prototipo, architettura e benefici
4.
Web-Search: Migliorie, profilazione utenti, prospettive
1
EUCIP: Modello concettuale
EUropean Certification of Informatics Professionals è lo
standard di riferimento CEPIS, rappresentato in Italia da
contribuisce allo sviluppo dell’ICT e della competitività
delle Imprese e di Sistema, a livello nazionale ed europeo
http://www.eucip.it/
Risponde alla domanda del
responsabile di business, delle
risorse umane e della formazione,
e dell’IS-Manager:
cosa bisogna sapere e saper fare, per contribuire alla fornitura ed alla progettazione,
realizzazione e gestione del Sistema ICT, di una impresa o di un ente della PA.
2
EUCIP: Architettura dei profili e delle competenze
Sistema dei 21+1 profili
EUCIP raggruppati in 7 aree di
professionalità
Dizionario delle competenze
(3.000 unità di conoscenza elementari
raggruppate in 155 categorie, articolate in 6
classi riconosciute dai responsabili RU)
IT Business Mgr & Professionals
Solution Consultants
e-Business & Innovation Agents
Software Designers
Technical Advisers
Service Support Specialists
Operational Managers
Competenze informatiche e delle TLC (*)
Competenze gestionali
Competenze per l’innovazione (prodotto, processo
organizzative)
Competenze di contesto su mercato/normative/
sicurezza
Competenze didattiche
Competenze comportamentali (minime)
(*) le competenze informatiche e delle TLC
raggruppano unità di conoscenza elementari sia in
ambito proprietario che in ambito libero (open source)
3
EUCIP: Syllabus (catalogo)
BASIC
ELECTIVE
Areas
Branch
Categories
Profiles
Outcomes
SubCategories
Topics
SubTopics
EUCIP è basato su un Syllabus (catalogo), di oltre 3.000 unità elementari di conoscenza
(topics + subtopics), costituenti 21+1 profili professionali, che raggruppano le principali
figure professionali, operanti nell'ICT.
4
EUCIP: as a Service (EUCIPaaS)
Sarebbe meglio che formazione, qualificazione e informazione professionali "emanassero"
dall'uso quotidiano del sistema informativo d’impresa, invece di essere solo progettati a tavolino
ed erogati oralmente e sulla carta:
Sviluppare, mantenere e erogare
EUCIP come servizio digitale (as a
Service), fruibile in rete (on the
Cloud), da qualsiasi persona,
sistema o applicazione abilitata
EUCIP
as
On the Cloud
a
Service
Invero AICA ha già concepito e sviluppato servizi professionali EUCIP in rete, come la autovalutazione del “Profilo di Prossimità” (eCCO) e l’automazione dei TEST di certificazione.
5
EUCIPaaS: Auto-valutazione delle competenze ICT (eCCO)(*)
eCCO (eCompetences and Certifications Observatory) consente di valutare on-line lo
scostamento (gap) fra le competenze possedute dall’utente e quelle richieste per ciascun
profilo professionale EUCIP.
Nel “radar” riportato a titolo esemplificativo il Profilo
Elettivo più prossimo è quello dell’IS Manager.
Modello eCCO
Alla base vi è una ontologia,
sviluppata su una rete semantica,
che collega tra loro competenze e
skill, estratti dai profili EUCIP.
Competenze del
Profilo più prossimo
Competenze
Autovalutate
Aree di competenza
comuni
Il sistema, utilizzando un algoritmo di
corrispondenza (matching), può
ricostruire i profili dei candidati,
ricercando relazioni di sinonimia e
inclusione, per valutare la reale
corrispondenza con i profili standard.
(*)
Realizzato da AICA con la
Fondazione Politecnico Milano
6
EUCIPaaS: Ricerca sul Web per competenze (SearchBySkill)
(*)
SearchBySkill-EUCIP assiste il professionista ICT nel trovare informazioni pertinenti al
profilo professionale EUCIP prescelto, tramite il consueto motore di ricerca sul Web:
 Google Search
 Microsoft Bing
 Ecc.
SearchBySkill-EUCIP sfrutta la “nomenclatura” del Syllabus EUCIP per:
 Completare i quesiti posti dall’utente al motore
 Precisare i risultati delle ricerche ottenuti dal motore
in base agli interessi e competenze professionali ICT, indicati dall’utente stesso.
(*) proposta
allo studio.
7
SearchBySkill (prototipo): mashup di EUCIPaaS e GoogleSearch
PROTOTIPO!
Selezion
a
Profilo
Seleziona
Sub
Categori
a
Mia Clausola
Mia Ricerca
Espansione ricerca
Risultati: Web,Video, Blog,
News, Libri, Immagini, Brevetti
8
SearchBySkill (prototipo): architettura logica
GOOGLE FACTORY
Google
Indexes
& Logs
WEB
Google Search
Web-Service
AICA
•Editors
•Auditors
SYLLABUS
Syllabus Web-Service
SylEditor
SYLLOG
EUCIP FACTORY
Search
By
Skill
End Users
SearchBySkill USERS
9
SearchBySkill (prototipo): funzionamento
1.
2.
3.
4.
L’utente accede a SearchBySkill
con il suo Browser.
SearchBySkill accede ai Profili e
Categorie EUCIP, con il Syllabus
Web-Service (SOAP, WSDL).
SearchBySkill accede a Google
Search, con la Google Search
API (AJAX).
SearchBySkill chiama Google
Search, precisando il quesito
dell’utente con la SubCategoria
del Profilo prescelta.
INVOKE
WSDL
CONSUME
Syllabus
Web-Service
SearchBySkill potrà gestire anche gli oltre 3000 Topics, che compongono le SubCategorie:
 Per focalizzare ulteriormente il quesito dell’utente.
 Per classificare i risultati di Google Search.
10
SearchBySkill: Benefici previsti
Il servizio SearchBySkill prevede un triplice beneficio per l’utenza professionale ICT:
1.
2.
3.
Fare esperienza on-line, sulla struttura e nomenclatura del Syllabus EUCIP,
senza necessità di spulciare volumi di documenti.
Scandagliare il Web su quanto pubblicato, inerente il Profilo EUCIP scelto,
evidenziando le novità.
Trovare nel Web quanto richiesto di specifico dall’utente, ma nel contempo
congruente, rispetto al Profilo EUCIP adottato.
E permette ad AICA di tenere aggiornato il Syllabus, avvalendosi del feedback di
SearchBySkill, sulle statistiche d’uso e sui desiderata dell’utenza.
11
Web-Search: Apparati accessori, migliorativi la ricerca
Fin dagli albori dell’Information Retrieval, sono noti gli apparati accessori, migliorativi la
capacità e la precisione di ricerca per parole chiave, su grandi basi documentali, oltre la
mera indicizzazione a testo pieno (indici invertiti, vettori binari, ecc.):
a) Vocabolario, per aumentare la capacità di reperimento,
mascherando le variazioni grammaticali dei termini
(declinazione dei nomi e aggettivi, coniugazione dei verbi,
plurali, femminili, ecc…).
b) Thesaurus, per aumentare la capacità di reperimento,
tenendo conto delle relazioni semantiche fra termini
(gerarchia, preferenza o affinità/sinonimia).
c) Profilo utente, per aumentare la precisione di reperimento,
superando le ambiguità pragmatiche dei termini e delle
espressioni (polisemie, metafore, ecc..).
12
Web-Search: Vantaggi della profilazione utente
La capacità di reperimento degli attuali motori di ricerca è soddisfacente, semmai
esuberante, per gli apparati linguistici e le potenze d’elaborazione messi in campo.
La precisione di reperimento è perseguita con algoritmi di valutazione delle pagine
(page ranking), basati sulle reciproche citazioni (hyperlink) nel Web; ma la conoscenza
dell’utente, tramite profilazione (implicita o esplicita), offre ulteriori rilevanti vantaggi:
a) Da un lato è possibile arricchire in modo automatico i quesiti dell’utente, con i dati
presenti nel suo profilo, risparmiandogli le fasi di raffinamento delle ricerche, spesso
trascurate, per mancanza di tempo o di conoscenza dello strumento.
b) Dall’altro si possono ottenere, in risposta ai quesiti dell’utente, risultati personalizzati,
confacenti alle caratteristiche del suo profilo.
La nuova generazione di motori di ricerca dovrà quindi assumere come protagonista
l’utente che chiede, invece della base informativa da cui attingere le risposte: a maggior
ragione quando a domandare sarà un professionista competente ed a rispondere uno
strumento di lavoro e/o di addestramento.
13
Web-Search: Cosa c’è dietro l’angolo
L’evoluzione dei motori di ricerca sul Web, vede oggi due linee principali di progresso:
a) Profilazione sofisticata dell’utente, fino alla “sentiment analysis” e oltre.
b) Risposte precise ai quesiti dell’utente, invece di “pacchi” di risultati, da spulciare.
E’ noto che i moderni motori analizzano “a valle” il gradimento dell’utente, per i
risultati ottenuti, a fronte dei quesiti formulati, per scoprire classi d’interesse
(cluster analysis) da soddisfare “ad hoc”; a maggior ragione resta utile profilare la
utenza “a monte” del motore: con SearchBySkill e ancor meglio con sistemi WfM
(Work-flow Management), che considerino il ruolo degli utenti al lavoro: chi fa cosa
e come, nelle pratiche dell’impresa (SearchByRole).(*)
Invece motori di ricerca in grado di dare risposte precise, alla maniera dei DBMS,
sono previsti per il Web-Semantico o Web 3.0 (RDF, OWL e SPARQL), ma sono
già disponibili o allo studio “anticipazioni”, in grado di operare col Web tradizionale:
 Google Squared
 Wolfram Alpha (con Microsoft Bing)
 AlterEgo (allo studio dell’autore !?!?)
(*)
Ruolo = competenza applicata (skill » role » task)
14
Web-Search: Morale della favola
L’idea è creare piattaforme che consentano
a gruppi di persone connesse a computer
di agire più intelligentemente
dei gruppi privi di computer
e dei computer privi di persone.
Ricercatori del “Centre for Collective Intelligence” del M.I.T.
citati da Luca De Biase, su Nova del Sole24Ore 21-1-2010
[email protected]
GdLENT20 20100222 SearchBySkill
15
Scarica

GdLENT20 20100222 SearchBySkill