Traduzione e computer
(3)
Cristina Bosco
Informatica applicata alla
comunicazione multimediale
2014-2015
Tipi di sistemi
Fino alla metà degli anni ‘90 esistono solo due
tipi di sistemi di MT:
• Sistemi su mainframe di grandi compagnie
• Sistemi su personal computer
A partire dalla metà degli anni ’90:
• Traduttori tascabili
• Software di traduzione per telefonia mobile
• Servizi di MT su Internet
Sistemi su mainframe
I sistemi di MT che giravano su mainframe di
grandi compagnie erano utilizzati per produrre
una grande quantità di traduzioni di qualità
tale da essere pubblicabili, quindi era
necessario che l’output di questi sistemi fosse
migliorato.
Per questo motivo furono applicate tecniche di
soluzione finalizzate a migliorare la qualità e a
limitare l’intervento umano
Soluzioni (applicate nei mainframe)
Le seguenti soluzioni possono aumentare la
qualità dell’output dei sistemi di MT:
• Impiego di revisori umani nel post-editing
• Sistemi interattivi
• Vincolare la varietà del linguaggio di input
Soluzioni (applicate nei mainframe)
L’impiego di revisori umani (esperti del LS e del
LT) nel post-editing è proposto come soluzione
per aumentare la qualità delle traduzioni
prodotte da MT fin dai primi sistemi.
Progressivamente si svilupparono strumenti per
il post-editing specializzati nell’evidenziare
errori frequenti e sistematici dei sistemi di MT
Soluzioni (applicate nei mainframe)
Vengono sviluppati sistemi di MT che non
richiedono post-editing, ma interagiscono con
l’utente durante il processo di traduzione, ad
es. nel caso di ambiguità di tipo lessicale o
sintattico
Soluzioni (applicate nei mainframe)
Vincolando la varietà del linguaggio di input si
limita la difficoltà della traduzione.
In due modi:
• Il sistema viene costruito per trattare un certo
tipo di linguaggio (es. quello dei bollettini
metereologici)
• Il testo da tradurre viene scritto utilizzando un
dizionario ristretto e una struttura sintattica
semplificata
Mainframe e localizzazione
È nel contesto dei sistemi su mainframe per grandi
compagnie che si sviluppa l’applicazione della MT
al problema della localizzazione.
Localizzazione significa adattamento di prodotti e
della relativa documentazione a particolari
condizioni culturali che possono variare dal
corretto modo di esprimere date, numeri, tempi,
indirizzi ed abbreviazioni a modificazioni più
complesse del testo per renderlo corrispondente
alle aspettative del cliente.
Mainframe e localizzazione
La localizzazione nasce come effetto
dell’immissione sul mercato di prodotti per
vari paesi in contemporanea o quasi.
Nasce soprattutto in relazione al software,
quindi ad un genere testuale (manuali)
caratterizzato da ripetitività e da piccole
differenze tra uno e l’altro, tra un’edizione e
l’altra.
Sistemi su PC
I sistemi che giravano su personal computer non
è chiaro per quali scopi fossero utilizzati, ne’
da chi … prevalentemente per avere traduzioni
sommarie di testi diversamente inaccessibili,
senza particolare interesse per la
pubblicazione del risultato della traduzione
Traduttori tascabili
Sono la versione elettronica dei dizionari
tascabili e hanno una analoga diffusione.
Vengono diffusi prevalentemente sul mercato
del turismo e dei viaggi
Vengono prodotti per molte lingue
Nelle versioni più recenti sono in grado di
produrre output vocali
Software di traduzione per telefonia
mobile
Sono una estensione delle funzioni dei telefoni
cellulari
Riguardano i linguaggi commercialmente
dominanti
Nelle versioni più recenti fanno riferimento a
database su server
Servizi di traduzione su Internet
Inizialmente non sono ad accesso libero e
simultanei
Sono la versione web dei primi sistemi di MT e
sono basati su regole, solo recentemente è
comparso Google Translate che applica un
approccio statistico
Non è chiaro come e da chi sono utilizzati
Servizi di traduzione su Internet
La MT è nuova per la maggior parte degli utenti
che scoprono i servizi di traduzione online.
Molti testano i servizi proponendo la traduzione
di espressioni idiomatiche e tentano di
valutare il servizio con una doppia traduzione.
Il risultato è deludente.
Servizi di traduzione su Internet
Non si hanno dati su chi usa i servizi di
traduzione online e per quale scopo.
Sorprendentemente sono poco utilizzati (15%)
per lo scopo che parrebbe più ovvio, la
traduzione di pagine web.
Nel 50% dei casi vengono sottomesse 1-2
parole, nel restante 50 frasi lunghe
mediamente 20 parole
Servizi di traduzione su Internet
Sembrerebbe quindi che siano usati come
dizionari, nonostante l’ampia disponibilità di
dizionari online
Prevalentemente da persone che conoscono la
lingua in cui traducono
Tuttavia l’utilizzo di questi servizi cresce
costantemente in modo esponenziale
A partire dal 2000 sono stati sviluppati anche
sistemi per la localizzazione di pagine web
Limiti della traduzione e della LC
Ulteriori limiti della MT sono stati messi in
evidenza in relazione alla gestione di linguaggi
colloquiali, cioè caratterizzati da frequenti
ellissi e irregolarità.
Ne sono un esempio:
• Messaggi di email
• SMS sui cellulari
• Messaggi su social network
Limiti della traduzione e della LC
A partire dal 1990 il crescente utilizzo di
telecomunicazioni ha portato allo sviluppo di
sistemi di traduzioni di messaggi di email e
pagine di informazione.
L’importanza per studi politici e sociali dei social
network ha evidenziato l’urgenza di trattare
testi che vengono prodotti in Facebook e
Twitter.
Limiti della traduzione e della LC
Anche se cresce il numero di sistemi in grado di
produrre output in forma vocale, la traduzione
del linguaggio orale è ancora una delle aree
più problematiche.
Non solo per i problemi legati all’analisi e sintesi
del parlato, ma anche per la forma particolare
dei dialoghi, la massiccia presenza di ellissi e la
forte dipendenza dal contesto.
Limiti della traduzione e della LC
Esistono progetti non commerciali per lo
sviluppo di sistemi di dialogo e traduzione su
domini limitati, come comunicazioni di affari e
prenotazioni alberghiere.
Un’area in via di sviluppo riguarda la
comunicazione medico-paziente con possibili
applicazioni in contesti in cui sono presenti
minoranze linguistiche.
Warren Weaver - 1949
“There is no need to do more than mention the
obvious fact that a multiplicity of languages
impedes cultural interchange between the
peoples of the earth, and is a serious
deterrent to international understanding.”
MT per quali lingue?
La MT si è orientata ai suoi esordi alla coppia
inglese-russo e successivamente alle lingue
commercialmente interessanti (giapponese,
tedesco, spagnolo, francese, cinese …).
Pochissima attenzione è stata prestata agli altri
linguaggi
MT per quali lingue?
Da un punto di vista globale, i linguaggi ‘minori’
sono quelli non significativi per le transazioni
commerciali
L’immigrazione però fa sì che linguaggi minori
siano parlati ovunque.
MT per quali lingue?
Il problema dei linguaggi delle minorità è dovuto
anche alla mancanza di risorse dedicate a tali
linguaggi (dizionari, spellchecker … corpora).
E ci sono anche linguaggi di minoranze non di
tipo etnico e geografico, come i sordi
MT per quali lingue?
Negli ultimi anni sono stati sviluppati progetti
per la traduzione nel linguaggio dei sordi ad
es. per l’italiano
E progetti per la traduzione di sottotitoli di
programmi televisivi
Ieri e oggi la MT
Oggi la tendenza è verso lo sviluppo di moduli di
traduzione integrati in sistemi che svolgono
varie funzioni e meno di sistemi dedicati
unicamente alla MT
Oltre alla MT, si lavora su altri task multilingue
come Information Retrieval e Information
Extraction: la traduzione non è un’attività
isolata
Ieri e oggi la MT
Dal punto di vista sociale il mondo è cambiato e
di conseguenza la richiesta di MT proviene da
utenti diversi e per task diversi rispetto al
passato.
Anche le aspettative sono oggi diverse e i
risultati positivi riguardano task e domini
limitati. La ricerca della traduzione perfetta
non ha più senso.
Scarica

MTsistemi-2015 - Dipartimento di Informatica