Mercato unico digitale e barriere linguistiche: una piattaforma di traduzione automatica per superare gli ostacoli

25 Settembre 2015
DIMT

Si stima che la realizzazione del Digital Single Market possa portare all’interno dell’Unione Europea una crescita nell’ordine dei 340 miliardi; ma se la ricchezza linguistica del Vecchio continente finisse per essere un ostacolo in grado di pregiudicare alcuni dei potenziali vantaggi della strategia della Commissione? È una domanda che, a 24 ore dalla Giornata europea delle lingue, non appare peregrina a giudicare dall’impegno che gli enti di ricerca stanno mettendo in campo per superare rischi finora tenuti sullo sfondo rispetto ad altre tematiche come il geo-blocking in materia di eCommerce e fruizione transfrontaliera dei contenuti online. I numeri che descrivono lo scenario sono infatti tutt’altro che rassicuranti: “Stando alla lettera aperta alla Commissione Europea firmata da 3.629 addetti ai lavori di tutta Europa provenienti dal mondo accademico e industriale, il 99% delle imprese europee è costituito da pmi, di cui solo il 7% riesce a vendere a consumatori che parlano una lingua diversa”, afferma Simonetta Montemagni, direttore dell’Istituto di linguistica computazionale Antonio Zampolli del Consiglio nazionale delle ricerche di Pisa (Ilc-Cnr): “Analogamente, il 90% dei clienti europei preferisce navigare all’interno di siti web nella propria lingua. Un supporto tecnologico adeguato che garantisca il multilinguismo e un Mercato unico digitale effettivo si stima potrebbe creare una crescita fino a 340 miliardi di euro, centinaia di migliaia di nuovi posti di lavoro e una società realmente basata sulla conoscenza”. Si badi bene, multilinguismo, non omologazione sull’inglese, lingua franca dell’era tecnologica; un altro rischio da evitare è infatti quello di una estinzione digitale delle lingue meno conosciute e utilizzate: “In occasione della Giornata di due anni fa – ricorda la ricercatrice – uno studio condotto da Meta-Net, una rete che riunisce i maggiori esperti di tecnologie linguistiche da 30 centri di ricerca in 34 Paesi europei, aveva diffuso l’allarme in tal senso. Ad oggi, la situazione non è cambiata significativamente; se da un lato il Digital Single Market è fondamentalmente multilingue, dall’altro la maggior parte delle lingue europee non ha un sufficiente supporto tecnologico, vanificando l’obiettivo di un lavoro, un commercio e una vita realmente senza frontiere”. L’esigenza di abbattere le barriere conservando e valorizzando al contempo la ricchezza linguistica dell’Ue trova il suo sbocco nel programma europeo Connecting Europe Facility (Cef.at), sviluppato per facilitare la comunicazione multilingue e disponibile gratuitamente per tutti i servizi pubblici europei. La tecnologia alla base di Cef.at è rappresentata da un sistema di traduzione automatica di tipo statistico che impara come tradurre un testo a partire da vaste collezioni di traduzioni esistenti: “Il sistema – spiega Montemagni – è stato addestrato primariamente sulle traduzioni della legislazione europea. Ciò lo rende non sempre in grado di soddisfare le esigenze dei servizi pubblici nazionali, e pertanto oggi la sfida consiste nella sua specializzazione in funzione delle peculiarità del linguaggio delle pubbliche amministrazioni nazionali ed europee. Tale obiettivo è perseguito nell’ambito dell’azione European Language Resources Coordination: uno sforzo di raccolta dati testuali e linguistici, mono e bilingui, senza precedenti, provenienti da istituzioni nazionali come ministeri, governi, amministrazioni pubbliche e organizzazioni non governative. In questo modo, Elrc contribuirà non solo a colmare il divario tra i servizi di traduzione automatica attualmente offerti dalla Commissione Europea e le esigenze dei servizi pubblici di tutta Europa, ma anche alla sopravvivenza delle lingue nazionali europee”. Elrc sta organizzando una serie di seminari nei Paesi partecipanti per comprendere le esigenze delle amministrazioni in materia di traduzione automatica, effettuare una ricognizione e raccolta di dati relativi alla lingua italiana e discutere di eventuali problemi tecnici e giuridici. L’evento italiano si terrà a Roma a inizio 2016 a cura dello stesso Ilc-Cnr, che opera nel settore della linguistica computazionale da quasi mezzo secolo. 25 settembre 2015