Trattamento automatico della lingua: nasce TALIA, spin off dell’istituto di linguistica computazionale “A. Zampolli” del CNR di Pisa in collaborazione con GruppoMeta – ETT. La nuova struttura, prima in Italia nel comparto, si colloca come trait d’union tra la ricerca scientifica dell’Intelligenza Artificiale e la società della conoscenza
Pisa, 4 agosto 2022 – È stato presentato a Pisa lo Spin off TALIA, nato grazie all’attività dell’Istituto di Linguistica Computazionale “A. Zampolli” del CNR di Pisa Dipartimento Scienze Umane e Sociali, Patrimonio Culturale (DSU), in collaborazione con GruppoMeta di ETT.
La nuova struttura, prima in Italia del comparto, si basa sulla coniugazione di Intelligenza Artificiale (IA) con il Trattamento Automatico della Lingua (TAL), tecnologia protagonista di una crescita esponenziale, trasversale a una molteplicità di industry della società della conoscenza, dalla Pubblica Amministrazione, alla scuola, alla sanità e anche alla valorizzazione del patrimonio culturale immateriale.
Sono proprio i sistemi di Trattamento Automatico del Linguaggio, infatti, che, servendosi dell’Intelligenza Artificiale, trasmettono a un computer le abilità indispensabili per utilizzare il linguaggio naturale nell’ottica di interagire con le persone (pensiamo ai chatbot). Abilitano, inoltre, a estrarre automaticamente informazioni da testi o da altri media (per es. la sentiment analysis dei social media) e a estendere dinamicamente la competenza linguistica, come avviene per il traduttore istantaneo.
La linguistica computazionale si occupa, infatti, dell’analisi ed elaborazione del linguaggio naturale, cioè quello che abitualmente utilizziamo, attraverso l’uso di metodologie informatiche. Con i sistemi di trattamento automatico del linguaggio si possono fare analisi a velocità inimmaginabile per le capacità dell’essere umano.
Utilizzando i tool a disposizione è possibile, per esempio, comprendere di cosa parla un testo, come ne parla e quale ne sia il sentimento prevalente, il target, la lingua materna di chi lo ha scritto, anche se diversa rispetto a quella del testo, e, con una certa accuratezza, anche la sua età e il suo livello di scolarizzazione.
Simonetta Montemagni direttrice dell’Istituto “A. Zampolli” ricorda: “Non è certo un caso che TALIA sia nato all’interno dell’Istituto di Linguistica Computazionale “Antonio Zampolli” del CNR di Pisa che opera nel settore della Linguistica Computazionale dal 1967, come Divisione di Linguistica Computazionale presso il Centro Nazionale Universitario di Calcolo Elettronico (CNUCE), e dal 1978 come Istituto indipendente del CNR. Da anni svolge un ruolo fondamentale nello sviluppo di tecnologie, prodotti e servizi per il trattamento automatico della lingua, con un occhio di riguardo alla lingua italiana. L’Istituto è stato tra i primi a intraprendere ricerche nel settore e, oggi, ha una consolidata posizione di centro di riferimento, a livello nazionale e internazionale”.
Talia è il primo spin-off di linguistica computazionale che si confronta direttamente con le esigenze del mercato, focalizzandosi sulla sperimentazione e realizzazione di modelli allo stato dell’arte per l’analisi della lingua italiana (e non solo) in contesti applicativi reali.
La mission di Talia è, dunque, quella di raggiungere una crescita tangibile e un’innovazione tecnologica dal punto di vista di funzioni, prestazioni e qualità negli ambiti del trattamento automatico del linguaggio e delle tecniche di Intelligenza Artificiale applicata ai testi.
Giovanni Verreschi, AD del Gruppo ETT, che controlla GruppoMeta dal 2021, ha dichiarato: “Grazie alla specializzazione di ETT e GruppoMeta nella tecnologia per l’innovazione nel settore della cultura, abbiamo verticalizzato ulteriormente il know how relativo alla linguistica computazionale rendendo possibile al Gruppo l’ingresso nel mondo delle soluzioni digitali sviluppate per la valorizzazione dei contenuti applicati ai beni culturali e all’editoria scolastica. Nello specifico di questo progetto, l’obiettivo di mercato è quello di ingegnerizzare algoritmi e tecnologie NLP (Natural Language Processing), frutto della ricerca accademica, e renderli facilmente utilizzabili tramite servizi in Cloud scalabili e performanti in diversi settori: dalla sanità all’editoria, dalla scuola al turismo, alla P.A. e, in generale, per tutte quelle realtà che hanno necessità di catalogare e restituire una grande quantità di dati“.
Date le premesse e le attese, lo spin off punta dunque a divenire il soggetto di riferimento per tutte le aziende e le realtà che hanno bisogno di gestire, conservare, analizzare, catalogare grandi quantità di dati e contenuti testuali – singoli documenti, manuali, banche dati, archivi – per trasformarli in informazioni accessibili e/o riorganizzarli, comprenderli, riscriverli in maniera automatica sfruttando le più moderne tecnologie informatiche e di Intelligenza Artificiale. Talia è, inoltre, in grado di fornire servizi fortemente innovativi allo stato dell’arte, sia rispetto agli strumenti di analisi del testo – in termini di contenuto, sentimento, forma linguistica – che in fase di authoring (per la realizzazione di una comunicazione multimediale riproducibile su pc) e scrittura.
“Lo scopo di Talia è proprio quello di raccogliere i risultati e le competenze di tutti questi anni di ricerca dell’Istituto di Linguistica Computazionale e sfruttare lo stato dell’arte nel settore del Trattamento Automatico della Lingua (TAL) e dell’Intelligenza Artificiale (IA), per realizzare prodotti software e sistemi in grado di risolvere ogni compito che richieda l’analisi e la produzione del testo con la velocità e l’affidabilità di una macchina, ma con le competenze di un essere umano”, conclude Felice Dell’Orletta, presidente di Talia e primo ricercatore del CNR.