Ecco Minerva, l'IA in italiano che sfiderà ChatGpt
Modello linguistico con 500 miliardi parole nella nostra lingua
Si chiamano Minerva e sono i nuovi modelli di Intelligenza Artificiale generativa pensati da un gruppo di ricercatori italiani per addestrare da zero nella nostra lingua con 500 miliardi di parole, i futuri Large Language Model come ChatGpt ma interamente in italiano. A realizzarli è stato il gruppo di ricerca Natural Language Processing (Nlp) dell'Università Sapienza di Roma, all'interno di Fair - Future Artificial Intelligence Research, e il supercomputer Leonardo del Cineca. "La caratteristica distintiva dei modelli Minerva - ha detto Roberto Navigli, alla guida di Sapienza Nlp - è il fatto di essere stati costruiti e addestrati da zero usando testi ad accesso aperto, al contrario dei modelli italiani esistenti che sono basati sull'adattamento di modelli come LLaMA e Mistral, i cui dati di addestramento sono tuttora sconosciuti". Ogni modello Minerva è stato addestrato su un vasto insieme di fonti italiane e inglesi online e documentate, per un totale di oltre 500 miliardi di parole, l'equivalente di oltre 5 milioni di romanzi. Modelli che da oggi sono disponibili alla comunità scientifica di Fair, il progetto guidato dal Consiglio Nazionale delle Ricerche che realizza la strategia nazionale sull'IA, e in futuro anche al pubblico. Un progetto che vuole fornire fondamenta trasparenti per sistemi di intelligenza artificiale che siano applicabili in diversi campi, dalla comprensione del linguaggio naturale alla generazione di testo.
(W.Budayev--DTZ)