Lanciato il nuovo Minerva 7B: il modello linguistico della Sapienza si arricchisce di capacità

L’Università La Sapienza di Roma presenta Minerva 7B, un avanzato modello linguistico per l’italiano con 7 miliardi di parametri, migliorando la memorizzazione e l’interazione nel trattamento del linguaggio naturale.
Lanciato Il Nuovo Minerva 7B3A Lanciato Il Nuovo Minerva 7B3A
Lanciato il nuovo Minerva 7B: il modello linguistico della Sapienza si arricchisce di capacità - Gaeta.it

Minerva 7B è il nuovo modello linguistico sviluppato dall’Università La Sapienza di Roma, un passo decisivo nel campo dell’intelligenza artificiale dedicato alla lingua italiana. Oggi, è stato ufficialmente annunciato il rilascio di questa versione avanzata, che si distingue per le sue capacità di memorizzazione e rielaborazione, grazie a un significativo incremento del numero di parametri rispetto alla versione precedente. Questo aggiornamento rappresenta un importante progresso per il trattamento del linguaggio naturale, con un focus particolare sulle esigenze comunicative in italiano.

Dettagli sullo sviluppo di Minerva 7B

Il team coinvolto nella creazione di Minerva 7B è guidato dal professor Roberto Navigli e fa parte del gruppo di ricerca Sapienza Nlè , operante sotto il progetto Fair . Questo programma è volto a implementare la strategia nazionale per l’intelligenza artificiale, sostenuto da finanziamenti provenienti dal Pnrr. Un elemento fondamentale per il successo di questo progetto è stata la collaborazione con Cineca, che ha messo a disposizione il supercomputer Leonardo, strumento cruciale per l’addestramento del modello.

La principale novità di Minerva 7B è l’aumento del numero di parametri a 7 miliardi, un notevole miglioramento rispetto ai 3 miliardi della versione rilasciata ad aprile. Questo incremento offre una capacità senza precedenti di elaborare, memorizzare e attuare interazioni linguistiche più complesse. La nuova versione è stata addestrata utilizzando oltre 2 trilioni di token, equivalenti a circa 1,5 trilioni di parole, il che le consente di avere un bagaglio di conoscenze ed espressioni molto più ampio e variegato.

Le tecnologie alla base di Minerva 7B

Un aspetto distintivo di Minerva 7B è l’utilizzo di fonti aperte per il suo addestramento. Questa scelta segue una direzione strategica nel panorama degli LLM, permettendo un approccio trasparente e accessibile nello sviluppo del modello. Minerva ha subito un processo di instruction tuning, che implica il raffinamento delle capacità del modello nella comprensione e nell’interpretazione delle istruzioni, migliorando notevolmente la sua capacità di comunicare in modo naturale ed efficace.

Grazie a questi miglioramenti, Minerva 7B si presenta come uno strumento che può soddisfare in modo più efficace le richieste degli utenti, generando risposte più pertinenti e coerenti. Essa è ora capace di adattarsi meglio al contesto, rendendo le interazioni più fluide e soddisfacenti rispetto al passato.

Le dichiarazioni dei protagonisti e gli obiettivi futuri

Il professor Navigli ha messo in evidenza l’impegno del team nel garantire continui miglioramenti in termini di sicurezza e conversazionalità. Ha descritto il rilascio di Minerva 7B non come un traguardo, ma piuttosto come un punto di partenza per ulteriori sviluppi. L’idea è quella di instaurare un “laboratorio permanente” dove il modello venga costantemente aggiornato e testato per affrontare le nuove sfide del linguaggio naturale.

Antonella Polimeni, rettrice della Sapienza, ha ribadito l’importanza del progetto Minerva nell’ambito della missione universitaria, evidenziando come esso possa fungere da volano per l’innovazione e il progresso a beneficio della società. L’approccio dell’Università si fonda sull’idea di formare competenze elevate nel settore dell’intelligenza artificiale, mirando a fornire strumenti utili per il futuro.

La presentazione di Minerva 7B è, quindi, un passo significativo nel panorama dell’intelligenza artificiale in Italia, posizionando La Sapienza come un punto di riferimento per la ricerca e lo sviluppo nel campo dei modelli linguistici.

Ultimo aggiornamento il 26 Novembre 2024 da Sofia Greco

Change privacy settings
×