L’Università Sapienza di Roma ha presentato ufficialmente Minerva 7B, la versione aggiornata del suo modello linguistico di IA generativa. Sviluppato in partenariato con FAIR – Future Artificial Intelligence Research (la Fondazione che realizza gli interventi del PNRR nel settore dell’intelligenza artificiale) e in collaborazione con il consorzio interuniversitario Cineca che ha messo a disposizione il supercomputer Leonardo, il chatbot alza lo standard di prestazioni, interoperabilità e sicurezza degli LLM (Large Language Model) completamente italiani.
La Sapienza presenta Minerva 7B: cosa cambia nell’LLM
Minerva 7B è addestrato con un dataset di 2 trilioni di token corrispondenti a circa 1,5 trilioni di parole, è ottimizzato per la lingua italiana e potenziato a 7,4 miliardi di parametri (da cui il nome 7B), più del doppio rispetto alla capacità della versione precedente che si fermava a 3 miliardi. Il processo avanzato di tuning delle istruzioni (la tecnica per la messa a punto degli LLM su un set di dati etichettato di prompt didattici e output corrispondenti per migliorare le prestazioni dei modelli nel colloquiare e nel seguire le istruzioni) garantisce un’elevata elaborazione e comprensione del linguaggio naturale in italiano, con risposte coerenti e appropriate, più accurate e pertinenti al contesto.
La sicurezza è assicurata da 21mila istruzioni di safety su tematiche sensibili come la discriminazione razziale, la criminalità, le molestie, la violenza di genere e l’uso di sostanze illegali. È da questo incrocio tra oltre 300mila ore GPU di addestramento da zero in italiano, trasparenza delle fonti utilizzate (un corpus enorme di testi dal web) e instruction tuning potenziato a 580mila esempi che Minerva 7B lavora come modello completamente aperto, in grado di capire a fondo la richiesta dell’utente, elaborarla e fornire una risposta coerente, evitando nei limiti del possibile le cosiddette allucinazioni e la generazione di contenuti volgari o discriminatori.
L’ultima versione di Minerva promette quindi di migliorare significativamente l’interpretazione e la generazione di testi, facendo fare un salto di qualità notevole alla Gen AI nazionale. Ma è soprattutto un progetto d’avanguardia che poggia su una tecnologia tutta italiana, flessibile, inclusiva e comprensibile, addestrata su dati italiani autorizzati e di origine garantita e capace di “sfidare” le piattaforme di Big Tech come ChatGPT di OpenAI, Copilot di Microsoft e Gemini di Google. Un’AI generativa riflesso della lingua, della cultura e della società italiane, che vuole imporsi come modello di riferimento per la pubblica amministrazione e modello di cooperazione tra i soggetti che l’hanno realizzata.
Chi c’è dietro Minerva: un mix di accademia e innovazione
Dietro Minerva 7B c’è il gruppo di ricerca Sapienza NLP (Natural Language Processing) composto da 15 ricercatori e dottorandi guidati da Roberto Navigli, professore di IA e robotica al Dipartimento di Ingegneria informatica, automatica e gestionale (DIAG) della Sapienza e co-fondatore di Babelscape, la start-up deep tech dell’ateneo romano che programma software di intelligenza artificiale per l’analisi grammaticale, logica e semantica, l’estrazione di termini e concetti chiave e la comprensione di testi. Il team si è avvalso anche della collaborazione di NVIDIA e con quest’evoluzione di Minerva rilascia ITA-Bench, il primo grande benchmark italiano con 18 task.
Alla presentazione ufficiale di Minerva 7B, Navigli ha spiegato che questo modello linguistico “è un punto di partenza per sviluppare soluzioni trasparenti e sicure, con l’obiettivo di ampliare le collaborazioni con editori ed enti pubblici”. “Il nostro impegno è continuare a lavorare per massimizzare la sicurezza e gli aspetti conversazionali in una sorta di laboratorio permanente, con la consapevolezza scientifica che il rilascio di oggi non è un traguardo ma un punto di partenza. La scarsità di dati di qualità in italiano, sia per il preaddestramento linguistico sia per le conversazioni e le istruzioni, è uno dei temi chiave che intendiamo affrontare nei prossimi mesi”, ha aggiunto Navigli.
Cosa fa e come funziona Minerva 7B
È possibile utilizzare Minerva 7B gratuitamente accedendo al sito web ufficiale e interagendo con il modello attraverso una classica interfaccia di dialogo. Il chatbot può essere utilizzato per scrivere e riassumere testi, rispondere a domande, tradurre lingue, comporre mail e post per i social e i blog, generare codici di programmazione, fornire assistenza e molto altro ancora. Prossimamente il modello sarà reso scaricabile: l’approccio open source vuole trasformarlo in uno strumento utilizzabile da parte delle pubbliche amministrazioni e per tutti gli scopi istituzionali, aperto alle aziende italiane che vogliono adottare soluzioni e servizi di IA e a studenti e studentesse come mezzo d’insegnamento della Gen AI.
Per cominciare ad usare Minerva 7B basta accedere al portale, generare un account con nome, cognome e indirizzo mail con Open WebUI e verificare il profilo. A quel punto si apre la consueta finestra di dialogo con cui iniziare a chattare. Dalle impostazioni si possono modificare la lingua, l’interfaccia, le proprietà audio, esportare, modificare o cancellare le chat e personalizzare l’account. Questa fase di soft launch è molto utile perché permette di svolgere un lavoro di perfezionamento sulla base delle conversazioni effettuate dagli utenti e raccogliere feedback indispensabili ai programmatori. Una versione più robusta del modello, basata anche su questi riscontri, dovrebbe essere resa disponibile entro la fine del 2024.