Notizie

I ricercatori di IBM hanno scoperto che l’IA addestrata con un computer quantistico ha mostrato un notevole miglioramento. (Credito immagine: fotograzia via Getty Images)Condividi questo articolo 0Unisciti alla conversazioneSeguiciAggiungici come fonte preferita su GoogleIscriviti alla nostra newsletter
I ricercatori hanno sviluppato un metodo per ridurre l’incertezza nei sistemi di intelligenza artificiale (IA) sfruttando la potenza dei computer quantistici. Affermano che il loro lavoro rappresenta la prima dimostrazione di “potenziamento quantistico” in un modello linguistico di grandi dimensioni (LLM) pre-addestrato su scala di produzione.
Una delle metriche chiave utilizzate per misurare la qualità e le capacità dei sistemi di IA come Claude di Anthropic, ChatGPT di OpenAI e servizi simili è un’unità nota come “perplessità” – spesso espressa come PPL. Questa misura la capacità generale di un sistema di prevedere correttamente la parola successiva in una frase o sequenza di parole.
Un sistema con un PPL basso è considerato migliore nel prevedere la parola successiva, mentre uno con un PPL alto ha matematicamente maggiori probabilità di produrre risultati errati. Esistono molteplici metodi per ridurre il PPL nei grandi modelli di IA, tra cui il fine-tuning, l’addestramento su set di dati più ampi e l’aggiunta di parametri.
GPT-5.5, ad esempio, si stima abbia tra 2 trilioni e 5 trilioni di parametri. In tutti gli LLM standard, ogni parametro occupa spazio nella memoria del sistema, il che significa che man mano che questi modelli diventano più grandi e capaci, richiedono infrastrutture sempre più imponenti.
Ma gli scienziati di Multiverse Computing hanno trovato un’alternativa all’ampliamento dell’infrastruttura intorno all’IA. In un nuovo studio caricato il 7 maggio sul database di preprint arXiv, hanno proposto che un relativo piccolo aumento del numero di parametri in un modello di IA possa portare a una significativa riduzione della perplessità quando li si esegue utilizzando blocchi di circuiti quantistici – le unità fondamentali dei calcoli quantistici.
“I risultati qui riportati costituiscono, per quanto ne sappiamo, la prima dimostrazione di potenziamento quantistico end-to-end di un LLM distribuito su larga scala e ampiamente utilizzato su hardware quantistico superconduttore reale per la generazione di linguaggio autoregressivo,” hanno scritto gli scienziati nello studio. “La loro importanza non risiede nella magnitudine dei miglioramenti della perplessità – che cresceranno con la fedeltà dell’hardware e il numero di qubit – ma nel fatto che esistono.”
Un passo avanti per l’IA potenziata dal quantistico
Nello studio, i ricercatori hanno creato ed eseguito blocchi di circuiti quantistici chiamati adattatori unitari parametrizzati di Cayley (CUA).
I parametri di Cayley sono un insieme di matrici matematiche che possono essere “addestrati” ponderandoli verso specifici componenti matriciali. Vengono inseriti in uno strato specifico di un LLM per l’addestramento su un computer classico.
I parametri originali dell’LLM vengono congelati durante questo processo in modo che rimangano invariati. Il nuovo sistema ibrido contenente sia i parametri di Cayley addestrati che i parametri del modello originale viene quindi eseguito sull’unità di elaborazione quantistica superconduttrice IBM Quantum System Two a 156 qubit (QPU).

IBM ha svelato i suoi piani per costruire Starling, il primo computer quantistico fault-tolerant al mondo, entro il 2029.
(Credito immagine: IBM)
Il modello ibrido quantistico-classico risultante ha ridotto la perplessità di Llama 3.1 8B – un modello da 8 miliardi di parametri creato da Meta – dell’1,4% aggiungendo solo 6.000 parametri (un aumento dello 0,000075%).
Borja Aizpurua, scienziato ricercatore senior presso Multiverse Computing e primo autore dello studio, ha descritto la nuova tecnica come una prova di concetto per ulteriori sviluppi. Parlando con Live Science, ha spiegato che i computer quantistici possono offrire alcuni vantaggi rispetto a un paradigma strettamente classico, ma comportano un compromesso.
“La prima cosa che fai è codificare [i parametri] nel computer quantistico. Una volta codificato lo stato, sei pronto per applicare l’adattatore unitario di Cayley, che addestriamo classicamente e poi implementiamo nell’hardware quantistico,” ha detto.
Ha spiegato che questi adattatori sono piccoli, il che è importante perché più grande è il circuito, maggiore è il “rumore”. Il rumore generato durante i calcoli quantistici – che può provenire da interazioni con qubit vicini, disturbi dal campo magnetico terrestre, radiazioni da Wi-Fi o telefoni, e persino raggi cosmici – può causare errori e rendere gli output e le misurazioni insignificanti.
Come in gran parte della ricerca sul calcolo quantistico, la correzione degli errori quantistici è una delle principali aree di interesse. In questo studio, la mitigazione degli errori causati dal rumore è stata l’ostacolo principale che Aizpurua e il team di Multiverse Computing hanno cercato di superare.
Affrontare problemi del mondo reale
Gli scienziati hanno caricato gli adattatori unitari di Cayley addestrati classicamente nel sistema quantistico prima che avvenisse l’inferenza end-to-end – la fase di utilizzo dell’IA in cui il modello esegue una risposta. Quindi, gli output ibridi potevano essere misurati rispetto ai normali risultati non potenziati quantisticamente.
I ricercatori hanno scoperto che il modello ibrido poteva rispondere correttamente a diverse domande a cui il modello Llama di base non era in grado di rispondere.
In una domanda di astronomia, il modello originale ha selezionato erroneamente un’opzione indicando che solo Saturno ha anelli di pianeti gioviani. Tuttavia, il modello potenziato con CUA ha identificato correttamente tutti i pianeti gioviani come dotati di anelli.
In un altro esempio, il modello originale ha risposto in modo errato a una domanda di biologia sulle conseguenze genetiche dell’immigrazione genica sulla popolazione, selezionando “disruzione di Hardy-Weinberg”, mentre il modello potenziato con CUA ha correttamente identificato un’aumentata omogeneità genetica.
“Quindi qui possiamo vedere un esempio in cui un modello non risponde correttamente, e poi aggiungi qualcosa di quantistico e improvvisamente risponde correttamente,” ha detto Aizpurua.
Storie correlate
- Un computer quantistico rivoluzionario potrebbe consumare 2.000 volte meno energia di un supercomputer e risolvere problemi 200 volte più velocemente
- Gli scienziati costruiscono un ‘processore AGI’ specializzato che credono alimenterà la prossima ondata di agenti AI
- La svolta dell’AI di Google significa che i chatbot usano 6 volte meno memoria durante le conversazioni senza compromettere le prestazioni
Questo risultato, unito alla riduzione misurata dell’1,4% della perplessità, dimostra un chiaro percorso per lo sviluppo di sistemi IA ibridi quantistici, ha affermato Aizpurua. Ha aggiunto che questa ricerca potrebbe aiutare i ricercatori a superare gli attuali colli di bottiglia nello sviluppo in cui i sistemi sono limitati dalla capacità degli sviluppatori di scalare l’infrastruttura informatica classica.
La ricerca futura comporterebbe lo sviluppo di metodi mediante i quali l’intero circuito quantistico, non solo gli adattatori unitari di Cayley, venga direttamente codificato, ha detto Aizpurua. Ciò risulterebbe presumibilmente in un LLM capace di raggiungere una perplessità inferiore e una maggiore accuratezza, utilizzando meno parametri rispetto a qualsiasi metodo puramente classico.
In definitiva, ha detto, l’obiettivo della ricerca è produrre sistemi di IA di qualità superiore capaci di raggiungere il “vantaggio quantistico”, un termine che descrive un sistema informatico basato sul quantistico capace di compiere imprese irraggiungibili da qualsiasi computer classico.
Riesci ad abbinare questi antichi dispositivi alle loro immagini? Scoprilo con il nostro quiz sull’informatica!
Sourse: www.livescience.com