Una fuga di notizie suggerisce che il rilascio del modello di AI open-source di OpenAI è imminente

 

Una fuga di notizie suggerisce che OpenAI sta per lanciare un nuovo potente modello di intelligenza artificiale open-source, potenzialmente entro poche ore.

Le prove provengono da una scia di briciole digitali, anelate dagli sviluppatori. Al centro di tutto ci sono degli screenshot che mostrano una serie di repository di modelli con nomi come yofo-deepcurrent/gpt-oss-120b e yofo-wildflower/gpt-oss-20b. I repository sono stati nel frattempo cancellati, ma gli account presentano membri del team OpenAI.

Il tag gpt-oss è la vera pistola fumante, apparentemente un chiaro segnale di “GPT Open Source Software”. Per un’azienda che ha sempre più protetto i suoi modelli di punta, questo sarebbe una sorta di ritorno alle origini. Il fatto che stiamo vedendo più versioni, con nomi in codice e dimensioni diverse, suggerisce che sta per debuttare una famiglia di modelli ben pianificata.

Screenshot of alleged leaked repos for OpenAI's open-source AI model that is set for imminent launch.
  • Save

Grazie a un file di configurazione trapelato, possiamo anche sbirciare sotto il cofano della presunta versione da 120 miliardi di parametri.

Il modello sembra essere costruito su un’architettura Mixture of Experts, o MoE. Non si tratta di un cervello unico e monolitico che cerca di sapere tutto, ma di un consiglio di 128 consulenti specializzati. Quando arriva una richiesta, il sistema seleziona in modo intelligente i quattro migliori esperti per il lavoro. In questo modo il modello ha la vasta conoscenza del suo enorme numero di parametri, ma la velocità e l’agilità di un sistema molto più piccolo, dato che solo una frazione di esso lavora in ogni momento.

Questo design mette il modello di intelligenza artificiale open-source di OpenAI in competizione con i più famosi della scena, come Mixtral di Mistral AI e la famiglia Llama di Meta.

E le specifiche non si fermano qui. Il modello di intelligenza artificiale open-source di OpenAI sembra vantare un vocabolario enorme, che dovrebbe renderlo più efficiente con una gamma più ampia di lingue, e utilizza la Sliding Window Attention per gestire lunghi flussi di testo senza sudare. In pratica, tutto questo fa pensare a un modello potente e pratico da eseguire.

Allora, perché OpenAI ha fatto una mossa del genere proprio ora? Per anni, l’azienda ha affrontato critiche leggere e definitive per essersi allontanata dai suoi inizi più aperti. Lanciare un potente gpt-oss sarebbe una massiccia offensiva di fascino rivolta direttamente agli sviluppatori e ai ricercatori che si sono sentiti abbandonati.

Naturalmente, si tratta anche di un’accorta mossa competitiva. Meta e Mistral hanno dimostrato come un fiorente ecosistema open-source possa guidare l’innovazione. Con l’introduzione di un potente modello di intelligenza artificiale open-source come sembra essere questo, OpenAI non si sta solo unendo alla gara, ma sta cercando di ridefinire la pista.

Finché non avremo notizie ufficiali da OpenAI, tecnicamente si tratta ancora di voci. Ma si tratta di voci concrete, supportate da codice e file di configurazione.

Il lancio di un modello MoE open-source ad alte prestazioni e da 120 miliardi di parametri da parte del nome più famoso dell’IA sarebbe a dir poco un evento epocale e sembra essere imminente.

(Foto di Mariia Shalabaieva)

 

Leggi di più su www.artificialintelligence-news.com

Articoli correlati

Share via
Copy link