Il team Qwen di Alibaba ha appena rilasciato una nuova versione del suo modello di intelligenza artificiale open-source con alcuni benchmark impressionanti.
Meet Qwen3-235B-A22B-Thinking-2507. Negli ultimi tre mesi, il team di Qwen ha lavorato duramente per aumentare la cosiddetta “capacità di ragionamento” della sua IA, con l’obiettivo di migliorare sia la qualità che la profondità del suo ragionamento.
Il risultato dei loro sforzi è un modello che eccelle nelle cose davvero difficili: ragionamento logico, matematica complessa, problemi scientifici e codifica avanzata. In queste aree, che di solito richiedono l’intervento di un esperto umano, il nuovo modello Qwen sta definendo lo standard dei modelli open-source.
Nei benchmark di ragionamento, l’ultimo modello di intelligenza artificiale open-source di Qwen ha ottenuto 92,3 su AIME25 e 74,1 su LiveCodeBench v6 per il coding. Inoltre, si distingue anche nei test di capacità più generali, ottenendo un punteggio di 79,7 su Arena-Hard v2, che misura l’allineamento con le preferenze umane.

Si tratta di un modello di intelligenza artificiale a ragionamento massivo realizzato dal team di Qwen, con 235 miliardi di parametri in totale. Tuttavia, utilizza il Mixture-of-Experts (MoE), il che significa che attiva solo una frazione di questi parametri – circa 22 miliardi – in qualsiasi momento. È come avere un’enorme squadra di 128 specialisti a disposizione, ma solo gli otto più adatti a un compito specifico vengono chiamati a lavorarci.
Forse una delle caratteristiche più impressionanti è la sua enorme memoria. Il modello di intelligenza artificiale ragionante open-source di Qwen ha una lunghezza di contesto nativa di 262.144 token; un vantaggio enorme per i compiti che prevedono la comprensione di grandi quantità di informazioni.
Per gli sviluppatori e gli appassionati, il team di Qwen ha reso facile iniziare a lavorare. Il modello è disponibile su Hugging Face. Puoi distribuirlo utilizzando strumenti come sglang o vllm per creare il tuo endpoint API. Il team indica anche il suo framework Qwen-Agent come il modo migliore per utilizzare le capacità del modello di chiamare gli strumenti.
Per ottenere le migliori prestazioni dal loro modello di ragionamento AI open-source, il team di Qwen ha condiviso alcuni consigli. Suggeriscono una lunghezza di output di circa 32.768 tokens per la maggior parte dei compiti, ma per le sfide davvero complesse, dovresti aumentare la lunghezza a 81.920 tokens per dare all’IA abbastanza spazio per “pensare”. Si consiglia inoltre di dare al modello istruzioni specifiche nel prompt, ad esempio chiedendogli di “ragionare passo dopo passo” per i problemi di matematica, per ottenere risposte più accurate e ben strutturate.
Il rilascio del nuovo modello Qwen offre un’intelligenza artificiale potente e open source in grado di competere con alcuni dei migliori modelli proprietari, soprattutto quando si tratta di compiti complessi e impegnativi per il cervello. Sarà interessante vedere cosa gli sviluppatori riusciranno a costruire con questo modello.
(Immagine di Tung Lam)
Leggi di più su www.artificialintelligence-news.com

Consulente di comunicazione, social media, SEO ed e-commerce. Grafico, web designer, impaginatore, copertinista e addentrato quanto basta in tutto ciò che riguarda l’Internet. Appassionato di narrativa, arti visive e cinema di menare. Nerd. Gamer.
Vivo e lavoro come freelancer in provincia di Taranto.