Grok-3 di xAI sembra impressionante, ma il suo vero banco di prova è il mainstream

La xAI guidata da Elon Musk ha annunciato il suo ultimo modello di AI, Grok-3, tramite un livestream. Fin dall’inizio è stato evidente che l’azienda vuole colmare rapidamente tutte le lacune pratiche che possono rendere il suo chatbot più accessibile a un utente medio, piuttosto che limitarsi a vendere retorica sulla wokeness e sulla comprensione dell’universo.

L’azienda rilascerà due versioni del suo ultimo modello di AI: Grok-3 e Grok-3 mini. Quest’ultimo è addestrato per scenari a basso consumo, mentre il primo offrirà tutti i vantaggi di Grok-3, come DeepSearch, Think e Big Brain.

Cosa c’è da sapere su Grok-3

Homepage of Grok 3 chat.
  • Save

Mentre Musk parlava di tutte le nuove funzionalità in arrivo con Grok-3 insieme agli esperti di xAI, è stato evidente che questa versione non si limita a stabilire nuovi parametri di riferimento per le prestazioni, ma anche a recuperare tutte le tendenze che definiranno il panorama dell’IA nel 2025.

Secondo i benchmark condivisi dall’azienda, Grok-3 e anche Grok-3 mini hanno ottenuto risultati migliori rispetto ai modelli GPT-4o, Gemini, Claude e Deep Seek di OpenAI in compiti come il coding, la matematica e la risoluzione di problemi scientifici.

Nella classifica della Chatbot Arena (LMSYS), una prima versione di Grok-3 ha raggiunto un massimo di 1.400 punti, precedendo Gemini 2.0 Flash Thinking, DeepSeek e altri. L’azienda ha sviluppato Grok-3 a un ritmo impressionante e raggiungere queste prestazioni è un’impresa non da poco, nonostante sia un’azienda relativamente giovane rispetto a Google o OpenAI.

Grok-3 AI benchmark comparison.
  • Save

Spingerlo nel mainstream, tuttavia, sarà la sfida più grande, soprattutto dal punto di vista dell’accesso. Grok-3 sarà inizialmente disponibile per gli abbonati a X Premium come parte di un programma di accesso anticipato. Attualmente il livello più alto di abbonamento a X, Premium, ha un prezzo di 22 dollari al mese e 229 dollari per il piano annuale.

Gli utenti idonei avranno accesso alle funzionalità di Grok-3, come il ragionamento, la DeepSearch, limiti di utilizzo più elevati e l’accesso anticipato a nuovi strumenti. L’azienda sta inoltre lanciando un servizio di abbonamento separato, chiamato SuperGrok, che offre accesso prioritario a Grok-3 e limiti di generazione di immagini più elevati.

Introduction of SuperGrok by xAI team.
  • Save

Questo abbonamento sarà limitato all’applicazione mobile Grok e al sito web Grok.com, appena lanciato. Musk afferma che le funzionalità più recenti e avanzate saranno comunque disponibili tramite il sito web.

“Si tratta di una sorta di beta, quindi all’inizio dovreste aspettarvi qualche imperfezione, ma miglioreremo rapidamente”, ha detto Musk durante il livestream, aggiungendo che gli utenti possono aspettarsi miglioramenti ogni giorno. Sarebbe interessante vedere come xAI colmerà il vuoto di interesse di un appassionato di chatbot con un telefono e contemporaneamente invierà un succoso pitch deck a clienti aziendali molto paganti.

Aggiornarsi sulle tendenze

xAI sembra aver fatto molto con Grok-3, non solo in termini di miglioramento delle funzionalità, ma anche di parità di funzioni. Uno degli elementi di spicco di Grok-3 è il potenziamento delle capacità di ragionamento e di pensiero, che sembra essere la nuova tendenza nel mondo dei modelli linguistici.

Prendiamo ad esempio la modalità Think di Grok-3, che è una diretta rivale dei modelli della serie O di OpenAI. Questi modelli di intelligenza artificiale sono progettati per dedicare più tempo alla riflessione e alla scomposizione delle domande dell’utente prima di fornire la risposta.

Gli utenti possono vedere la catena di pensieri in tempo reale e i vantaggi, secondo gli utilizzatori, sono migliori prestazioni nelle ricerche scientifiche, matematiche e di codifica. xAI sta coprendo questo divario non solo con la modalità Think, ma anche con uno strumento Big Brain separato per Grok-3 che ne potenzierà le capacità di calcolo per scenari più avanzati e complessi.

Grok 3 deep thinking response.
  • Save

Google non è da meno con la sua linea Gemini. L’azienda ha recentemente lanciato la serie Gemini 2.0 di modelli di intelligenza artificiale, che comprende Gemini 2.0 Flash Thinking Experimental e un’iterazione separata app-first che dà priorità alle informazioni estratte da YouTube, Maps e Google Search.

DeepSeek, il chatbot cinese open-source che ha recentemente sconvolto Wall Street, offre anche un prodotto di pensiero e ragionamento chiamato DeepThink. Anche se le risposte sono censurate, le prestazioni sono davvero impressionanti.

anche xAI sta inseguendo la formula dell’agente di intelligenza artificiale con Grok-3, anche se ha molta strada da percorrere, soprattutto se confrontata con aziende del calibro di OpenAI e Google. A tal fine, l’azienda sta lanciando il suo primo prodotto agenziale basato su Grok-3, chiamato DeepSearch.

Elon Musk with xAI team
  • Save

Funziona più o meno come Deep Research di Google Gemini e gli omonimi prodotti rivali di Perplexity e OpenAI. Esegue una ricerca sul web, compila un rapporto completo e fornisce anche tutte le fonti da cui ha tratto informazioni come citazioni.

xAI è arrivato in ritardo nella corsa, ma il prezzo potrebbe essere un ostacolo quando si tratta di un’applicazione di massa. Perplexity offrirà un numero limitato di query Deep Research gratuitamente, mentre Google offre un pacchetto più generoso con Gemini Deep Research a 20 dollari per gli abbonati a Gemini Advanced.

La Ricerca Profonda (o DeepSearch per Grok-3) è un processo estremamente dispendioso dal punto di vista dei calcoli, quindi ha senso che sia un vantaggio premium. Ma dare ai clienti un assaggio, anche con un numero limitato di query, significa avere maggiori possibilità di guadagnare nuovi abbonati, una strategia che sia Perplexity che OpenAI stanno seguendo.

A demonstration of Gemini Live on a Google Pixel 9.
  • Save

Musk ha anche accennato al fatto che una modalità di interazione vocale è in arrivo su Grok e che sarà lanciata tra circa una settimana. L’obiettivo è fornire un metodo alternativo per conversare con Grok, che risulti più naturale.

ChatGPT di OpenAI offre da tempo una modalità chiamata Voice Mode e una funzione simile, chiamata Gemini Live, è disponibile anche per gli utenti di Google Gemini.

xAI non ha fornito molti dettagli sulla modalità vocale di Grok-3, ma ha confermato che sarà dotata di una memoria conversazionale in grado di ricordare i dettagli delle interazioni precedenti. “È una delle migliori esperienze di Grok”, ha detto Musk durante il livestream.

La sfida è trovare un appeal di massa

Tools for using Grok-3 AI.
  • Save

Deep Research non è l’unica implementazione agenziale di chatbot AI, ed è qui che xAI è molto indietro. OpenAI ha recentemente presentato Operator, un agente AI in grado di eseguire compiti complessi sul web per conto degli utenti, assumendo essenzialmente il controllo delle attività di navigazione sul web.

Grazie al framework Computer-Using Agent (CUA), è in grado di svolgere attività come lo shopping, la prenotazione di ristoranti e le attività legate ai viaggi. Soprattutto, OpenAI ha già stretto accordi con aziende come DoorDash, InstaCart, Uber ed eBay per promuovere l’Operatore come un’impressionante vetrina di capacità agenziali pratiche.

C’è poi il sistema di plug-in di ChatGPT, che rende il chatbot molto più funzionale grazie all’integrazione con piattaforme come Zapier, Expedia, Klarna, Slack e Shopify. Questi plugin rendono ChatGPT un prodotto molto più interessante per le aziende rispetto a Grok-3.

Google, invece, sfrutta il suo ampio portafoglio di prodotti e applicazioni che le persone utilizzano quotidianamente. La profonda integrazione a livello di sistema con le app (tramite estensioni) su Android e la disponibilità di funzionalità Gemini multimodali nei prodotti Workspace come Gmail e Docs le conferiscono un netto vantaggio funzionale.

DeepSeek, invece, è già stato adottato da marchi come Honor. Apple ha inoltre introdotto uno stack di Apple Intelligence basato su ChatGPT in milioni di iPhone e Mac e ha siglato un accordo con Alibaba per offrire queste funzionalità in Cina.

xAI non ha ancora trovato acquirenti per Grok. Questa è la sfida più grande per xAI in questo momento e sarebbe interessante vedere quali marchi riuscirà a coinvolgere per spingere Grok-3, con tutte le sue caratteristiche, nel mainstream.

Leggi di più su www.digitaltrends.com

Articoli correlati

Share via
Copy link