Meta condivide i suoi ultimi progressi nell’identificazione automatica degli oggetti, uno sviluppo chiave nella sua spinta AR

Meta ha delineato i suoi ultimi progressi nell’identificazione automatica degli oggetti all’interno delle immagini, con il suo sistema aggiornato SEER ora, secondo Meta, il più grande e avanzato modello di computer vision disponibile. SEER – che è un derivato di ‘self-supervised’ – è in grado di imparare da qualsiasi gruppo casuale di immagini su Internet, senza la necessità di una curatela ed etichettatura manuale, che accelera la sua capacità di identificare una vasta gamma di oggetti diversi all’interno di un fotogramma, ed è ora in grado di superare i principali sistemi di computer vision standard del settore in termini di precisione.

Meta SEER examples
  • Save

E sta solo migliorando. La versione originale di SEER, che è stata inizialmente annunciata da Meta l’anno scorso, è stata costruita su un modello di oltre 1 miliardo di immagini. Questa nuova versione ha ora una portata 10 volte superiore. Come spiegato da Meta: Quando abbiamo annunciato SEER per la prima volta la scorsa primavera, ha superato lo stato dell’arte dei sistemi, dimostrando che l’apprendimento auto-supervisionato può eccellere in compiti di computer vision in ambienti reali. Ora abbiamo scalato SEER da 1 miliardo a 10 miliardi di parametri densi, rendendolo a nostra conoscenza il più grande modello di computer vision denso del suo genere” Di particolare rilievo è la capacità del sistema di identificare diverse immagini di persone e culture diverse, mentre è anche in grado di assegnare significato e interpretazione agli oggetti provenienti da diverse regioni globali. I sistemi tradizionali di computer vision sono addestrati principalmente su esempi provenienti dagli Stati Uniti e dai paesi ricchi in Europa, quindi spesso non funzionano bene per le immagini provenienti da altri luoghi con caratteristiche socioeconomiche diverse. Ma SEER offre ottimi risultati per immagini provenienti da tutto il mondo – comprese le regioni non statunitensi e non europee con un’ampia gamma di livelli di reddito” Questo è significativo, perché espanderà la comprensione del sistema di oggetti e usi diversi, che può quindi aiutare a migliorare l’accuratezza, e fornire migliori descrizioni automatiche di ciò che è in un fotogramma. Questo può quindi fornire più contesto per gli utenti ipovedenti, insieme alla corrispondenza dell’identificazione del prodotto, ai segnali di segnaletica, agli avvisi di branding, ecc. Meta nota anche che il sistema è una componente chiave del suo prossimo cambiamento. L’avanzamento della computer vision è una parte importante della costruzione del Metaverso. Per esempio, per costruire occhiali AR che possano guidarvi verso le vostre chiavi fuori posto o mostrarvi come fare una ricetta preferita, avremo bisogno di macchine che capiscano il mondo visivo come fanno le persone. Dovranno funzionare bene nelle cucine non solo a Kansas e Kyoto, ma anche a Kuala Lumpur, Kinshasa e una miriade di altri posti nel mondo. Questo significa riconoscere tutte le diverse varianti di oggetti quotidiani come le chiavi di casa o i fornelli o le spezie. SEER apre una nuova strada nel raggiungimento di questa robusta performance” Meta sta lavorando sul miglioramento dell’identificazione degli oggetti da anni, e ha fatto progressi significativi in termini di didascalie automatizzate, descrizioni dei lettori e altro.

Facebook image recongnition example
  • Save

Sta anche lavorando sull’identificazione degli oggetti all’interno dei video, la prossima fase. E mentre questa non è ancora un’opzione praticabile, potrebbe, alla fine, portare a tutte le nuove intuizioni sui dati, consentendo di imparare di più su ciò che ogni singolo utente pubblica, e come raggiungerlo con le vostre promozioni. Anche ora, questo può essere prezioso. Se si sapesse, per esempio, che un certo sottoinsieme di utenti su Instagram è più propenso a postare una foto del proprio pasto, in base ai modelli di post precedenti, questo potrebbe aiutare nel targeting degli annunci. Estrapolate questo a qualsiasi soggetto, con un alto grado di precisione nella corrispondenza dei dati, e questo potrebbe essere un ottimo modo per generare il massimo valore dal vostro approccio pubblicitario. E questo prima, come nota Meta, di considerare le applicazioni avanzate nelle sovrapposizioni AR, o nel migliorare i suoi algoritmi video per mostrare alle persone più del contenuto che hanno più probabilità di impegnarsi, in base a ciò che è effettivamente in ogni fotogramma. La prossima fase sta arrivando, e sistemi come questo saranno alla base di grandi cambiamenti nella connettività online. Puoi leggere di più sul sistema SEER di Meta qui

. Leggi di più su Social Media Today

Articoli correlati

Share via
Copy link