Questo strumento di Google AI individua le cause genetiche del cancro

Google ha annunciato DeepSomatic, uno strumento di intelligenza artificiale in grado di identificare con maggiore precisione le mutazioni legate al cancro nelle sequenze genetiche dei tumori.

Il cancro inizia quando i controlli che governano la divisione cellulare non funzionano. Individuare le specifiche mutazioni genetiche che guidano la crescita di un tumore è essenziale per creare piani di trattamento efficaci. I medici ora sequenziano regolarmente i genomi delle cellule tumorali dalle biopsie per informare i trattamenti che possono indirizzare il modo in cui un particolare cancro cresce e si diffonde.

Pubblicato su Nature Biotechnology, questo lavoro presenta uno strumento che utilizza le reti neurali convoluzionali per identificare le varianti genetiche nelle cellule tumorali con una precisione maggiore rispetto ai metodi attuali. Google ha reso disponibili sia DeepSomatic che il set di dati di addestramento di alta qualità creato per questo strumento.

La sfida delle varianti somatiche

La genetica del cancro è complessa. Sebbene il sequenziamento del genoma trovi variazioni genetiche del cancro, distinguere le varianti reali dagli errori di sequenziamento è difficile e uno strumento di intelligenza artificiale potrebbe fornire un aiuto prezioso. La maggior parte dei tumori è causata da varianti “somatiche” acquisite dopo la nascita piuttosto che da varianti “germinali” ereditate dai genitori.

Le mutazioni somatiche si verificano quando fattori ambientali come i raggi UV danneggiano il DNA o quando si verificano errori casuali durante la replicazione del DNA. Quando queste varianti alterano il normale comportamento delle cellule, possono causare una replicazione incontrollata, favorendo lo sviluppo e la progressione del cancro.

Identificare le varianti somatiche è più difficile che trovare quelle ereditarie perché possono esistere a basse frequenze all’interno delle cellule tumorali, a volte con percentuali inferiori al tasso di errore del sequenziamento stesso.

Come funziona DeepSomatic

In ambito clinico, gli scienziati sequenziano sia le cellule tumorali provenienti da una biopsia sia le cellule normali del paziente. DeepSomatic individua le differenze, identificando le variazioni nelle cellule tumorali che non sono ereditarie. Queste variazioni rivelano cosa sta alimentando la crescita del tumore.

Il modello converte i dati grezzi del sequenziamento genetico di campioni tumorali e normali in immagini che rappresentano vari punti di dati, tra cui i dati del sequenziamento e il loro allineamento lungo il cromosoma. Una rete neurale convoluzionale analizza queste immagini per distinguere tra il genoma di riferimento standard, le varianti ereditarie normali dell’individuo e le varianti somatiche che causano il cancro, filtrando gli errori di sequenziamento. Il risultato è un elenco di mutazioni legate al cancro.

DeepSomatic può funzionare anche in modalità “solo tumore” quando non sono disponibili campioni di cellule normali, cosa che accade spesso con i tumori del sangue come la leucemia. Questo rende lo strumento applicabile a molti scenari clinici e di ricerca.

Formazione di uno strumento di ricerca sul cancro AI più preciso

L’addestramento di un modello AI accurato richiede dati di alta qualità. Per il suo strumento di intelligenza artificiale, Google e i suoi partner dell’UC Santa Cruz Genomics Institute e del National Cancer Institute hanno creato un set di dati di riferimento chiamato CASTLE. Hanno sequenziato cellule tumorali e normali di quattro campioni di cancro al seno e di due campioni di cancro ai polmoni.

Questi campioni sono stati analizzati utilizzando tre piattaforme di sequenziamento leader del settore per creare un unico e accurato set di dati di riferimento, combinando i risultati ed eliminando gli errori specifici della piattaforma. I dati mostrano come anche lo stesso tipo di cancro possa presentare firme mutazionali molto diverse, informazioni che possono aiutare a prevedere la risposta del paziente a trattamenti specifici.

I modelli di DeepSomatic hanno ottenuto risultati migliori rispetto ad altri metodi consolidati su tutte e tre le principali piattaforme di sequenziamento. Lo strumento si è distinto per l’identificazione di mutazioni complesse chiamate inserzioni e delezioni, o “Indel”. Per queste varianti, DeepSomatic ha ottenuto un punteggio F1 del 90% sui dati di sequenziamento Illumina, rispetto all’80% del metodo migliore. Il miglioramento è stato più evidente sui dati di Pacific Biosciences, dove DeepSomatic ha ottenuto un punteggio superiore all’80%, mentre il metodo migliore ha ottenuto meno del 50%.

L’intelligenza artificiale si è comportata bene anche nell’analisi di campioni difficili. I test includevano un campione di cancro al seno conservato con formalina-fissa-paraffina-embedded (FFPE), un metodo comune che può introdurre danni al DNA e complicare l’analisi. È stato anche testato su dati provenienti dal sequenziamento dell’intero esoma (WES), un metodo più economico che sequenzia solo l’1% del genoma che codifica per le proteine. In entrambi gli scenari, DeepSomatic ha superato gli altri strumenti, suggerendo la sua utilità per l’analisi di campioni di qualità inferiore o storici.

Uno strumento di intelligenza artificiale per tutti i tipi di cancro

Lo strumento di intelligenza artificiale ha dimostrato di poter applicare il suo apprendimento a nuovi tipi di cancro su cui non era stato addestrato. Quando è stato utilizzato per analizzare un campione di glioblastoma, un tumore cerebrale aggressivo, ha individuato con successo le poche varianti note per guidare la malattia. In una collaborazione con il Children’s Mercy di Kansas City, ha analizzato otto campioni di leucemia pediatrica e ha trovato le varianti precedentemente conosciute e ne ha identificate 10 nuove, nonostante abbia lavorato con campioni di soli tumori.

Google spera che i laboratori di ricerca e i medici adottino questo strumento per comprendere meglio i singoli tumori. Individuando le varianti tumorali note, potrebbe aiutare a orientare le scelte dei trattamenti esistenti. Identificandone di nuove, potrebbe portare a nuove terapie. L’obiettivo è far progredire la medicina di precisione e fornire ai pazienti trattamenti più efficaci.

Leggi di più su www.artificialintelligence-news.com

Articoli correlati

Share via
Copy link