Umelá inteligencia má pomôcť predpovedať kardiovaskulárne ochorenia či cukrovku

Text vyšiel pôvodne na webe denníka Washington Post.

Vedci vyvinuli spôsob, ako preosiať milióny variantov nachádzajúcich sa v genetickom plán človeka. Zámer je odhaliť tie, ktoré ohrozujú naše zdravie a spôsobujú rôzne ochorenia. Tento nový nástroj otestovali na biomedicínskej databáze viac ako 450 000 ľudí v Spojenom kráľovstve.

V článku sa dočítate:

ako PrimateAI-3D funguje,
o tom, ako PrimateAI-3D môže pomôcť v medicíne,
čo je to genóm.

Výskum predstavuje rozhodujúci krok k využitiu plnej sily genómu v medicíne a ukazuje nový spôsob, ako možno umelú inteligenciu aplikovať na problémy v oblasti ľudského zdravia, uviedli odborníci v sérii článkov uverejnených vo štvrtok v časopise Science.

Jeden z problémov, ktorý už roky frustruje lekárov, vyplýva z toho, že hoci sme si na úrovni DNA podobní na 99,6 percenta, každý z nás má v priemere štyri milióny variantov, teda častí genetického kódu, v ktorých sa od seba navzájom líšime.

„Bolo nesmierne ťažké určiť, ktoré z nich spôsobujú ochorenie a ktoré nie,“ povedal Kyle Farh, viceprezident pre umelú inteligenciu v biotechnologickej spoločnosti Illumina so sídlom v San Diegu.

Farh a medzinárodný tím, ktorý tvorilo takmer sto výskumníkov, skonštruovali algoritmus, čo má pomôcť medicíne objasniť časť tejto neistoty. „Naším cieľom je odstrániť varianty neznámeho významu, ktoré sú hlavnou prekážkou pri odhaľovaní hodnoty genomickej medicíny,“ povedal Farh.

Znak katastrofálnej zmeny

Tak ako sa ChatGPT dokáže naučiť predpovedať ľudskú reč tým, že ho inžinieri zásobujú množstvom textu, nový algoritmus bol vycvičený na vytváranie lekárskych predpovedí na základe čítania genómov.

Vedci vytvorili algoritmus s názvom PrimateAI-3D pomocou genetických plánov 233 rôznych druhov primátov. Na tomto základe sa zvýraznili varianty, ktoré primáty vrátane človeka tolerujú, a tie, ktoré sú smrteľné. Vedci hľadajú miesta, kde je sekvencia u jednotlivých primátov rovnaká, čo je jasným znakom toho, že akákoľvek zmena spôsobí katastrofu.

„Je to geniálny nápad. Hneď ako som si prečítal článok, poslal som ho svojmu tímu a povedal som mu: ‚Musíme sa do toho pustiť,‘“ povedal Stephen Kingsmore, prezident a výkonný riaditeľ Children's Institute for Genomic Medicine, zariadenia so sídlom v San Diegu, ktoré ročne dekóduje genómy 1000 rodín pre 90 nemocníc v Spojených štátoch.

Kingsmore uviedol, že približne v štvrtine prípadov lekári sekvenujú genóm pacienta len preto, aby našli variant s neznámym vplyvom na zdravie.

„Robíme im veľkú medvediu službu,“ povedal. „Rodičia tak trochu rozhadzujú rukami a hovoria, ‚má dieťa nejakú chorobu alebo nie?‘ a my môžeme povedať len možno.“

Doteraz nemocnice, ktoré skúmali genetické varianty u svojich pacientov, často hľadali vo veľkom archíve s názvom ClinVar. Nový algoritmus PrimateAI-3D skenuje približne 70 miliónov genetických variantov, čo je výber, ktorý je viac ako 1000-krát väčší ako ClinVar, povedal Farh.

Pomôže uprednostniť varianty

Spomínané „3D“ v názve sa vzťahuje na trojrozmernú štruktúru proteínov, ktorá je kľúčovým faktorom pri rozlišovaní, ktoré mutácie spôsobia spúšť. Mnohé choroby sú spôsobené mutáciami, ktoré poškodzujú proteín alebo spôsobujú, že telo ho vytvára príliš veľa alebo príliš málo.

Zatiaľ nie je jasné, aký veľký význam bude mať algoritmus v každodennej medicíne, „ale ukazuje sa, že prekonáva všetko, čo máme v súčasnosti k dispozícii,“ povedal Bruce Gelb, riaditeľ Mindichovho inštitútu pre zdravie a rozvoj detí na Icahnovej lekárskej fakulte na Mount Sinai.

Gelb, ktorý nebol súčasťou výskumného tímu, povedal, že videl predchádzajúcu verziu algoritmu opísanú v časopise Nature Genetics v roku 2018. Predchádzajúca verzia bola založená len na šiestich druhoch primátov iných ako človek, na rozdiel od 233 druhov primátov v novej verzii. „To je veľmi veľký nárast a dáva to algoritmu oveľa väčšiu štatistickú silu pri hľadaní vecí,“ povedal Gelb.

Matthew Lebo, ktorý riadi Laboratórium molekulárnej medicíny na Mass General Brigham, povedal, že PrimateAI-3D neodstráni problém hľadania variantov s neznámym významom, ale pomôže lekárom uprednostniť varianty, ktoré skúmajú v súvislosti s konkrétnym ochorením.

Nový nástroj by mal pomôcť aj farmaceutickým spoločnostiam pri hľadaní nových liekov. Klinické skúšky často zlyhávajú, pretože gén, na ktorý sa vedci zameriavajú, je „nesprávny a nie je relevantný pre chorobu“, povedal Farh. „Používanie umelej inteligencie a genomiky na výber správnych cieľov by malo výrazne znížiť mieru neúspešných klinických skúšok v neskorej fáze.“

Spoločnosť Illumina uviedla, že nový nástroj bude široko dostupný v budúcich verziách jej softvérových produktov.

Písmená A, T, G, C

Testovaním nového algoritmu na stovkách tisícok genómov pacientov v britskej biobanke „sme zistili, že 97 percent celkovej populácie nesie zriedkavý variant“, ktorý má nejaký významný vplyv na zdravie, povedal Farh.

Hoci algoritmus nemôže zohľadniť vplyv stravy a environmentálnych faktorov, podľa Farha „v podstate môže predpovedať hladinu cholesterolu a glukózy u ľudí, a teda aj ich riziko kardiovaskulárnych ochorení alebo cukrovky - a to tak, že z genómu predpovie vplyv týchto variantov“.

Kingsmore uviedol, že veda o genóme „už roky núti medicínu k umelej inteligencii“, pretože náš genetický plán je obrovský.

Genóm je dlhý kód zapísaný štyrmi písmenami A, T, G, C – každé písmeno znamená jednu zo štyroch chemických báz, z ktorých je naša DNA zložená – adenín, tymín, guanín a cytozín. Jeden celý genóm je ako rebrík obsahujúci približne tri miliardy schodíkov, pričom na každom z nich je dvojica písmen.

Národný inštitút zdravia odhaduje, že sekvenovanie genómov v súčasnosti generuje až 40 miliárd gigabajtov údajov ročne, čo zodpovedá približne desiatim miliónom úplných genómov.

Dôvodom, prečo je umelá inteligencia podľa Kingsmora vhodná, je to, že zdravotnícky personál je slabo pripravený na získavanie odpovedí z takéhoto oceánu údajov.

Autor: Mark Johnson