Stručná odpoveď: Generatívna umelá inteligencia urýchľuje najmä skorý objav liekov generovaním kandidátskych molekúl alebo proteínových sekvencií, navrhovaním syntetických ciest a vynáraním testovateľných hypotéz, takže tímy môžu vykonávať menej „slepých“ experimentov. Najlepšie výsledky dosahuje, keď presadzujete prísne obmedzenia a overujete výstupy; ak sa s ňou zaobchádza ako s veštcom, môže s istotou zavádzať.
Kľúčové poznatky:
Zrýchlenie : Použite GenAI na rozšírenie generovania nápadov a následné zúženie pomocou prísneho filtrovania.
Obmedzenia : Pred generovaním je potrebné vyžadovať rozsahy vlastností, pravidlá štruktúry a limity novosti.
Validácia : Výstupy považovať za hypotézy; potvrdiť ich pomocou testov a ortogonálnych modelov.
Sledovateľnosť : Zaznamenávajte výzvy, výstupy a zdôvodnenia, aby rozhodnutia zostali auditovateľné a preskúmateľné.
Odolnosť voči zneužitiu : Zabráňte úniku informácií a nadmernej sebadôvere pomocou riadenia, kontrol prístupu a ľudskej kontroly.

Články, ktoré by ste si mohli prečítať po tomto:
🔗 Úloha umelej inteligencie v zdravotníctve
Ako umelá inteligencia zlepšuje diagnostiku, pracovné postupy, starostlivosť o pacientov a výsledky.
🔗 Nahradí umelá inteligencia rádiológov?
Skúma, ako automatizácia rozširuje rádiológiu a čo zostáva ľudské.
🔗 Nahradí umelá inteligencia lekárov?
Úprimný pohľad na vplyv umelej inteligencie na prácu a prax lekárov.
🔗 Najlepšie nástroje AI laboratória pre vedecké objavy
Najlepšie nástroje laboratória umelej inteligencie na urýchlenie experimentov, analýz a objavov.
Úloha generatívnej umelej inteligencie pri objavovaní liekov, jedným dychom 😮💨
Generatívna umelá inteligencia pomáha farmaceutickým tímom vytvárať kandidátske molekuly, predpovedať vlastnosti, navrhovať modifikácie, navrhovať syntetické cesty, skúmať biologické hypotézy a komprimovať iteračné cykly – najmä pri skorom objavovaní a optimalizácii potenciálnych produktov. Nature 2023 (prehľad objavovania ligandov) Elsevier 2024 (generatívne modely v de novo dizajne liekov)
A áno, dokáže s istotou generovať aj nezmysly. To je súčasť dohody. Ako veľmi nadšený stážista s raketovým motorom. Sprievodca pre lekárov (riziko halucinácií) npj Digital Medicine 2025 (halucinácie + bezpečnostný rámec)
Prečo je to dôležitejšie, než si ľudia pripúšťajú 💥
Veľa objavovacích prác je „hľadanie“. Hľadajte v chemickom priestore, hľadajte v biológii, hľadajte v literatúre, hľadajte vzťahy medzi štruktúrou a funkciou. Problém je v tom, že chemický priestor je... v podstate nekonečný. Accounts of Chemical Research 2015 (chemický priestor) Irwin & Shoichet 2009 (chemická priestorová škála)
Mohli by ste stráviť niekoľko životov len skúšaním „rozumných“ variácií.
Generatívna umelá inteligencia posúva pracovný postup z:
-
„Vyskúšajme, čo nás napadne“
na:
-
„Vygenerujme väčšiu a inteligentnejšiu sadu možností a potom otestujme tie najlepšie.“
Nejde o elimináciu experimentov. Ide o výber lepších experimentov . 🧠 Nature 2023 (prehľad objavov ligandov)
Tiež, a o tom sa málo diskutuje, pomáha to tímom komunikovať naprieč disciplínami . Chemici, biológovia, ľudia z DMPK, výpočtoví vedci... každý má iné mentálne modely. Slušný generatívny systém môže slúžiť ako spoločný skicár. Recenzia Frontiers in Drug Discovery 2024
Čo robí dobrú verziu generatívnej umelej inteligencie pre objavovanie liekov? ✅
Nie všetka generatívna umelá inteligencia je rovnaká. „Dobrá“ verzia pre túto oblasť nie je o okázalých ukážkach a viac o nepríťažlivej spoľahlivosti (nepríťažlivosť je tu cnosťou). Nature 2023 (prehľad objavu ligandov)
Dobré nastavenie generatívnej umelej inteligencie má zvyčajne:
-
Uzemnenie domény : trénované alebo prispôsobené chemickým, biologickým a farmakologickým údajom (nielen všeobecný text) 🧬 Recenzia Elsevier 2024 (generatívne modely)
-
Obmedzenia – prvá generácia : môže sa riadiť pravidlami, ako sú rozsahy lipofility, obmedzenia štruktúry, vlastnosti väzbových miest, ciele selektivity JCIM 2024 (difúzne modely v de novo dizajne liekov) REINVENT 4 (otvorený rámec)
-
Povedomie o vlastnostiach : generuje molekuly, ktoré sú nielen nové, ale aj „nie smiešne“ v terminológii ADMET ADMETlab 2.0 (prečo je dôležitý skorý ADMET)
-
Hlásenie neistoty : signalizuje, kedy ide o odhad oproti tomu, kedy je to spoľahlivé (pomáha aj hrubé pásmo spoľahlivosti) Princípy validácie OECD QSAR (oblasť použiteľnosti)
-
Riadenie s ľudským zásahom : chemici môžu rýchlo riadiť, odmietať a usmerňovať výstupy Nature 2023 (pracovný postup + kontext objavovacích technológií)
-
Sledovateľnosť : môžete vidieť, prečo k návrhu došlo (aspoň čiastočne), alebo letíte naslepo. Usmernenia OECD pre QSAR (transparentnosť modelu + validácia).
-
Vyhodnocovací systém : dokovanie, QSAR, filtre, kontroly retrosyntézy - všetko zapojené 🔧 Nature 2023 (prehľad objavu ligandov) Strojové učenie v CASP (Coley 2018)
-
Kontroly skreslenia a úniku : aby sa predišlo vkrádaniu sa do pamäte tréningových dát (áno, stáva sa to) USENIX 2021 (extrakcia tréningových dát) Vogt 2023 (obavy týkajúce sa novosti/jedinečnosti)
Ak vaša generatívna umelá inteligencia nedokáže zvládnuť obmedzenia, je to v podstate generátor noviniek. Zábava na večierkoch. Menej zábavy v protidrogovom programe.
Kam sa generatívna umelá inteligencia hodí v procese objavovania liekov 🧭
Tu je jednoduchá mentálna mapa. Generatívna umelá inteligencia môže prispieť takmer ku každej fáze, ale najlepšie výsledky dosahuje tam, kde je iterácia nákladná a priestor pre hypotézy je obrovský. Nature 2023 (prehľad objavov ligandov)
Bežné kontaktné body:
-
Objav a validácia cieľov (hypotézy, mapovanie dráh, návrhy biomarkerov) Prehľad Frontiers in Drug Discovery 2024
-
Identifikácia zhodných výsledkov (rozšírenie virtuálneho skríningu, generovanie de novo zhodných výsledkov) Nature Biotechnology 2019 (GENTRL)
-
Optimalizácia potenciálnych zákazníkov (návrhy analógov, ladenie viacerých parametrov) REINVENT 4
-
Predklinická podpora (predikcia vlastností ADMET, niekedy rady týkajúce sa formulácie) ADMETlab 2.0
-
CMC a plánovanie syntézy (návrhy retrosyntézy, triedenie ciest) AiZynthFinder 2020 Coley 2017 (počítačom asistovaná retrosyntéza)
-
Vedomostná práca (syntéza literatúry, zhrnutia konkurenčného prostredia) 📚 Vzory 2025 (LLM v oblasti objavovania liekov)
V mnohých programoch najväčšie úspechy pramenia z integrácie pracovných postupov , nie z toho, že jeden model je „géniálny“. Model je motor – potrubie je auto. Nature 2023 (prehľad objavov ligandov)
Porovnávacia tabuľka: populárne generatívne prístupy umelej inteligencie používané pri objavovaní liekov 📊
Trochu nedokonalý stôl, pretože skutočný život je trochu nedokonalý.
| Nástroj / Prístup | Najlepšie pre (publikum) | Približná cena | Prečo to funguje (a kedy nie) |
|---|---|---|---|
| Generátory molekúl de novo (SMILES, grafy) | Lekárska chémia + komplexná chémia | $$-$$$ | Skvelý na rýchle objavovanie nových analógov 😎 - ale dokáže odhaliť nestabilné a neuspokojivé jedlá REINVENT 4 GENTRL (Nature Biotech 2019) |
| Generátory proteínov / štruktúr | Biologické tímy, štrukturálna biológia | $$$ | Pomáha navrhovať sekvencie + štruktúry - ale „vyzerá to vierohodne“ nie je to isté ako „funguje“ AlphaFold (Nature 2021) RFdiffusion (Nature 2023) |
| Molekulárny dizajn v difúznom štýle | Pokročilé tímy strojového učenia (ML) | $$-$$$$ | Silný v podmieňovaní obmedzeniami a diverzite - nastavenie môže byť… celá vec JCIM 2024 (difúzne modely) Prehľad difúzie PMC 2025 |
| Kopiloti predikcie nehnuteľností (kombinácia QSAR + GenAI) | DMPK, projektové tímy | $$ | Dobré na triedenie a hodnotenie - zlé, ak sa s tým zaobchádza ako s evanjeliom 😬 OECD (oblasť použiteľnosti) ADMETlab 2.0 |
| Plánovači retrosyntézy | Procesná chémia, CMC | $$-$$$ | Zrýchľuje navrhovanie trás – stále vyžaduje ľudí pre uskutočniteľnosť a bezpečnosť AiZynthFinder 2020 Coley 2018 (CASP) |
| Multimodálne laboratórne kopiloty (text + údaje z testov) | Prekladateľské tímy | $$$ | Užitočné pri sťahovaní signálov medzi súbormi údajov - náchylné na nadmernú sebadôveru, ak sú údaje nekonzistentné Nature 2024 (dávkové efekty v zobrazovaní buniek) npj Digital Medicine 2025 (multimodálne v biotechnológii) |
| Asistenti pre literatúru a hypotézy | Každý, v praxi | $ | Výrazne skracuje čas čítania – ale halucinácie môžu byť klzké, ako miznúce ponožky. Vzory 2025 (LLM v oblasti objavovania liekov) Sprievodca pre lekárov (halucinácie) |
| Zákazkové modely základov na mieru | Veľké farmaceutické spoločnosti, dobre financované biotechnologické spoločnosti | $$$$ | Najlepšie ovládanie + integrácia - tiež drahé a pomalé na zostavenie (prepáčte, je to pravda) Recenzia Frontiers in Drug Discovery 2024 |
Poznámky: ceny sa výrazne líšia v závislosti od rozsahu, výpočtového výkonu, licencií a od toho, či váš tím chce „plug and play“ alebo „postavme si vesmírnu loď“
Bližší pohľad: Generatívna umelá inteligencia pre objavovanie úspešných produktov a de novo dizajn 🧩
Toto je hlavný prípad použitia: generovanie kandidátskych molekúl od nuly (alebo zo skafoldu), ktoré zodpovedajú cieľovému profilu. Nature Biotechnology 2019 (GENTRL) REINVENT 4
Ako to zvyčajne funguje v praxi:
-
Definovať obmedzenia
-
cieľová trieda, tvar väzbového vrecka, známe ligandy
-
rozsahy vlastností (rozpustnosť, logP, PSA atď.) Lipinski (kontext pravidla 5)
-
obmedzenia novosti (vyhnite sa známym IP zónam) 🧠 Vogt 2023 (hodnotenie novosti)
-
-
Generovanie kandidátov
-
skákanie po lešení
-
rast fragmentov
-
Návrhy na „ozdobenie tohto jadra“
-
viacúčelová generácia (väzbová + priepustná + netoxická) REINVENT 4 Recenzia Elsevier 2024 (generatívne modely)
-
-
Agresívne filtrujte
-
pravidlá medicínskej chémie
-
PAINS a reaktívne skupinové filtre Baell & Holloway 2010 (PAINS)
-
kontroly syntetizovateľnosti AiZynthFinder 2020
-
dokovanie / hodnotenie (nedokonalé, ale užitočné) Nature 2023 (prehľad objavov ligandov)
-
-
Vyberte malú sadu pre syntézu
-
ľudia si stále vyberajú, pretože niekedy cítia nezmysly
-
Trápna pravda: hodnota nespočíva len v „nových molekulách“. Sú to nové molekuly, ktoré dávajú zmysel pre obmedzenia vášho programu . Táto posledná časť je všetko. Nature 2023 (prehľad objavov ligandov)
Tiež mierne preháňanie: keď sa to urobí dobre, môže to vyzerať, akoby ste si najali tím neúnavných juniorských chemikov, ktorí nikdy nespia a nikdy sa nesťažujú. Na druhej strane tiež nechápu, prečo je konkrétna stratégia ochrany nočnou morou, takže... rovnováha 😅.
Bližší pohľad: Optimalizácia potenciálnych zákazníkov s generatívnou umelou inteligenciou (ladenie viacerých parametrov) 🎛️
Optimalizácia potenciálnych zákazníkov je miesto, kde sa sny komplikujú.
Chcete:
-
zvýšenie potencie
-
selektivita hore
-
metabolická stabilita
-
rozpustnosť hore
-
bezpečnostné signály vypnuté
-
priepustnosť „tak akurát“
-
A stále syntetizovateľné
Toto je klasická viacúčelová optimalizácia. Generatívna umelá inteligencia je nezvyčajne dobrá v navrhovaní súboru kompromisných riešení, namiesto toho, aby predstierala, že existuje jedna dokonalá zlúčenina. REINVENT 4 Elsevier 2024 (generatívne modely)
Praktické spôsoby, ako to tímy používajú:
-
Analogický návrh : „Vyrobte 30 variantov, ktoré znížia klírens, ale zachovajú účinnosť“
-
Substitučné skenovanie : riadené skúmanie namiesto hrubej sily
-
Scaffold hopping : keď jadro narazí na stenu (tox, IP alebo stabilita)
-
Návrhy na vysvetlenie : „Táto polárna skupina môže pomôcť rozpustnosti, ale mohla by zhoršiť priepustnosť“ (nie vždy správne, ale užitočné)
Jedno upozornenie: prediktory vlastností môžu byť krehké. Ak sa vaše tréningové dáta nezhodujú s vašou chemickou sériou, model sa môže s istotou mýliť. Veľmi mýliť. A nebude sa červenať. Princípy validácie OECD QSAR (oblasť použiteľnosti) Weaver 2008 (oblasť použiteľnosti QSAR)
Bližší pohľad: ADMET, toxicita a skríning „prosím, nezabíjajte program“ 🧯
ADMET je oblasť, kde veľa kandidátov potichu zlyháva. Generatívna umelá inteligencia síce nerieši biologické problémy, ale môže znížiť počet chýb, ktorým sa dá vyhnúť. ADMETlab 2.0 Waring 2015 (úbytok)
Bežné role:
-
predpovedanie metabolických zodpovedností (miesta metabolizmu, trendy klírensu)
-
označovanie pravdepodobných motívov toxicity (upozornenia, zástupné ukazovatele reaktívnych medziproduktov)
-
odhad rozsahov rozpustnosti a priepustnosti
-
navrhuje úpravy na zníženie rizika hERG alebo zlepšenie stability 🧪 FDA (ICH E14/S7B Otázky a odpovede) EMA (prehľad ICH E14/S7B)
Najefektívnejší vzorec zvyčajne vyzerá takto: na navrhovanie možností použite GenAI, ale na overenie použite špecializované modely a experimenty.
Generatívna umelá inteligencia je motorom tvorby nápadov. Validácia stále existuje v testoch.
Bližší pohľad: Generatívna umelá inteligencia pre biologické liečivá a proteínové inžinierstvo 🧬✨
Výskum liekov sa netýka len malých molekúl. Generatívna umelá inteligencia sa používa aj na:
-
generovanie sekvencie protilátok
-
návrhy na dozrievanie afinity
-
zlepšenie stability bielkovín
-
enzýmové inžinierstvo
-
prieskum peptidovej terapie ProteinMPNN (Veda 2022) Rives 2021 (modely proteínového jazyka)
Generovanie proteínov a sekvencií môže byť účinné, pretože „jazyk“ sekvencií prekvapivo dobre korešponduje s metódami strojového učenia. Ale tu je nezáväzná spätná väzba: dobre sa to zhoduje... až kým to neprestane. Pretože imunogenicita, expresia, glykozylačné vzorce a obmedzenia vývoja môžu byť brutálne. AlphaFold (Nature 2021) ProteinGenerator (Nat Biotech 2024)
Medzi najlepšie nastavenia teda patria:
-
filtre rozvinutosti
-
skóre rizika imunogenicity
-
obmedzenia vyrobiteľnosti
-
mokré laboratórne slučky pre rýchlu iteráciu 🧫
Ak ich vynecháte, získate nádhernú sekvenciu, ktorá sa v produkcii správa ako diva.
Bližší pohľad: Plánovanie syntézy a návrhy retrosyntézy 🧰
Generatívna umelá inteligencia sa vkráda aj do chemických operácií, nielen do tvorby molekúl.
Plánovači retrosyntézy môžu:
-
navrhnúť cesty k cieľovej zlúčenine
-
navrhnúť komerčne dostupné východiskové materiály
-
zoradiť trasy podľa počtu krokov alebo vnímanej uskutočniteľnosti
-
pomôcť chemikom rýchlo vylúčiť „roztomilé, ale nemožné“ nápady AiZynthFinder 2020 Coley 2018 (CASP)
Toto môže ušetriť skutočný čas, najmä pri skúmaní mnohých kandidátskych štruktúr. Ľudia tu však zohrávajú veľkú úlohu, pretože:
-
zmeny dostupnosti činidiel
-
Obavy z bezpečnosti a rozsahu sú reálne
-
niektoré kroky vyzerajú na papieri dobre, ale opakovane zlyhávajú
Nie práve dokonalá metafora, ale aj tak ju použijem: retrosyntéza AI je ako GPS, ktorá má väčšinou pravdu, až na to, že vás niekedy nasmeruje cez jazero a trvá na tom, že je to skratka. 🚗🌊 Coley 2017 (počítačom asistovaná retrosyntéza)
Dáta, multimodálne modely a drsná realita laboratórií 🧾🧪
Generatívna umelá inteligencia miluje dáta. Laboratóriá produkujú dáta. Na papieri to znie jednoducho.
Ha. Nie.
Skutočné laboratórne údaje sú:
-
neúplný
-
hlučný
-
plný dávkových efektov Leek a kol. 2010 (dávkové efekty) Nature 2024 (dávkové efekty v zobrazovaní buniek)
-
roztrúsené po rôznych formátoch
-
požehnaný „kreatívnymi“ konvenciami pomenovávania
Multimodálne generatívne systémy môžu kombinovať:
-
výsledky testov
-
chemické štruktúry
-
snímky (mikroskopia, histológia)
-
omika (transkriptomika, proteomika)
-
text (protokoly, ELN, správy) npj Digitálna medicína 2025 (multimodálna v biotechnológii) Analýza lekárskych obrazov 2025 (multimodálna umelá inteligencia v medicíne)
Keď to funguje, je to úžasné. Môžete odhaliť nenápadné vzorce a navrhnúť experimenty, ktoré by jeden špecialista mohol prehliadnuť.
Keď to zlyhá, zlyhá to potichu. Nezabuchne to dvere. Len vás to postrčí k sebavedomému nesprávnemu záveru. Preto nie sú riadenie, validácia a kontrola domény voliteľné. Sprievodca pre lekárov (halucinácie) npj Digital Medicine 2025 (halucinácie + bezpečnostný rámec)
Riziká, obmedzenia a sekcia „nenechajte sa oklamať plynulým výstupom“ ⚠️
Ak si pamätáte len jednu vec, pamätajte na toto: generatívna umelá inteligencia je presvedčivá. Môže znieť správne, ale zároveň nesprávne. Sprievodca pre lekárov (halucinácie)
Kľúčové riziká:
-
Halucinačné mechanizmy : pravdepodobná biológia, ktorá nie je skutočná. Sprievodca pre lekárov (halucinácie).
-
Únik údajov : generovanie niečoho príliš blízkeho známym zlúčeninám USENIX 2021 (extrakcia tréningových údajov) Vogt 2023 (obavy týkajúce sa novosti/jedinečnosti)
-
Nadmerná optimalizácia : naháňanie predpokladaných výsledkov, ktoré sa nepremietajú in vitro Nature 2023 (prehľad objavov ligandov)
-
Skreslenie : tréningové dáta skreslené smerom k určitým chemotypom alebo cieľom Vogt 2023 (hodnotenie modelu + skreslenie/novosť)
-
Falošná novosť : „nové“ molekuly, ktoré sú v skutočnosti triviálnymi variantmi Vogt 2023
-
Medzery vo vysvetliteľnosti : ťažko zdôvodniť rozhodnutia zainteresovaným stranám Zásady validácie QSAR OECD
-
Obavy týkajúce sa bezpečnosti a IP : citlivé podrobnosti o programe v pokynoch 😬 USENIX 2021 (extrakcia tréningových údajov)
Zmierňujúce opatrenia, ktoré pomáhajú v praxi:
-
udržiavať ľudí v procese rozhodovania
-
výzvy a výstupy protokolov pre sledovateľnosť
-
validovať ortogonálnymi metódami (testy, alternatívne modely)
-
automaticky presadzovať obmedzenia a filtre
-
zaobchádzať s výstupmi ako s hypotézami, nie ako s tabuľkami pravdy Usmernenia OECD pre QSAR
Generatívna umelá inteligencia je elektrický nástroj. Elektrické náradie z vás neurobí tesára... len robí chyby rýchlejšie, ak neviete, čo robíte.
Ako tímy zavádzajú generatívnu umelú inteligenciu bez chaosu 🧩🛠️
Tímy to často chcú použiť bez toho, aby z organizácie urobili vedecký veľtrh. Praktický postup pri implementácii vyzerá takto:
-
Začnite s jedným úzkym hrdlom (rozšírenie zásahu, generovanie analógov, triedenie literatúry) Nature 2023 (prehľad objavov ligandov)
-
Vytvorte tesnú hodnotiacu slučku (filtre + dokovanie + kontroly vlastností + chemické hodnotenie) REINVENT 4 AiZynthFinder 2020
-
Meranie výsledkov (ušetrený čas, miera úspešnosti, zníženie úbytku zamestnancov) Waring 2015 (úbytok zamestnancov)
-
Integrácia s existujúcimi nástrojmi (ELN, register zlúčenín, databázy testov) Zdroj ELN v Edinburghu
-
Vytvorenie pravidiel používania (čo sa môže zobraziť, čo zostane offline, kroky kontroly) USENIX 2021 (riziko extrakcie údajov)
-
Školte ľudí jemne (vážne, väčšina chýb pochádza zo zneužitia, nie z modelu) Sprievodca pre lekárov (halucinácie)
Tiež nepodceňujte kultúru. Ak majú chemici pocit, že im niekto vnucuje umelú inteligenciu, budú ju ignorovať. Ak im to ušetrí čas a bude rešpektovať ich odbornosť, rýchlo si ju osvoja. Ľudia sú v tomto smere vtipní 🙂.
Aká je úloha generatívnej umelej inteligencie pri objavovaní liekov pri oddialení? 🔭
Pri menšom zväčšení nejde o „nahradenie vedcov“. Ide o „rozšírenie vedeckého potenciálu“. Nature 2023 (prehľad objavov ligandov)
Pomáha tímom:
-
preskúmať viac hypotéz týždenne
-
navrhnúť viac kandidátskych štruktúr za cyklus
-
inteligentnejšie uprednostňovanie experimentov
-
komprimovať iteračné cykly medzi návrhom a testovaním
-
zdieľanie vedomostí medzi oddelenými oblasťami Patterns 2025 (LLM v oblasti objavovania liekov)
A možno najviac podceňovaná časť: pomáha vám to neplytvať drahou ľudskou kreativitou na opakujúce sa úlohy. Ľudia by mali premýšľať o mechanizme, stratégii a interpretácii – nie tráviť dni ručným generovaním zoznamov variantov. Nature 2023 (prehľad objavov ligandov)
Takže áno, úloha generatívnej umelej inteligencie pri objavovaní liekov je urýchľovačom, generátorom, filtrom a niekedy aj problémovým faktorom. Ale je cenná.
Záverečné zhrnutie 🧾✅
Generatívna umelá inteligencia sa stáva kľúčovou schopnosťou v modernom objavovaní liekov, pretože dokáže generovať molekuly, hypotézy, sekvencie a trasy rýchlejšie ako ľudia – a môže pomôcť tímom vybrať si lepšie experimenty. Prehľad Frontiers in Drug Discovery 2024, Nature 2023 (prehľad objavovania ligandov).
Súhrnné odrážky:
-
Najlepšie sa hodí na včasné objavovanie a optimalizáciu potenciálnych zákazníkov ⚙️ REINVENT 4
-
Podporuje malé molekuly a biologické liečivá GENTRL (Nature Biotech 2019) ProteinMPNN (Science 2022)
-
Zvyšuje produktivitu rozšírením nápadového lievika Nature 2023 (prehľad objavov ligandov)
-
Vyžaduje si obmedzenia, validáciu a ľudí, aby sa predišlo sebavedomým nezmyslom. Princípy OECD QSAR. Sprievodca pre lekárov (halucinácie).
-
Najväčšie úspechy pramenia z integrácie pracovných postupov , nie z marketingovej peny. Nature 2023 (prehľad objavov ligandov)
Ak sa k nemu správate ako k spolupracovníkovi – nie ako k veštcovi – môže skutočne posunúť programy vpred. A ak sa k nemu správate ako k veštcovi… no, možno skončíte tak, že budete znova sledovať tú GPS do jazera. 🚗🌊
Často kladené otázky
Aká je úloha generatívnej umelej inteligencie pri objavovaní liekov?
Generatívna umelá inteligencia primárne rozširuje cestu k nápadom v skorom objavovaní a optimalizácii potenciálnych zákazníkov navrhovaním kandidátskych molekúl, proteínových sekvencií, syntetických ciest a biologických hypotéz. Hodnota spočíva menej v „nahradení experimentov“ a viac v „výbere lepších experimentov“ generovaním mnohých možností a následným dôkladným filtrovaním. Najlepšie funguje ako akcelerátor v rámci disciplinovaného pracovného postupu, nie ako samostatný rozhodovací orgán.
Kde v procese vývoja liekov dosahuje generatívna umelá inteligencia najlepšie výsledky?
Zvyčajne prináša najväčšiu hodnotu tam, kde je priestor pre hypotézy rozsiahly a iterácia je nákladná, ako napríklad identifikácia zhôd, de novo návrh a optimalizácia potenciálnych zákazníkov. Tímy ho tiež používajú na triedenie ADMET, návrhy retrosyntézy a podporu literatúry alebo hypotéz. Najväčšie zisky zvyčajne vyplývajú z integrácie generovania s filtrami, bodovaním a ľudským preskúmaním, a nie z očakávania, že jeden model bude „inteligentný“
Ako nastavíte obmedzenia, aby generatívne modely neprodukovali zbytočné molekuly?
Praktickým prístupom je definovať obmedzenia pred generovaním: rozsahy vlastností (ako sú ciele rozpustnosti alebo logP), pravidlá pre scaffold alebo podštruktúru, vlastnosti väzbových miest a limity novosti. Potom sa musia vynútiť filtre medicínskej chémie (vrátane PAINS/reaktívnych skupín) a kontroly syntetizovateľnosti. Generovanie s použitím obmedzení je obzvlášť užitočné pri molekulárnom dizajne difúzneho štýlu a rámcoch, ako je REINVENT 4, kde je možné kódovať viacúčelové ciele.
Ako by mali tímy overovať výstupy GenAI, aby sa predišlo halucináciám a prehnanej sebadôvere?
Každý výstup považujte za hypotézu, nie za záver, a overte ju pomocou testov a ortogonálnych modelov. Generovanie párov s agresívnym filtrovaním, dokovaním alebo bodovaním tam, kde je to vhodné, a kontrolami oblasti použiteľnosti pre prediktory v štýle QSAR. Vždy, keď je to možné, zviditeľnite neistotu, pretože modely sa môžu s istotou mýliť v prípade chemických zložiek mimo distribúcie alebo neistých biologických tvrdení. Kontrola „human-in-the-loop“ zostáva základným bezpečnostným prvkom.
Ako môžete zabrániť úniku údajov, riziku IP a „uloženým“ výstupom?
Používajte riadenie a kontroly prístupu, aby citlivé detaily programu neboli náhodne vkladané do výziev, a výzvy/výstupy zaznamenávajte do protokolov pre auditovateľnosť. Vynucujte kontroly novosti a podobnosti, aby sa vygenerovaní kandidáti nenachádzali príliš blízko známych zlúčenín alebo chránených oblastí. Dodržiavajte jasné pravidlá o tom, aké údaje sú povolené v externých systémoch, a uprednostňujte kontrolované prostredia pre prácu s vysokou citlivosťou. Ľudská kontrola pomáha včas odhaliť „príliš známe“ návrhy.
Ako sa generatívna umelá inteligencia používa na optimalizáciu potenciálnych zákazníkov a ladenie viacerých parametrov?
Pri optimalizácii potenciálnych zákazníkov je generatívna umelá inteligencia cenná, pretože dokáže navrhnúť viacero kompromisných riešení namiesto naháňania sa za jednou „dokonalou“ zlúčeninou. Bežné pracovné postupy zahŕňajú návrhy analógov, riadené skenovanie substituentov a preskakovanie medzi scaffoldmi, keď pokrok blokujú obmedzenia účinnosti, toxicity alebo IP. Prediktory vlastností môžu byť krehké, takže tímy zvyčajne hodnotia kandidátov pomocou viacerých modelov a potom experimentálne potvrdzujú najlepšie možnosti.
Môže generatívna umelá inteligencia pomôcť aj s biologickými látkami a proteínovým inžinierstvom?
Áno – tímy ho používajú na generovanie sekvencií protilátok, nápady na afinitné dozrievanie, zlepšenie stability a prieskum enzýmov alebo peptidov. Generovanie proteínov/sekvencií môže vyzerať vierohodne, ale nemusí byť vyvíjateľné, preto je dôležité použiť filtre vyvíjateľnosti, imunogenicity a vyrobiteľnosti. Štrukturálne nástroje ako AlphaFold môžu podporiť uvažovanie, ale „viarohodná štruktúra“ stále nie je dôkazom expresie, funkcie alebo bezpečnosti. Mokré laboratórne slučky zostávajú nevyhnutné.
Ako generatívna umelá inteligencia podporuje plánovanie syntézy a retrosyntézu?
Plánovači retrosyntézy môžu navrhnúť trasy, východiskové materiály a poradie trás, aby urýchlili generovanie nápadov a rýchlo vylúčili nerealizovateľné cesty. Nástroje a prístupy, ako je plánovanie v štýle AiZynthFinder, sú najúčinnejšie v spojení s kontrolami uskutočniteľnosti v reálnom svete zo strany chemikov. Dostupnosť, bezpečnosť, obmedzenia škálovania a „papierové reakcie“, ktoré v praxi zlyhávajú, si stále vyžadujú ľudský úsudok. Pri takomto použití sa šetrí čas bez toho, aby sa predstieralo, že chémia je vyriešená.
Referencie
-
Nature - Prehľad objavov ligandov (2023) - nature.com
-
Prírodná biotechnológia - GENTRL (2019) - nature.com
-
Príroda - AlphaFold (2021) - nature.com
-
Príroda - RFdifúzia (2023) - nature.com
-
Nature Biotechnology - Generátor proteínov (2024) - nature.com
-
Nature Communications - Dávkové efekty v zobrazovaní buniek (2024) - nature.com
-
npj Digitálna medicína - Halucinácie + bezpečnostný rámec (2025) - nature.com
-
npj Digitálna medicína - Multimodálna medicína v biotechnológii (2025) - nature.com
-
Veda - ProteinMPNN (2022) - science.org
-
Bunkové vzory - LLM v oblasti objavovania liekov (2025) - cell.com
-
ScienceDirect (Elsevier) - Generatívne modely v de novo návrhu liekov (2024) - sciencedirect.com
-
ScienceDirect (Elsevier) - Vogt (2023): obavy týkajúce sa novosti/jedinečnosti - sciencedirect.com
-
Analýza lekárskych snímok (ScienceDirect) - Multimodálna umelá inteligencia v medicíne (2025) - sciencedirect.com
-
PubMed Central - Sprievodca pre lekárov (riziko halucinácií) - nih.gov
-
Účty chemického výskumu (publikácie ACS) - Chemický priestor (2015) - acs.org
-
PubMed Central - Irwin a Shoichet (2009): chemická priestorová škála - nih.gov
-
Hranice objavovania liekov (PubMed Central) - Recenzia (2024) - nih.gov
-
Journal of Chemical Information and Modeling (ACS Publications) - Difúzne modely v de novo dizajne liekov (2024) - acs.org
-
PubMed Central - REINVENT 4 (otvorený rámec) - nih.gov
-
PubMed Central - ADMETlab 2.0 (skoré záležitosti ADMET) - nih.gov
-
OECD - Zásady validácie modelov (Q)SAR na regulačné účely - oecd.org
-
OECD - Usmerňovací dokument k validácii modelov (Q)SAR - oecd.org
-
Účty chemického výskumu (ACS Publications) - Plánovanie syntézy pomocou počítača / CASP (Coley, 2018) - acs.org
-
ACS Central Science (ACS Publications) - Počítačom asistovaná retrosyntéza (Coley, 2017) - acs.org
-
PubMed Central - AiZynthFinder (2020) - nih.gov
-
PubMed - Lipinski: Pravidlo 5 kontext - nih.gov
-
Časopis pre medicínsku chémiu (publikácie ACS) - Baell a Holloway (2010): PAINS - acs.org
-
PubMed - Waring (2015): úbytok - nih.gov
-
PubMed - Rives (2021): modely proteínového jazyka - nih.gov
-
PubMed Central - Leek a kol. (2010): dávkové účinky - nih.gov
-
PubMed Central - Prehľad Diffusion (2025) - nih.gov
-
FDA - E14 a S7B: klinické a neklinické hodnotenie predĺženia intervalu QT/QTc a proarytmického potenciálu (Q&A) - fda.gov
-
Európska agentúra pre lieky – prehľad smernice ICH E14/S7B – europa.eu
-
USENIX - Carlini a kol. (2021): extrakcia trénovacích dát z jazykových modelov - usenix.org
-
Univerzita v Edinburghu – Služby digitálneho výskumu – Zdroj elektronických laboratórnych zošitov (ELN) – ed.ac.uk
-
ScienceDirect (Elsevier) - Weaver (2008): Oblasť použiteľnosti QSAR - sciencedirect.com