Защо Nvidia, Google и Microsoft залагат милиарди в бъдещето на биотехнологиите с изкуствен интелект?
След като езикови модели като ChatGPT и Gemini поставиха началото на нова ера на изкуствения интелект в Силициевата долина, най-мощните технологични компании в света гледат напред към откриването на лекарства и дигитална биология.
Когато главният изпълнителен директор на Nvidia Дженсън Хуанг поглежда към аудиторията на JPMorgan Healthcare Conference през януари тази година в Сан Франциско, най-голямото събитие в областта на здравните технологии за годината, той признава, че се намира на необичайна почва. “Вие не сте моята нормална публика”, каза той на залата, пълна със специалисти по здравни и биологични технологии по време на разговор с Recursion – фирма за откриване на лекарства, в която Nvidia вложи 50 млн. долара миналата година.
Аудиторията може и да не е част от основната му таргет група, но той се надява това да се промени. Хуанг отново и отново изтъква дигиталната биология като “следващата невероятна революция” в технологиите. Тъй като бумът на изкуствения интелект обхвана Силициевата долина, Nvidia изгради бизнес за над 60 млрд. долара годишно и миналото лято стана една от малкото компании с пазарна капитализация в трилиони. В сферата на здравеопазването и биотехнологиите тя вижда още възможности за стимулиране на растежа си.
“Обявено е, че ние сме следващият многомилиарден бизнес за Nvidia”, казва пред Forbes Кимбърли Пауъл, вицепрезидент на Nvidia за здравеопазването. Тя заяви, че компанията има за цел да предостави чипове, облачна инфраструктура и други инструменти на повече биотехнологични фирми.
Сега, когато големите езикови модели като ChatGPT на OpenAI и Gemini на Google DeepMind вече са навлезли в практиката на генеративния изкуствен интелект, няколко от най-мощните технологични компании в света гледат към биотехнологиите като към следващата граница на изкуствения интелект – граница, в която изкуственият интелект не генерира смешни стихотворения от подкана, а по-скоро следващото животоспасяващо лекарство.
В Nvidia, която вероятно е гръбнакът на революцията в областта на изкуствения интелект, благодарение на мощните си графични чипове, през последните две години по-голямата част от инвестициите в звеното за рисков капитал на компанията са в откриването на лекарства.
В DeepMind моделът AlphaFold на лабораторията за изкуствен интелект на Google – революционен инструмент за предсказване на протеинови структури – е използван от академични изследователи през последната година за разработване на “молекулярна” спринцовка за инжектиране на лекарства директно в клетките и за изследване на култури, които са по-малко зависими от пестициди. Интересът към биотехнологиите е в цялата индустрия: Microsoft, Amazon и дори Salesforce също имат проекти за проектиране на протеини.
Въпреки че използването на изкуствен интелект в откриването на лекарства не е съвсем нова тенденция – DeepMind представи AlphaFold за първи път през 2018 г. – ръководителите на DeepMind и Nvidia заявиха пред Forbes, че това е пробив, благодарение на сливането на три елемент: базата налични данни за обучение, експлозията на компютърни ресурси и напредъка в алгоритмите на изкуствения интелект. “Трите съставки са тук за първи път”, казва Пауъл. “Това не беше възможно преди пет години.”
Изкуственият интелект има огромен потенциал в областта на биотехнологиите поради самата им сложност – вземете само проблема, към който е насочена AlphaFold. Протеините са основният механизъм на вашето тяло, който управлява голямо разнообразие от функции. Всички тези функции зависят от триизмерната форма на протеина. Всеки протеин е съставен от последователност от аминокиселини, а взаимодействието между тези аминокиселини и външната среда определя начина, по който протеинът се “сгъва” – което диктува крайната му форма. Възможността да се предвиди формата на даден протеин въз основа на последователността на аминокиселините е от голям интерес за биотехнологичните компании, които могат да използват тези познания, за да разработят всичко – от нови лекарства до подобрени култури и биоразградими пластмаси.
Тук се намесва дълбокото учене: обучението на модели на изкуствен интелект върху стотици милиони различни протеинови последователности и техните основни структури помага на тези модели да откриват модели в биологията, без да е необходимо да се правят скъпи изчисления, необходими за истинска симулация на молекулярна динамика. Пълното симулиране на протеини изисква толкова интензивни изчислителни ресурси, че институциите са проектирали и изградили суперкомпютри специално за справяне с този тип проблеми, като например Anton 2 в Питсбъргския суперкомпютърен център.
Бумът на технологиите за откриване на лекарства не идва само от технологичните гиганти с изкуствен интелект. От 2021 г. насам в света са осъществени 281 сделки с рисков капитал в стартиращи предприятия за откриване на лекарства с изкуствен интелект, които възлизат на 7,7 млрд. долара инвестиции, според Pitchbook. Най-големият скок настъпва през 2021 г., когато пандемията навлиза в действие. Тогава са сключени 105 сделки, в сравнение с 65 предишната година, като през 2023 г. броят им намалява до 67. В доклад, публикуван по-рано този месец, анализаторската фирма отбеляза, че все още има силно ниво на ентусиазъм “за фирми в ранен етап на развитие, които интегрират изкуствения интелект в откриването и разработването на лекарства”. Възходът на генеративния изуствен интелект също е предизвикал повишен интерес, казва Дейвид Бейкър, директор на Института за дизайн на протеини към Вашингтонския университет.
“Това винаги е било нещо като лудост, нещо крайно. Много извън мейнстрийма”, казва Бейкър. Сега “всички говорят за него”. От основаването на Института за протеинов дизайн през 2012 г. досега повече от 20 стартъпа са били създадени в рамките на програмата, посочва Бейкър. Десет от тях – включително Archon Biosciences, която разработва наноматериали за регенеративна медицина и рак, и Lila, създаваща лечения за фиброзни заболявания – са се появили през последните години, от 2021 г. насам.
В DeepMind изследователите наистина разбират залозите на своите изследвания едва след появата на пандемията Covid-19. Те са работили почти 5 години, за да разработят AlphaFold, и докато преквалифицират модела за второто му поколение, целият свят започва да се крие заради мистериозен вирус. “Това наистина припомни важността на проблема”, казва Пушмит Кохли, вицепрезидент по научните въпроси в DeepMind, пред Forbes.
Резултатът от преквалификацията на DeepMind е AlphaFold 2, революционен модел, който може толкова точно да предсказва протеинови структури, че организаторите на CASP, световно състезание за научни изследвания в областта на сгъването на протеини, изпратиха имейл до DeepMind, за да попитат дали компанията по някакъв начин е измамила, спомня си Кохли, смеейки се.
Усилията са били толкова обещаващи, че съоснователят Демис Хасабис е отделил отделна компания в Alphabet, базирана на пробивите на AlphaFold през 2021 г. Наречен Isomorphic Labs, стартъпът се фокусира върху откриването на лекарства и се ръководи от самия Хасабис. Само тази година например Isomorphic Labs сключи договори за изследвания с Lilly и Novartis на обща стойност до близо 3 млрд. долара, ако бъдат изпълнени всички основни етапи – и това не включва доходоносните възнаграждения от потенциални продажби на лекарства, които са резултат от тези партньорства.
През 2022 г. Nvidia представи BioNeMo – генеративна платформа за изкуствен интелект, която помага на разработчиците да ускорят обучението, внедряването и мащабирането на големи езикови модели за откриване на лекарства. В Nventures, подразделението за рисков капитал на производителя на чипове, седем от общо 19-те сделки на звеното са в стартиращи компании за откриване на лекарства с изкуствен интелект, включително Genesis Therapeutics, Terray и Generate Biomedicines – най-голямата от всички инвестиционни категории.
“Индустрията за автоматизирано проектиране създаде първата компания за чипове на стойност 2 трилиона долара”, каза Пауъл, визирайки Nvidia и нейния стратосферен възход през последната година. “Защо същата индустрия за компютърно подпомогнато откриване на лекарства да не създаде следващата компания за лекарства за трилиони долари?” Тя добави: “Ето защо инвестираме по начина, по който го правим.”
Няколко други технологични гиганта имат собствени усилия в областта на сгъването на протеини. Миналата година Salesforce дебютира с ProGen – модел на изкуствен интелект за генериране на протеини, а Microsoft пусна EvoDiff – подобен модел, но с отворен код. Amazon също пусна инструменти за сгъване на протеини за SageMaker, своята платформа за машинно обучение AWS. Дори ByteDance, компанията майка на TikTok, изглежда набира персонал за екипи за наука и проектиране на лекарства, съобщи Forbes през януари.
Въпреки това, колкото и обещаващо и популярно да е откриването на лекарства с изкуствен интелект, има и пречки. Провеждането на клинични изпитвания на лекарства все още отнема години и въпреки че досега FDA е разрешила клинични изпитвания на над 100 нови кандидати за лекарства, които използват изкуствен интелект или машинно обучение за разработване, вероятно ще минат години, преди някой от тях да се появи на пазара.
В някои случаи трудностите, свързани с откриването на лекарства, са накарали големите технологични компании да се откажат от тези изследвания. През август миналата година Meta, компанията майка на Facebook, закри екипа си за сгъване на протеини. По-късно изследователите от звеното се оттеглиха сами, като основаха компания, наречена EvolutionaryScale, съобщи Forbes миналата година. Meta отказва да коментира причината за закриването на проекта.
Едно от важните пречки, върху които технологичните компании ще трябва да се съсредоточат, е наличието на достатъчно данни за обучение. По-новите основополагащи модели като GPT разчитат на обучение с подсилване – метод, при който алгоритмите могат да обработват немаркирана информация чрез проби и грешки. Това ги прави още по-зависими от висококачествени данни, казва пред Forbes Анна Мари Вагнер, ръководител на отдела за изкуствен интелект в компанията за синтетична биология Ginkgo Bioworks. Миналото лято нейната компания сключи петгодишно стратегическо партньорство с Google Cloud, за да съчетае експертния си опит в областта на ИИ със способността на Ginkgo бързо да генерира биологични данни в автоматизираните си лаборатории, които след това могат незабавно да бъдат върнати в модела на ИИ като нови данни за обучение. Според нея тази комбинация помага за по-доброто оптимизиране на процеса на откриване.
Освен това, казва тя, Ginkgo има способността бързо да потвърждава прогнозите на моделите. Контраинтуитивно, това прави странността на моделите с изкуствен интелект, които понякога халюцинират – дават грешни или подвеждащи резултати при подкана – “характеристика, а не грешка”, защото може да доведе до интересни открития, които може да са били немислими за учените. “Искаме моделът да измисля лудите неща, защото именно там започваме да виждаме подобрения от порядък на порядък.”
Кохли поставя проблема с данните по-ясно: “Боклукът влиза, боклукът излиза”. И все пак, докато индустрията работи по отстраняването на тези проблеми, той вече е видял въздействието, което ИИ е оказал върху биологичните изследвания. “Когато ходя на конференции и виждам промяната в начина, по който биолозите са вършили работата си по-рано, и начина, по който я вършат днес, това е невероятна трансформация”, казва той.
От Ричард Нива и Алекс Кнап