Ученые из Швейцарии и США выяснили, что большие языковые нейросети можно научить решать большой набор задач в области органической химии, если встроить в них набор из нескольких алгоритмов, которыми пользуются профессиональные химики в своей работе. Система ИИ успешно синтезировала репеллент от насекомых и несколько катализаторов, передает агентство Kazinform со ссылкой на ТАСС.
— Наша система похожа по принципам своей работы на то, как ведет себя эксперт в своей области, имеющий доступ к калькулятору и специализированным базам данных. Умение пользоваться этими инструментами и наличие доступа к ним не только повышает эффективность работы эксперта, но и помогает совершать меньше ошибок. В случае с нейросетью эти инструменты снижают вероятность появления «галлюцинаций» в ее работе, — пояснил научный сотрудник EPFL Андрес Бран, чьи слова приводит пресс-служба Федеральной политехнической школы Лозанны (EPFL).
Этот подход, как отмечают Бран и его коллеги, позволяет ликвидировать главный недостаток уже существующих больших языковых нейросетей — их неспособность корректно оперировать научными данными и решать тривиальные задачи. В частности, системы ИИ из семейства GPT не способны точно перемножать числа, а также визуализировать молекулы веществ, опираясь на их названия или формулы.
Для решения этой проблемы ученые встроили в одну из популярных больших языковых моделей набор алгоритмов и виртуальных инструментов, которыми химики пользуются для поиска патентов и публикаций по интересующим их темам, оценки массы и сходства изучаемых веществ, подготовки плана по синтезу определенных молекул и решения других тривиальных и рутинных задач.
Последующие проверки ее работы показали, что новая система ИИ, получившая имя ChemCrow, значительно превосходила GPT-4 в точности предсказаний и совершала меньше ошибок в работе. При ее помощи ученым удалось синтезировать популярный репеллент от насекомых DEET, а также три катализатора, ускоряющих реакции с участием органических соединений серы.
Кроме того, ученые использовали ChemCrow для создания ранее не существовавшего соединения из числа хромофор, органических молекул, способных поглощать ультрафиолетовое излучение с длиной волны в 369 нанометров. Подобные успехи, по мнению Брана и его коллег, позволяют использовать созданную ими систему ИИ в качестве виртуального помощника для химика-профессионала, который сможет значительно ускорить его работу и избавить от рутины.
Так называемые большие языковые нейросети (LLM) представляют собой сложно устроенные системы ИИ, которые были обучены на большом количестве неразмеченного текста и обладают миллиардами параметров. Благодаря особенностям процесса их обучения и архитектуры они способны решать очень широкий перечень задач и при этом демонстрировать значительные общие знания о мире. К их числу относятся системы ChatGPT, Claude, LLaMA и прочие похожие на них нейросети.