В Томске разрабатывают алгоритм машинного обучения для предсказания свойств химических соединений
Молодой ученый ТПУ Борис Пякилля разрабатывает алгоритм, который сможет строить модели, предсказывающие молекулярные свойства малых органических соединений. Алгоритм основан на объединении методов искусственного интеллекта и байесовского подхода из теории вероятностей. В дальнейшем его будут применять для разработки лекарственных средств и сельскохозяйственных пестицидов.
Результатом алгоритма станет модель, предсказывающая липофильность – свойство вещества, характеризующее его химическое сродство к органическим веществам. Она будет способна учитывать возможную неопределенность предсказаний, вызванную нехваткой обучающих данных.
«Работа актуальна за счет появления большого количества проектов, связанных с оценкой молекулярных свойств, а также ростом данных о химических экспериментах. Информация о неопределенности предсказаний, мере их возможного разброса крайне важна для пользователей из химических и биологических лабораторий и научных институтов», – поясняет молодой ученый.
Разработанный алгоритм основывается на байесовском машинном обучении. Этот раздел программирования напрямую работает с неопределенностями и позволяет не только точечно оценивать параметры полученной модели, но и их распределение.
Как отмечает Борис Пакилля, аналогичная работа ведется во многих институтах и фармкомпаниях. Однако алгоритм, разработанный в ТПУ, отличает качество вычислительных аспектов.
«Уникальность нашего алгоритма — в вычислительных аспектах: скорости построения предсказательной модели, высоком качестве предсказания липофильности, возможности учитывать неопределенность предсказаний из-за нехватки обучающих данных или их низкого качества», — добавляет Борис Пякилля.
В будущем алгоритм может быть использован в разработке лекарственных средств или сельскохозяйственных препаратов, например, пестицидов.
Фото: пресс-служба ТПУ.