Программный конвейер AIPeptideDesigner
Ссылка на репозиторий
https://gitea.sysbio.ru/program_providing_fund/AIPeptideDesigner
Модуль предназначен для решения задач фармакологии и биомедицины, включая конструирование новых фармакологических молекул и поиск новых фармакологических мишеней в пространственной структуре белков с использованием методов искусственного интеллекта. Конвейер состоит из четырех основных этапов: (1) подготовка 3D структуры функционального сайта, (2) генерация конформационных пептидов по координатам атомов функционального сайта, (3) пептид-каркас (4) генерация структуры пептидных миметиков функционального сайта.
-
Подготовка 3d структуры функционального сайта может проводиться двумя способами: (1) путем поиска сайта в базе данных PDBSite с помощью поисковой системы базы данных и (2) задание пользовательского файла с координатами функционального сайта в формате pdb. Поиск сайта в базе данных PDBSite возможен по ключевым словам и/или идентификатору. Найденный сайт может быть сохранен в формате pdb.
-
Генерация конформационных (разрывных) пептидов по координатам атомов функционального сайта осуществляется путем идентификации в 3d структуре сайта цепочек аминокислотных остатков, расстояния между которыми удовлетворяют требованиям расстояний между соседними остатками, наблюдаемых в аминокислотных последовательностях белков.
-
Определение пептида-каркаса осуществляется путем выбора пространственной структуры суперскрученных пептидов из базы данных Multicoil2, включающего димеры и тримеры суперскрученных пептидов, представленных в пространственных структурах белков из pdb.
-
Генерация структуры пептидных миметиков функционального сайта осуществляется с использованием генеративной нейронной сети Chroma. Результирующий пептид содержит аминокислотные остатки функционального сайта, положения которых заданы конформационным пептидом. Укладка 3D структуры пептида-миметика соответствует укладке пептида-каркаса.
Описание входных данных
На вход конвейера подается файл с параметрами. Параметрами являются директивы: Директива 1: Извлечь функциональный сайт из базы PDBSite; Ключевые слова поиска сайта. Директива 2: Использовать пользовательский pdb файл функционального сайта; Путь и имя pdb файла. Директива 3: Определить пептид-каркас. Димер да/нет, тример да/нет. Длина число. Pdb Id белка каркаса. Директива 4: Путь и имя файла для сохранения 3D структур результирующих пептидов-миметиков. Последовательности в формате fasta, 3D структуры в формате pdb.
Описание выходных данных
Подготовка 3d структуры функционального сайта
- pdb файл с координатами аминкоислотных остатков сайта.
Генерация конформационных пептидов
- pdb файлы с координами атомов аминокислотных остатков конформационных пептидов.
Пептид-каркас
- pdb файл с координами атомов пептида-каркаса
Генерация структуры пептидных миметиков функционального сайта
- Последовательности пептидов-миметиков в формате fasta, 3D структуры в формате pdb
Комментарии по компиляции/сборке/запуску модуля, включая:
Подготовка 3D структуры функционального сайта. На этом этапе система получает pdb файл с функциональным сайтом. Согласно директивы входных параметров производится поиск сайта в базе данных PDBSite программой PDBSiteExtractor, написанной на языке C. Либо используется указанный пользователем pdb файл.
Генерация конформационных пептидов. Осуществляется программой CPeptideGenerator, написанной на языке C. Входные данные CPeptideGenerator длина пептидов и pdb файл. Выходные данные pdb файл с 3d структурами конформационных пептидов.
Пептид-каркас pdb файл с координатами атомов пептида-каркаса извлекается из созданной нами базы данных pdb файлов супер-скрученных пептидов. База представляет собой набор pdb файлов, именами которых являются идентификаторы. Каждый пептид описан в отдельном файле. База PeptideScaffoldDB построена по данным из базы данных Multicoil2.
Генерация структуры пептидных миметиков функционального сайта. Используется нейронная генеративная сеть Chroma. Chroma реализована на Python.
Chroma достигает высокоточной и эффективной генерации белков за счет внедрения нового процесса диффузии, архитектуры нейронной сети и алгоритма выборки, основанного на принципах современного генеративного моделирования и биофизических знаний.