Программный конвейер AIPeptideDesigner


Ссылка на репозиторий

https://gitea.sysbio.ru/program_providing_fund/AIPeptideDesigner


Модуль предназначен для решения задач фармакологии и биомедицины, включая конструирование новых фармакологических молекул и поиск новых фармакологических мишеней в пространственной структуре белков с использованием методов искусственного интеллекта. Конвейер состоит из четырех основных этапов: (1) подготовка 3D структуры функционального сайта, (2) генерация конформационных пептидов по координатам атомов функционального сайта, (3) пептид-каркас (4) генерация структуры пептидных миметиков функционального сайта.

  1. Подготовка 3d структуры функционального сайта может проводиться двумя способами: (1) путем поиска сайта в базе данных PDBSite с помощью поисковой системы базы данных и (2) задание пользовательского файла с координатами функционального сайта в формате pdb. Поиск сайта в базе данных PDBSite возможен по ключевым словам и/или идентификатору. Найденный сайт может быть сохранен в формате pdb.

  2. Генерация конформационных (разрывных) пептидов по координатам атомов функционального сайта осуществляется путем идентификации в 3d структуре сайта цепочек аминокислотных остатков, расстояния между которыми удовлетворяют требованиям расстояний между соседними остатками, наблюдаемых в аминокислотных последовательностях белков.

  3. Определение пептида-каркаса осуществляется путем выбора пространственной структуры суперскрученных пептидов из базы данных Multicoil2, включающего димеры и тримеры суперскрученных пептидов, представленных в пространственных структурах белков из pdb.

  4. Генерация структуры пептидных миметиков функционального сайта осуществляется с использованием генеративной нейронной сети Chroma. Результирующий пептид содержит аминокислотные остатки функционального сайта, положения которых заданы конформационным пептидом. Укладка 3D структуры пептида-миметика соответствует укладке пептида-каркаса.

Описание входных данных

На вход конвейера подается файл с параметрами. Параметрами являются директивы: Директива 1: Извлечь функциональный сайт из базы PDBSite; Ключевые слова поиска сайта. Директива 2: Использовать пользовательский pdb файл функционального сайта; Путь и имя pdb файла. Директива 3: Определить пептид-каркас. Димер да/нет, тример да/нет. Длина число. Pdb Id белка каркаса. Директива 4: Путь и имя файла для сохранения 3D структур результирующих пептидов-миметиков. Последовательности в формате fasta, 3D структуры в формате pdb.

Описание выходных данных

Подготовка 3d структуры функционального сайта

  • pdb файл с координатами аминкоислотных остатков сайта.

Генерация конформационных пептидов

  • pdb файлы с координами атомов аминокислотных остатков конформационных пептидов.

Пептид-каркас

  • pdb файл с координами атомов пептида-каркаса

Генерация структуры пептидных миметиков функционального сайта

  • Последовательности пептидов-миметиков в формате fasta, 3D структуры в формате pdb

Комментарии по компиляции/сборке/запуску модуля, включая:

Подготовка 3D структуры функционального сайта. На этом этапе система получает pdb файл с функциональным сайтом. Согласно директивы входных параметров производится поиск сайта в базе данных PDBSite программой PDBSiteExtractor, написанной на языке C. Либо используется указанный пользователем pdb файл.

Генерация конформационных пептидов. Осуществляется программой CPeptideGenerator, написанной на языке C. Входные данные CPeptideGenerator длина пептидов и pdb файл. Выходные данные pdb файл с 3d структурами конформационных пептидов.

Пептид-каркас pdb файл с координатами атомов пептида-каркаса извлекается из созданной нами базы данных pdb файлов супер-скрученных пептидов. База представляет собой набор pdb файлов, именами которых являются идентификаторы. Каждый пептид описан в отдельном файле. База PeptideScaffoldDB построена по данным из базы данных Multicoil2.

Генерация структуры пептидных миметиков функционального сайта. Используется нейронная генеративная сеть Chroma. Chroma реализована на Python.

Chroma достигает высокоточной и эффективной генерации белков за счет внедрения нового процесса диффузии, архитектуры нейронной сети и алгоритма выборки, основанного на принципах современного генеративного моделирования и биофизических знаний.