Программный конвейер PlantGnD (Plant Growth and Development) для извлечения знаний об ауксине из научных публикаций.


Программный конвейер PlantGnD (Plant Growth and Development) предназначен для извлечения знаний об ауксине, ключевом регуляторе роста и развития A. thaliana, из научных публикаций. Конвейер включает два основных модуля: (1) модуль автоматического анализа текстов с использованием технологий искусственного интеллекта и (2) модуль реконструкции генных сетей.

Модуль автоматического анализа текстов использует программный комплекс ANDSystem, настроенный на специфику предметной области. Для извлечения знаний в ANDSystem реализованы следующие технологии: (1) семантико-лингвистические правила извлечения знаний из текстов, (2) предобученная большая языковая модель. Получаемая при анализе текстов информация сохраняется в базе знаний PlantGnD. Модуль реконструкции генных сетей включает программу формирования шаблона-запроса к базе знаний PlantGnD, программу ANDVisio, осуществляющую поиск по базе знаний, реконструкцию и визуализацию генной сети. Схематичное изображение программного конвейера PlantGnD показано на Рис. 1.

pic1

Рисунок 1. Схематичное изображение программного конвейера PlantGnD.

Описание входных данных

На вход подаётся объект, связанный с ауксином. Программа принимает объекты 7 типов: «Agronomic phenotype», «Gene», «Metabolite», «miRNA», «Phenotype», «Protein», «Pathway». С помощью интерфейса пользователь выбирает интересующий его объект, и программа генерирует запрос к базе знаний PlantGnD в виде файла Gene_Network_Generated.andp.

Описание выходных данных

Выходные данные представляют из себя реконструированную генную сеть , содержащую регуляторный механизм влияния ауксина на интересующий объект. На рисунке 2 приведен пример реконструкции генной сети с использованием конвейера PlantGnD, описывающей регуляторные механизмы влияния ауксина на процессы программируемой клеточной гибели.

pic2

Рисунок 2. Пример реконструкции генной сети регуляторных механизмов влияния ауксина на процессы программируемой клеточной гибели.