База знаний по регуляторам роста и развития растений на основе методов автоматического анализа текстов научных публикаций, патентов и фактографических баз данных
ВВЕДЕНИЕ. Фитогормоны – это низкомолекулярные вещества, вырабатывающиеся в растениях и регулирующие практически все аспекты их роста и развития от эмбриогенеза до созревания плодов и старения, а также контролирующие ответы растений на действие стрессов. В настоящее время известны 9 фитогормонов: ауксин, цитокинин, этилен, гиббереллины, абсцизовая кислота, брассиностероиды, жасмонаты, салициловая кислота, стриголактоны. Благодаря своим свойствам, фитогормоны находят применение в сельском хозяйстве в качестве регуляторов роста растений. Детальное понимание механизмов работы фитогормонов – не только важнейшая фундаментальная задача биологии развития и генетики растений, но и необходимое условие для разработки новых эффективных и безопасных регуляторов роста растений, основанных на действии растительных гормонов.
МЕТОДЫ. Интерфейс базы знаний разработан на языке программирования Python 3 с использованием библиотеки PyQt5 для реализации графического интерфейса пользователя. В качестве источника данных используются результаты автоматического анализа текстов (text-mining), представленные в формате STSV (структурированные табличные данные) из системы ANDSystem. В текущей реализации база знаний интегрирует массивы данных по ключевым фитогормонам и их аналогам, включая: 6-бензиламинопурин (6-BAP), брассинолид, жасмоновую кислоту и индол-3-уксусную кислоту (ауксин).
РЕЗУЛЬТАТЫ. Создана база знаний, позволяющая находить и анализировать ассоциации целевых генов, белков и метаболитов с четырьмя ключевыми регуляторами роста растений: 6-бензиламинопурином, брассинолидом, жасмоновой кислотой и индол-3-уксусной кислотой. Разработанный программный модуль обеспечивает доступ к данным и поддерживает следующие функции:
- Поиск ассоциаций: Выявление связей между пользовательскими объектами (Gene, Protein, Metabolite) и указанными фитогормонами в автоматическом режиме.
- Агрегация и категоризация: Возможность работы как с отдельными наборами данных, так и с объединенной базой знаний («ALL») для поиска перекрестных взаимодействий, с отображением статистики распределения по типам сущностей.
- Верификация данных: Для каждой найденной ассоциации система предоставляет доказательную базу, включая тип взаимодействия, ссылки на литературные источники и контекстные предложения из текстов научных статей, подтверждающие связь.
- Экспорт результатов: Реализована функция выгрузки реконструированных ассоциативных сетей в формат CSV для последующей обработки и интерпретации роли найденных компонентов в процессах морфогенеза.

Рисунок 1 — Интерфейс базы знаний по поиску ассоциаций с фитогормонами (вкладка «Жасмоновая кислота»). В примере показан результат поиска для гена CEJ1: выявлена ассоциация с жасмоновой кислотой, подтвержденная текстовым фрагментом из публикации в PubMed Central, описывающим CEJ1 как ген, реагирующий на воздействие жасмоновой кислоты.