Программный модуль «PlantReg»


Ссылка на программный модуль

https://plamorph.sysbio.ru/fannotf/


Модуль предназначен для выстраивания связи от изменений в экспрессии генов до изменений в течении биологических процессов. Схема работы программного модуля «PlantReg» представлена на рисунке 1, и можно выделить два основных шага: (1) функциональная аннотацию входного списка генов с использованием R-пакета clusterProfiler, (2) поиск пересечения районов связывания ТФ из входного списка с промоторами генов из подсписков функционально аннотированных генов.

Для работы программного модуля нудно определить параметры запуска: длина промотора генов (500, 1000, 1500, 2000, 2500), порог значимости для обогащения терминов генной онтологии, вариант библиотеки пиков (GTRD MACS2, CisCross MACS2).

Рис. 1

Описание входных данных

На вход конвейера подается два файла со списками AGI кодов (TAIR ID), один файл со списком генов, второй файл со списком ТФ, указанных каждый в отдельной строке.

Описание выходных данных

В качестве выходных данных пользователь получает файл в виде таблицы, который состоит из пяти блоков, с информацией об обогащенных терминах ГО, ассоциированных с ними ДЭГ, кодах обоснования аннотаций, ТФ, районы связывания которых в геноме картируются в 5’ регуляторные районы генов, ассоциированных с обогащенными терминами ГО.

Блок (1) характеризует гены и содержит подсписок входного списка, аннотированных обогащенными терминами ГО, со списками потенциальных транскрипционных регуляторов для каждого гена, их количеством и указанием для каждого ТФ принадлежности к определенному семейству. Для каждого гена также указывается общее количество и список обогащенных терминов ГО с указанием кода обоснования аннотации.

Центральным элементом блока (2) являются биологические процессы и для каждого обогащенного термина ГО определён подсписок ассоциированных с ним генов с указанием кодов обоснования аннотации, а также подсписок ТФ, потенциально регулирующих дифференциальную экспрессию этих ДЭГ, с указанием принадлежности к определенному семейству.

Блок выдачи (3) характеризует транскрипционные регуляторы и содержит список ТФ, для которых среди ДЭГ были найдены гены-мишени, ассоциированные с обогащенными терминами ГО.

Блок выдачи (4) содержит таблицу, где в каждой строчке указан один ген, один из потенциальных регуляторов этого гена, семейство ТФ и один из терминов ГО с кодом обоснования аннотации. Эта выдача наиболее подходит для дальнейшего анализа с использованием программных средств. Блок выдачи (5), вспомогательный, содержит результаты функциональной аннотации списка ДЭГ с помощью программы clusterProfiler с указанием значимости обогащения терминов ГО.