Программа ARGO_CUDA


Ссылка на программу

https://gitea.sysbio.ru/program_providing_fund/ArgoCUDA


Модуль «ARGO_CUDA» предназначен для выявления в последовательностях пиков ChIP-экспериментов значимых олигонуклеотидов. Осуществляет оценку сходства выявленных с помощью программы ArgoCUDA IUPAC мотивов с весовыми матрицами, хранящимися в БД Jaspar и Hocomoco. Модуль включает в себя следующие компоненты:

  1. Оценка сходства IUPAC мотивов с весовыми матрицами осуществляется с помощью системы Tomtom (https://meme-suite.org/meme/tools/tomtom).

  2. Результаты работы системы Tomtom анализируются программой MotifAnnotator_Base.

Описание входных данных

На вход конвейера подается файл «query_motifs» с IUPAC мотивами в fasta – формате и БД Hocomoco и Jaspar. Пример файлов «query_motifs» с IUPAC мотивами в fasta – формате (фрагмент):

>TRTWKACH
TRTWKACH
>RTTKACHY
RTTKACHY
>TMAAYANS
TMAAYANS

БД Hocomoco «HOCOMOCOv11_full_annotation_HUMAN_MOUSE.tab» и Jaspar «Jaspar.tab».

Описание выходных данных

  1. Результат работы Tomtom – файл «tomtom.tsv». Пример результата в прилагаемых файлах «FoxA2_major_30_Hocomoco_0_01.tsv» (рисунок 1) и «FoxA2_major_30_Jaspar_redundant_2022_vertebrates_0_01.tsv» (рисунок 2).

  2. Результат работы MotifAnnotator_Base – файл «result.out» (рисунок 3).

pic1

Рисунок 1 - Пример выходного файла «FoxA2_major_30_Hocomoco_0_01.tsv»

pic2

Рисунок 2 - Пример выходного файла «FoxA2_major_30_Jaspar_redundant_2022_vertebrates_0_01.tsv»

pic3

Рисунок 3 - Пример выходного файла «result.out».