ARGO_rSNP_Guide для анализа влияния SNP на сайты связывания транскрипционных факторов
ВВЕДЕНИЕ. К настоящему времени накоплены большие объёмы информации об однонуклеотидных полиморфизмах (SNPs, single nucleotide polymorphisms) в промоторах генов человека, ассоциированных с различными заболеваниями. Для идентификации сайтов связывания транскрипционных факторов (СС ТФ), функционирование которых нарушается под действием SNPs, мы разработали программный модуль ARGO_rSNP_Guide, доступный по адресу (https://samurai.bionet.nsc.ru/cgi-bin/03/programs/rsnp_lin_cuda/rsnpd.pl), интерфейс которого показан на рисунке Ж.34. МАТЕРИАЛЫ И МЕТОДЫ. При разработке ARGO_rSNP_Guide были использованы созданные нами ранее программы rSNP_Guide и ARGO_Peak_Score_Predictor. Программа rSNP_Guide распознает сайты связывания транскрипционных факторов с использованием позиционных весовых матриц. ARGO_Peak_Score_Predictor делает это с использованием наборов вырожденных непозиционированных олигонуклеотидных мотивов, записанных в IUPAC коде. Таким образом, ARGO_rSNP_Guide оценивает влияние мутации на сайты связывания транскрипционных факторов на основе комплексного анализа с использованием двух независимых биоинформатических подходов к распознаванию сайтов связывания транскрипционных факторов, что увеличивает точность и надежность получаемых результатов. Именно это является отличительной особенностью ARGO_rSNP_Guide в сравнении с другими методами. РЕЗУЛЬТАТЫ. Для идентификации СС ТФ, функционирование которых нарушается под действием SNPs, создан веб-сервис ARGO_rSNP_Guide. Входные данные – ДНК-последовательности промоторов, содержащие нормальный и мутантный аллели исследуемого SNP. На рисунке Ж.34 показаны результаты работы ARGO_rSNP_Guide при анализе клинически охарактеризованной замены C->G в позиции -133 промотора гена GP1BB человека, кодирующего тромбоцитарный гликопротеин Ibβ. Согласно rSNP, эта замена повреждает сайт связывания транскрипционного фактора, относящийся к семейству GATA, а модуль ARGO_Peak_Score_Predictor уточнил этот результат, показав, что замена -133 C—>G локализована в СС ТФ из подсемейства GATA1, входящего в семейство GATA. Также предсказаны повреждения СС ТФ E2, GAGA, GR, RAR и CEBPA, что может отражать многокомпонентную природу транскрипционной машины, регулирующей экспрессию гена GP1BB.

Рисунок Ж.34 Снимок экрана интернет-сайта программы ARGO_rSNP_Guide (https://samurai.bionet.nsc.ru/cgi-bin/03/programs/rsnp_lin_cuda/rsnpd.pl), содержащего входные данные решения задачи по идентификации сайта связываания неизвестного транскрипционного фактора, повреждённого клинически охарактеризованной нуклеотидной заменой C>G (выделены красными контурами) в позиции -133 промотора гена GP1BB человека, кодирующего тромбоцитарный гликопротеин Ibβ. Согласно экспериментальным данным, эта замена приводит к снижению уровня указанного гликопротеоина и ассоциирована с синдромом Бернанда-Саулера. А - поле ввода референсной последовательности промотора дикого типа; Б - поле ввода мутантной последовательности промотора, содержащей SNP; В – информация о влиянии аллеля дикого типа на связывание транскрипционных факторов с исследуемым районом промотора; Г – информация о влиянии мутантного аллеля на связывание транскрипционных факторов с исследуемым районом промотора, содержащего SNP; Д - статистический порог на статистическую значимость результата. Запуск ARGO_rSNP_Guide осуществляется кликом на кнопку «Calculate». Согласно записи rSNP00J0003 в разработанной в ИЦиГ СО РАН базе данных rSNP_DB, эта замена повреждает сайт связывания транскрипционного фактора GATA1.
Результаты расчетов с приведены на рисунке Ж.35.

Рисунок Ж.35 – Результат работы программы ARGO_rSNP_Guide в ходе анализа клинически охарактеризованного SNP: замены C->G в позиции -133 промотора гена GP1BB человека, кодирующего тромбоцитарный гликопротеин Ibβ. А - порог статистической значимости результата, заданный пользователем; Б - транскрипционные факторы, сайты связывания которых, согласно результатам расчётов, повреждены исследуемым SNP, C —>G; синяя стрелка указывает на транскрипционный фактор семейства GATA, сайт связывания которого повреждён исследуемой заменой согласно методу rSNP_Guide; зеленая стрелка указывает на конкретный транскрипционный фактор - GATA1 (относящийся к семейству GATA), сайт связывания которого, согласно методу ARGO_PeakScorePredictor повреждён исследованной заменой C —>G в промоторе гена GP1BB человека; согласно записи с идентификатором rSNP00J0003 в базе данных rSNP_DB, содержащей экспериментальные данные о клинических проявлениях SNP, эта замена действительно повреждает сайт связывания транскрипционного фактора GATA1, как это предсказано методом ARGO_PeakScorePredictor. В - транскрипционные факторы, сайты связывания которых, согласно результатам расчётов, не повреждены этой заменой; Г - транскрипционные факторы, о которых программа не смогла дать достоверный прогноз