Расчет геномного выравнивания и синтении
Существуют различные методы для парных и множественных генных выравниваний, например, BLASTZ50, MULTIZ51,Shuffle – LAGAN52 «Меркатор» и MAID53, Mauve и несколько симметричных выравниваний. Все эти методы обьеденены общим принципом нахождением наиболее близких геномных интервалов (якорей), расширение этих регионов, цепочек группировок, которые граничат между собой и анализ реконструкций.
После выравнивания следующий шаг заключается в том, чтобы найти сохраненные сигналы, которые могут указывать на потенциально функциональные области. Методы расчета коротких сигналов сохранены в области простого окна похожего на PipMaker и Vista, филогенетически скрывающие модели Маркова Phastcons57,58 и другие статистические модели Gamby59. Расчет сохраняющихся синтений, означает сохранение хромосом, которые расположены в нескольких генах, основанные на анализе ДНК либо на выравнивании или двунаправленном сравнении ортологичных генов с интервалом в 2 гена. Эволюционное значение синтении вытекает из предположения, что точный порядок генов в хромосоме идет от общего предка.
Визуализация выравнивания необходима для разработки способов решения различных аналитических задач. Графическое представление о синтении на уровне всего генома имеет решающее значение для изучения эволюции генома. Кроме того, важным является возможность «развернуть» для глобального представления о синтении и для изучения конкретных областей сохраненных генов в контексте аннотации. В добавок, собрание геномов и аннотация их модели может быть представлена путем сравнения положения неизвестного гена и его гомологической последовательности из одного организма в другой, который имеет готовые или хорошо аннотированные последовательности генома.
Ниже мы опишем методы визуализации, которые используются для отображения синтении на микро и макро уровнях (таб.3).
Визуализация геномного выравнивания
Широкие спектры стратегии были изучены для графического синтении на уровне целого генома. Двумерные точечные графики, которые традиционно используются при анализе локального выравнивания, увидели современное возрождение в качестве мощного способа визуализации более доступного геномного выравнивания(DaGChainer, Vista-DotMUMmer62,GenomeMatcher и другие).
Геномы этих двух организмов представлены по осям х и у графика, с указанием линий сетки хромосомных границ. Точки на графике указывают на некоторую степень выравнивания, образуя 45 градусные линии на отдельном месте.
Геном реконструкции и дублирования сразу опознает их как, соответственно вне диагонали и идентифицирует линии как горизонтально так и вертикально сложенные. Dag- первое общедоступное средство для создания графиков, рассчитывает синтении на основе мета-выравнивании генов в родственных BLAST сочетаниях между двумя организмами.
Vista – диаграммы предложили точечный графический режим для просмотра синтении на основе геномного ДНК выравнивания (доп.рис.1). Эти средства имеют интерактивные карты типа Google интерфейса, позволяющие пользователям масштабировать и паномировать в пределах областей, а также на ссылку из соответствующего сегмента для просмотра в Vista или в геномном JGI браузере.
Точечные графики являются полезными не только при анализе синтении между готовыми геномами, но и геномной обработки. Например, OSLAY средство, которое автоматизирует все более распространенные методы использования точечных графиков и приводит коллекцию наборов генов из незавершенного ассемблирования с эталонной сборкой, и тем самым карту целого генома.
Глобальное сохранение может быть визуализировано и представлено ссылкой генома с использованием таблеточной формы идеограмм хромосом и ленточных для обозначения областей приведенных в соответствии, с каким либо геном. Группы имеют цветовую маркировку для обозначения хромосом в соответствии с геном, с которым они сравниваются.
Идеограмма представленных геномов выравнивания является самым предпочтительным выбором для индивидуального генерирования данных в публикациях новой последовательности геномов.
Три варианта являются доступными для автоматической генерации вариантов этой визуализации для определенных пользователей геномной информации:Cinteny,Apollo, « Градиент изображения» Сибилла использует инновационные визуализации, в которых гены отображаются по цвету по геномным ссылкам, эти цвета используются для обозначения гомологичных мест в наборе унифицированных геномов.
VISTA синтении изображения (доп.рис.2) используют основную идеограмму, которая описывает выравнивание родственных генома в качестве направляющего средства отбора хромосом в организме, в ссылках рассмотрено более детально. По сравнению с точечными графиками представление синтении с помощью диаграммы способствует утере информации о местонахождении унифицированных областей для сравнения геномов. Тем не менее, использование цветов в этих диаграммах способствует возможности с легкостью представлять себе, геном и сравнивать его с другими.
Кроме того, цветные сегменты в информационно-справочном геноме могут быть связаны с какими-то конкретными положениями хромосом и линии рисуются более мелкие по сравнению с хромосомными символами в организмах. Этот подход используется в «Apollo», а также в PhiGs веб сайте, который позволяет пользователям создавать синтении карт из 45 последовательностей грибов и многоклеточных.
Альтернативный эстетический подход к геномным изображениям представил Circos. Средства, представляющие из себя Circos, две или более геномные дуги на одном круге. Линии, которые пересекают центр круга, связывают и выравнивают соответствующие области.
В этом циркуляре систематизированы и уменьшены визуальные путаницы, которые вытекают из эквивалентных линейных представлений, в которых паутины соединяют отдаленные области во множестве геномов.
Этот инструмент также поддерживает анимацию выравнивания связей между отдельными геномами, а хромосомы могут быть просмотрены в последовательности и в дальнейшем путаницы сокращаются.
Циркуляционное геномное изображение также доступно в MEDEA и в Miz Bce.
Точечные графики, идеограммы и циркулярные изображения представляют собой оперативное исскуство (стратегию) для визуального изображения и обеспечивают сохранность геномных шкал. Инструменты для реализации этих изображений могут быть использованы для выявления областей синтении, дублирования и перемещения между геномами. После выявления таких областей исследователям необходимы средства, чтобы просмотреть их на более высоком уровне разрешения для визуальной ассоциации с аннотациями данных.
Визуализация геномной защиты
Наиболее простым способом визуально связываться с аннотацией сохраненных данных будет представление выравнивания геномов и сравнение их как «треков» в УСК браузере и браузере VISTA (рис.3).
В обоих случаях попарное или множественное выравнивание представлено в виде двухмерного графика, в котором по оси х указывается положение вдоль представленного генома, а по оси у представлено и сохранено множественное выравнивания этого генома.
Вдобавок, UCSC браузер имеет следы «цепочки выравнивания» показаны как различные оттенки серого.
В случае следов VISTA, такие функции как сохранение экзонов,UTRS и некодирующие области обозначены цветом, находившимся под кривыми.
VISTA треки могут быть экспортированы для просмотра в рамках соответствующих организмов ссылаясь на другие геномные браузеры, такие как JGI геномный браузер и УСК геномный браузер.
Выравнивание треков предоставляет ценные средства для быстрой идентификации и сохранения при просмотре отдельных геномов. Тем не менее, это сохранение изображения не позволяет исследователям использовать функции в двух направлениях: просматривать и сравнивать выравнивания одновременно.
По этой причине многие инструменты были разработаны с возможной визуализацией локальных синтений (таб.3). Как правило, эти инструменты используют общую стратегию, изображающую множественную цепочку и сравнения местоположения одного или более генома рисуя при этом линии между ними, чтобы указать синтении (изображающие связанные следы).
Функции треков с указанной аннотацией геномной модели и определил последовательности тега, которые могут быть наложены выше или ниже соответствующих регионов, аналогично тому, который используется геномным браузером.
Это представление позволяет визуально просматривать выравнивание, сохраняя при этом в контексте геномной аннотации, которая описывает содержание исследованных областей, ссылки подключений в сохраненных областях могут быть сделаны на основе геномных выравниваний ортологичных генов, кластерных белков или даже модельной структуры GMOD Общие Модельные организмы Данного проекта. В том числе популярные геномные браузеры GBrowseявляются, пожалуй, наиболее широко используемой основой для программного обеспечения для поддержки геномного анализа и хранения.
Три синтении веб обозревателей были разработаны в рамках GMOD: SynBrowse и GBrowseSyn, а расширение семейства инструментов из GBrowse позволяет пользователям переключатся между тремя режимами отображения с сохранением связи между регионами.