«Применение ит в молекулярной генетике» (стр. 3 из 5)

На сайте присутствует большое количество справочной информации. Здесь исследователь может найти необходимые методики для проведения различного рода реакций. В протоколе методик присутствуют: 1) название; 2) прописи используемых растворов (если они выходят за рамки общеизвестных); 3) краткое описание преимуществ данного протокола; 4) в комментариях — обычные выходы продукта и затраты времени; 5) разделён собственно протокол и комментарии к нему (это позволит использовать протокол "за столом" непосредственно в ходе эксперимента). Для всех остальных материалов на сайте есть специальные формы:

· сообщение для главной страницы сайта;

· поиск работы (аспирантуры, дипломной или курсовой работы);

· поиск сотрудника (аспиранта, студента);

· поиск единомышленников или сотрудничества;

· работы и услуги (продам, подарю, выполню);

· работы и услуги (закажу, куплю);

· информация о компании.

Вторым русскоязычным ресурсом, пользующимся большим спросом у исследователей является сайт www.rusbiotech.ru. Этот сайт является проектом фирмы Интерруссофт. Цель проекта - создать первый в России специализированный портал, посвященный биоинформатике и биотехнологии. Портал ведётся и развивается специалистами как в области биотехнологии, так и в области IT, и имеет специализированные разделы, ориентированные на:

· профессионалов;

· инвесторов и бизнесменов;

· всех интересующихся.

Сайт создан как русский аналог проекта biospace.com открыт для сотрудничества всех, заинтересованных в развитии российских биотехнологий. В настоящее время портал rusbiotech.ru не является коммерческим проектом, однако он будет активно использоваться в различных научных и инвестиционных проектах.

Сайт может быть полезен для поиска необходимой информации о методиках, исследуемых организмах, реактивах, материалах и оборудовании. На сайте также содержится информация об организациях, проектах, грантах, а также научные публикации по геномике, молекулярной биологии, биоинформатике, биотехнологии.

2.2.2 Применение IT для проведения молекулярно-генетических исследований.

Часто для получения необходимой информации бывает не достаточно воспользоваться вышеуказанными поисковыми системами. Например, необходимо найти последовательность нуклеотидов определенного гена, подобрать праймеры к заданной нуклеотидной последовательности. Сравнение аминокислотных и нуклеотидных последовательностей является важным звеном исследований молекулярной генетике, которое позволяет идентифицировать семейства генов, относить к ним секвенированные последовательности, устанавливать их структурные и функциональные взаимоотношения. В настоящее время, когда секвенируются целые геномы, значение подобных исследований постоянно возрастает. В таких случаях используют специальные программы.

К программам, используемым для сравнения последовательностей с последующим определением их сходства, относятся: ALIGN, AMAS, BLAST, BLAT, CLUSTAL, DiAlign, FASTA, HI, HMMER, MAP, MGA, OWEN, PipMaker, MultiPipMaker, T-Coffee и др. Наиболее часто используются программы CLUSTAL и BLAST (Basic Local Alignment Search Tool, основное средство поиска, основанное на локальных выравниваниях).

BLAST (англ. Basic Local Alignment Search Tool) — семейство компьютерных программ, служащих для поиска гомологов белков или нуклеиновых кислот, для которых известна первичная структура (последовательность) или её фрагмент. Используя BLAST, исследователь может сравнить имеющуюся у него последовательность с последовательностями из базы данных и найти последовательности предполагаемых гомологов. Является важнейшим инструментом для молекулярных биологов, генетиков, биоинформатиков, систематиков. Первое поколение BLAST программ появилось в начале 90-х годов прошлого столетия. Второе поколение программ данной серии представлено двумя вариантами: WU-BLAST 2 (Washington University BLAST 2) и NCBI BLAST 2 (National Center for Biotechnology information BLAST 2). Эти программы являются самыми быстрыми (скорость поиска на порядок выше программы FASTP и других алгоритмов) и чувствительными (определяют даже незначительное сходство последовательностей). Программы серии BLAST продолжают модифицироваться, при этом скорость поиска у последних версий BLAST приблизительно в 3 раза выше скорости оригинала.

Семейство программ серии BLAST делится на 5 основных групп:

1. Нуклеотидные – предназначены для сравнения изучаемой нуклеотидной последовательности с базой данных секвенированных нуклеиновых кислот и их участков:

1.1. megablast – быстрое сравнение с целью поиска высоко сходных последовательностей,

1.2. dmegablast – быстрое сравнение с целью поиска дивергировавших последовательностей, обладающих незначительным сходством,

1.3. blastn – медленное сравнение с целью поиска всех сходных последовательностей и др..

2. Белковые – предназначены для сравнения изучаемой аминокислотной последовательности белка с имеющейся базой данных белков и их участков.

2.1. blastp – медленное сравнение с целью поиска всех сходных последовательностей,

2.2. cdart – сравнение с целью поиска гомологичных белков по доменной архитектуре,

2.3. rpsblast – сравнение с базой данных консервативных доменов,

2.4. psi-blast – сравнение с целью поиска последовательностей, обладающих незначительным сходством,

2.5. phi-blast – поиск белков, содержащих определенный пользователем паттерн и др.

3. Транслирующие – способны транслировать нуклеотидные последовательности в аминокислотные:

3.1. blastx – переводит изучаемую нуклеотидную последовательность в кодируемые аминокислоты, а затем сравнивает ее с имеющейся базой данных аминокислотных последовательностей белков,

3.2. tblastn – изучаемая аминокислотная последовательность сравнивается с транслированными последовательностями базы данных секвенированных нуклеиновых кислот,

3.3. tblastx – переводит изучаемую нуклеотидную последовательность в аминокислотную, а затем сравнивает ее с транслированными последовательностями базы данных секвенированных нуклеиновых кислот.

4. Геномные – предназначены для сравнения изучаемой нуклеотидной последовательности с базой данных секвенированного генома какого-либо организма (человека, мыши и др.)

5. Специальные – прикладные программы, использующие BLAST:

5.1. bl2seq – сопоставление двух последовательностей по принципу локальных выравниваний,

5.2. VecScreen – определение сегментов нуклеотидной последовательности нуклеиновой кислоты, которые могут иметь векторное происхождение и др.

Все выравнивания принято делить на глобальные (последовательности сравниваются полностью) и локальные (сравниваются только определенные участки последовательностей). Программы серии BLAST производят локальные выравнивания, что связано с наличием в различных белках сходных доменов и паттернов. Кроме этого локальное выравнивание позволяет сравнить иРНК с геномной ДНК. В случае глобального выравнивания обнаруживается меньшее сходство последовательностей, особенно их доменов и паттернов.

После введения изучаемой нуклеотидной или аминокислотной последовательности (запрос) на одну из web-страниц BLAST, она вместе с другой входной информацией (база данных, размера «слова» (участка), значение величины E и др.) поступает на сервер. BLAST создает таблицу всех «слов» (в белке – это участок последовательностей, который по умолчанию состоит из трех аминокислот, а для нуклеиновых кислот из 11 нуклеотидов) и сходных «слов». Затем в базе данных проводится их поиск. Когда обнаруживается соответствие, то делается попытка продлить размеры «слова» (до 4 и более аминокислот и 12 и более нуклеотидов) сначала без гэпов (пробелов), а затем с их использованием. После максимального продления размеров всех возможных «слов» изучаемой последовательности, определяются выравнивания с максимальным количеством совпадений для каждой пары запрос – последовательность базы данных, и полученная информация фиксируется в структуре SeqAlign. Форматер, расположенный на сервере BLAST, использует информацию из SeqAlign и представляет ее различными способами (традиционным, графическим, в виде таблицы).

Для каждой обнаруженной в базе данных программами BLAST последовательности необходимо определить, насколько она сходна с изучаемой последовательностью (запрос) и значимо ли это сходство. Для этого BLAST вычисляет число битов и величину Е (expected value, E-value) для каждой пары последовательностей.

При определении сходства ключевым элементом является матрица замен, так как она определяет показатели сходства для любой возможной пары нуклеотидов или аминокислот. В большинстве программ серии BLAST используется матрица BLOSUM62 (Blocks Substitution matrix 62% identity, блоковая матрица замен с 62% идентичности) . Исключением являются blastn и megablast (программы, которые выполняют нуклеотид – нуклеотидные сравнения и не используют матрицы аминокислотных замен).

С помощью модифицированных алгоритмов Смита-Уотермана или Селлерса определяются все пары сегментов (продленные «слова»), которые нельзя увеличить, так как это приведет к уменьшению показателей сходства. Такие пары продленных «слов» называются парами сегментов с максимальным сходством (high-scoring segment pairs, HSP). В случае достаточно большой длины изучаемой последовательностей (m) и последовательности базы данных (n) показатели сходства HSP характеризуются двумя параметрами K (размера области поиска) и ? (системы подсчета). Эти показатели необходимо указывать при приведении показателей сходства изучаемой последовательности и последовательности базы данных (S).

Для сравнения показателей сходства различных выравниваний независимо от используемой матрицы, их необходимо преобразовать. Для получения преобразованного показателя сходства (числа битов, Sґ) используют формулу:

Sґ = (?S – ln K)/ln 2 (1).

Величина Sґ показывает, насколько сходны последовательности (чем больше число битов, тем больше сходство). Так как в формулу расчета Sґ заложены показатели К и ?, то нет необходимости указывать их при приведении значений Sґ. Величина E (Е-value), соответствующая показателю Sґ, показывает достоверность данного выравнивания (чем ниже значение E, тем достовернее выравнивание). Она определяется по формуле: