Кроме того, при выводе результатов, напротив каждого из них BLAST отображает величину E (от англ. Expect value), которая является уровнем значимости и определят достоверность каждого конкретного результата. Например, E=0,05 означает: вероятность того, что найденное сходство случайно составляет 5%.
Важным является то, что BLAST способен предоставлять результаты поиска в нескольких форматах без перезапуска, и пользователь может сравнить и выбрать наиболее для него приемлемый. Это возможно благодаря тому, что результаты работы сохраняются в формате ASN.1, который быстро трансформируется утилитой BLAST formatter в определнного вида html, наиболее предпочтительный для пользователя [6, 12, 13].
Глава 2. Методика исследования
Для проведения эксперимента, способного продемонстрировать эффективность/неэффективность использования ИТ в области диагностической биологии, планировалось с помощью одного из программных приложений GeneBank разработать пару праймеров, позволяющих в условиях обычной лаборатории производить достоверное определение вируса PCV2 с помощью простой реакции ПЦР. Для работы было использовано web-приложение Primer-BLAST, представляющее собой гибрид двух широко использующихся в молекулярно-биологической практике программ – Primer 3 и упомянутого выше BLAST.
Праймеры – короткие одноцепочечные фрагменты ДНК с известной и заданной последовательностью нуклеотидов, которые при определенных условиях (соответствие нуклеотидов, температуры и др.) могут связываться с длинными и также одноцепочечными нитями ДНК (называемыми матрицами), создавая короткие двухцепочечные участки, служащие центрами связывания с ферментами, осуществляющими удлинение этих двухцепочечных участков до определенного размера (образуются т.н. продукты). За счет многократного повторения этапа связывания праймеров с матрицей и синтеза двухцепочечных продуктов в ходе реакции накапливается большое количество одинаковых фрагментов, которые можно легко определить, к примеру, с помощью электрофореза. Сама по себе программа Primer 3 используется для поиска на основе введенной последовательности ДНК всех праймеров, соответствующих заданным условиям ПЦР, она учитывает множество основных параметров, которые вручную определить очень сложно (если вообще возможно), например, температура плавления праймеров, сложность структуры последовательности и др. Таким образом, после установки всех необходимых параметров, Pimer-BLAST производит поиск результатов, соответствующих заданным критериям, осуществляя их сортировку по двум направлениям – соответствие условиям проведения ПЦР (с помощью компонента Primer 3) и соответствие заданному уровню уникальности (специфичности) праймера (с помощью компонента BLAST).
При работе в Primer-BLAST были заданы две группы основных параметров. Первая группа параметров определяла условия проведения ПЦР – температура плавления праймеров (57-63°С), размер продукта (0,7-1,1 тпн) и т.п. Вторая определяла условия поиска родственных последовательностей, которые следовало исключить из результатов, чтобы оставить наиболее специфичные и уникальные праймеры – размер слова (7), пороговая величина (50000), разделы базы данных для сравнения (заданны геномы PCV1 и свиньи Sus scrofa, на основе образцов которой проводился эксперимент) и т.п.
Из предоставленных программой результатов был выбран один, наиболее соответствующий, с точки зрения специфичности, задачам эксперимента (см. таблица 1). После получения праймеров проводилась ПЦР с последующим электрофорезом (разделением молекул синтезированного продукта в геле в электрическом поле).
Таблица 1 - Характеристики отобранных праймеров.
Название праймера | Последовательность, 5’"3’ | Длина, n | GC, % | Tm гетеродимера, oC |
F1_OUT_PCV2 | GGAAGAATGCTACAGAACAATCCA | 24 | 41.67 | 14,6 |
R1_OUT_PCV2 | GATTATTCAGCGTGAACACCCAC | 23 | 47.83 | 35,6 |
Результаты проведенного эксперимента представлены на рисунке 1 в виде фотографии геля, в котором проводилось разделение полученных продуктов ПЦР.
Рисунок 1 –Фотография результатов электрофореза ПЦР в агарозном геле
На дорожке 1 для сравнения ДНК-маркеры молекулярного размера, представляющие собой набор двухцепочечных молекул ДНК различных длин (размеры соответствующих фрагментов подписаны слева). На дорожке 2 – результат реакции с геномом вируса PCV1 (продукт отсутствует), на дорожке 3 результат реакции с геномом вируса PCV2 (виден продукт размером около 1 тпн), на дорожке 4 продукт реакции генома здоровой свиньи Sus scrofa (продукт отсутствует), на дорожке 5 виден продукт реакции, размером около 1 тпн, с геномом свиньи, инфицированной вирусом PCV2. Как следует из фотографии, реакция прошла исключительно в тех пробах, где в том или ином виде присутствовала последовательность генома вируса PCV2, при этом пробы с очень близким к нему вирусом PCV1 и геномом свиньи оказались отрицательными.
Глава 4. Обсуждение результатов
В соответствии с поставленной задачей для проведения эксперимента была разработана пара праймеров, использованных в ПЦР для определения возможности их применения в диагностике заболевания СМИО, вызываемого вирусом PCV2. Исходя из результатов, приведенных на рисунке 1, можно заключить, что полученные праймеры являются специфическими и обеспечивают обнаружение генома вируса PCV2 как в чистых пробах, так и в пробах, содержащих дополнительно постороннюю геномную ДНК (дорожки 3 и 5), кроме того, отсутствует неспецифическая реакция с близким геномом вируса PCV1, а также с ДНК хромосом свиньи, поскольку в обоих указанных случаях однозначно получены отрицательные результаты. Следовательно, разработанные праймеры пригодны для проведения подобного рода исследований и могут быть использованы в практической диагностике для идентификации инфекции PCV2.
В ходе работы с помощью программного обеспечения Primer-BLAST и на основе данных, имеющихся в распоряжении ресурса GeneBank, была разработана пара уникальных праймеров, с помощью которых проводилась ПЦР-диагностика на предмет возможности достоверного выявления скрытой инфекции PCV2 в организмах свиней. Из полученных во время проведения эксперимента результатов следует, что разработанные праймеры специфичны и позволяют проводить диагностику с помощью ПЦР в лабораторных условиях. Кроме того, примененная в ходе работы технология по созданию праймеров для диагностических целей может быть перенесена на другие виды заболеваний, вызываемых инфекционными агентами, для которых еще не существует подобных систем.
Полученные результаты свидетельствуют в пользу того, что современный уровень развития ИТ в области поддержания, обслуживания и использования ресурсов банков данных нуклеотидных последовательностей, а также полнота и точность предоставленной в них информации, в частности речь идет о GeneBank, позволяют эффективно разрабатывать средства диагностики в области ПЦР, и заниматься исследовательской деятельностью, связанной со структурой геномов.
1. Официальная информационная страница проекта «Геном человека» [Электронный ресурс] / U.S. Department of Energy Office of Science. – Режим доступа: http://www.ornl.gov/sci/techresources/Human_Genome/home.shtml. – Дата доступа 05.01.2011.
2. Официальный сайт компании Knom, предлагающей услуги по сиквенированию и аннотации генома человека [Электронный ресурс] / Knome, 2010. – Режим доступа: http://www.knome.com. – Дата доступа 05.01.2011.
3. Электронная версия английского журнала Bio-IT World, освещающего последние и важнейшие достижения в области биологических и медицинских исследований [Электронный ресурс] / Cambridge Healthtech Institute, . – Режим доступа: http://www.bio-itworld.com/news/05/18/09/knome-exome-sequencing-service.html. – Дата доступа 05.01.2011.
4. Щелкунов, С.Н. Базы данных нуклеотидных и аминокислотных последовательностей / С.Н. Щелкунов // Генетическая инженерия / С.Н. Щелкунов. – Новосибирск: Сибирское университетское издательство, 2004. Гл. 1. – С. 9-80.
5. Банк данных GeneBank, содержащий все когда-либо опубликованные генетические нуклеотидные последовательности [Электронный ресурс] / National Center for Biotechnology Information, National Library of Medicine, USA. – Режим доступа: http://www.ncbi.nlm.nih.gov/genbank/. – Дата доступа 05.01.2011.
6. Mizrachi, I. GenBank: The Nucleotide Sequence Database / I. Mizrachi // The NCBI Handbook / J. McEntyre, J. Ostell. – USA, 2002. – Ch. 1. P. 1-11.
7. Европейская база данных, аналог GeneBank [Электронный ресурс] / European Bioinformatics Institute, 2010. – Режим доступа: http://www.ebi.ac.uk/embl/.– Дата доступа 05.01.2011.
8. Японская база данных, аналог GeneBank [Электронный ресурс] / DNA Data Bank of Japan, 2010. – Режим доступа: http://www.ddbj.nig.ac.jp/.– Дата доступа 05.01.2011.
9. Olson, M. A common language for physical mapping of the human genome / M. Olson [et al.] // Science. – 1989. – Vol. 245(4925). – P. 1434–1435.
10. Kans, J. Sequin: A Sequence Submission and Editing Tool / J. Kans // The NCBI Handbook / J. McEntyre, J. Ostell. – USA, 2002. – Ch. 12. P. 155-166.
11. Sirotkin, K. The Processing of Biological Sequence Data at NCBI / K. Sirotkin [et al.] // The NCBI Handbook / J. McEntyre, J. Ostell. – USA, 2002. – Ch. 12. P. 166-174.
12. Altschul, S.F. Basic local alignment search tool / S.F. Altschul [et al.] // J. Mol. Biol. – 1990. – Vol. 215. – P. 403–410.
13. Mount, W.D. Alignment of pairs of sequences / W.D. Mount // Bioinformatics. Sequence and genome analisys / W.D. Mount. – Cold Spring Harbor Laboratory Press, 2001. – Ch. 3. – P. 52-141.
Предметный указатель к реферату
A
ASN.1, 9, 11
B
BankIt, 7, 8, 21
BLAST, 3, 9, 10, 11, 12, 14, 17, 21
D
DDJB, 7