БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
Выпускная работа по
«Основам информационных технологий»
Магистрант
кафедры молекулярной биологии Бадалян Ольга
Руководители:
доцент Николайчик Евгений Артурович, Ph. D.,
ст. преподаватель Шешко Сергей Михайлович
Минск – 2010 г.
СПИСОК ОБОЗНАЧЕНИЙ КО ВСЕЙ ВЫПУСКНОЙ РАБОТЕ. 3
РЕФЕРАТ НА ТЕМУ «ИСПОЛЬЗОВАНИЕ НФОРМАЦИОННЫХ ТЕХНОЛОГИЙ В МОЛЕКУЛЯРНОЙ БИОЛОГИИ». 4
Глава 1 Анализ последовательностей ДНК.. 4
1.1 WEB-приложения, используемые для анализа последовательностей ДНК 6
1.2 Приложения в составе Vector NTI Suite. 7
1.3 Компьютерная программа SQ для редактирования и анализа биологических последовательностей. 10
Глава 2 Моделирование макромолекул и процессов протекающих на молекулярном уровне. 12
2.1 Программа RasWin для просмотра 3D молекул. 12
2.2 Программа Modeller для моделирования макромолекул. 13
2.3 Использование программы AutoDock для моделирования молекулярных процессов. 14
Список литературы к реферату. 16
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ К РЕФЕРАТУ.. 19
ИНТЕРНЕТ РЕСУРСЫ В ПРЕДМЕТНОЙ ОБЛАСТИ ИССЛЕДОВАНИЯ.. 20
ДЕЙСТВУЮЩИЙ ЛИЧНЫЙ САЙТ В WWW... 23
ТЕСТОВЫЕ ВОПРОСЫ ПО ОСНОВАМ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ 25
ПРЕЗЕНТАЦИЯ МАГИСТЕРСКОЙ ДИССЕРТАЦИИ.. 26
СПИСОК ЛИТЕРАТУРЫ К ВЫПУСКНОЙ РАБОТЕ. 28
СПИСОК ОБОЗНАЧЕНИЙ КО ВСЕЙ ВЫПУСКНОЙ РАБОТЕ
ДНК | Дизоксирибонуклеиновая кислота |
ИТ | Информационные технологии |
ПЦР | Полимеразная цепная реакция |
РНК | Рибонуклеиновая кислота |
РЕФЕРАТ НА ТЕМУ «ИСПОЛЬЗОВАНИЕ НФОРМАЦИОННЫХ ТЕХНОЛОГИЙ В МОЛЕКУЛЯРНОЙ БИОЛОГИИ»
Современная молекулярная биология и молекулярная генетика определяют развитие как фундаментальной, так и прикладной биологии. Огромное разнообразие подходов к решению задач исследований требует все более точных и быстрых методов анализа. Эффективность исследований зависит от нескольких параметров, основополагающими из которых, являются техническое оснащение лаборатории и освоение новых методических подходов.
На каждом этапе работы молекулярный биолог сталкивается с применением информационных технологий. Молекулярная биология изучает такие молекулы как ДНК, РНК и белки. Такие объекты изучения нельзя потрогать руками, нельзя увидеть невооруженным глазом. Поэтому практически все методы, которые используются в молекулярной биологии, связаны с использованием информационных технологий (ИТ).
Любой молекулярно-биологический эксперимент можно разделить на три стадии: планирование эксперимента, его проведение и анализ полученных результатов. На той или иной стадии молекулярный биолог сталкивается с использованием ИТ-инструментов, будь то пакет Microsoft Office и глобальная сеть «Интернет» или же программное обеспечение для приборов, используемых в молекулярно-биологической лаборатории (амплификаторы в режиме реального времени, секвенаторы, системы гель-документации, спектрофотометры и др.). Также стоит отметить применение различных графических редакторов и программ для моделирования не только макромолекул, но и целых процессов протекающих на молекулярном уровне.
Глава 1
Анализ последовательностей ДНК
Молекулярная биология – это комплекс биологических наук, изучающих механизмы хранения, передачи и реализации генетической информации, строение и функции нерегулярных биополимеров (белков и нуклеиновых кислот). Поскольку ДНК является материальным носителем генетической информации, молекулярная биология значительно сблизилась с генетикой, и на стыке образовалась молекулярная генетика, являющаяся одновременно разделом генетики и молекулярной биологии. Для анализа генетической информации привлекается вычислительная техника, в связи с чем появились новые направления молекулярной генетики, которые иногда считают особыми дисциплинами: биоинформатика, геномика и протеомика.
Анализ последовательностей биологических макромолекул (ДНК, РНК, белков) является существенной частью повседневной работы современного биолога. Из-за большого размера макромолекул в подавляющем большинстве случаев такой анализ требует использования специализированных программ для просмотра аннотированных последовательностей, выявления интересующих исследователя функциональных участков, рестрикционного анализа, подбора праймеров для ПЦР и т.д. Кроме того, планирование молекулярно-биологических экспериментов in silico перед их реальной постановкой in vitro способно сэкономить время, средства и помочь избежать ошибок[1].
В связи с большим разнообразием возможных вариантов анализа последовательностей ДНК и потребностей молекулярных биологов в настоящее время существует значительное количество компьютерных программ, в той или иной степени эти потребности удовлетворяющих. Существующие программные решения можно разделить на две группы: крупные программные пакеты, способные выполнять всесторонний анализ последовательностей ДНК, и специализированные программы, предназначенные для решения конкретной частной проблемы. В первом случае речь идет, как правило, о наборе небольших программ (например, пакет EMBOSS [2]) суммарно представляющих мощный аналитический инструмент, который, однако, из-за слабой связи этих программ между собой и нестандартного интерфейса не очень удобен для молекулярного биолога, не специализирующегося в области биоинформатики. Программы второй группы имеют, как правило, более привычный простой графический интерфейс и должны быть удобнее в работе (при условии реализации всех необходимых для пользователя функций). Также существуют различные web-приложения, среди которых можно, наверное, найти программы для всех мыслимых вариантов анализа последовательностей биологических макромолекул, но подавляющее большинство таких приложений является слишком узкоспециализированными[1].
1.1 WEB-приложения, используемые для анализа последовательностей ДНК
В качестве примера можно привести web-приложение Sequence Manipulation Suite [3]. Данное приложение работает on-line и включает в себя множество различных программ (более 50), которые значительно облегчают работу молекулярного биолога. Так, например, программа Restriction Summary (рисунок 1.1) позволяет быстро определить ферменты, разрезающие определенную последовательность ДНК; программа Reverse Translate преобразует аминокислотную последовательность белков в кодирующую данный белок нуклеотидную последовательность ДНК. Программа DNA Stats при вводе нуклеотидной последовательности ДНК и РНК определяет количество каждого азотистого основания в последовательности, а также процентное соотношение нуклеотидов и пар нуклеотидов, что может быть очень полезным для расчета температуры отжига праймеров.
Преимуществом данного web-приложения является его доступность и широкий выбор программ. Однако существует и ряд недостатков. Данное приложение не позволяет одновременно выполнять в одном окне несколько программ. Еще одним недостатком может быть то, что приложение Sequence Manipulation Suite доступно только на английском языке.
Рисунок 1.1 – программа Restriction Summary в web-приложении Sequence Manipulation Suite.
1.2 Приложения в составе Vector NTI Suite
Vector NTI Suite – это достаточно удобный набор программных инструментов, предназначенных главным образом для анализа последовательностей. Инструменты разработаны компанией InfoMax Inc. для специалистов в области молекулярной биологии и позволяют изучать, визуализировать, манипулировать и конструировать биологические молекулы, а также хранить и предоставлять доступ к информации об этих молекулах [4].
При помощи инструментов Vector NTI Suite можно делать следующее:
1. Легко ориентироваться и осуществлять поиск в базе данных молекул и ферментов;
2. Разрабатывать стратегию рекомбинации и соответствующие протоколы;
3. Симулировать гель-электрофорез, анализировать результаты эксперимента;
4. Анализировать и манипулировать ДНК, РНК и белковыми молекулами;
5. Создавать или импортировать молекулы, энзимы, олигонуклеотиды, добавлять описание и дополнительную информацию.
Vector NTI позволяет генерировать протоколы для клонирования и амплификации, разрабатывать пробы и праймеры, расcчитывать фрагменты рестрикции и симулировать гель-электрофорез. Приложения Vector NTI Suite обеспечивают молекулярный анализ, выравнивание и сборку последовательностей из фрагментов. К базовым приложениям Vector NTI Suite следует отнести следующие программы и инструменты:
1. Основная программа Vector NTI (Графическая оболочка для работы с базой данных, молекулами, гель-электрофорезом, обеспечивающая интеграцию на уровне данных с другими приложениями Vector NTI Suite);
2. 3Dmol - приложение, позволяющее эффективно визуализировать и манипулировать 3х-мерными молекулярными структурами, описанными в стандарте Protein Data Bank (программа по функциям близка к Rasmol);
3. AlignX – программа для выравнивания последовательностей (множествен.), позволяющая работать как с протеинами, так и с нуклеиновыми кислотами. AlignX читает все стандартные текстовые форматы, например FASTA, GenBank, EMBL, SWISS-PROT, GenPept и ASCII- текст;
4. AlignX Blocks – программа для определения положения, анализа и редактирования блоков из найденных подобий среди множества белковых последовательностей;