5. BioPlot – набор инструментов для анализа последовательностей белков и нуклеиновых кислот, предоставляющих более пятидесяти различных предопределенных градаций для анализа белковых последовательностей (ProtScale-анализ), связанных с картой свойств и последовательностью аминокислот. BioPlot позволяет выполнять восемь различных видов анализа нуклеиновых кислот, среди которых анализ: температуры плавления, свободной энергии, энталпии, энтропии, содержания GC;
6. ContigExpress – программа для манипулирования и сборки множества небольших фрагментов, как текстовых последовательностей, так и хроматограмм с автоматического секвенатора, в длинные последовательности;
7. GCG Converter – инструмент в составе Vector NTI Suite, который преобразует последовательности в файл формата GCG, так чтобы их можно было импортировать в Suite;
8. PubMed/Entrez Search – это поисковый механизм для поиска (и извлечения) цитат и молекул из публичных баз данных, таких как PubMed, GenBank и Protein DataBank. Результаты поиска могут быть импортированы другими приложениями Vector NTI Suite [4].
В терминах Vector NTI, конструирование – это создание молекул из полностью предопределенных фрагментов, сочетание которых определяется пользователем программы. Конструирование молекулы ДНК выполняется по следующей схеме:
1. Выбор и описание фрагментов молекулы;
2. Создание списка фрагментов, описывающего целевую молекулу (Goal Molecule Definition List);
3. Вызов соответствующего инструмента и собственно конструирование молекулы.
Молекула ДНК может быть собрана из различных типов фрагментов – из фрагментов существующих молекул, линкеров, адаптеров и т.п. (рисунок 1.2). Значительная часть работы при конструировании молекул - это определение фрагментов, описание линкеров и адаптеров занимает значительно меньше времени. К счастью, в составе Vector NTI есть специальный инструмент – Мастер фрагментов (Fragment Wizard), который "руководит" пользователем в процессе описания нового фрагмента и обеспечивает быстроту и прозрачность процедуры [5].
В дополнении к Fragment Wizard для определения фрагментов можно использовать Редактор фрагментов (Fragment Editor). С помощью редактора легко описываются любые фрагменты, однако наиболее эффективно он может быть использован при определении линкеров и адаптеров.
Кроме конструирования, в рамках инструментария Vector NTI для создания и добавления новой молекулы в базу данных существует целый ряд возможностей, в частности:
1. Описание молекулы может быть импортировано из GenBank, EMBL, FASTA;
2. Для описания молекулы может быть использована последовательность из какого-либо текстового файла;
3. Молекула может быть разработана по правилам встроенной в Vector NTI базы биологических знаний.
Молекулы, которые собраны из фрагментов, в терминах Vector NTI называются сконструированными молекулами. Молекулы, описание которых импортировано или составлено вручную, называются базовыми молекулами, т.к. они записываются в базу данных как нечто целое в противовес сконструированным молекулам, для которых вместе с общими данными записывается информация об исходных фрагментах [5].
1.3 Компьютерная программа SQ для редактирования и анализа биологических последовательностей
Приложение SQ было разработано преподавателями кафедры молекулярной биологии биологического факультета БГУ, доцентом, к.б.н. Николайчиком Е. А. и к.б.н. Валентовичем Л.Н.
SQ – редактор последовательностей ДНК, предназначенный для создания, редактирования и анализа последовательностей ДНК, а также для моделирования экспериментов молекулярного клонирования и ПЦР. Простота и удобство интерфейса были одной из основных целей при разработке программы SQ. Для достижения этой цели в SQ реализованы поддержка альтернативных языков интерфейса, удобная панель инструментов и использование вкладок вместо отдельных окон для отображения результатов анализа последовательности (рисунок 1.3).
Программа SQ использует классификацию стандартных функциональных участков последовательностей ДНК, принятую в формате GenBank [6] и таблицы генетического кода [7], опубликованные на сайте NCBI.
При помощи программы SQ можно выполнить следующие операции:
1. Получить обратную, комплементарную или обратно-комплементарную цепь ДНК;
2. Поиск промоторных, операторных и прочих последовательностей;
3. Создание, отображение и редактирование аннотации последовательности ДНК;
4. Трансляция нуклеотидных последовательностей и поиск открытых рамок считывания;
5. Рестрикционный анализ;
6. Виртуальное клонирование;
7. Проверка праймеров для ПЦР.
Процедуры рестрикционного анализа используют базу данных REBASE [8]. Связанные с рестрикцией функции доступны через многие элементы интерфейса программы: через панель инструментов, стандартное меню, контекстные меню основного окна и вспомогательного окна "Ферменты". Последнее окно содержит список доступных ферментов, представляющий собой выборку из рестрикционных эндонуклеаз, описанных в базе данных REBASE [2]. Меню "Рестрикция" позволяет редактировать этот список, а также создавать/редактировать наборы ферментов. Также графическая карта предоставляет некоторые дополнительные возможности по сравнению с простым рестрикционным анализом[1].
Виртуальное клонирование позволяет моделировать реальные эксперименты по молекулярному клонированию. Последовательности рекомбинантных плазмид, которые можно создать с помощью этой методики, облегчают документацию экспериментов по молекулярному клонированию, а также помогают оценить размеры фрагментов рестрикции, ожидаемых при проверке рекомбинантных клонов[1].
Программа SQ является сегодня единственной, предназначенной для анализа нуклеотидных последовательностей и симуляции молекулярного клонирования программой с русскоязычными (а также белорусскоязычными) интерфейсом и документацией. Несмотря на то, что программа SQ уступает по своим функциональным возможностям аналогичным коммерческим продуктам, она превосходит большинство из них по удобству пользования (и, естественно, цене).Программа SQ распространяется свободно и не имеет ограничений по ее использованию. Последняя версия программы и вспомогательные файлы доступны для загрузки на официальном сайте проекта SQ [9].
Глава 2
Моделирование макромолекул и процессов протекающих на молекулярном уровне
2.1 Программа RasWin для просмотра 3D молекул
Данная программа находится в свободном доступе в глобальной сети «Интернет». RasWin позволяет просматривать изображения молекул в формате .pdb. Файлы в данном формате можно найти в базе данных Protein Data Base (PDB) [10]. Для того чтобы найти интересующую структуру необходимо в окне поиска набрать код структуры или название, например, 132L - лизоцим. В открывшемся окне, найти ссылку на файл .pdb, который откроется в окне браузера. Далее необходимо скопировать весь текст в блокнот и сохранить как name.pdb (изменить при сохранении 'текстовые файлы' на 'все файлы', для того, чтобы изменить разрешение). Пользовательский интерфейс достаточно прост (рисунок 2.1).
При помощи RasWin макромолекулы можно представить в различных вариациях (рисунок 2.2). Также в данной программе предусмотрен выбор цветов для отдельных групп атомов, которые составляют макромолекулу. Полученные 3D изображения можно сохранить в форматах .bmp, .gif, .epsf, .ppm и .rast.
2.2 Программа Modeller для моделирования макромолекул.
Modeller - компьютерная программа, которая моделирует трехмерные структуры белков и строит их со всеми необходимыми пространственными ограничениями. Modeller является наиболее часто используемой программой для гомологического или сравнительного моделирования структуры белков: пользователь предоставляет выровненную последовательность, на основе которой программой будет смоделирована молекула с известными родственными структурами. В процессе работы Modeller автоматически вычислит модель со всеми неводородными атомами.
В более широком смысле, использование программы Modeller ограничено пространственной структурой аминокислотной и лигандной последовательностью, которые будут смоделированы. Результат вычислений - трехмерная структура, которая соответствует этим ограничениям настолько, насколько это возможно [11].
Трехмерная модель, полученная в программе Modeller при оптимизации функции вероятности молекулярной плотности имеет формат (pdf). Молекулярная pdf для сравнительного моделирования оптимизирована с переменно-целевой процедурной функцией в пространстве декартовых координат, которое использует методы сопряженных градиентов и динамику молекул с модельной "закалкой". Программа Modeller может также выполнять множественное сравнение последовательностей белка и/или структур, объединенных в кластеры белков, и поиска последовательности из баз данных. Программа использует язык скриптов (сценариев) и не имеет графического интерфейса. Программа Modeller распространяется бесплатно. Скачать ее можно с официального сайта Modeller [12].