Проект "Геном человека" (Human Genome Project)
Наиболее масштабным и дорогостоящим биологическим научно-исследовательским проектом считают проект «Геном человека». Во время его 15-тилетней истории возникла биоинформатика, т.е. то, чем мы, участники медицинских проектов распределенных вычислений (РВ), помогаем заниматься коллективам исследователей опасных болезней.
Проект можно рассматривать и в некотором роде как проект распределенных вычислений. Да, технологически проект построен, безусловно, совсем на других принципах, чем «классические» проекты РВ, где необходимые вычислительные мощности складываются из персональных компьютеров участников. В проекте «Геном человека» всю работу проворачивали мощные суперкомпьютеры и специализированные вычислительные системы-автоматы. Но в более широком смысле, этот проект похож на любой проект РВ фундаментальностью поставленных целей, огромным количеством потребовавшихся вычислений, открытостью результатов и соревновательной составляющей — в проекте приняли участие десятки государственных и коммерческих научных организаций со всего мира, действующих заодно, но преследующих разные цели.
Поэтому очень интересно проследить историю проекта «Геном человека», тем более что разворачивалась она в 1990-х гг. на фоне стремительного развития компьютерных технологий, сыгравших определяющую роль в его успешном завершении.
В 1988 г. один из первооткрывателей знаменитой двойной спирали ДНК, нобелевский лауреат Дж. Уотсон, публично высказал мысль о том, что наука вплотную приблизилась к раскрытию химической основы наследственности человека. К тому времени было уже известно, что наследственный аппарат человека, геном, составляет около 3 млрд. нуклеотидных пар. В то время эта величина казалась необозримо большой, и сама мысль, что такой объем информации может быть получен, представлялась совершенно фантастической.
В 1980-е годы технологии были слишком примитивными для решения задачи расшифровки генома и среди биологов было много противников этого проекта. Биологи всерьез опасались, что их всех заставят бесконечное количество раз выполнять скучные операции с ДНК человека. Как сказал один юный кандидат наук: «Я не хочу положить свою жизнь на то, чтобы определить последовательность 12-й хромосомы от 100 000-й до 200 000-й пары оснований». Такие опасения рассеялись после появления новых технологий, позволивших передать машинам рутинную работу по определению последовательности. И 1990-е годы вошли в историю как годы уверенного совершенствования возможностей определять последовательность полных геномов.
В 1988 г. средства на изучение генома человека выделило Министерство энергетики, а в 1990 г. — Конгресс США. В Роквилле (штат Мэриленд) появился Национальный институт исследования генома человека (National Human Genome Research Institute, NHGRI), директором которого стал Фрэнсис Коллинз (Francis Collins), и работа над проектом пошла полным ходом.
1995. NHGRI публикует первую полную последовательность ДНК живого организма — бактерии Haemophilus influenzae. За этой бактерий вскоре последовали другие организмы.
1996. Определен первый геном эукариотической клетки (т. е. сложноорганизованной клетки, ДНК которой заключена в ядре) — клетки дрожжей Saccharomyces cerevisiae. Этим открытием увенчались совместные усилия шестисот ученых из Европы, Северной Америки и Японии.
1998. Опубликована первая последовательность ДНК многоклеточного организма — плоского червя Caenorhabditis elegans. Число хромосом и их длина различны у разных биологических видов. В клетках бактерий всего одна хромосома. Так, размер генома бактерии Mycoplasma genitalium — 0,58 Мб (Мегабаза — от английского слова «base» — основание), у бактерии кишечной палочки Escherichia coli в геноме 4,2 Мб, у растения Arabidopsis thaliana — 100 Мб, у плодовой мушки Drosophila melanogaster — 120 Мб. Самая маленькая хромосома клеток человека Homo sapiens содержит ДНК длиной 50 Мб, самая большая (хромосома 1) — 250 Мб. До 1996 г. наибольший участок ДНК, выделяемый из хромосом с помощью реактивов, имел длину 0,35 Мб, а на лучшем оборудовании их структура расшифровывалась со скоростью 0,05–0,1 Мб в год при стоимости $1–2 за основание. Иными словами, только на эту работу понадобилось бы примерно 30 тыс. дней (почти век) и $3 млрд.
Совершенствование технологии к 1998 г. повысило производительность до 0,1 Мб в день (36,5 Мб в год) и понизило стоимость до $0,5 за основание. Использование новых электромеханических устройств, которые к тому же потребляют меньше реактивов, позволило уже в 1999 г. ускорить работы еще в 5 раз и уменьшить стоимость до $0,25 за основание (для человеческой ДНК еще дешевле).
Знаковой фигурой в этом процессе стал Крейг Вентер (Craig Venter), бывший ведущий сотрудник NHGRI, основавший в 1998 г. собственную коммерческую компанию «Силера джиномикс» (Роквилл, штат Мэриленд). В распоряжении Вентера оказался огромный парк компьютеров, который считался тогда вторым по мощности в мире. Триста суперкомпьютеров стоимостью около 80 миллионов долларов круглосуточно обрабатывали огромные объемы данных.
Вентер внедрил в науку метод определения последовательности ДНК, позднее названный «методом беспорядочной стрельбы», который еще называют «методом пулеметной очереди» или «методом стрельбы из дробовика». Суть метода в том, что определяемую ДНК организма разбивают на множество небольших фрагментов, каждый из которых вводят в автомат, определяющий последовательность ДНК. Нечто похожее получится, если разодрать книгу по страницам и раздать их разным читателям. После того как будут определены последовательности каждого фрагмента, в действие вводят сложнейшие компьютерные программы, заново собирающие исходную последовательность. Такое интенсивное использование информационных технологий объясняет, почему многие ученые назвали новую область исследований генома биоинформационной революцией.
К концу 1999 г. было расшифровано свыше двух десятков геномов. Каждое такое достижение требовало определения все более и более длинной последовательности и было важной вехой на пути к определению собственно генома человека.
В июне 2000 года Крейг Вентер и Фрэнсис Коллинз, руководитель проекта «Геном человека» в NHGRI и Национальных институтах здоровья США, объявили о событии, названном ими «первой сборкой генома человека». По существу, это была первая реконструкция полного генома человека, выполненная методом беспорядочной стрельбы.
В феврале 2001 г. Международный консорциум, в который вошли помимо NHGRI и биотехнологической компании «Силера джиномикс», 16 организаций из Великобритании, США, Франции, Германии, Японии и Китая, обнародовали результаты колоссальной работы — первый набросок генома человека.
На протяжении следующих лет различные группы ученых во всем мире постепенно расшифровывали хромосомы человека, периодически сообщая о результатах своей работы. Так, в 2003-м было объявлено о полной расшифровке ДНК, оставалась только первая хромосома человека — последняя из нерасшифрованных хромосом.
И вот, 17 мая 2006 г. исследователи Wellcome Trust Sanger Institute совместно с американскими и английскими коллегами объявили об окончании последнего этапа работы по расшифровке полного генома человека — секвенировании самой большой, первой хромосомы. Об этом сообщается в статье S.G. Gregory et al. «The DNA sequence and biological annotation of human chromosome 1», опубликованной 18 маявжурнале Nature.
В последовательность 1-й хромосомы входит 223 569 564 нуклеотидных оснований, что составляет около 8% от человеческого генома. Она кодирует в два раза больше генов, чем средняя человеческая хромосома – более 3000 генов, включая те, мутации которых лежат в основе развития более 350 известных заболеваний, в том числе некоторых типов рака, болезней Альцгеймера и Паркинсона, гиперлипидэмии и порфирии. В ходе последнего этапа секвенирования идентифицировано более 1000 новых генов, что должно помочь ученым в разработке новых диагностических тестов и методов терапии различных заболеваний.
По словам доктора Марка Уолпорта (Mark Walport), директора Wellcome Trust, проект «Геном человека» обеспечил исследователей огромным количеством информации о человеческих генах и их возможных вариациях. Эта информация необходима для получения ответов на вопросы о причинах тех или иных состояний человеческого организма.
Весь этот огромный массив информации содержится в многочисленных базах данных и электронных библиотеках со свободным доступом для ученых со всего мира. Этой возможностью последние охотно пользуются, применяя полученные данные в многочисленных исследованиях и проектах, порой самого фантастического толка. Кроме того, в настоящее время с различными прикладными целями активно продолжается расшифровка геномов многих организмов.
Литература
1. В.Н. Сойфер. Международный проект «Геном человека», 1999.
2. Л.Л.Киселев. Вестник. Геном человека и биология XXI века. / РАН (том 70, №5, с. 412-424 (2000)
3. Б.В.Громов. Поведение бактерий. Соросовский образовательный журнал, № 6, 1997.
4. С.А.Боринская, Н.К.Янковский. Структура прокариотических геномов. Молекулярная биология, 1999, 33 (6):941-957.
5. Более подробно об истории изучения бактериальных геномов: Г.Стент, Р.Кэлиндар. Молекулярная генетика. М., "Мир", 1991.