нов в спнтанном мутационном процессе.
В геноме человека присутствуют также нуклеотидные
последовательности, гомологичные генам некоторых вирусов.
Впервые эти последовательности были идентифицированы в гено-
ме вирусов, индуцирующих развитие опухолей у животных и че-
ловека, и потому они были названы онкогенами. Гомологичные
последовательностям в геноме человека носят название прото-
онкогенов. В настоящее время уже идентифицировано более 100
протоонкогенов. Белковые продукты протоонкогенов, по-видимо-
му, играют важную роль в нормальной пролиферации клеток осо-
бенно на ранних стадиях эмбрионального развития, контролируя
клеточный цикл и выбор геномной программы развития клетки.
При возникновении специфических мутаций в протоонкогенах, а
также при нарушениях регуляции их работы, выражающихся в ги-
перпродукции или в зкспрессии в нетипичномном месте или в
несвойственный момент жизнедеятельности клетки, они начинают
вести себя как онкогены, стимулируя неконтролируемое размно-
жение и пролиферацию определенных клеточных клонов, что и
может, в конечном счете, привести к формированию опухоли.
Раздел 2.4 Современное определение понятия "ген",
транскрипция, регуляторные элементы генов.
Около 10-15% генома человека представлено уникальными
транскрибируемыми последовательностями, составляющими основу
структурных генов (Льюин, 1987). В настоящее время в понятие
"ген" включается не только его транскрибируемая область -
экзоны + интроны, но также фланкирующие последовательности -
лидерная, предшествующая началу гена, и хвостовая нетрансли-
руемая область, раположенная на 3' конце гена (Рис.2.1 ). В
отличие от генов прокариот гены человека редко представлены
одной непрерывной последовательностью и в подавляющем боль-
шинстве имеют прерывистую структуру. Относительно короткие
кодирующие участки - зкзоны, чередуются с длинными интрона-
ми, которые транскрибируются и входят в состав первичного
РНК-продукта, но затем при процессинге первичного РНК
-транскрипта они вырезаются и не участвуют в трансляции.
Процесс вырезания интронов из первичных транскриптов получил
название сплайсинга. Таким образом, в зрелой мРНК интронные
области отсутствуют, а экзоны составляют непрерывную кодиру-
ющую последовательность. Размеры зрелых мРНК нередко в
десятки раз меньше первичных РНК-транскрипов и, соот-
ветственно, размеров самого гена.
Согласно классическим представлениям ген - это локус,
на хромосоме, мутации в котором реализуются на уровне фено-
типа. В молекулярной биологии ген трактуется как ассоцииро-
ванный с регуляторными последовательностями фрагмент ДНК,
соответствующий определенной единице транскрипции. Следова-
тельно, представления о гене формальных генетиков далеко не
полностью тождественны его физической единице и соотношения
между этими двумя понятиями достаточно запутанные. Отметим
некоторые причины этих противоречий. Известно, что мутации
одного гена могут приводить к совершенно разным и даже в ря-
де случаев к комплементарным фенотипам. Результаты прямого
секвенирования генома свидетельствуют о присутствии в нем
значительного большего числа генов, чем можно ожидать от ре-
зультатов мутационного анализа. Одна и та же последователь-
ность ДНК в геноме может кодировать несколько различных бел-
ков, что достигается за счет так называемого альтернативного
сплайсинга (образование разных мРНК из одного первичного
РНК-транскрипта). В крупных интронах ряда генов обнаружены
смысловые последовательности других генов ("ген в гене"),
считываемые в противоположном направлении. Транскрипционные
единицы генома могут перекрываться за счет наличия разных
промоторов. Наконец, благодаря соматической рекомбинации
структура транскрибируемых последовательнстей некоторых ге-
нов может быть различной в разных клонах клеток одного орга-
низма (Т-клеточные рецепторы). Ситуация с определением поня-
тия "ген" еще больше осложняется, если в это понятие вклю-
чать многочисленные регуляторные последовательности. Возни-
кает вопрос: "Как далеко от гена могут располагаться эти
последовательности, чтобы их можно было включать в структуру
гена?". Для многих целей оказывается удобным введенное в
последнее время понятие "считаемый ген"- counting gene.
Последний рассматривается как отдельная транскрибируемая
единица ДНК или её часть, которая может транслироваться в
одну или несколько взаимосвязанных аминокислотных последова-
тельностей. Поэтому последовательность, дающая две
транскрипционные единицы за счет альтернативного сплайсинга
и, как следствие, два разных белка учитывается как один ген.
Однако, если степень гомологии двух генопродуктов, имеющих
общий транскрибируемый участок, невелика, то эти последова-
тельности расцениваются как два разных гена (Fields et
al.,1994).
По своему функциональному назначению гены могут быть
разделены на две группы. Группа I представлена генами, коди-
рующими собственно белки; группа II - генами, контролирующи-
ми синтез рибосомальных, транспортных и ядерных РНК. По ха-
рактеру экспрессии гены также могут быть подразделены на две
группы - гены "домашнего хозяйства" (housekeeping genes),
продукты которых необходимы для обеспечения жизнедеятель-
ности любого типа клеток, и тканеспецифические гены, обеспе-
чивающие специализированные функции клеток, то есть гены,
функционально активные только в определенных типах клеток
(тканей) и только на определенных стадиях онтогенеза, так
называемые гены терминальной дифференцировки.
Считается, что средние размеры гена человека составля-
ют, примерно, от 10 до 30 кб. Однако, эта величина может ко-
лебаться от нескольких десятков до миллионов пар нуклеоти-
дов. Согласно последним данным, самый маленький из известных
генов- МСС-7, имеет размеры всего 21 п.о. (Gonzales-Pastor
et al.,1994), а самый болшой - ген дистрофина -2.2 мегабаз.
Гены отделены друг от друга протяженными промежутками -
спейсерами, содержащими в своем составе большое количество
повторяющихся последовательностей ДНК и нетранскрибируемые
уникальные последовательности.
Рассмотрим более подробно современные данные о числе
генов в геноме человека. Полученные разными методами оценки
этой величены приведены в Табл.2.1. Исходя из размера генома
(около 3 000 миллионов п.о.), и среднего размера одного гена
порядка 10 - 30 тыс.п.о. (Gilbert, 1992), общее число генов
должно быть порядка 100 000. При этом, как уже указывалось,
распределение генов на хромосомах крайне неравномерно. Уста-
новлено, что более 90% генов находится в Гимза -отрицатель-
ных районах метафазных хромосом, в так называемых R-бэндах
(Antequera,Bird ,1993). Проведенные недавно прямые исследо-
вания методом секвенирования показывают, что в R-бэндах их
число достигает 43-50 на один бэнд, а в Гимза- положительных
районах хромосом (G бэндах), - только 1-2 на 75-80 килобаз,
то есть всего в геноме можно ожидать около 70 000 генов.
Оценка числа генов по доле транскрибируемой части генома
(всего 12%) дает совсем маленькую величину - 20 000 генов
(Wagner et al.,1993). Методом исследования кинетики реассо-
циации РНК в культуре клеток число генов оценивается между
20 - 40 000 (Lewin, 1990). В то же время в клетках мозга
число различных мРНК по некоторым данным достигает 97 000
(Wagner et al.,1993). Наиболее точные подсчеты числа генов
человека проведены в последнее время и основаны на оценке
числа CpG островков (Табл.2.1). Известно, что в промоторной
области всех генов "домашнего хозяйства" и примерно у 40 %
генов терминальной дифференцировки, обеспечивающих специали-
зированные функции дифференцированных клеток, находятся об-
ласти коротких динуклеотидных CpG повторов. Разработаны мо-
лекулярные методы точной регистрации этих участков, которые
показали, что их число в геноме около 45 000, отсюда число
структурных генов оценивается в 67-70 000 ( Antequera, Bird,
1993). Практически такое же число генов (64 000) определено
недавно методом учета маркерных экспрессирующихся последова-
тельностей (expressed sequence tags) (Fields et al., 1994).
Таким образом, суммируя вышеизложенное, можно сделать вывод,
что в геноме человека содержится, в среднем, около 70-80 000
отдельных транскрибируемых ДНК последовательностей, то есть
генов.
Транскрипция гена начинается с 5' конца первого экзона,
где расположен сайт инициации транскрипциии. Определенной
гомологии между стартовыми сайтами разных генов не наблюда-
ется, но чаще всего они начинаются с нуклеотида А, окружен-
ного пиримидиновыми основаниями. На границах между экзонами
и интронами имеются консервативные канонические последова-
тельности, играющие существенную роль в обеспечении точности
вырезания интронов во время сплайсинга РНК. Все интронные
последовательности начинаются с динуклеотида GT и заканчива-
ются динуклеотидом AG, называемыми, соответственно, донорны-
ми и акцепторными сайтами сплайсинга. На 3' конце многих
структурных генов идентифицирована поли(А)-сигнальная после-
довательность (AATAAA), участвующая в процессе модификации
первичного РНК транскрипта и ответственная за альтернативный
сплайсинг мРНК, обеспечивающий синтез разных зрелых мРНК с
одного и того же первичного РНК транскрипта.
Транскрипция генов осуществляется с помощью фермента
РНК-полимеразы. Около 50-70% клеточного синтеза РНК обеспе-
чивается РНК-полимеразой I, локализованной в ядрышках и от-