Оценка числа генов по доле транскрибируемой части генома
(всего 12%) дает совсем маленькую величину - 20 000 генов
(Wagner et al.,1993). Методом исследования кинетики реассо-
циации РНК в культуре клеток число генов оценивается между
20 - 40 000 (Lewin, 1990). В то же время в клетках мозга
число различных мРНК по некоторым данным достигает 97 000
(Wagner et al.,1993). Наиболее точные подсчеты числа генов
человека проведены в последнее время и основаны на оценке
числа CpG островков (Табл.2.1). Известно, что в промоторной
области всех генов "домашнего хозяйства" и примерно у 40 %
генов терминальной дифференцировки, обеспечивающих специали-
зированные функции дифференцированных клеток, находятся об-
ласти коротких динуклеотидных CpG повторов. Разработаны мо-
лекулярные методы точной регистрации этих участков, которые
показали, что их число в геноме около 45 000, отсюда число
структурных генов оценивается в 67-70 000 ( Antequera, Bird,
1993). Практически такое же число генов (64 000) определено
недавно методом учета маркерных экспрессирующихся последова-
тельностей (expressed sequence tags) (Fields et al., 1994).
Таким образом, суммируя вышеизложенное, можно сделать вывод,
что в геноме человека содержится, в среднем, около 70-80 000
отдельных транскрибируемых ДНК последовательностей, то есть
генов.
Транскрипция гена начинается с 5' конца первого экзона,
где расположен сайт инициации транскрипциии. Определенной
гомологии между стартовыми сайтами разных генов не наблюда-
ется, но чаще всего они начинаются с нуклеотида А, окружен-
ного пиримидиновыми основаниями. На границах между экзонами
и интронами имеются консервативные канонические последова-
тельности, играющие существенную роль в обеспечении точности
вырезания интронов во время сплайсинга РНК. Все интронные
последовательности начинаются с динуклеотида GT и заканчива-
ются динуклеотидом AG, называемыми, соответственно, донорны-
ми и акцепторными сайтами сплайсинга. На 3' конце многих
структурных генов идентифицирована поли(А)-сигнальная после-
довательность (AATAAA), участвующая в процессе модификации
первичного РНК транскрипта и ответственная за альтернативный
сплайсинг мРНК, обеспечивающий синтез разных зрелых мРНК с
одного и того же первичного РНК транскрипта.
Транскрипция генов осуществляется с помощью фермента
РНК-полимеразы. Около 50-70% клеточного синтеза РНК обеспе-
чивается РНК-полимеразой I, локализованной в ядрышках и от-
ветственной за синтез генов рибосомальной РНК. РНК-полимера-
за II обеспечивает транскрипцию генов, кодирующих собственно
структурные белки. Этот фермент локализован в ядре (но не в
ядрышках). На его долю приходится 20 - 40% синтеза РНК.
РНК-полимераза III контролирует синтез ядерных и транспорт-
ных РНК (Льюин, 1987). На 1-м этапе РНК-полимераза связыва-
ется с двухнитевым участком ДНК и, расплетая его, делает
доступным спаривание смысловой нити ДНК с рибонуклеотидами
(Рис. 2.2). После того как первый нуклеотид РНК инкорпориру-
ется в сайт инициации транскрипции, полимераза начинает
продвигаться по нити ДНК в направлении 5'- 3', расплетая
двойные нити ДНК впереди себя и заплетая их позади. Этот
процесс продолжается до достижения терминирующего сигнала,
представляющего собой один или несколько терминирующих кодо-
нов. Затем молекулы РНК и фермента высвобождаются и двойная
спираль (дуплекс) ДНК полностью восстанавливается.
Для правильного начала синтеза РНК необходимо точное
взаимодействие РНК-полимеразы с молекулой ДНК. Этот процесс
контролируется промотором - специальной регуляторной после-
довательностью ДНК размерами около 75 п.о., локализованной,
как правило, в 5'-фланкирующей области гена. Иногда под
контролем одного промотора считывается несколько генов c об-
разованием единого первичного РНК-транскрипта. Промоторные
области различных генов довольно разнообразны по своему нук-
леотидному составу. Однако, почти для всех промоторов харак-
терно наличие консервативной последовательности из 7 основа-
ний на расстоянии 19-27 нуклеотидов слева от сайта инициации
транскрипции. Это, так называемый, TATA -бокс (блок Хог-
несса), обеспечивающий корректное расположение РНК полимера-
зы по отношению к стартовому сайту. На расстоянии 70 - 80
п.о. в направлении 5'-конца от начала транскрипции часто
расположена другая консервативная последовательность из 9
п.о. - CAAT- бокс, контролирующий начальное связывание
РНК-полимеразы. Мутации в TATA- или в CAAT-боксах могут су-
щественно влиять на скорость синтеза РНК. В 5'-фланкирующей
области гена на расстоянии до тысячи пар оснований от начала
его кодирующей части располагаются другие регуляторные
последовательности, так называемые инхансеры (усилители),
способные резко увеличивать продукцию гена за счет увеличе-
ния скорости транскрипции. Эти контролирующие элементы могут
работать независимо от их ориентации по отношению к сайту
инициации. Для некоторых генов найдены участки ДНК, подавля-
ющие транскрипцию, а также так называемые аттенюаторы (осла-
бители) - последовательности, лежащие между сайтом инициации
транскрипции и собственно геном. Они могут блокировать прод-
вижение РНК-полимеразы. Благодаря такому сложному механизму
контроля, достигается очень тонкая и эффективная регуляция
экспрессии генов практически на всех этапах транскрипции,
трансляции и образования функционально зрелого белка. Эти
механизмы более детально рассмотрены в других разделах.
Раздел 2.5 Изменчивость генома, полиморфные сайты рест-
рикции, ПДРФ-анализ.
Кодирующие и регуляторные области структурных генов на-
иболее консервативны в процессе эволюции, так как мутации в
них подвержены давлению жесткого естественного отбора.
Действительно, небольшие изменения в этих последователь-
ностях, даже замена одного основания, делеция или инсерция
нескольких нуклеотидов, могут привести к прекращению синтеза
белка или к потере его функции, что, как правило, драмати-
ческим образом сказывается на жизнеспособности особей, несу-
щих подобные мутации. Однако, около 90% генома человека
состоит из некодирующих последовательностей, подобных сател-
литным ДНК, умеренным повторам, интронам и спейсерным проме-
жуткам между генами. Эти участки значительно более изменчивы
и содержат множество, так называемых нейтральных мутаций или
полиморфизмов, не имеющих фенотипического выражения и не
оказывающих заметного влияния на жизнеспособность или репро-
дуктивные свойства особей и, таким образом, не подверженных
прямому давлению естественного отбора. Полиморфные локусы
являются удобными генетическими маркерами. На основе анализа
родословных можно проследить их наследование в ряду поколе-
ний, проанализировать сцепление друг с другом, с известными
генами и с анонимными последовательностями ДНК, то есть
использовать в качестве обычных менделевских признаков в
классическом генетическом анализе. Информативность полиморф-
ных локусов определяется уровнем их генетической изменчи-
вости в различных популяциях.
Экспериментально легко выявляются два варианта геномно-
го полиморфизма. Количественые изменения в области локализа-
ции мини- и микросателлитных последовательностей ДНК и ка-
чественные замены отдельных нуклеотидов, приводящие к появ-
лению полиморфных сайтов рестрикции. В первом случае измен-
чивость по числу повторенных "коровых " единиц создает серию
аллелей, характер и частота которых уникальны для каждого
вариабильного локуса. Полиморфизм в сайтах рестрикции связан
с присутствием точковых нейтральных мутаций, локализованых,
как правило, в уникальных последовательностях некодирующих
участков ДНК. Подобные мутации в силу вырожденности генети-
ческого кода (см.Глава 1) могут возникать и в кодирующих
последовательностях генов. Спонтанные мутации, возникающие в
сайтах узнавания для определенных рестриктаз, делают их ре-
зистентными к действию этих ферментов. Аналогичным образом,
при таких заменах могут создаваться новые сайты рестрикции.
Показано, что полиморфные локусы встречаются во всех хро-
мосомах с частотой приблизительно один полиморфный сайт на
300-500 п.о. Этот тип изменчивости ДНК был выявлен и исполь-
зован для молекулярной маркировки специфических участков ге-
нома исторически раньше по сравнению с вариабильными сател-
литными повторами (Botstein et al.,1980).
Мутационная изменчивость в сайтах рестрикции может быть
легко обнаружена по изменению длины рестрикционных фрагмен-
тов ДНК, гибридизующихся со специфическими ДНК-зондами. Ана-
лиз полиморфизма длины рестрикционных фрагментов, так назы-
ваемый ПДРФ-анализ (Restriction Fragment Length Polymorphism
-RFLP analysis), включает следующие этапы: выделение геном-
ной ДНК, ее рестрикцию специфической эндонуклеазой, элекро-
форетическое разделение образующихся фрагментов ДНК и иден-
тификацию фрагментов ДНК, содержащих полиморфный сайт рест-
рикции, путем блот-гибридизации по Саузерну (см.Главу 1).
При отсутствии рестрикции в полиморфном сайте на электрофо-
реграммах или радиоавтографах (в зависимости от типа мечения
ДНК-зонда) будет выявляться один крупный фрагмент, соот-
ветствующий по длине последовательности ДНК между двумя
соседними константными сайтами рестрикции для той же эндо-
нуклеазы. При наличии рестрикции в полиморфном локусе на
электрофореграмме будет присутствовать меньший по размерам
фрагмент, равный расстоянию между полиморфным сайтом рест-