Таблиця прикладів варіантів генетичного коду
Приклад | Кодон | Звичайне значення | Читається як: |
Деякі види дріжджів роду Candida | CUG | Лейцин | Серин |
Мітохондрії, в тому числі і Saccharomyces cerevisiae | CU (U, C, A, G) | Лейцин | Серин |
Мітохондрії вищих рослин | CGG | Аргінін | Триптофан |
Мітохондріїї (у всіх без виключення организмів, що досліджувалися) | UGA | Стоп | Триптофан |
Мітохондірії ссавців, дрозофіли, S. cerevisiae і багатьох найпростіших | AUA | Ізолейцин | Метіонин = Старт |
Прокаріоти | GUG | Валин | Старт |
Еукаріоти (рідко) | CUG | Лейцин | Старт |
Еукаріоти (рідко) | GUG | Валін | Старт |
Прокаріоти (рідко) | UUG | Лейцин | Старт |
Еукаріоти (рідко) | ACG | Треонін | Старт |
Мітохондрії ссавців | AGC, AGU | Серин | Стоп |
Мітохондрії дрозофіли | AGA | Аргінін | Стоп |
Мітохондрії ссавців | AG (A, G) | Аргінін | Стоп |
''Найважчим в проблемі коду було зрозуміти, що код існує. На це знадобилося ціле століття. Коли це зрозуміли, то для того, щоб розібратися в деталях, вистачило які-небудь десять року'' [8].
Проблема генетичного коду - це ключова проблема. У кінці 50-х - початку 60-х років вона приковувала до себе увагу, збуджувала активність умів, спонукала віру у велич і мудрість загадок науки. У широкому сенсі генетичний код - це спосіб запису генетичної інформації в послідовностях нуклеїнових кислот (ДНК або РНК) про структуру поліпептидів (білків). У конкретному сенсі генетичний код - ця відповідність між триплетними кодонами матричної РНК (М-РНК) і амінокислотами кодованого білку, що задається кодовою таблицею.
Розвиток проблеми генетичного коду пройшов в декілька етапів. Предтечами цієї проблеми можна вважати багатьох видатних дослідників. Зокрема, Н.К. Кольцов (1927, 1935) запропонував в загальній формі ідею молекули-гена і матричний принцип її дублювання. Э. Шредингер (1944) явно сформулював необхідність кодування генетичної інформації в структурі генів-молекул.П. Колдуэлл і С. Хиншельвуд (1950) запропонували ідею матричного синтезу білків на ДНК.А. Даунс (1952) сформулював гіпотезу про синтез білків на РНК.
Наукові уявлення про генетичний код як про реальну проблему експерименту і теорії були сформульовані Г.А. Гамовым відразу ж після обгрунтування Дж. Уотсоном і Ф. Криком (1953) моделі будови подвійної спіралі ДНК. Перший етап вивчення проблеми (1953-1961) можна назвати гіпотетичним. З моделі Уотсона-Крика [8] витікало уявлення про лінійну послідовність ДНК - текст, побудований з чотирьох типів нуклеотидів (A, T, G і C - чотири символи алфавіту (або A, Г, Ц і Т)). Але кодовані білки теж мають лінійну первинну структуру - текст, побудований з 20 типів канонічних амінокислот (алфавіт з 20 символів). Тому Г.А. Гамору (1954) відразу ж сформулював ідею генетичного коду в конкретному сенсі - як відповідність двох текстів, записаних за допомогою двох різних алфавітів. Крім того, він запропонував використовувати технічні засоби криптографії (розшифровки невідомих кодів) для вирішення центральної проблеми генетики.
Генетичний код відразу ж придбав вигляд великої загадки природи, ребусу для дотепних. Багато сотень математиків, фізиків, хіміків, біологів, включаючи Г.А. Гамова, Ф. Крику та ін., запропонували гіпотетичні варіанти генетичного коду, які представляють тепер лише історичний інтерес. Реальний код виявився зовсім іншим.
Науковими результатами першого етапу можна вважати [8]:
1) постановку проблеми генетичного коду;
2) формування понять лінійного тексту, алфавіту для нуклеїнових кислот і білків, генетичної інформації, записаної в цих текстах за допомогою символів алфавіту;
3) уявлення про матричну роль РНК в трансляції;
4) поняття про кодони і доказ їх неперекривання;
5) припущення про триплетности кодонів і колінеарності гена і білку, доведене лише надалі, і так далі.
Другий етап (1961-1966) можна назвати експериментальним, оскільки в цей період генетичний код був розшифрований в прямому експерименті [8-11]. У 1961 році Ф. Крик із співробітниками в блискучій роботі показали, що: а) кодони триплетны; б) між ними немає розділових знаків (''ком''); в) гени, що кодують структуру білків (цистроны), мають фіксований початок, орієнтований напрям і фіксований кінець; г) існує невелике число некодуючих триплетів (''нонсенсу'', безглуздих кодонів), а код в цілому сильно вироджений. У 1964 році Ч. Янофски із співробітниками і С. Бреннер із співробітниками показали, що ген і кодований ним білок взаємно коллініарні, тобто є послідовна відповідність між кодонами гена і амінокислотами білка.
Пряма розшифровка генетичного коду in vitro виявилася можливою завдяки техніці білкового синтезу в безклітинних системах [8-10], тобто в клітинних екстрактах, що містять усі необхідні компоненти апарату трансляції (Т-РНК, рибосоми, амінокислоти, ферменти, джерело енергії і так далі), окрім М-РНК. Вводячи в такі системи природні М-РНК або штучні невеликі олигорибонуклеотиды, можна було вивчати специфічність включення мічених амінокислот в поліпептиди, що будуються. М. Ниренберг і Ф. Ледер подавали в безклітинну систему трансляції E. coli різні олигорибонуклеотиды і показали, що індивідуальні фракції тририбонуклеотидов, що асоціюються з рибосомами, зв'язують певні фракції Т-РНК, заряджені певними міченими амінокислотами. За допомогою такого методу генетичний код був розшифрований повністю. Влітку 1966 року на симпозіумі по кількісній біології в Колд-Спринг-Харборе (США) усі отримані дані були зведені Ф. Криком воєдино [9]. Розшифрований генетичний код E. coli, досліджений in vitro, повністю узгоджувався також з іншими незалежними даними, отриманими in vivo і для інших видів. Цей вивід підтверджується також результатами секвенування останніх років, коли знайдено, що тисячі генів і кодованих ними білків дійсно відповідають один одному за правилами генетичного коду.
З 64 можливих триплетів 61 є смисловим кодоном, тобто кодує амінокислоти. Усі кодони триплетні, нерозривні і не перекриваються в тексті, а також не розділені межкодонними знаками (комами). Усі кодони однозначні, тобто кожен кодує єдину амінокислоту. Інакше кажучи, в напрямі кодон - амінокислота генетичний код однозначний.
Зворотна відповідність в напрямі амінокислота - кодон неоднозначно, і ця властивість називається вирожденістю. Окремі амінокислоти кодуються групами (серіями) кодонів-синонімів. 18 серій з 20 містять від двох до шести кодонів, дві серії (Met і Trp) не вироджено, містять по одному кодону. Середня виродженість генетичного коду приблизно три кодони на серію.
Виродженість називається систематичною, якщо кодони-синоніми розрізняються в третій позиції або пуринами (R = A або G), або пиримидинами (Y = U або C), або взагалі будь-якими з чотирьох нуклеотидів (N = A, G, U або C). Цим принципам задовольняють 30 пар кодонів з 32, а також вісім тетрад з 16. Усі ці пари зв'язні, а тетради полнозв'язні. Інші варіанти виродженості називають несистематичними. Вони відносяться до великих серій: Leu і Arg - зв'язні серії, Ser - незв'язна серія, Ile - три кодони, повнозв'язна серія.
Генетичний код містить також знаки пунктуації (початку і кінця) трансляції. Кодони AUG, GUG і UUG у прокариот окрім кодування амінокислот кодують також ініціацію трансляції. Проте однозначність кодування при цьому не порушується, оскільки знаки, що ініціюють, локалізовані в певному оточенні (контексті), здатному утворювати самокомплементарні ''шпильки''. У еукаріот ініціюють триплети AUG і слабіше, - UUG, AUA і ACG. Три ''вакантні'' триплети у E. coli - UAA (ochre), UAG (amber) і UGA (opal) - не кодують амінокислот, а виконують роль термінальних знаків трансляції (стоп-кодонів, нонсенс-кодонов або термінального нонсенсу). У нормі ними закінчуються усі цистрони, тобто трансльовані гени, одиниці трансляції. Мутаційне виникнення нонсенсу усередині гена призводить до передчасної термінації трансляції і обриву білку. Нонсенс теж утворює зв'язну серію.
Розшифровка генетичного коду була одним з найвидатніших наукових відкриттів ХХ століття.
Третій етап вивчення проблеми генетичного коду (після 1966 року) пов'язаний з поглибленим дослідженням молекулярних механізмів кодування, системних властивостей генетичного коду: симетрії, регулярності, завадостійкої, універсальності, а також шляхів його виникнення і еволюції [11]. Молекулярною системою, що забезпечує відповідність кодонів М-РНК і амінокислот, являється набір адапторних молекул транспортних РНК (Т-РНК) і набір кодуючих ферментів аміноацил-т-РНК-синтетаз (АРС-аз). Кожна специфічна молекула Т-РНК має антикодон, що взаємодіє з кодоном М-РНК, а також специфічний сайт взаємодії з певною АРС-азой і неспецифічний сайт зв'язування амінокислоти. Кожна АРС-аза пізнає усі ізоакцепторні (що переносять одну амінокислоту) фракції Т-РНК, одну певну амінокислоту і сполучає їх макроергічним (енергобагатою) зв'язком. Тому відповідність антикодону Т-РНК і амінокислоти визначається саме АРС-азой. Фракції Т-РНК виконують функції адапторів (специфічних посередників) між кодонами М-РНК і амінокислотами.