Для поиска в белковых последовательностях мотивов «спираль-поворот-спираль» (helix-turn-helix, HTH) использовалась программа “Helix-Turn-Helix Motif Prediction” (Dodd and Egan, 1990).
Результаты и обсуждение
Поиск ортологов белка-регулятора в геномах архей
В качестве первого этапа поиска ортологов был произведен поиск гомологов белка-регулятора из M. thermoautotrophicus в белковой базе данных при помощи программы BLAST. После этого уже среди геномов архей, имеющих гомолога, был проведен поиск ортологов данного регулятора, в результате был выбран ряд геномов (см. материалы и методы). Поиск ортологов белка-регулятора является необходимым условием изучения регуляции, поскольку при его отсутствии невозможно предположить, что искомые сайты в исследуемых геномах будут похожи на уже известные сайты в геноме M. thermoautotrophicus. Отсутствие ортолога белка-регулятора говорит о том, что-либо используется другой механизм регуляции, либо отсутствует данный метаболический путь. Отдельного внимания заслуживает ситуация с геномом M.barkeri. В настоящее время нам доступна лишь неполная последовательность генома этого организма, в которой не удалось найти ортолога белка-регулятора. Однако в белковой базе данных с помощью программы BLAST был найден гомолог регулятора из Methanobacter thermoautotrophicus. Поиск гомологов в геноме M. thermoautotrophicus показал, что лучшим гомологом для найденного белка из M. barkeri является именно регулятор MTH1654. Таким образом, эти два белка являются ортологами. Кроме того, нами были найдены ортологи MTH1654 в геномах двух других организмов из рода Methanosarcina: M. acetivorans и M. mazei. На основании этого мы исследовали регуляцию синтеза триптофана также и в геноме M. barkeri.
Выравнивание аминокислотных последовательностей белков-регуляторов показано на рисунке 2. Ранее были высказаны предположения о том, что данный белок содержат HTH-домен (Gelfand, 2000). Их картирование при помощи программы поиска HTH-доменов (Dodd and Egan, 1990) показало, что таковые имеются во всех белках. Несмотря на то, что данные участки выравниваются между собой, степень их сходства крайне низка, в результате чего возможны изменения в структуре регуляторного сигнал. Выравнивание показало также, что у белков-регуляторов из M. burtonii, P. furiosus, M. thermoautotrophicus и H. salinarum неправильно определены старты генов (Рис. 2).
На основе множественного выравнивания было построено филогенетическое дерево белков-регуляторов (Рис.3). Как видно из рисунка 3, степень сходства регуляторов низка, а, следовательно, и сигнал во всех изучаемых видах мог измениться в ходе эволюции. Поэтому для поиска сигнала разумно выделить на дереве группы, в которых регуляторы имеют достаточно высокий уровень сходства. Можно рассчитывать, что внутри таких групп сигнал скорее всего будет сохраняться. Поиск сигнала производился отдельно внутри каждой группы. Были выделены следующие группы:
- группа, соответствующая роду Pyrococcus;
- группа, включающая в себя рода Methanosarcina и Methanococcoides;
- группа, объединяющая рода Thermoplasma и Ferroplasma.
Рис. 2. Выравнивание аминокислотных последовательностей белков-регуляторов с картированными на нем HTH-доменами (показаны белыми буквами на черным фоне). Обозначения: PAB - Pyrococcus abyssi, PH - Pyrococcus horikoshii, PF - Pyrococcus furiosus, MA - Methanosarcina acetivorans, MM - Methanosarcina mazei, MBA - Methanosarcina barkeri, MCB - Methanococcoides burtonii, AF - Archaeoglobus fulgidus, Hsp - Halobacterium salinum NRC-1, FAC - Ferroplasma acidarmanus, TA - Thermoplasma acidophilum, TVN - Thermoplasma volcanium, MTH - Methanobacter thermoautotrophicus.
PAB -------------------------------------MWGRIEHYFDEYPVRKLIAKTLL
PH -------------------------------------MWGRIEHYFDEYPVRKLIAKTLL
PF ----------------------------MLNFVGGRLMWGKIEHYFDEYPVRKLIAKTLL
MTH -----------------------------MYINVVKCMWKQIKHRFEGYPSRMYVARKII
MA -------------------------------------MWQTLLSKFEKYPAQAKVLKLLF
MM -------------------------------------MWQTLLKKFEKYPAQAKVLKLLF
MBA -------------------------------------MWQTLLKKFEKYPAQAKVLKLLF
MCB MSNYICMFLCFNGSFIKLILYGYKPLYPYNFRPKVIIMWSTVLNKFEKHPAQQKVIKLLF
Hsp ------------------------------------------MQKFEGSPGQQAVIRLLL
TA -------------------------------------MWSYIYDKFSRSPSQLRIVKKMF
TVN -------------------------------------MWSYIYDKFSRSPSQLKIVKKMI
FAC -------------------------------------MWDYINKVFDNYPAEKKVVQKML
AF -------------------------------------MWKKVAEKFEKYPSQIAVAREFL
Рис. 2. Продолжение
PAB RYGLRVSE----DMKIKAGEIEVPYTKIAKALNVDRRVVKETVAMILKTPELREIYMNLE
PH RYGLRVSE----DMKIKAGEIEVPYTKIAKALNVDRRVVKETVAMILKTPELRDIYMNLE
PF RYGLRVSE----DMKIKAGEIEVPYTKIAKALNVDRRVVKETVAMILKTPELRDIYMNLE
MTH DLGFRIDR----NGKIYCDDVEISDVALARAVGVDRRTVRATANTILEDEKLRGIFENMM
MA ERGFQVNE----EGKVTSGSIEIAHTQLAKEVGVDRRVVDATTKTIISDELLSTIFKNVH
MM ERGFQVNE----EGKVTSGSIEIAHTQLAKEVGVDRRVVDATTKTIISDELLSTIFKNVH
MBA ERGFQVNE----EGKVTSGSIEIAHTQLAKEAGVDRRVVDATTKTIISDELLSRIFRNVH
MCB ERGFQVNG----DGKVTSGSIEIPHTQLAKEAGVDRRVVDATTETILSDELLKNIFQNVT
Hsp ERGFSVND----GGRVVSGGIEIPYTQVAQEAGVDRRVVDSTTEAILDDGELTRIFQNIS
TA SIGIRVTKLYD-EPVLMCGDIEIRPNTLAKATGTDRRSVMSVIERIINDETLYPVFSQLE
TVN STGIKVTKSFDNEPVLMCGDIEIRPNTLAKAAETDRRSVISVINRIANDDKLYPFFSQLE
FAC KIGISVKILYD-EPKLFCESIEIKPNSIARAFHVDRRVIVNMIQKIINDPELFDFFSNLE
AF RLGISVR-----NGKAYCGDIELVPTKIAEAIGVDRKVVLAAIQNIESDEELSKVFSALK
*: : . :*: :*. .**: : * . * .: :
PAB PT-VHMKYVGKHVGYGVIEIEPEPRA-IGILAKVAQKIADRGINIVQAIAEDPELYPEAT
PH PT-VHMKYVGRHVGYGVIEIEPEPRA-IGILARVAQKIADRGINIVQAIAEDPELYPEAT
PF PT-VHMKYVGKHVGYGVIEIEPEPRA-IGILAKIAQKIAEREINIVQVVAEDPELYPEAI
MTH PAGALLRDAAGELDFGVVEIEADARN-PGILAAAARLIADKGISIRQAHAGDPELDETPR
MA SI-PFLRDVAPALGLGVIIIIPEDAAHIGILAEVAGLISKHNVSIRQAVSDDPYLTDNPR
MM SI-PFLRDVAPSLGLGVIIIIPEDAAHVGILAEVAGLISKHNVSIRQAVSDDPYLTDNPM
MBA SI-PFLRDVAPSLGLGVIIIIPEDAADVGILAEVASLISGSKVSIRQAVSDDPYLTDNPR
MCB SI-PFLRDVAPALGLGVIIITPDDAANVGILFSVSQVISNHNISIRQAVSDDPYFNSKAM
Hsp QI-PSLMDLAPVLDLHVVTVAVQDADEPGIVAAVTGLLADHGIPIRQTISEDPEFTDEPR
TA PV-ANLWKVSSKLGYGVIEILPESASKPGIIAGVSSIIAKRGISIRQVIVDDPELVEDPK
TVN PV-ANLWKASVKMGLGVIEIIPESANKPGIIAGISSIIAKHNISIRQVIVDDPEIVEDPK
FAC PM-SNFENSGSKMGFGVIEIIPTDASMPGIIAGVMNVLAESGISVRQFIADDPDLVDNPR
AF PV-ANIAEVARILGFGVLEVYAEST-KVGIVAGVASALANAGISIRYILAEDPELSVESK
: . :. *: : **: :: : : ** : .
PAB LTIITEKPIPGDLINELSKLEGVKRISIY
PH LTIITEKPIPGDLINELSKLEGVKRISIY
PF LTIITEKPIPGDLINELSKLEGVKRISIY
MTH LTIITETPIPGGLLKDFLKIDGVKRVSIY
MA LTIITDHKVPGDLVDDILNLPSVKGVSIY
MM LTIITDNKVPGDLVDEILKLPSVKGVSIY
MBA LTIITDKKVPGELVDKILELPSVKGVSIY
MCB LTIITDSKVPGDIVNEILQLPGVKGVSIY
Hsp LYVVTDEELPGAVFTALAEMSAVRSVELS
TA AVVVTEQKVPPDIIPELKSVEGVRAITIL
TVN AVVVTDQKVPAELIPELRSVDGVKGITIL
FAC AIIVTTNTITGDVLNGIKKARGVKAVML-
AF LTVVTETKIPGAVVEEILRVEGVEKVLIS
::* :. :. : .*. : :
Рис. 3. Филогенетическое дерево для белков, ортологичных MTH1654 из M. thermautotrophicum. Обозначения: MTH - Methanobacter thermoautotrophicus, PAB - Pyrococcus abyssi, PH - Pyrococcus horikoshii, PF - Pyrococcus furiosus, MA - Methanosarcina acetivorans, MM - Methanosarcina mazei, MBA - Methanosarcina barkeri, MCB - Methanococcoides burtonii, AF - Archaeoglobus fulgidus, Hsp - Halobacterium salinum NRC-1, FAC - Ferroplasma acidarmanus, TA - Thermoplasma acidophilum, TVN - Thermoplasma volcanium.
Поиск потенциальных членов триптофанового регулона в геномах архей
После того, как были выбраны геномы, содержащие ортолога белка-регулятора, в них был произведен поиск генов, участвующих в синтезе триптофана. С этой целью был проведен поиск ортологов для всех генов, входящих в триптофановый регулон в M. thermautotrophicus (Таблица 2). Особенно стоит отметить то, что, несмотря на наличие регулятора у P. horikoshii, метаболический путь у данного вида почти полностью отсутствует, что было показано ранее (Xie et al., 2003).
Для некоторых генов в ряде геномов не удалось найти ортологов. При этом в составе оперонов, содержащих гены синтеза триптофана, были найдены гены с неизвестной функцией. Для продуктов этих генов был произведен поиск гомологов при помощи программы BLASTP.
Ряд неортологичных замен наблюдается для 5’-фосфорибозил антанилат изомеразы (trpF) у таких организмов, как Pyrococcus abyssi и P.furiosus, Thermoplasma acidophilum и Archaeglobus fulgidus. Для белков из Pyrococcus abyssi и P.furiosus уровень сходства с ферментом TrpF из Lactobacillus casei, для которого данная функция была определена экспериментально, составляет 30% и 32% соответственно (Natori, 1990). Для этих же видов был показан высокий уровень сходства с TrpF из археи Thermococcus kodakaraensis (уровень сходства 60% и 58% соответственно) и белками из бактерий Clostridium acetobutylicum с меньшим сходством (32%) для P. abyssi, и Listeria innocua для P.furiosus с уровнем сходства 35%. Для TrpF из Thermoplasma acidophilum было обнаружено сходство с белком из Thermoplasma volcanium (48%) , белком из бактерии Lactobacillus casei, но с меньшим сходством (35%). Для белка из A. fulgidus уровень сходства с соответствующим белком из бактерии Lactobacillus casei составляет 31%, так же найдено сходство с белками из ряда архей, например, уровень сходства с белком из Thermococcus kodakaraensis составляет 50%. Для всех найденных TrpF из архей и TrpF из бактерии Lactobacillus casei было построено филогенетическое дерево (Рис. 4). Как видно из рис. 4, все белки TrpF, несмотря на низкий уровень сходства, принадлежат к одному семейству. Ветвь, соответствующая бактериальному белку, выходит из одного общего корня со всеми белками из архей, в результате чего исключается предположение о горизонтальном переносе от бактерий к археям. Таким образом, наиболее вероятным представляется следующее предположение: все белки TrpF архей представляют собой гомологи, далеко разошедшиеся в ходе эволюции. Однако, из-за низкого уровня сходства, используемый алгоритм поиска ортологов не позволяет нам идентифицировать все TrpF, как ортологичные.Помимо этого наблюдается неортологичные замены альфа-субъединицы триптофан синтазы (TrpA) у рода Thermoplasma. Так для T. acidophilum было найдено сходство с TrpA
Тривиальное название гена | MTH | MCB | MM | MBA | MA | AF | Hsp | FAC | TA | TVN | PAB | PF |
MTH1654 | 068_0059 | MM2375 | - | MA1396 | AF1020 | VNG2296C | 166_0095 | Ta1106 | TVN0456 | PAB2435 | PF1572 | |
aroC | MTH748 | 068_0108 | MM1712 | RMMA08408 | aroC | AF0670 | aroC | 157_0040 | Ta0824 | TVN0729 | aroC | PF1700 |
pheA | MTH804 | - | - | - | - | - | VNG1244C | - | - | - | - | - |
trpB-1 | MTH1476 | 068_0036 | MM0337 | - | trpB | AF1240 | - | 158_0036 | Ta0669 | TVN0931 | trpB-2 | PF1592 |
tyrA | MTH1640 | 046_0008 | MM1275 | - | MA4595 | AF0227 | - | - | - | - | - | - |
trpE | MTH1655 | 048_0022 | MM2818 | RMMA07397 | trpE | AF1603 | trpE1 | 158_0031 | Ta0806 | TVN1024 | trpE | PF1709 |
trpG | MTH1656 | - | MM2817 | - | trpG | AF1602 | trpG1 | 158_0030 | Ta0807 | TVN1023 | trpG | PF1708 |
trpC | MTH1657 | 062_0018 | MM2823 | RMMA07985 | trpC | AF1604 | trpC | 158_0029 | Ta0808 | TVN1022 | PAB2043 | PF1711 |
trpF | MTH1658 | - | MM2819 | RMMA08710 | trpF | AF1601* | trpF | 158_0032 | Ta0805* | TVN1025 | trpF* | PF1707* |
trpB-2 | MTH1659 | 062_0019 | MM2822 | RMMA08701 | - | AF1600 | trpB | - | - | - | trpB-1 | PF1706 |
trpA | MTH1660 | 062_0020 | MM2821 | RMMA08700 | trpA |
trpA