Смекни!
smekni.com

работа студентки 2-го курса (стр. 2 из 6)

Для поиска в белковых последовательностях мотивов «спираль-поворот-спираль» (helix-turn-helix, HTH) использовалась программа “Helix-Turn-Helix Motif Prediction” (Dodd and Egan, 1990).

Результаты и обсуждение

Поиск ортологов белка-регулятора в геномах архей

В качестве первого этапа поиска ортологов был произведен поиск гомологов белка-регулятора из M. thermoautotrophicus в белковой базе данных при помощи программы BLAST. После этого уже среди геномов архей, имеющих гомолога, был проведен поиск ортологов данного регулятора, в результате был выбран ряд геномов (см. материалы и методы). Поиск ортологов белка-регулятора является необходимым условием изучения регуляции, поскольку при его отсутствии невозможно предположить, что искомые сайты в исследуемых геномах будут похожи на уже известные сайты в геноме M. thermoautotrophicus. Отсутствие ортолога белка-регулятора говорит о том, что-либо используется другой механизм регуляции, либо отсутствует данный метаболический путь. Отдельного внимания заслуживает ситуация с геномом M.barkeri. В настоящее время нам доступна лишь неполная последовательность генома этого организма, в которой не удалось найти ортолога белка-регулятора. Однако в белковой базе данных с помощью программы BLAST был найден гомолог регулятора из Methanobacter thermoautotrophicus. Поиск гомологов в геноме M. thermoautotrophicus показал, что лучшим гомологом для найденного белка из M. barkeri является именно регулятор MTH1654. Таким образом, эти два белка являются ортологами. Кроме того, нами были найдены ортологи MTH1654 в геномах двух других организмов из рода Methanosarcina: M. acetivorans и M. mazei. На основании этого мы исследовали регуляцию синтеза триптофана также и в геноме M. barkeri.

Выравнивание аминокислотных последовательностей белков-регуляторов показано на рисунке 2. Ранее были высказаны предположения о том, что данный белок содержат HTH-домен (Gelfand, 2000). Их картирование при помощи программы поиска HTH-доменов (Dodd and Egan, 1990) показало, что таковые имеются во всех белках. Несмотря на то, что данные участки выравниваются между собой, степень их сходства крайне низка, в результате чего возможны изменения в структуре регуляторного сигнал. Выравнивание показало также, что у белков-регуляторов из M. burtonii, P. furiosus, M. thermoautotrophicus и H. salinarum неправильно определены старты генов (Рис. 2).

На основе множественного выравнивания было построено филогенетическое дерево белков-регуляторов (Рис.3). Как видно из рисунка 3, степень сходства регуляторов низка, а, следовательно, и сигнал во всех изучаемых видах мог измениться в ходе эволюции. Поэтому для поиска сигнала разумно выделить на дереве группы, в которых регуляторы имеют достаточно высокий уровень сходства. Можно рассчитывать, что внутри таких групп сигнал скорее всего будет сохраняться. Поиск сигнала производился отдельно внутри каждой группы. Были выделены следующие группы:

- группа, соответствующая роду Pyrococcus;

- группа, включающая в себя рода Methanosarcina и Methanococcoides;

- группа, объединяющая рода Thermoplasma и Ferroplasma.

Рис. 2. Выравнивание аминокислотных последовательностей белков-регуляторов с картированными на нем HTH-доменами (показаны белыми буквами на черным фоне). Обозначения: PAB - Pyrococcus abyssi, PH - Pyrococcus horikoshii, PF - Pyrococcus furiosus, MA - Methanosarcina acetivorans, MM - Methanosarcina mazei, MBA - Methanosarcina barkeri, MCB - Methanococcoides burtonii, AF - Archaeoglobus fulgidus, Hsp - Halobacterium salinum NRC-1, FAC - Ferroplasma acidarmanus, TA - Thermoplasma acidophilum, TVN - Thermoplasma volcanium, MTH - Methanobacter thermoautotrophicus.

PAB -------------------------------------MWGRIEHYFDEYPVRKLIAKTLL

PH -------------------------------------MWGRIEHYFDEYPVRKLIAKTLL

PF ----------------------------MLNFVGGRLMWGKIEHYFDEYPVRKLIAKTLL

MTH -----------------------------MYINVVKCMWKQIKHRFEGYPSRMYVARKII

MA -------------------------------------MWQTLLSKFEKYPAQAKVLKLLF

MM -------------------------------------MWQTLLKKFEKYPAQAKVLKLLF

MBA -------------------------------------MWQTLLKKFEKYPAQAKVLKLLF

MCB MSNYICMFLCFNGSFIKLILYGYKPLYPYNFRPKVIIMWSTVLNKFEKHPAQQKVIKLLF

Hsp ------------------------------------------MQKFEGSPGQQAVIRLLL

TA -------------------------------------MWSYIYDKFSRSPSQLRIVKKMF

TVN -------------------------------------MWSYIYDKFSRSPSQLKIVKKMI

FAC -------------------------------------MWDYINKVFDNYPAEKKVVQKML

AF -------------------------------------MWKKVAEKFEKYPSQIAVAREFL

Рис. 2. Продолжение

PAB RYGLRVSE----DMKIKAGEIEVPYTKIAKALNVDRRVVKETVAMILKTPELREIYMNLE

PH RYGLRVSE----DMKIKAGEIEVPYTKIAKALNVDRRVVKETVAMILKTPELRDIYMNLE

PF RYGLRVSE----DMKIKAGEIEVPYTKIAKALNVDRRVVKETVAMILKTPELRDIYMNLE

MTH DLGFRIDR----NGKIYCDDVEISDVALARAVGVDRRTVRATANTILEDEKLRGIFENMM

MA ERGFQVNE----EGKVTSGSIEIAHTQLAKEVGVDRRVVDATTKTIISDELLSTIFKNVH

MM ERGFQVNE----EGKVTSGSIEIAHTQLAKEVGVDRRVVDATTKTIISDELLSTIFKNVH

MBA ERGFQVNE----EGKVTSGSIEIAHTQLAKEAGVDRRVVDATTKTIISDELLSRIFRNVH

MCB ERGFQVNG----DGKVTSGSIEIPHTQLAKEAGVDRRVVDATTETILSDELLKNIFQNVT

Hsp ERGFSVND----GGRVVSGGIEIPYTQVAQEAGVDRRVVDSTTEAILDDGELTRIFQNIS

TA SIGIRVTKLYD-EPVLMCGDIEIRPNTLAKATGTDRRSVMSVIERIINDETLYPVFSQLE

TVN STGIKVTKSFDNEPVLMCGDIEIRPNTLAKAAETDRRSVISVINRIANDDKLYPFFSQLE

FAC KIGISVKILYD-EPKLFCESIEIKPNSIARAFHVDRRVIVNMIQKIINDPELFDFFSNLE

AF RLGISVR-----NGKAYCGDIELVPTKIAEAIGVDRKVVLAAIQNIESDEELSKVFSALK

*: : . :*: :*. .**: : * . * .: :

PAB PT-VHMKYVGKHVGYGVIEIEPEPRA-IGILAKVAQKIADRGINIVQAIAEDPELYPEAT

PH PT-VHMKYVGRHVGYGVIEIEPEPRA-IGILARVAQKIADRGINIVQAIAEDPELYPEAT

PF PT-VHMKYVGKHVGYGVIEIEPEPRA-IGILAKIAQKIAEREINIVQVVAEDPELYPEAI

MTH PAGALLRDAAGELDFGVVEIEADARN-PGILAAAARLIADKGISIRQAHAGDPELDETPR

MA SI-PFLRDVAPALGLGVIIIIPEDAAHIGILAEVAGLISKHNVSIRQAVSDDPYLTDNPR

MM SI-PFLRDVAPSLGLGVIIIIPEDAAHVGILAEVAGLISKHNVSIRQAVSDDPYLTDNPM

MBA SI-PFLRDVAPSLGLGVIIIIPEDAADVGILAEVASLISGSKVSIRQAVSDDPYLTDNPR

MCB SI-PFLRDVAPALGLGVIIITPDDAANVGILFSVSQVISNHNISIRQAVSDDPYFNSKAM

Hsp QI-PSLMDLAPVLDLHVVTVAVQDADEPGIVAAVTGLLADHGIPIRQTISEDPEFTDEPR

TA PV-ANLWKVSSKLGYGVIEILPESASKPGIIAGVSSIIAKRGISIRQVIVDDPELVEDPK

TVN PV-ANLWKASVKMGLGVIEIIPESANKPGIIAGISSIIAKHNISIRQVIVDDPEIVEDPK

FAC PM-SNFENSGSKMGFGVIEIIPTDASMPGIIAGVMNVLAESGISVRQFIADDPDLVDNPR

AF PV-ANIAEVARILGFGVLEVYAEST-KVGIVAGVASALANAGISIRYILAEDPELSVESK

: . :. *: : **: :: : : ** : .

PAB LTIITEKPIPGDLINELSKLEGVKRISIY

PH LTIITEKPIPGDLINELSKLEGVKRISIY

PF LTIITEKPIPGDLINELSKLEGVKRISIY

MTH LTIITETPIPGGLLKDFLKIDGVKRVSIY

MA LTIITDHKVPGDLVDDILNLPSVKGVSIY

MM LTIITDNKVPGDLVDEILKLPSVKGVSIY

MBA LTIITDKKVPGELVDKILELPSVKGVSIY

MCB LTIITDSKVPGDIVNEILQLPGVKGVSIY

Hsp LYVVTDEELPGAVFTALAEMSAVRSVELS

TA AVVVTEQKVPPDIIPELKSVEGVRAITIL

TVN AVVVTDQKVPAELIPELRSVDGVKGITIL

FAC AIIVTTNTITGDVLNGIKKARGVKAVML-

AF LTVVTETKIPGAVVEEILRVEGVEKVLIS

::* :. :. : .*. : :

Рис. 3. Филогенетическое дерево для белков, ортологичных MTH1654 из M. thermautotrophicum. Обозначения: MTH - Methanobacter thermoautotrophicus, PAB - Pyrococcus abyssi, PH - Pyrococcus horikoshii, PF - Pyrococcus furiosus, MA - Methanosarcina acetivorans, MM - Methanosarcina mazei, MBA - Methanosarcina barkeri, MCB - Methanococcoides burtonii, AF - Archaeoglobus fulgidus, Hsp - Halobacterium salinum NRC-1, FAC - Ferroplasma acidarmanus, TA - Thermoplasma acidophilum, TVN - Thermoplasma volcanium.

Поиск потенциальных членов триптофанового регулона в геномах архей

После того, как были выбраны геномы, содержащие ортолога белка-регулятора, в них был произведен поиск генов, участвующих в синтезе триптофана. С этой целью был проведен поиск ортологов для всех генов, входящих в триптофановый регулон в M. thermautotrophicus (Таблица 2). Особенно стоит отметить то, что, несмотря на наличие регулятора у P. horikoshii, метаболический путь у данного вида почти полностью отсутствует, что было показано ранее (Xie et al., 2003).

Для некоторых генов в ряде геномов не удалось найти ортологов. При этом в составе оперонов, содержащих гены синтеза триптофана, были найдены гены с неизвестной функцией. Для продуктов этих генов был произведен поиск гомологов при помощи программы BLASTP.

Ряд неортологичных замен наблюдается для 5’-фосфорибозил антанилат изомеразы (trpF) у таких организмов, как Pyrococcus abyssi и P.furiosus, Thermoplasma acidophilum и Archaeglobus fulgidus. Для белков из Pyrococcus abyssi и P.furiosus уровень сходства с ферментом TrpF из Lactobacillus casei, для которого данная функция была определена экспериментально, составляет 30% и 32% соответственно (Natori, 1990). Для этих же видов был показан высокий уровень сходства с TrpF из археи Thermococcus kodakaraensis (уровень сходства 60% и 58% соответственно) и белками из бактерий Clostridium acetobutylicum с меньшим сходством (32%) для P. abyssi, и Listeria innocua для P.furiosus с уровнем сходства 35%. Для TrpF из Thermoplasma acidophilum было обнаружено сходство с белком из Thermoplasma volcanium (48%) , белком из бактерии Lactobacillus casei, но с меньшим сходством (35%). Для белка из A. fulgidus уровень сходства с соответствующим белком из бактерии Lactobacillus casei составляет 31%, так же найдено сходство с белками из ряда архей, например, уровень сходства с белком из Thermococcus kodakaraensis составляет 50%. Для всех найденных TrpF из архей и TrpF из бактерии Lactobacillus casei было построено филогенетическое дерево (Рис. 4). Как видно из рис. 4, все белки TrpF, несмотря на низкий уровень сходства, принадлежат к одному семейству. Ветвь, соответствующая бактериальному белку, выходит из одного общего корня со всеми белками из архей, в результате чего исключается предположение о горизонтальном переносе от бактерий к археям. Таким образом, наиболее вероятным представляется следующее предположение: все белки TrpF архей представляют собой гомологи, далеко разошедшиеся в ходе эволюции. Однако, из-за низкого уровня сходства, используемый алгоритм поиска ортологов не позволяет нам идентифицировать все TrpF, как ортологичные.

Помимо этого наблюдается неортологичные замены альфа-субъединицы триптофан синтазы (TrpA) у рода Thermoplasma. Так для T. acidophilum было найдено сходство с TrpA


Тривиальное название гена MTH MCB MM MBA MA AF Hsp FAC TA TVN PAB PF
MTH1654 068_0059 MM2375

-

MA1396 AF1020 VNG2296C 166_0095 Ta1106 TVN0456 PAB2435 PF1572
aroC MTH748 068_0108 MM1712 RMMA08408 aroC AF0670 aroC 157_0040 Ta0824 TVN0729 aroC PF1700
pheA MTH804

-

-

-

-

-

VNG1244C

-

-

-

-

-

trpB-1 MTH1476 068_0036 MM0337

-

trpB AF1240

-

158_0036 Ta0669 TVN0931 trpB-2 PF1592
tyrA MTH1640 046_0008 MM1275

-

MA4595 AF0227

-

-

-

-

-

-

trpE MTH1655 048_0022 MM2818 RMMA07397 trpE AF1603 trpE1 158_0031 Ta0806 TVN1024 trpE PF1709
trpG MTH1656

-

MM2817

-

trpG AF1602 trpG1 158_0030 Ta0807 TVN1023 trpG PF1708
trpC MTH1657 062_0018 MM2823 RMMA07985 trpC AF1604 trpC 158_0029 Ta0808 TVN1022 PAB2043 PF1711
trpF MTH1658

-

MM2819 RMMA08710 trpF AF1601* trpF 158_0032 Ta0805* TVN1025 trpF* PF1707*
trpB-2 MTH1659 062_0019 MM2822 RMMA08701

-

AF1600 trpB

-

-

-

trpB-1 PF1706
trpA MTH1660 062_0020 MM2821 RMMA08700 trpA

trpA