1. Методы исследования
1.1. Частота встречаемости аминокислот в белках PG-рецепторов по сравнению с среднестатистической встречаемостью в белках человека. Сделано с помощью программы compseq пакета EMBOSS.
1.2. Поиск гомологичных белковых последовательностей проведен с помощью программ BLAST и PSI-BLAST (обе — с сервера NCBI) в базе данных SwissProt.
1.3. Множественные выравнивания белковых последовательностей сделаны с помощью программы ClustalW пакета EMBOSS. Парные выравнивания сделаны аналогично. Полученные множественные выравнивания потребовали дальнейшего редактирования вручную в программе GeneDoc.
1.4. Филогенетические деревья построены с помощью программ protdist, neighbor и drawgram из пакета программ PHYLIP (c сервера Института Пастера). Для визуализации 2 деревьев, вставленных в данный текст (на рис. 4 и 5) использована программа TreeView.
1.5. Информация о доменной структуре белка взята из базы данных Pfam.
1.6. Сравнение полученных результатов с базой данных по G-белок-связывающим рецепторам — GPCRDB (http://www.gpcr.org).
2. Результаты и обсуждение
2.1. Изучение белковых последовательностей простаноидных рецепторов.
2.1.1. Средняя частота встречаемости аминокислотных остатков в EP4-рецепторе человека, всех PG-рецепторах человека и вообще всех белках человека представлена в таблице 1.
Таблица 1.
Средняя частота встречаемости аминокислотных остатков в EP4-рецепторе человека, всех PG-рецепторах человека и вообще всех белках человека
Частота встречаемости а/к, % | |||
А/к | в pe24_human | в PG-рецепторах человека | в белках человека |
L | 12,7 | 14,6 | 9,8 |
S | 12,1 | 9,8 | 7,9 |
A | 7,8 | 10,2 | 7,1 |
V | 7,2 | 7,0 | 6,2 |
G | 6,8 | 7,2 | 6,8 |
R | 6,6 | 7,1 | 5,5 |
T | 5,9 | 5,2 | 5,3 |
I | 5,7 | 4,2 | 4,4 |
P | 4,9 | 4,9 | 1,6 |
F | 3,9 | 4,9 | 3,8 |
E | 3,9 | 2,9 | 7,0 |
Q | 3,5 | 3,2 | 4,6 |
D | 3,1 | 2,2 | 4,9 |
N | 2,9 | 2,4 | 3,7 |
Y | 2,9 | 2,3 | 2,8 |
C | 2,7 | 3,4 | 2,3 |
K | 2,7 | 2,1 | 5,7 |
M | 2,3 | 2,8 | 2,2 |
H | 1,8 | 1,9 | 2,5 |
W | 0,8 | 1,8 | 1,2 |
U | 0,0 | 0,0 | 0,0 |
Из приведенных данных видно, что и в PG-рецепторах, и во всех белках человека наиболее часто встречаются 3 аминокислоты: лейцин, серин и аланин. Их частоты для EP4-рецептора и для PG-рецепторов (лейцина — 12,7 % и 14,6 %, серина — 12,1 % и 9,8 %, аланина — 7,8 % и 10,2 %, соответственно) заметно превышают среднестатистические для человека (9,8 %, 7,9 % и 7,1 %).
Если бы все аминокислоты встречались одинаково часто, доля каждой из них была бы равна 4,8 %. В EP4-рецепторе человека с частотой, большей этого значения, встречаются лейцин, серин, аланин, валин, глицин, аргинин, треонин, изолейцин и пролин (перечислены в порядке убывания частоты). Во всех PG-рецепторах человека с частотой, превышающей это значение, встречаются те же аминокислоты, за исключением изолейцина, и фенилаланин. Среднестатистические же результаты для всех белков человека показывают, что частота, большая, чем 4,8 %, характерна для всех вышеназванных аминокислот, за исключением изолейцина и фенилаланина, а также для глутаминовой кислоты, лизина и аспарагиновой кислоты.
Глутаминовая кислота, лизин и аспарагиновая кислота — гидрофильные аминокислоты, а изолейцин и фенилаланин — гидрофобные. Из трех наиболее частых аминокислот лейцин и аланин — также гидрофобные. То есть количество гидрофильных аминокислотных остатков в PG-рецепторах (трансмембранных белках), как и ожидалось, меньше среднестатистического; а количество гидрофобных — больше.
2.1.2. Для выявления консервативных участков в белковых последовательностях PG-рецепторов проведено их множественное выравнивание.
Множественное выравнивание сделано для близких гомологов EP3-рецептора человека. Для этого с помощью программы BLAST получен список из 34 белков; все они принадлежат млекопитающим (человек, обезьяна, собака, мышь, крыса, кролик, бык и свинья). E Value для этих белков — не более 2*10 –15; остальные белки, предложенные программой BLAST в качестве возможных гомологов, имели E Value не менее 4*10 –5. В число этих 34 белков входят все PG-рецепторы, лежащие в SwissProt (и только они). Проведено выравнивание их аминокислотных последовательностей.
Сравнение сделанного автоматически выравнивания с представленным в базе данных показало, что результаты значительно различаются (в выравнивании, выставленном в Интернете, больше консервативных аминокислотных остатков). От сведений, приведенных в статье [2], оно также отличалось меньшим чилом консервативных аминокислотных остатков. А авторы статьи [9] предупреждали, что автоматические программы плохо справляются с выравниванием большого числа трансмембранных белков. Поэтому было проведено редактирование выравнивания вручную в программе GeneDoc.
Мутации в трансмембранных участках (α-спиралях) менее вероятны, чем во вне- или внутриклеточных участках, поэтому при выравнивании трансмембранных белков стоит опираться прежде всего на консервативные аминокислоты в α-спиралях как на более достоверные. В основе редактирования лежал поиск мотивов, приведенных в статье [10], которые встречаются у большинства представителей семейства родопсиновых рецепторов (так называемых “отпечатков пальцев” — fingerprints):
· G72N100 — в 1-ом трансмембранном участке;
· L92XXXD91 — во 2-ом трансмембранном участке;
· C94(17X)L79(5X)D80R98Y74 — в 3-ем трансмембранном участке и начале 2-ой внутриклеточной петли;
· W86 — в 4-ом трансмембранном участке;
· F49XXP77(7X)Y89 — в 5-ом трансмембранном участке;
· F80XXC76W58XP73 — в 6-ом трансмембранном участке и
· N86P97 — в 7-ом трансмембранном участке.
В этом списке нижние индексы — это проценты консервативности соответствующих аминокислотных остатков.
D во 2-ом трансмембранном участке, а также DRY (или ERW) в 3-ем трансмембранном участке и начале 2-ой внутриклеточной петли важны для активации рецептора. Они консервативны для всего семейства А и не консервативны для других семейств G-белок-связывающих рецепторов. Это позволяет считать, что изменение конформации центрального домена или процессы, приводящие к данному изменению конформации, различны для разных семейств [4].
Не все вышеперечисленные мотивы встречались у PG-рецепторов точно в таком виде. Непосредственно для PG-рецепторов абсолютно консервативными мотивами являются следующие:
· GXXXNXXA — в 1-ом трансмембранном участке;
· LXXXDXXG — во 2-ом трансмембранном участке;
· L(8X)MXXE — в 3-ем трансмембранном участке;
· LP — в 4-ом трансмембранном участке;
· N(6X)L — в 5-ом трансмембранном участке;
· CXXP — в 6-ом трансмембранном участке и
· R(6X)IXDPW(5X)R — в 7-ом трансмембранном участке.
После такого редактирования число консервативных аминокислотных остатков увеличилось до 27. Они расположены
· во всех 7 трансмембранных участках;
· в 1-ой внутриклеточной петле;
· в 1-ой внеклеточной петле;
· во 2-ой внутриклеточной петле;
· во 2-ой внеклеточной петле;
· в 4 внутриклеточном участке.
Консервативные аминокислотные остатки показаны на рис. 1.
2.1.3. Сравнение последовательностей PG-рецепторов человека путем их множественного выравнивания с последующим ручным редактированием показало, что консервативными являются 28 аминокислотных остатков. Они отмечены на рис. 1. Это те же аминокислотные остатки, что и в предыдущем пункте, а также треонин-64 (выделен на рис. 1 серым цветом).
2.1.4. Сравнение последовательностей EP-рецепторов у млекопитающих путем их множественного выравнивания с последующим ручным редактированием показало, что консервативными являются 40 аминокислотных остатков (рис. 2). В их число входят все аминокислотные остатки, консервативные для PG-рецепторов.