где
- спектр поглощения k-ой аминокислоты, - число k-ых аминокислот в белке, а - общее число аминокислот в белке. N - и С-концевые - NH2 и - COOHгруппы белка также должны быть включены в эту формулу наравне с аминокислотами. Пример исключения из ИК-спектра рибонуклеазы А вклада от поглощения боковых групп аминокислотных остатков приведен на рисунке 2.2.1 Таким образом, данный метод анализа ИК-спектров полностью аналогичен методам анализа спектров КД белков, за исключением того, что в нем используются не реальные белковые спектры, а вычисленные с помощью формул (2.2.1) и (2.2.2) спектры поглощения пептидного остова белков.Авторы метода использовали для анализа шесть типов вторичной структуры белка: упорядоченная (Ho) и неупорядоченная (Hd) формы a-спирали, упорядоченная (Вo) и неупорядоченная (Вd) формы b-структуры, b-изгиб (Т) и остальные формы (R). К неупорядоченной форме a-спирали были отнесены по два аминокислотных остатка с каждой стороны спирального сегмента, а к неупорядоченной форме b-структуры - аминокислотные остатки b-нитей, образующие "неклассические" водородные связи.
Применение к выбранному базисному набору метода "ортогональных спектров" [6] привело к получению 11 ортогональных спектров, амплитуда которых превышает экспериментальную ошибку, возникающую при регистрации ИК-спектров. Пять "наиболее значимых" ортогональных спектров показано на рисунке 2.2.2.
Экспериментальная проверка точности анализа ИК-спектров белков на белках из базисного набора дала следующие коэффициенты корреляции (смотри раздел 1.2):
Метод | Ho | Hd | Bo | Bd | T | R |
"регуляризации" | 0.97 | 0.77 | 0.94 | 0.91 | 0.80 | 0.48 |
"ортогональных спектров" | 0.98 | 0.80 | 0.93 | 0.90 | 0.75 | 0.48 |
"регуляризации" (без исключения поглощения боковых групп аминокислот) | 0.92 | 0.68 | 0.85 | 0.90 | 0.53 | 0.32 |
Пакет программ STRUCразработан в институте белка РАН [10]. Он предназначен для анализа инфракрасных спектров поглощения белков и определения их вторичной структуры. Алгоритм анализа спектров основан на оригинальном методе авторов программы [8-10] (смотри выше). Пакет STRUCсостоит из следующих программ и вспомогательных файлов:
- STRUC.BAT - командный файл, используемый для определения вторичной структуры белка. Он организует работу следующих трех программ:
- AMACIR (файл amacir.exe) - программа, исключающая из ИК-спектра поглощения белка вклад от поглощения боковых групп аминокислотных остатков по методу [8];
- SVDIR (файл svdir.exe) - программа, определяющая вторичную структуру белка методом "ортогональных спектров" [6];
- CONTIR (файл contir.exe) - программа, определяющая вторичную структуру белка методом "регуляризации" [4].
- VISUAL.BAT - командный файл, предназначенный для графического воспроизведения ИК-спектра поглощения белка. Он организует работу следующих двух программ:
- PLOTFL (файл plotfl.exe) - программа, осуществляющая преобразование спектров поглощения к формату, используемому программой PLOTNIK;
- PLOTNIK (файл plotnik.exe) - программа, осуществляющая графическое построение ИК-спектра поглощения белка.
- SOURCE - файл, содержащий входные данные для программы AMACIR (в том числе сам ИК-спектр поглощения белка).
- OUT.SVDи OUT.CON - файлы, являющиеся результатом работы программ SVDIRи CONTIR, содержащие данные по оценке вторичной структуры белка соответствующими методами.
Программы, входящие в пакет STRUC, не имеют системы экранного интерфейса, и работа с ними осуществляется из командной строки. Перед началом работы с пакетом необходимо создать текстовый файл SOURCE (рекомендуется скопировать уже имеющийся) и записать в него исходные данные по исследуемому белку и его ИК-спектру поглощения, необходимые для работы программ. Формат этого файла следующий:
Номер строки | Содержание |
1 | Идентификатор файла (длиной не более 70 символов) |
2, 3 | Формат записи числовых значений спектра в строках 6 - 14. По умолчанию устанавливается формат (10F6.0) - по 10 значений в каждой строке в форме действительного числа с фиксированной десятичной точкой, причем на запись всего числа отводится 6 позиций, из которых 0 позиций - на десятичную часть. (Для действительных чисел с плавающей десятичной точкой вместо символа 'F' следует записать символ 'E'.) |
5 | Спектральный диапазон (по волновым числам), используемый для вычислений, и число точек в спектре. Максимально допустимый спектральный диапазон составляет 1800 - 1480 см-1 при числе точек в спектре, равном 81. При задании диапазона и числа точек необходимо сохранять интервал между точками равным 4 см-1. |
6 - 14 | ИК-спектр поглощения белка, выраженный в единицах л моль-1·см-1. |
17 | Содержит единственный символ '*', положение которого определяет тип записи данных по аминокислотному составу белка: (а) NAmAc - указывается абсолютное количество остатков каждой аминокислоты в белке; (б) NAmAc/N - указывается абсолютное количество остатков каждой аминокислоты в белке, деленное на общее количество аминокислотных остатков. |
19 - 40 | Аминокислотный состав белка. Здесь же отдельно указываются N - и C-концевые группы белка. |
42 | Общее количество аминокислотных остатков в белке и значение pH, при котором снимался спектр. Указывать значение pHнужно обязательно, а общее количество аминокислотных остатков - только в том случае, если при записи аминокислотного состава белка записывались относительные доли аминокислотных остатков (вариант (б)). |
43 | Комментарий к файлу |
Пример заполнения файла можно посмотреть в уже имеющемся файле SOURCE.
После подготовки файла SOURCEнеобходимо запустить вычисления. Для этого в командной строке следует ввести
STRUC SOURCE OUT.SVD OUT.CON и нажать кнопку [Enter]. (Названия файлов SOURCE, OUT.SVDи OUT.CONмогут быть любыми, следует лишь соблюдать указанный порядок пр их записи.)
После окончания работы программ результаты вычислений моут быть просмотрены в файлах OUT.SVDи OUT.CONс помощью любого текстового редактора. Первая часть этих файлов содержит информацию о входных данных (взятую из файла SOURCE). Далее следует набор решений, соответствующий различным комбинациям ортогональных спектров (в файле OUT.SVD) или различным значениям параметра регуляризации (в файле OUT.CON). В конце файлов приводится аппроксимированный спектр и окончательно выбранное решение.
Можно просмотреть также промежуточные результаты вычислений программ. Файл PEPT, создаваемый программой AMACIR, содержит ИК-спектр поглощения пептидной цепи. Этот файл является входным для программ SVDIRи CONTIR. Файл AMACIR.RES, также создаваемый программой AMACIR, содержит данные об ионизации отдельных аминокислотных остатков при заданном значении pH, среднем значении массы одного аминокислотного звена данного белка, содержании в белке азота, а также три ИК-спектра поглощения: спектр белка (определенный экспериментально) и спектры боковых групп аминокислотных остатков и пептидной цепи (вычисленные программой AMACIR).
Для того, чтобы построить все три спектра на экране, необходимо запустить файл VISUAL.BAT.
В появляющемся после этого на экране главном меню программы PLOTNIKследует выбрать пункт Suit, позволяющий перейти в раздел задания параметров, необходимых для построения графиков. Ниже перечислены основные из них:
Titles/XTitles/YScale/X/UpperScale/X/LowerScale/Y/UpperScale/Y/LowerMisc/NptsMisc/Data | Волновое число, 1/смКоэффициент молярной экстинции, 1/ (моль см)14801800AutoAutoAutoFormatted |
Для одновременного построения трех графиков необходимо задать три набора данных (A, Bи C) и указать имена файлов, содержащих эти данные:
Set | Legend | Filename |
ABC | экспериментальный спектрспектр поглощения пептидной цеписпектр поглощения а/к остатков | buf1.datbuf2.datbuf3.dat |
Файлы buf1.dat, buf2.dat и buf3.dat создаются программой PLOTFL на основе данных файла AMACIR.RES (эти файлы уничтожаются после завершения работы программы PLOTNIK). После задания параметров следует вернуться в главное меню программы PLOTNIKи выбрать в нем пункт View. При этом на экране будут построены требуемые графики.
1. Кантор Ч., Шиммел П. Биофизическая химия. Том 2: Методы исследования структуры и функции биополимеров. М: Мир, 1984
2. Saxena V.P., Wetlaufer D.B. (1971) A new basis for interpreting the circular dichroic spectra of proteins. Proc. Natl. Acad. Sci. U.S.A.68, 969-972
3. Сhang C.T., Wu C. -S.C., Yang J.T. (1978) Circular dichroic analysis of protein conformation: inclusion of the b-turns. Anal. Biochem.91, 13-31
4. Provencher S.W., Glockner J. Estimation of globular protein secondary structure from circular dichroism. (1981) Biochemistry 20, 33-37
5. Hennessey J.P., Jr., Johnson W.C., Jr. (1981) Information content in the circular dichroism of proteins. Biochemistry 20, 1085-1094
6. Compton L.A., Johnson W.C., Jr. (1986) Analysis of protein circular dichroism spectra for secondary structure using a simple matrix multiplication. Anal. Biochem.155, 155-167
7. Manavalan P., Johnson W.C., Jr. (1987) Variable selection method improves the prediction of protein secondary structure from circular dichroism spectra. Anal. Biochem.167, 76-85
8. Venyaminov S.Yu., Kalnin N.N. (1990) Quantitative IR specrtophotometry of peptide compounds in water (H2O) solutions.I. Spectral parameters of amino acid residue absorption bands. Biopolymers 30, 1243-1257
9. Venyaminov S.Yu., Kalnin N.N. (1990) Quantitative IR specrtophotometry of peptide compounds in water (H2O) solutions. II. Amide absorption bands of polypeptides and fibrous proteins in a-, b-, and random coil conformations. Biopolymers 30, 1259-1271
10. Kalnin N.N., Baikalov I.A., Venyaminov S.Yu. (1990) Quantitative IR specrtophotometry of peptide compounds in water (H2O) solutions. III. Estimation of the protein secondary structure. Biopolymers 30, 1273-1280