Изучение этой наиболее обширной группы генов сталкивалось с серьезными трудностями. Сотни тысяч белков, которые участвовали в метаболических реакциях внутри различных по своему функциональному назначению клеток, и обеспечивали разнообразные внутриклеточные процессы, с большим трудом поддавались исследованиям. Главными препятствиями для исследователей являлись малые количества белковых молекул в клетке, скоротечность процессов синтеза и разрушения белка в живом организме, необходимость вести наблюдение за поведением молекул непосредственно в живой клетке. Малые размеры исследуемых белковых молекул и постоянное их нахождение среди тысяч других молекул тормозили работы по идентификации белков и сопоставлению их с биохимическими реакциями. К тому же в живой клетке одни из белковых молекул могли быть природными катализаторами или ингибиторами тех биохимических реакций, в которых сами не участвовали. Свойства, проявляемые белком в живой клетке, значительно отличались от свойств этого же белка, определенных в лабораторных условиях. По этим причинам в маршрутных картах «ген – белок – биохимическая реакция» оставалось много неисследованных белых пятен по позиции «белок» и еще больше по позиции «биохимическая реакция». Само собой разумеется, что совершенно неисследованными оставались вопросы взаимодействия белков и биохимических реакций, как между собой, так и друг с другом.
Значительно уменьшилась группа генов с неясными функциями по сравнению с уровнем знаний десятилетней давности. Были выделены участки генома человека, которые отвечали за обслуживание самой молекулы ДНК, в том числе принимающие участие в процессах разворачивания и сворачивания молекулы, служащие маркерами для присоединения ферментов, выполняющие функции количественного и временного учета обслуживающих молекулу ДНК процессов. Еще одна группа генов несла в себе информацию, описывающую фундаментальные принципы функционирования всего генома, и уже зафиксированную в других участках генома, но закодированную иным расположением нуклеотидов. Так было обнаружено резервное изложение фундаментальных принципов функционирования генома, записанное другими символами.
После выделения основных групп генов и выяснения их функций осталось еще достаточное количество генов в геноме не относящихся к любой из вышеперечисленных групп. Это были старые отбракованные в процессе эволюции гены, кодирующие устаревшие признаки, биохимические реакции и просто различные команды и инструкции. Эта накопленная за тысячелетия эволюции информация являлась устаревшей и в настоящее время была невостребованная, однако эволюционные процессы не привели к ее уничтожению, а напротив сохранили ее в неизменном виде. И это был бесценный материал для генного конструирования и оптимизации организма человека.
Следует заметить, что существующие трудности при исследовании структуры белковых молекул были хотя и велики, но принципиально преодолимы. Технические достижения способствовали созданию современного высокоэффективного инструментария для определения пространственной структуры белковых молекул, как в неподвижном состоянии, так и в процессе их участия в биохимических реакциях. Знание свойств белковых молекул и детального расположения атомов в них являлось чрезвычайно важным для генетики, биологии, фармакологии и многих других наук. Поэтому любые достижения в обеспечивающих производственных отраслях, научных и технических дисциплинах, незамедлительно брались на вооружение учеными, если их использование позволяло ускорить исследования человеческого генома.
Используя ультраяркие источники рентгеновского излучения, ученым удалось получить большие серии снимков и зафиксировать кадр за кадром развитие многих биохимических реакций. Этот метод исследований основывался на эффекте неодинакового поглощения рентгеновских лучей химическими элементами с различным атомным весом, на технической возможности создания ультраярких и сверхкоротких рентгеновских импульсов, на использовании сверхмощных компьютеров для расчетов. Для уточнения полученных данных параллельно применялся и традиционный метод, основанный на анализе информации о рассеянии рентгеновских лучей на белковой молекуле. В этом случае на суперкомпьютерах обрабатывалась информация об интенсивности рассеяния, углах рассеяния и о сдвиге фаз рассеянных лучей.
В это же время началось интенсивное использование в биохимии и генетике технологий, основанных на процессах рассеяния нейтронов на протонах. Эти технологии будто специально были созданы для исследования биологических объектов, имеющих в своем составе множество атомов водорода. Технологии нейтронного рассеяния базировалась на физическом эффекте хорошего рассеяния нейтронов на протонах. То, что биологические объекты (структурные части клеток, белковые молекулы, ДНК и другие) были «перенасыщены» водородом, позволяло при воздействии на них пучка нейтронов получать четкие картины распределения атомов водорода в пространстве. Приняв за точку отсчета эти своеобразные маркеры, можно было, в первом приближении, строить модель исследуемой молекулы, либо структурной части клетки. Последующее уточнение строения исследуемого объекта проводилось при помощи ультраярких источников рентгеновского излучения, а также расчетными методами. Технология рассеяния нейтронов на протонах позволила изучать строение белковых молекул с большим молекулярным весом, и даже некоторых внутриклеточных структур.
Не были оставлены в стороне и традиционные методы изучения структуры и строения белковых молекул, такие как криоэлектронная микроскопия, кристаллография с атомным разрешением, ядерный магнитный резонанс и другие.
Применение учеными совокупности известных методов изучения органических соединений при исследованиях структуры и свойств белковых молекул и механизмов реализации биохимических реакций, перевели задачи, поставленные в программе «Белок человека», в разряд успешно решаемых. Накопление полного объема информации по данной проблеме было только вопросом времени. Стартовавшая в прошлом десятилетии глобальная исследовательская программа «Белок человека», участие в которой приняли сотни научных государственных и частных компаний, привела к впечатляющим практическим результатам.
За время реализации этой программы была определена полипептидная структура более пятисот тысяч различных белков человека. Совершенное программное обеспечение для компьютерного моделирования способствовало построению достоверных моделей трехмерной структуры белковых молекул, исходя из их двухмерной полипептидной последовательности. Ситуация чем-то напоминала ситуацию уже имевшую место на рубеже веков, когда при первой расшифровке генома человека накопились гигантские объемы информации, требующие систематизации, сведения в единую общую модель. И если для систематизации расшифрованных последовательностей нуклеотидов человеческого организма и построения единой модели человеческого генома потребовалось более десяти лет, то систематизация знаний о строении сотен тысяч белков человеческого организма требовала большего времени. Сложность программы «Белок человека» была почти на три порядка выше, чем программы расшифровки человеческого генома, выполнение которой еще совсем недавно казалась пределом возможного.
Многочисленные достижения в различных областях науки и техники помогли определить к концу десятилетия полипептидную и пространственную структуру около полумиллиона белков, синтезируемых в организме человека. Однако до получения завершенной картины функционирования белков в человеческом организме было еще далеко. Причиной этого являлись трудности количественного порядка. В геноме человека насчитывалось порядка ста тысяч генов, из которых при синтезе белков использовалось не более половины. В то же время, в клетках человеческого организма для обеспечения нормального функционирования синтезировалось постоянно около миллиона различных белков. Было совершенно очевидным, что за синтез определенного белка отвечает не один ген, а целая группа, которая может состоять из различного количества генов. Таким образом, насущной задачей становилось составление полных маршрутных карт «группа генов – белок – биохимическая реакция», для чего требовалось определить сочетания генов, отвечающие за синтез белковых молекул, общее количество которых приближалось к миллиону.
В то же время миллион различных белков человеческого организма, каждый из которых способен вступать в химические реакции с органическими и неорганическими соединениями, которые во множестве находились в живой клетке, предопределял астрономические количества потенциально возможных химических реакций. Многие из них действительно осуществлялись в функционирующих клетках. Достоверно определить именно те биохимические реакции, которые являлись функциональными для каждой белковой молекулы, и отсечь десятки тысяч других возможных вариантов, которые не являлись важными для человеческого организма, было сверхсложной задачей. Эту задачу необходимо было решать незамедлительно, поскольку без этих базовых знаний невозможно было определить истинную картину функционирования человеческого организма на всех уровнях и, следовательно, двигаться вперед по пути прогресса. Главную роль в сложном и многоаспектном процессе функционирования живого человеческого организма играл, несомненно, белок, как класс химических соединений. Только владение полной информацией о первичной и пространственной структуре всех белков, входящих в состав организма человека, об их свойствах, функциональном назначении, взаимосвязях между собой и о взаимодействии с другими химическими соединениями, могло дать целостную картину устройства человека, как вместилища астрономического числа согласованных химических реакций.