За истекшее двадцатилетие методы, первоначально предложенные для прогноза спектра биологической активности, претерпели существенные изменения. Эти изменения базируются как на теоретическом анализе методики прогнозирования, так и на имеющемся опыте ее применения для поиска веществ с требуемыми свойствами.
Современная версия компьютерной системы предсказания спектра биологической активности PASS C&T (Prediction of Activity Spectra for Substances: Complex & Training) реализована в 1998 году. Она включает в себя обучающую выборку, содержащую более 30000 биологически активных веществ с известной биологической активностью, и охватывает более 400 фармакологических эффектов, механизмов действия, а также мутагенность, канцерогенность, тератогенность и эмбриотоксичность.
Математический подход, используемый в PASS C&T, выбран Д.А. Филимоновым в результате сравнительного анализа 300 различных методов. Показано, что средняя точность прогноза с помощью PASS C&T при скользящем контроле с поочередным исключением по одному соединению из обучающей выборки составляет около 84%.
Результаты прогноза выдаются либо в виде текстового файла, который может в дальнейшем обрабатываться с помощью различных текстовых процессоров, либо в виде SDF файла, который может импортироваться в ISIS/Base и добавляться к имеющейся в базе данных информации о веществах. Далее обработка результатов прогноза осуществляется стандартными программными средствами, имеющимися в ISIS/Base.
Биологическая активность описывается в PASS C&T качественным образом ("да"/"нет"). Выдаваемые результаты прогноза помимо названий активности включают в себя оценки вероятностей наличия (Pa) и отсутствия каждой активности (Pi), имеющие значения от 0 до 1. Поскольку эти вероятности рассчитываются независимо, их сумма не равна единице.
Пример предсказания спектра биологической активности для препарата талидомид приведен ниже. Как видно из рисунка, известные для данного вещества виды активности (анксиолитическая, седативная, снотворная, тератогенная, модулятор цитокинов, ингибитор ангиогенеза, антагонист фактора некроза опухоли) содержатся в прогнозируемом спектре активности. Помимо этого, прогнозируется также ряд дополнительных видов активности – сердечно - сосудистый аналептик, антагонист нейрокинина, ингибитор кальпаина, и другие - которые указывают перспективные направления дальнейшего тестирования данного препарата.
Необходимо подчеркнуть, что для эффективного использования данные компьютерного прогноза должны рассматриваться специалистами с учетом имеющейся дополнительной информации.
Так, если целью исследования является поиск базовых структур лекарств, обладающих существенной, целесообразно отбирать из массива доступных веществ не те структуры, для которых величина Pa близка к единице (они могут оказаться близкими аналогами известных препаратов), а соединения с Pa<0.7. Риск получения отрицательного результата в эксперименте тем больше, чем меньше величина Pa, однако и новизна такой структуры (при подтверждении прогноза в эксперименте) будет более высокой.
Наоборот, если поставлена цель поиска близкого аналога известного препарата, то из массива имеющихся образцов следует отобрать вещества с наибольшими значениями Pa.
Кроме того, если, наряду с основным действием, известен перечень нежелательных побочных эффектов, то при отборе перспективных для исследований соединений можно руководствоваться комбинированным критерием:
- наличие в прогнозируемом спектре требуемых эффектов/механизмов;
- отсутствие нежелательных эффектов/механизмов.
Естественно, что при рассмотрении всего списка, включающего свыше 400 прогнозируемых видов активности, можно составить большое количество комбинаций из требуемых и нежелательных эффектов. Для их анализа сотрудник Лаборатории структурно-функционального конструирования лекарств НИИ Биомедхимии РАМН А.А. Лагунин разработал специальную компьютерную систему интерпретации спектров биологической активности веществ IBIAC, основанную на знаниях об известных взаимосвязях между фармакологическими эффектами и механизмом действия биологически активных веществ (более 2000 терминов, описывающих биологическую активность). С использованием системы IBIAC генерация перечня эффектов, соответствующих определенному механизму действия и, наоборот, списка вероятных механизмов, ответственных за проявление определенного эффекта, осуществляется автоматически.
Поскольку прогноз спектра биологической активности осуществляется на основе структурной формулы химического соединения, он может быть выполнен уже на этапе планирования синтеза. В итоге будут синтезированы лишь некоторые из теоретически возможных производных, в наибольшей степени удовлетворяющие критериям задачи.
Необходимо отметить, что прогноз спектра биологической активности возможен для низкомолекулярных органических соединений, структура которых не отличается принципиально от веществ обучающей выборки. Не имеет смысла прогноз для синтетических и биополимеров, для неорганических веществ и т.п.
Другое ограничение определяется необходимостью наличия не менее 5 веществ с известной активностью для формирования обучающей выборки. Очевидно, что в случае принципиально новых мишеней действия лекарственных препаратов, для которых имеются данные только об 1-2 лигандах, предсказание биологической активности таким методом не может быть реализовано.
Химическая структура и часть прогнозируемого спектра биологической активности для препарата талидомид (жирным шрифтом выделены активности, известные из эксперимента).
PASS CT 1.11 - Prediction of Activity Spectra for Substances
Copyright (c) 1998 V.V.Poroikov, D.A.Filimonov & Associates
Chemical Structure File: thalido.mol, <ACTIVITY_PREDICTION>
24 Substructure descriptors; 0 new, 84 Possible activities.
Pa Pi Activity
0.781 0.006 Cytokine modulator
0.713 0.019 Sedative
0.678 0.030 Cardiovascular analeptic
0.656 0.015 Angiogenesis inhibitor
0.439 0.007 Neurokinin antagonist
0.435 0.008 Calpain inhibitor
0.433 0.009 Oxytocin antagonist
0.443 0.024 Chemoprotective
0.421 0.011 Tumour necrosis factor antagonist
0.398 0.007 Hypnotic
0.439 0.050 NMDA agonist
0.407 0.028 Bronchodilator
0.430 0.059 Psychotropic
0.417 0.054 Anxiolytic
0.370 0.007 Protein kinase C inhibitor
0.428 0.068 Anticonvulsant
0.421 0.062 Teratogen
0.361 0.008 Antidiabetic symptomatic
0.377 0.035 Cardioprotectant
0.336 0.012 Benzodiazepine agonist partial
0.362 0.052 Spasmolytic, urinary
0.364 0.060 Analeptic
0.360 0.060 Nootropic
0.305 0.008 Uterine Relaxant
0.375 0.086 Septic shock treatment
0.385 0.102 Platelet adhesion inhibitor
В случае существенной по отношению к соединениям обучающей выборки новизны химической структуры прогнозируемого вещества (более 3-х дескрипторов ни разу не встретились в обучающей выборке) результаты прогноза могут иметь значительную погрешность. В этом случае целесообразно протестировать вещество на требуемые виды активности независимо от результатов прогноза, так как результатом может оказаться принципиально новая базовая структура.
В некоторых случаях вещество прогнозируется одновременно как агонист и антагонист (стимулятор и блокатор, активатор и ингибитор) по отношению к одним и тем же рецепторам (ферментам и т.п.). Это означает, что система не может дифференцировать внутреннюю активность вещества, а лишь указывает на его способность к связыванию с данным рецептором (ферментом).
И, наконец, необходимо иметь в виду, что система PASS C&T не может предсказать, станет ли конкретное вещество лекарственным препаратом, поскольку это будет зависеть также от многих других факторов (сравнительной оценки безопасности и клинической эффективности; наличия необходимых для разработки и внедрения инвестиций, и т.д.). Прогноз, однако, может помочь определить, какие тесты наиболее адекватны для изучения биологической активности конкретного химического вещества, и какие вещества из имеющихся в распоряжении исследователя наиболее вероятно проявят требуемые эффекты. [19]
В этом и предыдущем разделах было дано краткое описание использовавшихся и используемых квантовохимических методов. Более детальное знакомство с ними практически не требуется для решения практических задач. Это связано с тем, что на основе анализа приближений, сделанных при разработке того или иного квановохимического метода, как правило, не удается установить область его применения и очертить круг задач, которые можно решить с его помощью. К сожалению, многие квантовохимические методы, которые лучше обоснованы с теоретической точки зрения, на практике дают плохие результаты и поэтому не применяются, а более грубые модели с удачно подобранными параметрами широко используются. Это связано с тем, что в любом квантовохимическом методе сделано достаточно много различных приближений. В некоторых методах ошибки, к которым приводят эти приближения, частично компенсируют друг друга и в результате получается хорошее согласие с экспериментом. Сказать заранее, будет или не будет иметь место такая компенсация нельзя, поэтому выяснить область применения и охарактеризовать точность конкретного метода можно лишь на основе численного эксперимента и систематизации опубликованного расчетного материала.
Данные статистического анализа результатов квантовохимических расчетов геометрических параметров стабильных органических молекул небольшого размера, содержащих одинарные и кратные связи, приведены в таблице 1.1 приложения А, показано, с какой точностью можно рассчитать геометрию молекул неэмпирическим методом и как меняются результаты расчетов в зависимости от выбора базиса. Обращает на себя внимание хорошее согласие с экспериментом, которое получается при использовании минимального и валентно - расщепленных базисов.