Смекни!
smekni.com

Моделирования связи структура химических соединений молекулярные свойства и биологическая акти (стр. 1 из 7)

Введение

В настоящее время в органической химии синтезировано более 20 миллионов химических веществ, набор сведений о которых весьма обширен. Активное использование в химических исследованиях этой огромной информации невозможно без привлечения средств вычислительной техники. Компьютерные технологии и математическое моделирование позволяют отказаться от традиционного метода поиска химических веществ с заданными свойствами путем экспериментов, которые являются чрезвычайно сложными, длительными и дорогостоящими. Так, разработка единственного лекарственного препарата требует в среднем от 8 до 20 лет, а затраты составляют до 100 миллионов долларов. Согласно статистике, удачным оказывается приблизительно одно из 10 тысяч испытаний возможных лекарственных препаратов. Исключительно большое число структур, которые необходимо исследовать, может быть проиллюстрировано тем фактом, что одна структура и 20 заместителей, присоединенных в шести различных положениях, будут приводить к полному числу исследуемых структур, равному

. В связи с этим многие фирмы связывают успех в разработке новых препаратов с внедрением в химические исследования компьютерного и математического моделирования, резко сокращающего сроки создания физиологически активных веществ, путем отсеивания заведомо неактивных и высокотоксичных соединений. Поэтому неудивительно, что в настоящее время для достижения такой заманчивой цели прилагаются значительные усилия. Например, расходы фирмы «Pfizer» на научные исследования по поиску фармацевтических препаратов в 1990 году возросли более чем на 20% и составили 640 миллионов долларов. По оценке «International Resource Development Inc» особенно быстро растет объем финансирования работ по созданию компьютерных систем для моделирования различных свойств химических веществ – от 66 миллионов долларов в 1983 голу до 8,5 миллиардов долларов в 1993 году. При создании таких систем возникают сложные, выходящие за рамки информационного поиска задачи, решение которых требует разработки специальных методов и моделей, оригинальных алгоритмов и соответствующего программного обеспечения. При этом подобные системы будут обладать рядом преимуществ, обусловленных мощной информационной поддержкой в виде фактографических баз данных, наличие которых позволит наряду с задачами информационного характера, решать и такие важные в научном и практическом отношении проблемы, как установление эмпирических закономерностей для моделирования связи между строением вещества и его физико-химическими и биологическими свойствами. Такого рода системы позволят более объективно использовать накопленный экспериментальный материал в виде разнообразных зависимостей «структура соединения – физико-химические и биологические свойства».

Таким образом, проблемы создания информационно-математической инфраструктуры системы научных химических исследований, в первую очередь комплекса проблемно-ориентированных баз данных, по полноте адекватных нуждам пользователей, является в настоящее время ключевой для интенсификации научных исследований. Изложенное выше определяет актуальность, научную и практическую значимость проведенных в монографии исследований в одной из наиболее важных областей химической информатики – разработке компьютерных средств и математических методов для моделирования связи между строением вещества и его свойствами. Вряд ли необходима более развернутая аргументация в пользу актуальности и важности компьютерно – моделирующих систем с обучением для таких предметных областей, как химия, биология, медицина и другие науки о жизни, где постановка реального или лабораторного эксперимента либо изрядно затруднена, либо вообще невозможна по тем или иным соображением. Хотелось бы отметить, что поиск новых высокоактивных и безопасных для человека и окружающей среды химических препаратов с заранее заданными свойствами является важнейшей фундаментальной проблемой мировой науки, так как создание таких веществ есть одно из основных условий роста технологической мощи современного общества.

Цель данной работы состоит в разработке эффективных методов математического и компьютерного моделирования связи «структура химических соединений –молекулярные свойства и биологическая активность» на основе стратегии формирования базы данных и знаний из имеющихся примеров, а также в создании компьютерных технологий поддержки профессиональных химико-структурно-биологических баз данных и знаний. Для достижения указанной цели по поиску эффективных препаратов с заданными свойствами требуется углубленный анализ и теоретические исследования первичных экспериментальных данных с использованием современных информационно - компьютерных технологий и методов математического моделирования.

Постановка задачи

Современное развитие общества связано с перевооружением всех отраслей народного хозяйства на основе современных достижений науки и техники. Особенно важную роль в решении этой задачи будет иметь внедрение новой информационной технологии, реализуемой в прикладных информационных системах на базе средств вычислительной техники. Автоматизированные информационные системы (информационно-поисковые, управляющие, диагностические, моделирующие) предназначены для оперирования особо интенсивными потоками информации, отсутствие или недостаток которой ведет к неэффективным решениям, сопровождаемым различными негативными последствиями. Их техническая и программная части должны обеспечивать выполнение специальных процедур автоматизированного сбора, хранения и обработки. В области науки большое значение имеет также создание математического обеспечения (методов, моделей, алгоритмов и программ) для моделирования, анализа и прогнозирования зависимостей типа структура объектов – его свойства, в частности, молекулярная структура – физико-химические свойства и биологическая активность. Таким образом, можно говорить о необходимости создания информационно – математической инфраструктуры в конкретных областях научных исследований. С этой глобальной задачей тесно связаны более локальные задачи создания автоматизированных систем научных исследований (АСНИ) по поиску препаратов с заданными свойствами в области органической химии, в которой огромный объем информации, принципиальная сложность и новизна решаемых научных проблем как раз и выдвигают в качестве одной из первоочередных задач разработку высокоэффективных средств информационно – компьютерной поддержки. Следует также подчеркнуть, что помимо прикладной роли, разработка таких систем имеет большое самостоятельное значение. Более того, можно утверждать, что без разработки эффективных АСНИ в органической химии, успешное решение проблемы поиска препаратов с заданными свойствами будет вообще невозможно, потому что возникают различные проблемы, в том числе, проблема оценки адекватности результатов моделирования при изучении явлений, экспериментальный анализ которых обычными средствами, как правило, невозможен. Так, при исследованиях по химическому канцерогенезу обычными лабораторными средствами, характерное время эксперимента – около трех лет, а стоимость изучения одного соединения – около 12 миллионов долларов США. Если учесть, что к настоящему времени известны более 15 миллионов химических веществ, число которых ежегодно увеличивается на 500 тысяч вновь созданных, то утверждение о затрудненности экспериментального анализа всего потока обычным путем становится просто очевидным [5]. Аналогично, эффективность работ по поиску новых химических средств защиты растений (ХСЗР) обычными средствами (путем синтеза и массовых испытаний большого числа самых различных химических соединений) чрезвычайно мала, так как для создания конкурентноспособного нового действующего вещества необходим синтез и биологические испытания от 30 до 100 тысяч химических соединений [6], причем, стоимость разработки нового продукта без затрат на создание промышленного производства составляет 10 – 35 миллионов долларов, а время, затрачиваемое на разработку, составляет около 10 лет. Поэтому, применение математических методов и АСНИ для установления количественных соотношений структура – активность и их использование для прогнозирования потенциально активных соединений становятся одними из важных и основных путей изыскания препаратов с заданными свойствами, так как они приведут к существенному сокращению времени и объема поисковых работ, а следовательно, и затрат на разработку.

Основными функциями АСНИ являются: сбор, автоматизированная обработка экспериментальных данных или другой информации, получение и исследование математических моделей, изучаемых объектов, явлений, процессов, с целью использования их в дальнейшем для получения новых знаний. Характерной тенденцией развития автоматизированных информационных систем является соединение в них средств удовлетворения чисто информационных потребностей (поиск в базах данных) и средств переработки информации (получение нового знания), создание которых связано с программной реализацией существующих и разработкой новых математических моделей и алгоритмов обработки данных.

Ядром АСНИ является информационно – математическое обеспечение, включающее информационно – вычислительные системы и системы математического моделирования и обработки данных на основе средств вычислительной техники. В состав информационного обеспечения научных химиико - биологических исследований в глобальном аспекте должны входить [7-14]:

· библиография по проблеме поиска химических веществ с заданными свойствами;

· результаты биологических испытаний в системах скрининга химических соединений;

· химико-структурно-биологическая информация из патентных и литературных источников;