Смекни!
smekni.com

Аналіз выкарыстання камп'ютэрў у біяінфарматыцы (стр. 1 из 5)

ЗМЕСТ

ЗМЕСТ

УВОДЗІНЫ

ГЛАВА 1АНАЛІЗ ВЫКАРЫСТАННЯ КАМП'ЮТЭРЎ У БІЯІНФАРМАТЫЦЫ

§1. Асноўныя прымяненні інфармацыйных тэхналогій

§2 Банкі даных біялагічнай інфармацыі

§3 Візуалізацыя біялагічнай інфармацыі

§4 Пашуковыя сістэмы

ГЛАВА 2ВЫКАРЫСТАННЕ ІНФАРМАЦЫЙНЫХ ТЭХНАЛОГІЙ ДЛЯ ЗАДАЧ ПАРАЎНАННЯ Ў БІЯІНФАРМАТЫЦЫ

§1 Супастаўленне з узорам

§2 Параўнанне структур бялкоў

ГЛАВА 3

ВЫКАРЫСТАННЕ ПРАГРАМНЫХ БІБЛІЯТЭК

§1 Бібліятэка BioJava

Глава 4ПРАКТЫЧНАЕ ВЫКАРЫСТАННЕ БІБЛІЯТЭКІ BIOJAVA

§1 Пастаноўка задачы

§2 Усталёўка бібліятэкі

§3 Выбар алгарытмаў

§4 Напісанне праграмы пошуку найбліжэйшых паслядоўнасцяў

§5 Тэсціраванне праграмы пошуку найбліжэйшых паслядоўнасцяў

ЗАКЛЮЧЭННЕ

СПІС ВЫКАРЫСТАНАЙ ЛІТАРАТУРЫ

ДАДАТАК 1


УВОДЗІНЫ

Сёння ўсё хутчэй нарастае аб'ём малекулярна-біялагічных і малекулярна-генетычных даных. Асэнсаванне гэтых каласальных па аб'ёмах даных ужо немагчыма без прыцягнення інфармацыйных тэхналогій і матэматыкі. Менавіта таму на стыку інфарматыкі, біялогіі і матэматыкі ўзнікла біяінфарматыка. Пад біяінфарматыкай зараз разумеюць прымяненне камп'ютэраў для вывучэння біялагічных аб'ектаў. У больш вузкім сэнсе яе можна разумець як прымяненне камп'ютэрных метадаў для вырашэння задач малекулярнай біялогіі. Сярод асноўных задач біяінфарматыкі вылучаюць:

- вывучэнне геномаў

- аналіз і прадказанне структуры бялкоў

- аналіз і прадказанне ўзаемадзеяння бялкоў

Біяінфарматыка ўключае ў сябе наступныя элементы:

- базы даных, у якіх захоўваецца інфармацыя пра біялагічныя аб'екты

- набор інструментаў для аналізу і апрацоўкі гэтай інфармацыі

- распрацоўку матэматычных мадэляў біялагічных аб'ектаў і алгарытмаў рашэння разнастайных біялагічных задач

Сярод банкаў даных найбольш вядомым прадстаўніком з'яўляецца Protein Data Bank (PDB) [1]. Гэта сховішча трохмернай структурнай інфармацыі аб бялках і нуклеінавых кіслотах. Гэтыя даныя звычайна атрымоўваюцца з дапамогай рэнтгенавай крысталаграфіі ці спектраскапіі на аснове ядзерна-магнітнага рэзанансу. Напаўняюць банк біёлагі і біяхімікі эксперыментальнымі данымі.

На бягучы час існуе шмат пакетаў праграм, якія прыназначаны для работы з біяфізічнай і біяхімічнай інфармацыяй. Вылучаюць наступныя накірункі:

- візуалізатары інфармацыі з банкаў даных біялагічнай інфармацыі

- прадказанне другаснай ці трэцічнай структуры бялку па вядомай першаснай структуры

- прадказанне ўзаемадзеяння бялок-бялок і бялок-рэчыва

- параўнанне бялкоў з банкаў даных і ацэнка іх падабенства

- пабудова іерархічных дрэваў эвалюцыі біялагічных аб'ектаў

Варта заўважыць, што ўсе гэтыя банкі і праграмы пабудаваны з улікам існуючых алгарытмаў збору, захавання і апрацоўкі біялагічнай інфармацыі. З-за таго, што амаль усе задачы адносяцца да класу NP-поўных, то атрыманне рашэння ператвараецца ў складаную задачу. З-за медыцынскай важнасці гэтым праблемам прысвечана шмат увагі, што выклікае цеснае ўзаемадзеянне інфарматыкаў, біяхімікаў і біяфізікаў. Гэтыя праблемы і будуць асвечаны ў дадзенай працы.


ГЛАВА 1АНАЛІЗ ВЫКАРЫСТАННЯ КАМП'ЮТЭРЎ У БІЯІНФАРМАТЫЦЫ

§1. Асноўныя прымяненні інфармацыйных тэхналогій

Як ужо было сказана, выкарыстанне камп'ютэраў для вырашэння біялагічных задач стала неабходным. Асноўныя сферы іх прымянення наступныя:

- камунікацыя

- кіраванне прыстасаваннямі

- вылічэнні

- захаванне

Камп'ютэры шырока выкарыстоўваюцца для кіравання разнастайнымі прыстасаваннямі для працы з біялагічнымі аб'ектамі: машынамі для секвенціравання ДНК, брадзільнымі чанамі, біярэактарамі і гэтак далей. Гэтыя устаноўкі кіруюцца праграмуемымі рукамі-робатамі і змяншаюць патрэбу ў людзях-аператарах. Там, дзе вельмі важны час выканання, камп'ютэры выйграюць у людзей, бо могуць працаваць без перапынкаў і з вялікай дакладнасцю.

З развіццём сеткавых тэхналогій і персанальных камп'ютэраў падрыхтоўка вучоным артыкула стала не толькі ў разы хутчэйшым, але і яго распаўсюджванне таксама паскорылася. Зараз мала хто з вучоных будзе адразу звяртацца да папяровага выдання, а хутчэй за ўсё звернецца да адной са шматлікіх баз даных біялагічных структур. Стала магчымай сумесная праца вучоных у геаграфічна аддаленых рэгіёнах.

Вылічальныя задачы ў біяінфарматыцы прадстаўлены вельмі шырока: ад візуалізацыі і пошуку падобных амінакіслотных ланцужкоў да мадэліравання ўзаемадзеяння складаных бялкоў па трохмерных іх структурах. Рашэнню такіх задач дапамагае вялікая колькасць гатовых праграмных сродкаў, а таксама наяўасць гатовых праграмных бібліятэк, якія спрашчаюць напісанне новых праграм і падтрымку старых.

Функцыі захавання шырока прадстаўлены ў выглядзе разнастайных сховішчаў інфармацыі, адрозных па сваёй эфектыўнасці, даступнасці і характары інфармацыі, для працы з якой яны прыназначаны.

§2 Банкі даных біялагічнай інфармацыі

Адной з найважнейшых частак прымянення камп’ютэраў у малекулярнай біялогіі з’яўляецца захаванне біялагічнай інфармацыі. Для гэтай мэты існуе шэраг спецыяльных сховішчаў, гэтак званых банкаў даных ці баз даных. Яны знаходзяцца ў цэнтры выкарыстання інфармацыйных тэхналогій у біяінфарматыцы. Насамрэч, большасць аперацый па вылічэннях і камунікацыі заснавана на даных, што знаходзяцца ў банках даных. Інфармацыя ў іх захоўваецца на трывалай і доўгачасовай аснове, амаль не падвяргаецца зменам, і яе форма прыстасаваная для хуткага выканання аперацый пошуку, сартыроўкі і іншых.

Існуе шэраг розных тыпаў такіх сховішчаў: банкі нуклеатыдных паслядоўнасцяў, бялковых паслядоўнасцяў, трохмерных структур, паслядоўнасных матываў (матыў – невялікі структурны элементы, які сустракаецца ў многіх пратэінах, напрыклад, α-спіраль). У табліцы 1.1 прыведзены некаторыя прадстаўнікі кожнага тыпу баз даных [2].

Табліца 1.1. Тыпы баз біялагічных даных

Тып базы даных Прыклады Заўвага
Нуклеатыдныя паслядоўнасці GenBank Адна з найвялікшых баз даных паслядоўнасцяў
EMBL Еўрапейская лабараторыя малекулярнай біялогіі
NDB База даных нуклеінавых кіслотаў
Бялковыя паслядоўнасці SWISS-PROT Швейцарскі і Еўрапейскі інстытуты біяінфарматыкі
PIR Рэсурс інфармацыі пра бялкі
Трохмерныя структуры PDB Банк пратэінавых даных
MMDB База даных малекулярнага мадэліравання
Паслядоўнасныя матывы LIGAND Хімічныя структуры і рэакцыі
PROSITE Паслядоўнасныя матывы
ProDOM Бялковыя дамены

Акрамя публічных, ёсць шэраг прыватных базаў даных, які хутка пашыраецца. У яго ўваходзяць базы, стварэннем і падтрымкай якіх займаюцца кампаніі і камерцыйныя лабараторыі пры падтрымцы акадэмічных інстытутаў. Напрыклад, база даных LifeSeq ад кампаніі IncyteGenomics, Inc. утрымоўвае паслядоўнасці генаў ад людзей, пацукоў і мышэй.

Незалежна ад таго, прыватнай ці публічнай з’яўляецца такая база, усе яны выконваюць адмысловыя функцыі па працы з біялагічнай інфармацыяй (пераважна функцыі пошуку, захавання і накаплення).

§3 Візуалізацыя біялагічнай інфармацыі

Бялок — гэта складаная малекула, для якой яе лінейная структура, зададзеная паслядоўнасцю амінакіслот, вызначае унікальную трохмерную фігуру. Гэтая фігура з'яўляецца адной з найважнейшых характарыстык бялка, бо цалкам адказвае за функцыі бялка і яго ўзаемадзеянне іншымі малекуламі. Гэтае ўзаемадзеянне часта заснавана на дапасаванасці фігур, гэта значыць, што ў бялкоў ёсць выпукласці і вогнутасці, якія дазваляюць ім звязвацца адзін з адным і ўтвараць складаныя структуры, такія як скура ці валасы. З гэтае прычыны такую важную ролю пры вынаходніцтве лекаў адыграе пошук малекул, чыя трохмерная форма дазволіць ім далучацца да зададзеных бялкоў ці ферментаў з мэтай замарудзіць ці паскорыць іх дзеянне.

Падчас эвалюцыі ў чалавека добра развілася засвойванне графічнай інфармацыі і распазнаванне вобразаў. Табліцы, дыяграмы і малюнкі часта суправаджаюць многія працы для прасцейшага ўсведамлення інфармацыі. У біяінфарматцы разнастайныя звесткі прадстаўлены ў абстрактнай форме, якая патрабуе далейшай візуалізацыі. Гэта асабліва запатрабавана для візуалізацыі паслядоўнасцяў і структур бялкоў, а таксама для стварэння графічных інтэрфейсаў для карыстальнікаў. Яшчэ адным накірункам з’яўляецца дапамога лікаваму аналізу, асабліва статыстычнаму. У кожнай вобласці прымянення замена тэкставай і лікавай інфармацыі графічнай мае мэтай замену чытання і далейшай лагічнай і матэматычнай інтэрпрэтацыі больш хуткім распазнаваннем вобразаў.

Асноўнай задачай тут з’яўляецца візуалізацыя трохмерных структур бялкоў, з мэтай пошуку лекаў. Візуалізацыя першаснай структуры бялка дае мала ведаў пра яго функцыі. У адрозненне ад візуалізацыі структур вышэйшых парадкаў. Так, разуменню докінгу бялкоў і параўнанню іх структур вельмі спрыяюць трохмерныя выявы гэтых малекул.

Існуе шэраг праглядальнікаў файлаў з такіх банкаў, якія канструіруюць трохмерную выяву бялка. Яны ўсе адрозніваюцца па сваіх магчымасцях і характарыстыках. Пры выбары канкрэтнага сродка трэба кіравацца прастатой выкарыстання, хуткасцю праграмы, апаратнымі патрабаваннямі, дакументацыяй і падтрымкай, а таксама коштам.

Адной з такіх праграм іх з'яўляецца Accelrys.[3] З яе дапамогай даследчык можа візуальна ацаніць структуру бялка. Праграма мае шэраг розных опцый і наладак, магчымасць маштабіравання і павароту выявы, уключэнне і выключэнне паказу зададзеных структурных элементаў, з'яўляецца бясплатнай і кросплатформавай. Наяўнасць такіх візуальных сродкаў дапамагае даследчыку ўбачыць структуру бялка і, напрыклад, параўнаць яе са структурай іншага бялка. На малюнку 1.1 прадстаўлена адна з магчымых форм візуалізацыі бялку.