Смекни!
smekni.com

«Биоинформатика: современное состояние и перспективы» (стр. 1 из 7)

БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

Выпускная работа по

«Основам информационных технологий»

Магистранта

кафедры генетики

биологического факультета

Панкратова Василия

Руководители:

член-кор. НАН Беларуси, профессор, д.б.н. Давыденко О. Г.,

старший преподаватель Шешко С.М.

Минск – 2010 г.

Оглавление

Оглавление. 2

Список обозначений ко всей выпускной работе. 3

Реферат на тему «Биоинформатика: современное состояние и перспективы». 4

Введение. 4

Глава 1. Обзор литературы.. 5

Работа с геномными и протеомными базами данных. 6

Выравнивание последовательностей. 7

Поиск генов и регуляторных элементов. 9

Моделирование пространственной структуры биомолекул. 10

Поиск лекарственных средств. 13

Молекулярная фиолгения. 13

Обработка цифровых изображений. 15

Системная биология. 16

Глава 2 Методика исследования. 18

Глава 3 Результаты и их обсуждение. 20

Поиск нуклеотидной последовательности гена ND6. 20

Подбор праймеров для амплификации гена ND6. 25

Сравнение полученной последовательности со стандартной. 27

Выявление функциональной значимости найденных замен. 28

Заключение. 32

Список литературы к реферату. 32

Предметный указатель к реферату. 33

Интернет ресурсы в биологии. 34

Ресурсы для поиска биологической информации. 34

http://www.ncbi.nlm.nih.gov/pubmed. 34

http://blast.ncbi.nlm.nih.gov/Blast.cgi 35

http://www.ncbi.nlm.nih.gov/sites/gquery. 35

http://www.mitomap.org/MITOMAP. 36

Ресурсы для работы с нуклеотидными и аминокислотными последовательностями 36

http://www.bioinformatics.org/sms2/ 36

http://expasy.org/tools/ 37

http://biotools.umassmed.edu/bioapps/primer3_www.cgi 38

Действующий личный сайт в WWW... 39

Граф научных интересов. 40

Вопросы по основам информационных технологий. 41

Вопрос по специальности. 41

Вопрос по общему курсу. 42

Презентация магистерской диссертации. 44

Список литературы к выпускной работе. 45

Приложение. 47

Список обозначений ко всей выпускной работе

БИ

Биоинформатика

ДНК

Дезоксирибонуклеиновая кислота

ПО

Программное обеспечение

ПЦР

Полимеразная цепная реакция

РНК

Рибонуклеиновая кислота

СБ

Системная биология

Реферат на тему «Биоинформатика: современное состояние и перспективы»

Введение

Бурное развитие молекулярной биологии и генетики в конце 20го – начале 21го веков привело к накоплению огромного массива экспериментальных данных, в первую очередь последовательностей ДНК, РНК и белков, цифровых биологических изображений и структур сигнальных сетей, хранение и анализ которых не возможен без применения соответствующего ПО. Хотя и раньше информационные технологии использовались биологами, например, для статистической обработки полученных данных, именно бум молекулярной биологии вызвал у специалистов-биологов потребность в специализированных инструментах для решения конкретных задач по обработке биологической информации. Как раз с этим связано возникновение БИ как самостоятельной области науки [6]. Уже сейчас большинство исследователей в области молекулярной биологии и генетики пользуются биоинформационными инструментами на этапе планирования эксперимента и обработки полученных экспериментальных данных. Более того, имеется большое количество опубликованных работ, полностью основанных на применении БИ для решения конкретных биологических проблем [7]. Вполне вероятно, что в перспективе будет возможным компьютерное моделирование биологических систем различной сложности, что позволит вывести биологию на принципиально иной уровень.

Кроме рассмотрения основных направлений развития, достижений и перспектив БИ, данной работе будет представлен конкретный пример использования биоинформатических средств в молекулярно-генетической работе. В рамках данной работы необходимо проверить, имеет ли больной Х мутацию в гене ND2, приводящую к нарушению его функции. Для достижения этой цели необходимо

1. Подобрать праймеры для амлификации и секвенирования гена ND2

2. Провести его амплификацию и секвенирование

3. Сравнить полученную последовательность со стандартной последовательностью гена ND2 человека и выявить отличия

4. Проверить, являются ли эти отличия уже описанными мутациями или полиморфизмами

5. Если найденная мутация окажется ранее не описанной, то необходимо проверить, скажется ли она на функционировании белка

На этапах 1,3,4,5 использовались те или иные биоинформатические инструменты.

Глава 1. Обзор литературы

Несмотря на непродолжительное время существования БИ, в этой сфере уже выявились конкретные направления и во многих из них уже имеются ощутимые достижения. Далее кратко будут рассмотрены основные задачи, которые могут быть решены с использованием биоинформатического подхода. К их числу относятся следующие [1,5]:

· Работа с геномными и протеомными базами данных

· Выравнивание (alighnment) нуклеотидных или аминокислотных последовательностей

· Поиск генов и различных регуляторных последовательностей в данном геноме

· Моделирование вторичной, третичной и четвертичной структур белков на основании их аминокислотной последовательностей

· Поиск функциональных доменов в молекулах белков (реакционных центров, трансмембранных доменов, сигнальных последовательностей и т.д.)

· Предсказание внутриклеточной локализации белка и характера его взаимодействия с другими белками

· Поиск лекарств

· Молекулярная филогения

· Обработка цифровых изображений

· Системная биология и моделирование биологических систем

Работа с геномными и протеомными базами данных

Первый геном бактерии был полностью секвенирован в 1995 году. С тех пор, благодаря развитию методов секвенирования ДНК, определены нуклеотидные последовательности геном многих видов живых организмов, в том числе человека, шимпанзе, нескольких видов растений, дрозофилы, пекарских дрожжей и многих бактерий.

С точки зрения БИ геном любого живого организма представляет собой последовательность длиной от 106 (бактерии) до 1011 (некоторые растения) символов (нуклеотидов), состоящую из четырех различных нуклеотидов (А, Т, Г и Ц). Очевидно, что само по себе создание геномных баз данных, в которых пользователи могли бы легко найти интересующий их участок генома конкретного организма, – это уже довольно непростая задача [6]. Тем не менее, в настоящее время существует довольно много баз данных, доступных в интернете, позволяющих работать с нуклеотидными последовательностями различных геномов. В зависимости от типа информации, хранящихся в них, все базы данных делятся на архивные, курируемые и интегрированные. В первые из них любой пользователь может добавить определенные им последовательности без какой-либо проверки их достоверности. Соответственно, такая база будет более полной, но менее достоверной. При подаче новой последовательности в курируемую базу происходит оценка достоверности как самой последовательности, так и найденных в ее составе генов и регуляторных последовательностей. Следовательно, такая база будет более надежной. Третий тип, интегрированные базы данных, такие как NCBI Entrez, предоставляют возможности поиска по многим как архивным, так и курируемым базам. Кроме того, базы можно разделить на специализированные, в которых хранятся последовательности генома только одного вида, но по этому геному представлена более подробная информация (например, есть специализированные базы данных по геномам дрозофилы, дрожжей, кишечной палочки и других организмов), и общие – в таких базах можно получить информацию о геномах многих организмов. Работа с геномными базами данных осуществляется через программы, называемыми геномными браузерами, многие из которых доступны он-лайн (например, Ensemble, UCSC Genome Browser и другие). С помощью геномного браузера можно найти участок генома с заданными координатами, ген по его названию или нуклеотидной последовательности, узнать предполагаемую или подтвержденную функцию данного участка ДНК и т.д.

Кроме геномных, существуют еще и протеомные базы данных, хотя иногда два этих типа баз могут быть объединены в один. В протеомных базах данных (наиболее известная и качественная из них – Swiss-Prot) можно найти аминокислотную последовательность белка по его названию и наоборот, вторичную, третичную и четвертичную структуру, если для данного белка они известны, и информацию о функции белка, его внутриклеточном расположении, взаимодействии с другими белками и т.д.

Выравнивание последовательностей

Следующей задачей БИ, для решения которой уже имеется большое количество эффективных программных средств, является выравнивание (в том числе и множественное) нуклеотидных или аминокислотных последовательностей [1,5,6]. Оно представляет собой запись последовательностей друг над другом таким образом, чтобы число соответствий было максимальным. При этом необходимо учитывать, что гомологичные («родственные») последовательности могут отличаться друг от друга в результате замены одного нуклеотида (аминокислоты) на другой или вставки/выпадения нуклеотида или аминокислоты. Решение этой задачи требуется в следующих случаях: для поиска нуклеотидной (аминокислотной) последовательности в геномной (протеомной) базе данных, сравнение двух или нескольких соответствующих последовательностей (при филогенетическом анализе, поиске эволюционно консервативных участков и предсказании функций генов и белков).