Смекни!
smekni.com

работа студентки 2-го курса (стр. 1 из 6)

Московский Государственный Университет им. М.В. Ломоносова

Факультет Биоинженерии и Биоинформатики

Компьютерный анализ регулона, отвечающего за биосинтез триптофана, в геномах архей

Курсовая работа студентки 2-го курса

Гарушянц С.

Тьюторы: Равчеев Д.А., Герасимова А.В.

Супервайзер: д.б.н. проф. Гельфанд М.С.

Москва, 2004

Введение

Археи представляют собой третью ветвь органического мира, отличную от эукариот и эубактерий. Расхождение архей и эукариот произошло, по всей видимости, уже после отделения эубактерий. Такие представления о возникновении данной группы связаны с тем, что по общему строению клетки, центральному метаболизму и строению транспортных систем они ближе к прокариотам, тогда как транскрипция и трансляция построены по эукариотическому типу. Так, строение РНК-полимеразы скорее напоминает эукариотическое, и, кроме того, для архебактерий показан процессинг мРНК, ранее известный только для эукариотических организмов. Некоторые особенности есть и в строении рибосом: по составу входящих в них рРНК и белков, они имеют типично бактериальное строение, но по форме скорее напоминают эукариотические (Bell and Jackson, 1998). Несмотря на то, что археи представляют собой уникальный источник биологического разнообразия, данная группа является намного менее изученной, чем бактерии и эукариоты. Это связано как с недавним ее открытием, так и с различными трудностями, возникающими при экспериментальном изучении архебактерий. К настоящему времени подробно изучены лишь механизмы метаногенеза, тогда как общий метаболизм практически не исследован.

Исследования архей биоинформатическими методами также ограничены лишь несколькими работами, например, предсказанием гена для шикимат-киназы, фермента, задействованного в синтезе ароматических соединений (Daugherty et al., 2001). В другой работе (Gelfand et al., 2000) был проведен анализ некоторых регуляторных систем архей методами сравнительной геномики. Так, была изучена регуляция теплового шока, фиксации азота и синтеза триптофана, пуриновых нуклеотидов. В связи с ростом числа полных геномных последовательностей, было решено провести дальнейшее исследование синтеза триптофана в различных архебактериях.

Регуляция синтеза триптофана ранее была подробно изучена у гамма-протеобактерий и в грам-положительных бактериях (Panina et al., 2001; Panina et al.,2003).

В случае гамма-протеобактерий была показана регуляция данного метаболического пути на нескольких уровнях. Регуляторная система включает два регулятора транскрипции, TyrR и TrpR, аттенюационные механизмы и аллостерическую регуляцию по принципу обратной связи. У грам-положительных бактерий наряду с регуляцией транскрипции присутствует также регуляция по типу аттенюации: за счет РНК-связывающего белка TRAP, а также за счет специфической последовательности в лидерной области мРНК, так называемого Т-бокса.

Описанные статьи представляют интерес, поскольку путь синтеза триптофана (Рис. 1) практически не отличается у бактерий и архей, и в нем участвуют гомологичные белки.

Как уже говорилось, предпринимались попытки изучения регуляции синтеза триптофана и в архебактериях. Так, в геноме Methanobacter thermautotrophicus в регуляторных областях генов синтеза триптофана были обнаружены довольно консервативные потенциальные сигналы (Gelfand et al., 2000). Сигнал в данном случае представляет собой тандемный повтор, единицей которого является палиндром длиной 6 нуклеотидов с консенсусом TGTACA. Расстояние между палиндромными последовательностями в пределах одного сайта составляет от 3 до 5 нуклеотидов.

Сайты такого вида были найдены перед всеми оперонами, кодирующими синтез триптофана из общего предшественника всех ароматических аминокислот – хоризмата (Рис.1). К таковым относятся опероны MTH1476 и MTH1655-61. Сайты были обнаружены также в регуляторных областях генов, ответственных за синтез общего предшественника всех ароматических аминокислот – хоризмата, и взаимопревращения хоризмата и префената (см. Табл.1). Префенат представляет собой предшественник двух других ароматических аминокислот – тирозина и триптофана. Таким образом, данная регуляторная система контролирует не только синтез триптофана, но и соотношение всех трех ароматических аминокислот.

Потенциальный сайт был также обнаружен перед геном MTH1654, образующим дивергон с опероном MTH1655-61. Анализ аминокислотной последовательности продукта этого гена, а также его ортологов из геномов Archaeoglobus fulgidus и Pyrococcus horikoshii показал, что данный белок является фактором транскрипции. Расположение данного гена в одном локусе с генами синтеза триптофана и присутствие перед ним регуляторного сайта говорит о том, что, скорее всего, именно этот белок и является регулятором синтеза триптофана.

Рис. 1. Путь синтеза триптофана у архей. Около стрелок указаны тривиальные названия генов.

Табл. 1. Названия генов и функции белков, входящих в регулон синтеза триптофана у Methanobacter thermautotrophicus

Функция Название соответствующего гена Тривиальное название гена
Предполагаемый репрессор синтеза триптофана

MTH1654

Хоризмат синтаза

MTH748

aroC

Хоризмат мутаза, субъединица А

MTH804

pheA

Триптофан синтаза, субъединица бета гомолог

MTH1476

trpB-1

Хоризмат мутаза, субъединица А

MTH1640

tyrA

Антанилат синтаза компонент I

MTH1655

trpE

Антанилат синтаза, компонент II

MTH1656

trpG

Индол-3-глицерол фосфат синтаза

MTH1657

trpC

5’-фосфорибозил антанилат изомераза

MTH1658

trpF

Триптофан синтаза, бета субъединица

MTH1659

trpB-2

Триптофан синтаза, альфа субъединица

MTH1660

trpA

Антанилат фосфорибозилтрансфераза

MTH1661

trpD

Цели и задачи

Как уже упоминалось ранее, целью данной работы было изучение регуляции синтеза триптофана в различных группах архебактерий. Данная задача интересна с точки зрения молекулярной эволюции, поскольку имеется возможность проследить изменения, как в составе метаболического пути, так и в строении регуляторных систем.

Для этого нами были поставлены следующие задачи: поиск ортологов регуляторного белка, поиск ортологов белков-ферментов метаболического пути, выявление неортологичных замен, поиск новых регуляторных сигналов, изучение структуры регулона.

Материалы и методы

Нами было исследовано 12 геномов архей, принадлежащих к различным группам:
Methanobacter thermautotrophicus delta H (Smith et al., 1997), Methanosarcina acetivorans C2A (Galagan et al., 2002), Methanosarcina mazei (Deppenmeier et al., 2002), Pyrococcus abyssi GE5 (Cohen et al., 2003), Pyrococcus furiosus DSM 3638 (Maeder et al., 2002), Pyrococcus horikoshii OT3 (Kawarabayasi et al., 1998), Archaeoglobus fulgidus DSM 4304 (Klenk et al., 1997), Halobacterium salinarum NRC-1 (Ng et al., 2000), Thermoplasma acidophilum DSM 1728 (Ruepp et al., 2000) и Thermoplasma volcanium GSS1 (Kawashima et al., 2000), а также неполные геномы Methanosarcina barkeri str. fusaro, Methanococcoides burtonii DSM 6242 и Ferroplasma acidarmanus. Все последовательности геномов были взяты из базы данных GenBank (http://www.ncbi.nlm.nih.gov/)

Для поиска интересующих нас регуляторных сайтов использовался метод «проверки соответствия» (“consistency check”). Суть данного метода заключается в том, что исследуется сохранение сайта перед ортологичными генами в родственных геномах. Если сайт сохраняется, то данные гены с большой вероятностью находятся под регуляцией. Если же сайт не сохраняется, то, скорее всего, данный сигнал является ложным (так называемое «перепредсказание»). Благодаря данному методу можно предсказывать регуляцию, даже имея недостаточно специфичное распознающее правило (Mironov et al., 2000).

Для поиска потенциальных сайтов в геномных последовательностях нами использовался метод позиционных весовых матриц (Gelfand et al., 2000).

В этом методе, на основании набора известных сайтов, используя множественное выравнивание, рассчитывается вес каждого нуклеотида в каждой позиции по формуле:

W(b,k)= log[N(b,k)+0,5]-0,25 Si log[N(i,k)+0,5],

где: i - все нуклеотиды, N(b,k) – число появлений нуклеотида b в позиции k.

Вес сайта представляет в данном случае сумму весов всех его позиций.

У данного метода есть несколько преимуществ. Во-первых, учитывается разная значимость различных позиций сайта, что является следствием специфичности ДНК-белковых взаимодействий. Во-вторых, учитывается возможность замен одного нуклеотида на другой в определенной позиции и вероятность таких замен.

Для поиска ортологичных генов и потенциальных регуляторных сайтов в геномных последовательностях был использован пакет программ GenomeExplorer (Миронов и др., 2000).

Для построения матриц для поиска сайтов использовалась программа SignalX (Миронов и др., 2000).

Для построения множественных выравниваний и филогенетических деревьев была использована программа ClustalX (Thomson et al., 1997).

Для визуализации деревьев использовалась программа GeneMaster (Миронов А. А., неопубликованное).

Для поиска гомологов известных белков в других геномах была использована программа BLAST (Altschul et al., 1997) (http://www.ncbi.nlm.nih.gov/BLAST/).

Для построения диаграмм лого регуляторного сайта использовалась программа WebLogo (Crooks, 2004).