Смекни!
smekni.com

Продукты рекомбинации: характеристика и манипулирование (стр. 3 из 11)

Комбинируя клонирование в М13 и секвенирование с помощью дидезокситерминатора, мы можем получить эффективный способ определения последовательностей молекул ДНК, длина которых достигает нескольких тысяч пар нуклеотидов. Для секвенирования длинных дуплексных молекул их разрезают механически на фрагменты и затем проводят клонирование. Каждая образующаяся бляшка содержит определенные фрагменты или цепи. Случайно отбирая клоны, определяют последовательность вставок. Поскольку вставки образуются в результате разрыва исходной молекулы ДНК в случайных местах, некоторые фрагменты содержат перекрывающиеся последовательности. С помощью компьютера сравнивают последовательность каждого фрагмента с последовательностями других фрагментов, выявляют перекрывающиеся области и располагают отдельные фрагменты в определенном порядке. Таким способом были определены последовательности митохондриальной ДНК человека и ДНК Х-фага.

Другое применение методов секвенирования. Секвенирование с помощью дидезокситерминаторов может применяться для прямого определения последовательностей РНК или ДНК, причем даже в том случае, если в смеси помимо секвенируемой цепи присутствуют неродственные молекулы. Важным элементом при этом является праймер, комплементарный небольшому интересующему нас участку и лишь с малой вероятностью ассоциирующий с другими молекулами, присутствующими в смеси. Подобной специфичностью обычно обладает праймер длиной 20 оснований с уникальной последовательностью. При таких условиях с помощью обратной транскриптазы синтезируют кДНК. Этот метод применим только в том случае, если мы уже достаточно много знаем об интересующих нас РНК или ДНК, но круг таких систем все время расширяется.

Метод химического секвенирования может применяться для анализа специфических последовательностей ДНК, присутствующих в смеси наряду с большим числом разных молекул ДНК, в том числе даже если речь идет об одном гене в суммарной геномной ДНК млекопитающих. Прежде всего ДНК разрезают с помощью рестриктирующей эндонуклеазы, так что интересующий нас сегмент оказывается во фрагменте длиной в несколько сотен пар оснований. Затем проводят химические реакции, специфичные к определенным основаниям, в результате чего образуются четыре набора фрагментов. Такие наборы включают все возможные по длине фрагменты с интересующей нас областью, начинающиеся в сайте рестрикции, по которому была разрезана ДНК. Здесь же присутствует множество других фрагментов из остальной части генома. Фрагменты разделяют путем электрофореза в секвенирующем геле, затем переносят на нейлоновый фильтр и отжигают с 32Р-меченным зондом, который комплементарен последовательности-мишени, находящейся вблизи одного из сайтов разрезания. Зонд ассоциирует со всеми фрагментами, образовавшимися начиная с одного конца последовательности-мишени, в результате чего на радиоавтограмме образуется типичная "секвенирующая лестница". Таким методом можно определить, например, нуклеотидную последовательность мутантных форм ранее клонированного гена. Он может использоваться также для определения характера метилирования специфической, уже клонированной области генома, поскольку гидразин реагирует с 5'-метилцитозиновыми остатками менее эффективно, чем с цитозиновыми и тиминовыми. О наличии 5'-метилцитозина в геле можно судить по отсутствию цитозинового остатка, представленного в соответствующем фрагменте ДНК, выделенном после клонирования и репликации в клетках Е. coli.

Компьютерный анализ нуклеотидных последовательностей ДНК

Простота разделения сегментов ДНК путем клонирования и их последующий анализ позволили определить нуклеотидную последовательность многих ДНК. Но хотя стремление биологов к получению точных в химическом отношении данных продолжало стимулировать эти исследования, информация оказывалась бесполезной, если не были выявлены какие-то особенности этих последовательностей. На первый взгляд длинные ряды оснований кажутся совершенно загадочными и не поддающимися расшифровке. К счастью, проблему расшифровки можно решить с помощью высокоэффективных компьютерных программ и для рутинного использования имеются программы на нескольких стандартных компьютерных языках. Возможности различных программ в значительной степени перекрываются. Их можно использовать при работе как на больших компьютерах, так и на мини - и микрокомпьютерах. Вообще говоря, эти программы пригодны для поиска как структурных, так и биологических особенностей последовательностей.

а. Хранение информации о первичной структуре

Для ввода и хранения данных о последовательностях и последующего поиска, проводимого исследователем вручную или с помощью специальной аналитической программы, используются стандартные процедуры редактирования. Большинство этих процедур предусматривают также возможность коррекции хранящейся информации. Ввод данных часто осуществляют путем типирования последовательности в компьютерном терминале после прочтения и регистрации данных секвенирующего геля. Однако имеются также программы для прямого ввода исходных данных. В принципе такие программы позволяют свести к минимуму ошибки, допускаемые при неправильном считывании гелей или неточной регистрации данных. Существует два подхода к такой автоматизации. В первом случае детектор автоматически сканирует радиоавтографы и передает данные непосредственно в компьютер. Во втором данные автоматически регистрируются от сенсора, управляемого вручную. При втором подходе исследователь является арбитром при любых затруднениях.

б. Структурный анализ

Первичная структура. Если имеются данные о нуклеотидной последовательности одной цепи, то большинство программ позволяют построить комплементарную цепь, вычислить нуклеотидный состав, выявить участки, богатые пуринами, пиримидинами или определенными сочетаниями оснований, и определить частоту встречаемости различных динуклеотидов. Могут быть выявлены специфические субпоследовательности в пределах определенного сегмента, что часто используется для нахождения сайтов для рестриктирующих эндонуклеаз. В программу введена информация о сайтах узнавания для известных ферментов, и по одной команде выдаются сведения о положении этих сайтов для каждого из ферментов, числе ожидаемых фрагментов, образующихся при расщеплении ими ДНК, размере каждого фрагмента в парах оснований и его процентном отношении к общей длине сегмента, а также о нуклеотидных остатках, соответствующих концам каждого фрагмента. Существуют также программы, которые могут предсказать, какие продукты будут получены при совместном действии двух или нескольких эндонуклеаз. При этом предсказания делаются как для линейных, так и для кольцевых молекул. Полученная информация может использоваться для подтверждения данных секвенирования путем сравнительного анализа ожидаемого и реального результатов действия эндонуклеаз.

Имеющиеся программы осуществляют также поиск характерных особенностей последовательностей, включая прямые и обратные повторы. Выявляются не только полностью совпадающие сегменты, но и сегменты с той или иной степенью несовпадения; для этого допускаются определенные отклонения параметров, заложенных в программу, от фиксированного значения. В примере перечислены все повторы длиной не менее шести пар оснований и гомологичные не менее чем на 75%. Предполагается, что максимальный размер образующихся петель равен двум основаниям.

Можно получить данные о гомологии или частичной гомологии различных последовательностей. Эти данные могут касаться структуры одного и того же гена у двух разных организмов или родственных генов одного организма. Такой сравнительный анализ широко используется при изучении эволюции на молекулярном уровне. Для сравнения двух последовательностей между собой или одной последовательности с группой других последовательностей разработаны специальные алгоритмы. Может использоваться описанный ранее вероятностный анализ. По результатам сравнения информации о последовательностях, полученной в разных лабораториях, был создан центральный банк данных, из которого всегда можно затребовать информацию о тех или иных последовательностях. К 1989 г. в банках имелась информация о последовательностях более 20 миллионов пар оснований, представляющая данные о многих генах и организмах.

Помимо этого общего применения, обнаружение сходства различных последовательностей является составной частью секвенирования очень длинных последовательностей с помощью дидезокси-метода, объединенного с клонированием в фаге М13. Используя компьютер для обнаружения перекрывающихся последовательностей, мы не только делаем работу менее утомительной, но и можем быстро решить, следует ли нам пытаться получить дополнительные данные.

Вторичная структура. Разработаны программы, позволяющие предсказать стабильную внутримолекулярную вторичную структуру одноцепочечных РНК или ДНК. Они позволяют, например, построить модель укладки цепи тРНК и рРНК, и многие из таких моделей получили экспериментальное подтверждение в опытах с использованием нуклеаз, специфичных к одноцепочечным участкам. Расчеты основаны на предположениях о вероятности образования определенных пар оснований, на термодинамических свойствах разных пар оснований и данных о стабильности спирали.

в. Биологическое значение

С помощью компьютерных программ можно перевести информацию с языка нуклеотидов на язык аминокислот в соответствии с правилами генетического кода. При этом указываются все три возможные рамки считывания и стоп-кодоны трансляции. В тех случаях, когда аминокислотная последовательность кодируемого полипептида известна, идентифицировать правильную рамку считывания не составляет труда. В противном случае правильную рамку можно выбрать, исходя из ее длины. Рамки, в которых часто встречаются стоп-кодоны, вряд ли могут считаться правильными. Показаны часть генома SV40, кодирующая участок вблизи г\ГИ2-конца малого и большого Т-антигенов, и полученные с помощью компьютера аминокислотные последовательности для всех трех рамок считывания. Правильной является третья рамка. Можно также рассчитать частоту, с которой встречается каждый кодон, и таким образом выявить предпочтительные кодоны для определенных аминокислот. Обращение этой процедуры позволяет воссоздать возможные нуклеотидные последовательности, исходя из известной аминокислотной последовательности полипептида, хотя эта задача не имеет однозначного решения вследствие вырожденности генетического кода. Центральный банк данных содержит информацию об аминокислотных последовательностях всех проанализированных полипептидов, что позволяет сравнивать последовательности изучаемого и известных белков.