Что такое генетический код в информатике. Генетический код: описание, характеристики, история исследования

Веществами, ответственными за хранение и передачу генетической информации, являются нуклеиновые кислоты (ДНК и РНК).

Все функции клеток и организма в целом определяются набором белков , обеспечивающих

    образование клеточных структур,

    синтез всех других веществ (углеводов, жиров, нуклеиновых кислот),

    протекание процессов жизнедеятельности.

В геноме содержится информация о последовательности аминокислот во всех белках организма. Именно эта информация и называется генетической информацией .

За счёт регуляции генов регулируется время синтеза белков, их количество, место нахождения в клетке или в организме в целом. Во многом за это отвечают регуляторные участки ДНК, усиливающие и ослабляющие экспрессию генов в ответ на те или иные сигналы.

Информация о белке может быть записана в нуклеиновой кислоте только одним способом - в виде последовательности нуклеотидов. ДНК построена из 4 видов нуклеотидов (А, Т, Г, Ц), а белки - из 20 видов аминокислот. Таким образом, возникает проблема перевода четырёхбуквенной записи информации в ДНК в двадцатибуквенную запись белков. Соотношения, на основе которых осуществляется такой перевод, называются генетическим кодом.

Первым проблему генетического кода теоретически рассмотрел выдающийся физик Георгий Гамов. Генетический код обладает определённым набором свойств, которые будут рассмотрены ниже.

почему необходим генетический код?

Ранее мы говорили о том, что все реакции в живых организмах осуществляются под действием ферментов, и именно способность ферментов сопрягать реакции даёт возможность клеткам синтезировать биополимеры за счёт энергии гидролиза АТФ. В случае простых линейных гомополимеров, то есть полимеров, состоящих из одинаковых единиц, для такого синтеза достаточно одного фермента. Для синтеза полимера, состоящего из двух чередующихся мономеров, необходимо два фермента, трёх - три и т. д. Если полимер разветвлён, необходимы дополнительные ферменты, образующие связи в точках ветвления. Таким образом, при синтезе некоторых сложных полимеров участвует более десяти ферментов, каждый из которых отвечает за присоединение определённого мономера в определённом месте и определённой связью.

Однако при синтезе нерегулярных гетерополимеров (то есть полимеров без повторяющихся участков) с уникальной структурой, таких как белки и нуклеиновые кислоты, такой подход в принципе невозможен. Фермент может присоединить определённую аминокислоту, но не может определить, в каком месте полипептидной цепи её надо поставить. В этом и состоит основная проблема биосинтеза белков, решение которой невозможно при использовании обычного ферментативного аппарата. Необходим дополнительный механизм, использующий некий источник информации о порядке аминокислот в цепи.

Для решения этой проблемы Кольцов предложил матричный механизм синтеза белков . Он считал, что молекула белка является основой, матрицей для синтеза таких же молекул, т. е. против каждого аминокислотного остатка в полипептидной цепи ставится такая же аминокислота в синтезируемой новой молекуле. Эта гипотеза отражала уровень знания той эпохи, когда все функции живого связывались с определёнными белками.

Однако позднее выяснилось, что веществом, хранящим генетическую информацию, являются нуклеиновые кислоты.

СВОЙСТВА ГЕНЕТИЧЕСКОГО КОДА

КОЛЛИНЕАРНОСТЬ (линейность)

Сначала мы рассмотрим, как в последовательности нуклеотидов записана последовательность аминокислот в белках. Логично предположить, что, поскольку последовательности нуклеотидов и аминокислот линейны, то между ними существует линейное соответствие, т. е. расположенным рядом нуклеотидам в ДНК соответствуют расположенные рядом аминокислоты в полипептиде. На это же указывает линейный характер генетических карт. Доказательством такого линейного соответствия, или коллинеарности, является совпадение линейного расположения мутаций на генетической карте и аминокислотных замен в белках мутантных организмов.

триплетность

При рассмотрении свойств кода реже всего встает вопрос о кодовом числе. Необходимо закодировать 20 аминокислот четырьмя нуклеотидами. Очевидно, что 1 нуклеотид не может кодировать 1 аминокислоту, т. к. тогда было бы возможно закодировать только 4 аминокислоты. Для того чтобы закодировать 20 аминокислот, нужны комбинации из нескольких нуклеотидов. Если взять комбинации из двух нуклеотидов, то мы получим 16 различных комбинаций ($4^2$ = 16). Этого недостаточно. Комбинаций из трёх нуклеотидов будет уже 64 ($4 ^3$ = 64), т. е. даже больше, чем нужно. Понятно, что комбинации из большего числа нуклеотидов тоже могли бы быть использованы, но из соображений простоты и экономии они маловероятны, т. е. код триплетный.

вырожденность и однозначность

В случае 64 комбинаций возникает вопрос, все ли комбинации кодируют аминокислоты или каждой аминокислоте соответствует только один триплет нуклеотидов. Во втором случае большая часть триплетов была бы бессмысленной, а замены нуклеотидов в результате мутаций в двух третях случаев приводили бы к потере белка. Это не соответствовует наблюдаемым частотам потери белка при мутациях, что указывает на использование всех или почти всех триплетов. В дальнейшем было выяснено, что существуют три триплета, не кодирующие аминокислот . Они служат для того, чтобы обозначать конец полипептидной цепочки. Их называют стоп-кодонами. 61 триплет кодирует различные аминокислоты, т. е. одна аминокислота может кодироваться несколькими триплетами. Это свойство генетического кода называется вырожденностью. Вырожденность имеет место только в направлении от аминокислот к нуклеотидам, в обратном направлении код однозначен, т.е. каждый триплет кодирует одну определённую аминокислоту.

знаки препинания

Важный вопрос, решить который теоретически оказалось невозможным, каким образом триплеты, кодирующие соседние аминокислоты, отделяются друг от друга, т. е. есть ли в генетическом тексте знаки препинания.

Отсутствие запятых - эксперименты

Остроумные эксперименты Крика и Бреннера позволили узнать, есть ли «запятые» в генетических текстах. В ходе этих экспериментов учёные при помощи мутагенных веществ (акридиновых красителей) вызывали возникновение определённого типа мутаций - выпадения или вставки 1 нуклеотида. Оказалось, что выпадение или вставка 1 или 2 нуклеотидов всегда вызывает поломку кодируемого белка, а вот выпадение или вставка 3 нуклеотидов (или числа, кратного 3) практически не сказывается на функции кодируемого белка.

Представим себе, что у нас имеется генетический текст, построенный из повторяющейся тройки нуклеотидов АВС (рис. 1, а). В случае, если знаков препинания нет, вставка одного дополнительного нуклеотида приведёт к полному искажению текста (рис. 1, а). Были получены мутации бактериофага, расположенные на генетической карте близко друг от друга. При скрещивании двух фагов, несущих такие мутации, возникал гибрид, несущий две однобуквенные вставки (рис. 1, б). Понятно, что смысл текста терялся и в этом случае. Если же ввести ещё одну однобуквенную вставку, то после короткого неправильного участка смысл восстановится и есть шанс получить функционирующий белок (рис. 1, в). Это верно для триплетного кода при отсутствии знаков препинания. Если кодовое число другое, то и количество необходимых для восстановления смысла вставок будет другим. Если же в коде есть знаки препинания, то вставка нарушит чтение только одного триплета, а весь остальной белок будет синтезироваться правильно и сохранит активность. Эксперименты показали, что однобуквенные вставки всегда приводят к исчезновению белка, а восстановление функции происходит, когда число вставок кратно 3. Таким образом была доказана триплетность генетического кода и отсутствие внутренних знаков препинания.

неперекрываемость

Гамов предположил, что код перекрывающийся, т. е. первый, второй и третий нуклеотиды кодируют первую аминокислоту, второй, третий и четвёртый - вторую аминокислоту, третий, четвёртый и пятый - третью и т. д. Такая гипотеза создавала видимость решения пространственных затруднений, но создавала другую проблему. При таком кодировании за данной аминокислотой не могла идти любая другая, так как в кодирующем её триплете два первых нуклеотида уже были определены, и число возможных триплетов снижалось до четырёх. Анализ последовательностей аминокислот в белках показал, что встречаются все возможные пары соседних аминокислот, т. е. код должен быть неперекрывающимся.

универсальность

расшифровка кода

Когда основные свойства генетического кода были изучены, начались работы по его расшифровке и были определены значения всех триплетов (см. рис.). Триплет, кодирующий определённую аминокислоту, получил название кодона. Как правило, указываются кодоны в мРНК, иногда - в смысловой цепи ДНК (те же кодоны, но с заменой У на Т). Для некоторых аминокислот, например, метионина, существует только один кодон. Другие имеют по два кодона (фенилаланин, тирозин). Есть аминокислоты, которые кодируются тремя, четырьмя и даже шестью кодонами. Кодоны одной аминокислоты похожи друг на друга и, как правило, отличаются одним последним нуклеотидом. Это делает генетический код более устойчивым, так как замена последнего нуклеотида в кодоне при мутациях не ведёт к замене аминокислоты в белке. Знание генетического кода позволяет нам, зная последовательность нуклеотидов в гене, выводить последовательность аминокислот в белке, что широко используется в современных исследованиях.

Министерство образования и науки Российской Федерации Федеральное агентство по образованию

Государственное образовательное учреждение высшего профессионального образования "Алтайский государственный технический университет им. И.И. Ползунова"

Кафедра "Естествознания и системного анализа"

Реферат по теме "Генетический код"

1. Понятие генетического кода

3. Генетическая информация

Список литературы


1. Понятие генетического кода

Генетический код - свойственная живым организмам единая система записи наследственной информации в молекулах нуклеиновых кислот в виде последовательности нуклеотидов. Каждый нуклеотид обозначается заглавной буквой, с которой начинается название азотистого основания, входящего в его состав: - А (A) аденин; - Г (G) гуанин; - Ц (C) цитозин; - Т (T) тимин (в ДНК) или У (U) урацил (в мРНК).

Реализация генетического кода в клетке происходит в два этапа: транскрипцию и трансляцию.

Первый из них протекает в ядре; он заключается в синтезе молекул и-РНК на соответствующих участках ДНК. При этом последовательность нуклеотидов ДНК "переписывается" в нуклеотидную последовательность РНК. Второй этап протекает в цитоплазме, на рибосомах; при этом последовательность нуклеотидов и-РНК переводится в последовательность аминокислот в белке: этот этап протекает при участии транспортной РНК (т-РНК) и соответствующих ферментов.

2. Свойства генетического кода

1. Триплетность

Каждая аминокислота кодируется последовательностью из 3-х нуклеотидов.

Триплет или кодон - последовательность из трех нуклеотидов, кодирующая одну аминокислоту.


Код не может быть моноплетным, поскольку 4 (число разных нуклеотидов в ДНК) меньше 20. Код не может быть дуплетным, т.к. 16 (число сочетаний и перестановок из 4-х нуклеотидов по 2) меньше 20. Код может быть триплетным, т.к. 64 (число сочетаний и перестановок из 4-х по 3) больше 20.

2. Вырожденность.

Все аминокислоты, за исключением метионина и триптофана, кодируются более чем одним триплетом: 2 аминокислоты по 1 триплету = 2 9 аминокислот по 2 триплета = 18 1 аминокислота 3 триплета = 3 5 аминокислот по 4 триплета = 20 3 аминокислоты по 6 триплетов = 18 Всего 61 триплет кодирует 20 аминокислот.

3. Наличие межгенных знаков препинания.

Ген- это участок ДНК, кодирующий одну полипептидную цепь или одну молекулу tРНК, rРНК или sРНК.

Гены tРНК, rРНК, sРНК белки не кодируют.

В конце каждого гена, кодирующего полипептид, находится, по меньшей мере, один из 3-х терминирующих кодонов, или стоп-сигналов: UAA, UAG, UGA. Они терминируют трансляцию.

Условно к знакам препинания относится и кодон AUG - первый после лидерной последовательности. Он выполняет функцию заглавной буквы. В этой позиции он кодирует формилметионин (у прокариот).

4. Однозначность.

Каждый триплет кодирует лишь одну аминокислоту или является терминатором трансляции.

Исключение составляет кодон AUG. У прокариот в первой позиции (заглавная буква) он кодирует формилметионин, а в любой другой - метионин.

5. Компактность, или отсутствие внутригенных знаков препинания.

Внутри гена каждый нуклеотид входит в состав значащего кодона.

В 1961г. Сеймур Бензер и Френсис Крик экспериментально доказали триплетность кода и его компактость.

Суть эксперимента: "+" мутация - вставка одного нуклеотида. "-" мутация - выпадение одного нуклеотида. Одиночная "+" или "-" мутация в начале гена портит весь ген. Двойная "+" или "-" мутация тоже портит весь ген. Тройная "+" или "-" мутация в начале гена портит лишь его часть. Четверная "+" или "-" мутация опять портит весь ген.

Эксперимент доказывает, что код триплетен и внутри гена нет знаков препинания. Эксперимент был проведен на двух рядом расположенных фаговых генах и показал, кроме того, наличие знаков препинания между генами.

3. Генетическая информация

Генетическая информация - программа свойств организма, получаемая от предков и заложенная в наследственных структурах в виде генетического кода.

Предполагается, что становление генетической информации шло по схеме: геохимические процессы - минералообразование - эволюционный катализ ( автокатализ).

Возможно, что первые примитивные гены представляли собой микрокристаллические кристаллы глины, причем каждый новый слой глины выстраивается в соответствии с особенностями строения предыдущего, как бы получая от него информацию о строении.

Реализация генетической информации происходит в процессе синтеза белковых молекул с помощью трех РНК: информационной (иРНК), транспортной (тРНК) и рибосомальной (рРНК). Процесс передачи информации идет: - по каналу прямой связи: ДНК - РНК - белок; и - по каналу обратной связи: среда - белок - ДНК.

Живые организмы способны получать, сохранять и передавать информацию. Причем живым организмам присуще стремление полученную информацию о себе и окружающем мире использовать максимально эффективно. Наследственная информация, заложенная в генах и необходимая живому организму для существования, развития и размножения передается от каждого индивида его потомкам. Эта информация определяет направление развития организма, и в процессе взаимодействия его с окружающей средой реакция на ее индивида может искажаться, обеспечивая тем самым эволюцию развития потомков. В процессе эволюции живого организма возникает и запоминается новая информация, в том числе для него возрастает ценность информации.

В ходе реализации наследственной информации в определенных условиях внешней среды формируется фенотип организмов данного биологического вида.

Генетическая информация определяет морфологическое строение, рост, развитие, обмен веществ, психический склад, предрасположенность к заболеваниям и генетические пороки организма.

Многие ученые, справедливо подчеркивая роль информации в становлении и эволюции живого, отмечали это обстоятельство в качестве одного из главных критериев жизни. Так, В.И. Карагодин считает: "Живое есть такая форма существования информации и кодируемых ею структур, которая обеспечивает воспроизведение этой информации в подходящих условиях внешней среды". Связь информации с жизнью отмечает и А.А. Ляпунов: "Жизнь - это высокоупорядоченное состояние вещества, использующее для выработки сохраняющихся реакций информацию, кодируемую состояниями отдельных молекул". Известный наш астрофизик Н.С. Кардашев также подчеркивает информационную составляющую жизни: "Жизнь возникает благодаря возможности синтеза особого рода молекул, способных запоминать и использовать вначале самую простую информацию об окружающей среде и собственной структуре, которую они используют для самосохранения, для воспроизводства и, что для нас особенно важно, получения еще большего количества информации". На эту способность живых организмов сохранять и передавать информацию обращает внимание в своей книге "Физика бессмертия" эколог С.С. Четверикова по популяционной генетике, в которых было показано, что отбору подвергаются не отдельные признаки и особи, а генотип всей популяции, но осуществляется он через фенотипические признаки отдельных особей. Это приводит к распространению полезных изменений во всей популяции. Таким образом, механизм эволюции реализуется как через случайные мутации на генетическом уровне, так и через наследование наиболее ценных признаков (ценности информации!), определяющих адаптацию мутационных признаков к окружающей среде, обеспечивая наиболее жизнеспособное потомство.

Сезонные изменения климата, различных природные или техногенные катастрофы с одной стороны, приводят к изменению частоты повторяемости генов в популяциях и, как следствие, к снижению наследственной изменчивости. Этот процесс иногда называют дрейфом генов. А с другой - к изменениям концентрации различных мутаций и уменьшению разнообразия генотипов, содержащихся в популяции, что может привести к изменениям направленности и интенсивности действия отбора.


4. Расшифровка генетического кода человека

В мае 2006 года учёные, работающие над расшифровкой генома человека, опубликовали полную генетическую карту хромосомы 1, которая была последней из не полностью секвенсированной хромосомой человека.

Предварительная генетическая карта человека была опубликована в 2003 году, что ознаменовало формальное завершение проекта Human Genome. В его рамках были секвенсированы фрагменты генома, содержащие 99% генов человека. Точность идентификации генов составила 99,99%. Однако на момент завершения проекта полностью секвенсированы были лишь четыре из 24 хромосом. Дело в том, что помимо генов хромосомы содержат фрагменты, не кодирующие никаких признаков и не участвующие в синтезе белков. Роль, которые эти фрагменты играют в жизни организма пока остается неизвестной, но все больше исследователей склоняются к мнению, что их изучение требует самого пристального внимания.

— это свойственный всем живым организмам способ кодирования аминокислотной последовательности белков при помощи последовательности нуклеотидов в молекуле ДНК.

Реализация генетической информации в живых клетках (то есть синтез белка, закодированного в ДНК) осуществляется при помощи двух матричных процессов: транскрипции (то есть синтеза иРНК на матрице ДНК) и трансляции (синтез полипептидной цепи на матрице иРНК).

В ДНК используется четыре нуклеотида — аденин (А), гуанин (Г), цитозин (Ц), тимин (T). Эти «буквы» составляют алфавит генетического кода. В РНК используются те же нуклеотиды, за исключением тимина, который заменен урацилом (У). В молекулах ДНК и РНК нуклеотиды выстраиваются в цепочки и, таким образом, получаются последовательности «букв».

В нуклеотидной последовательности ДНК имеются кодовые «слова» для каждой аминокислоты будущей молекулы белка — генетический код. Он заключается в определенной последовательности расположения нуклеотидов в молекуле ДНК.

Три стоящих подряд нуклеотида кодируют «имя» одной аминокислоты, то есть каждая из 20 аминокислот зашифрована значащей единицей кода — сочетанием из трех нуклеотидов, называемых триплет или кодон.

В настоящее время код ДНК полностью расшифрован, и мы можем говорить об определенных свойствах, характерных для этой уникальной биологической системы, обеспечивающей перевод информации с «языка» ДНК на «язык» белка.

Носителем генетической информации является ДНК, но так как непосредственное участие в синтезе белка принимает иРНК — копия одной из нитей ДНК, то чаще всего генетический код записывают на "языке РНК".

Аминокислота Кодирующие триплеты РНК
Аланин ГЦУ ГЦЦ ГЦА ГЦГ
Аргинин ЦГУ ЦГЦ ЦГА ЦГГ АГА АГГ
Аспарагин ААУ ААЦ
Аспарагиновая кислота ГАУ ГАЦ
Валин ГУУ ГУЦ ГУА ГУГ
Гистидин ЦАУ ЦАЦ
Глицин ГГУ ГГЦ ГГА ГГГ
Глутамин ЦАА ЦАГ
Глутаминовая кислота ГАА ГАГ
Изолейцин АУУ АУЦ АУА
Лейцин ЦУУ ЦУЦ ЦУА ЦУГ УУА УУГ
Лизин ААА ААГ
Метионин АУГ
Пролин ЦЦУ ЦЦЦ ЦЦА ЦЦГ
Серин УЦУ УЦЦ УЦА УЦГ АГУ АГЦ
Тирозин УАУ УАЦ
Треонин АЦУ АЦЦ АЦА АЦГ
Триптофан УГГ
Фенилаланин УУУ УУЦ
Цистеин УГУ УГЦ
СТОП УГА УАГ УАА

Свойства генетического кода

Три стоящих подряд нуклеотида (азотистых оснований) кодируют «имя» одной аминокислоты, то есть каждая из 20 аминокислот зашифрована значащей единицей кода — сочетанием из трех нуклеотидов, называемых триплет или кодон.

Триплет (кодон) — последовательность из трех нуклеотидов (азотистых оснований) в молекуле ДНК или РНК, определяющая включение в молекулу белка в процессе ее синтеза определенной аминокислоты.

  • Однозначность (дискретность)

Один триплет не может кодировать две разные аминокислоты, шифрует только одну аминокислоту. Определенный кодон соответствует только одной аминокислоте.

Каждая аминокислота может определяться более, чем одним триплетом. Исключение — метионин и триптофан . Другими словами — одной и той же аминокислоте может соответствовать несколько кодонов.

  • Неперекрываемость

Одно и то же основание не может одновременно входить в два соседних кодона.

Некоторые триплеты не кодируют аминокислоты, а являются своеобразными «дорожными знаками», которые определяют начало и конец отдельных генов, (УАА, УАГ, УГА), каждый из которых означает прекращение синтеза и расположен в конце каждого гена, поэтому мы можем говорить о полярности генетического кода.

У животных и растений, у грибов, бактерий и вирусов один и тот же триплет кодирует один и тот же тип аминокислоты, то есть генетический код одинаков для всех живых существ. Други ми словами, у ниверсальность — способность генетического кода работать одинаково в организмах разного уровня сложности от вирусов до человека. Универсальность кода ДНК подтверждает единство п роисхождения всего живого на нашей планете. На использовании свойства универсальности генетического кода основаны методы генной инженерии.

Из истории открытия генетического кода

Впервые идея о существовании генетического кода сформулирована А. Дауном и в 1952 — 1954 годах. Учёные показали, что последовательность нуклеотидов, однозначно определяющая синтез той или иной аминокислоты, должна содержать не менее трёх звеньев. Позднее было доказано, что такая последовательность состоит из трех нуклеотидов, названных кодоном или триплетом .

Вопросы о том, какие нуклеотиды ответственны за включение определенной аминокислоты в белковую молекулу и какое количество нуклеотидов определяет это включение, оставались нерешенными до 1961 года. Теоретический разбор показал, что код не может состоять из одного нуклеотида, поскольку в этом случае только 4 аминокислоты могут кодироваться. Однако код не может быть и дуплетным, то есть комбинация двух нуклеотидов из четырехбуквенного «алфавита» не может охватить всех аминокислот, так как подобных комбинаций теоретически возможно только 16 (4 2 = 16).

Для кодирования 20 аминокислот, а также сигнала «стоп», означающего конец белковой последовательности, достаточно трех последовательных нуклеотидов, когда число возможных комбинаций составит 64 (4 3 = 64).

Ведущий научный журнал Nature сообщил об обнаружении второго генетического кода – такого себе «кода внутри кода», который был недавно взломан молекулярными биологами и компьютерными программистами. Более того, для того чтобы его выявить, они использовали не эволюционную теорию, а информационные технологии.

Новый код получил название Код Сплайсинга. Он находится внутри ДНК. Этот код контролирует основной генетический код очень сложным, однако, предсказуемым образом. Код сплайсинга управляет тем, как и когда происходит сборка генов и регулирующих элементов. Раскрытие этого кода внутри кода помогает пролить свет на некоторые давнишние тайны генетики, которые всплыли на поверхность после проведения Проекта по расшифровке полной последовательности генома человека. Одна из таких тайн заключалась в том, почему в таком сложном организме, как человеческий, существует всего лишь 20 000 генов? (Ученые ожидали обнаружить намного больше.) Почему гены разбиваются на сегменты (экзоны), которые разделяются некодирующими элементами (интроны), а затем после транскрипции соединяются вместе (т.е. сплайсируются)? И почему гены включаются в одних клетках и тканях, и не включаются в других? На протяжении двух десятилетий молекулярные биологи пытались выяснить механизмы генетической регуляции. Эта статья указывает на очень важный момент в понимании того, что происходит на самом деле. Она не дает ответы на все вопросы, но она демонстрирует, что внутренний код существует. Этот код – система передачи информации, которую можно так понятно расшифровать, что ученые могли бы прогнозировать, как в определенных ситуациях и с необъяснимой точностью может вести себя геном.

Представьте, что в соседней комнате вы слышите оркестр. Вы открываете дверь, заглядываете внутрь и видите в комнате трех или четырех музыкантов, играющих на музыкальных инструментах. Это то, на что, по словам Брендона Фрея, участвовавшего в раскрытии кода, похож человеческий геном. Он говорит: «Мы смогли обнаружить только 20,000 генов, но мы знали, что они образуют огромное количество белковых продуктов и регулирующих элементов. Как? Один из методов называется альтернативным сплайсингом» . Различные экзоны (части генов) могут собираться разными способами. «Например, три гена белка нейрексина могут создавать более 3000 генетических посланий, которые помогают управлять системой связей мозга» , - говорит Фрей. Тут же в статье говорится о том, что ученым известно, что 95% наших генов имеют альтернативный сплайсинг, и в большинстве случаев в разных типах клеток и тканей транскрипты (молекулы РНК, образующиеся в результате транскрипции) экспрессируются по-разному. Должно быть что-то, что управляет тем, как собираются и экспрессируются эти тысячи комбинаций. В этом и состоит задача Кода Сплайсинга.

Читатели, которые хотят получить беглый обзор открытия, могут прочитать статью в Science Daily под названием «Исследователи, взломавшие ‘Код сплайсинга’, раскрывают тайну, лежащую в основе биологической сложности» . В статье говорится: «Ученые из университета Торонто получили фундаментально новое представление о том, как живые клетки используют ограниченное число генов для образования таких невероятно сложных органов, как мозг» . Сам журнал Nature начинается со статьи Хейди Ледфорда «Код внутри кода». Затем последовала статья Техедора и Валькарсела под названием «Регуляция генов: взлом второго генетического кода. И, наконец, решающей стала статья группы исследователей из университета Торонто под руководством Бенджамина Д. Бленкоу и Брендона Д. Фрея, «Расшифровывая код сплайсинга».

Эта статья – победа информационной науки, которая напоминает нам дешифровальщиков времен Второй Мировой Войны. Их методы включали алгебру, геометрию, теорию вероятностей, векторное исчисление, теорию информации, оптимизацию кода программы, и другие передовые методы. В чем они не нуждались, так это в эволюционной теории , которая никогда не упоминалась в научных статьях. Читая эту статью, можно увидеть, под каким сильным напряжением находятся авторы этой увертюры:

«Мы описываем схему ‘кода сплайсинга’, в которой используются комбинации сотен свойств РНК для того, чтобы предсказать обусловленные тканями изменения в альтернативном сплайсинге тысячи экзонов. Код устанавливает новые классы схем сплайсинга, распознает разные регулирующие программы в разных тканях и устанавливает контролируемые мутациями регулирующие последовательности. Мы раскрыли широко распространенные регулирующие стратегии, включая: использование непредвиденно крупных объединений свойств; выявление низких уровней включения экзона, которые ослабляются свойствами специфических тканей; проявление свойств в интронах глубже, чем считалось раньше; и модуляция уровней сплайс-варианта структурными характеристиками транскрипта. Код помог установить класс экзонов, включение которых заглушает экспрессию в тканях взрослого организма, активируя деградацию мРНКа, и исключение которых способствует экспрессии во время эмбриогенеза. Код облегчает раскрытие и детальное описание регулируемых событий альтернативного сплайсинга в масштабах всего генома».

В команде, взломавшей код, участвовали специалисты с кафедры электронной и вычислительной техники, а также с кафедры молекулярной генетики. (Сам же Фрей работает в подразделении корпорации Microsoft, Microsoft Research) Подобно дешифровальщикам прошлого времени, Фрей и Бараш разработали «новый метод биологического анализа, проводимого с помощью компьютера, который обнаруживает ‘кодовые слова’, запрятанные внутри генома» . С помощью огромного количества данных, созданных молекулярными генетиками, группа исследователей проводила «обратную разработку» кода сплайсинга до тех пор, пока они не смогли предсказать, как он будет действовать . Как только исследователи с этим справились, они проверили этот код на мутациях и увидели, как вставляются или удаляются экзоны. Они обнаружили, что код даже может вызывать тканеспецифические изменения или действовать по-разному в зависимости от того, взрослая это мышь или эмбрион. Один ген, Xpo4, связан с раком; исследователи отметили: «Эти данные подтверждают вывод о том, что экспрессия Xpo4 гена должна строго контролироваться во избежание возможных губительных последствий, включая онкогенез (рак), так как он активен во время эмбриогенеза, но его количество снижено в тканях взрослого организма. Оказывается, что они были абсолютно удивлены уровнем контроля, который они увидели. Намеренно или нет, но в качестве ключа к разгадке Фрей использовал не случайную изменчивость и отбор, а язык разумного замысла. Он отметил: «Понимание сложной биологической системы подобно пониманию сложной электронной схемы».

Хейди Ледфорд сказал, что кажущаяся простота генетического кода Уотсона-Крика, с его четырьмя основаниями, триплетными кодонами, 20 аминокислотами и 64 «символами» ДНК – скрывает под собой целый мир сложности . Заключенный внутри этого более простого кода, Код сплайсинга намного сложнее.

Но между ДНК и белками находится РНК – отдельный мир сложности. РНК – это трансформер, который иногда переносит генетические послания, а иногда управляет ими, задействуя при этом множество структур, способных влиять на его функцию. В статье, опубликованной в этом же выпуске, группа исследователей под руководством Бенджамина Д. Бленкоу и Брендона Д. Фрея из университета Торонто в Онтарио, Канада, сообщает о попытках разгадать второй генетический код, который может предсказывать, как сегменты информационной РНК, транскрибированные с определенного гена, могут смешиваться и сочетаться, чтобы образовывать разнообразные продукты в разных тканях. Это процесс известен как альтернативный сплайсинг. На этот раз нет никакой простой таблицы – вместо неё алгоритмы, которые объединяют более чем 200 различных свойств ДНК с определениями структуры РНК.

Работа этих исследователей указывает на быстрый прогресс, которого достигли вычислительные методы в составлении модели РНК. В дополнение к пониманию альтернативного сплайсинга, информатика помогает ученым предсказывать структуры РНК и устанавливать маленькие регулирующие фрагменты РНК, которые не кодируют протеины. «Это замечательное время» , - говорит Кристофер Берг, компьютерный биолог из массачусетского института технологий в Кембридже. «В будущем нас ждёт огромный успех» .

Информатика, компьютерная биология, алгоритмы и коды – эти концепции не были частью дарвиновского словаря, когда он разрабатывал свою теорию. У Менделя была очень упрощенная модель того, как распределяются признаки во время унаследования. К тому же, идея о том, что признаки кодируются, была представлена только в 1953 году. Мы видим, что исходный генетический код регулируется еще более сложным, включенным в него, кодом. Это революционные идеи . К тому же есть все признаки того, что этот уровень контроля не последний . Ледфорд напоминает нам, что например, РНК и белки имеют трехмерную структуру. Функции молекул могут изменяться, когда изменяется их форма Должно существовать что-то, что контролирует складывание, так что трехмерная структура выполняет то, что требует функция. К тому же, доступ к генам, по-видимому, контролируется другим кодом, гистоновым кодом . Этот код закодирован молекулярными маркерами или «хвостами» на гистоновых белках, которые служат центрами для скручивания и суперскручивания ДНК. Описывая наше время, Ледфорд говорит о «постоянном возрождении в информатике РНК» .

Техедор и Валькарсел согласны с тем, что за простотой кроется сложность. «По идее все выглядит очень просто: ДНК образует РНК, которая затем создает белок» , - начинают они свою статью. «Но в реальности всё намного сложнее» . В 1950-х годах мы узнали о том, что все живые организмы, от бактерий до человека, имеют основной генетический код. Но вскоре мы поняли, что сложные организмы (эукариоты) обладают каким-то неестественным и трудным для понимания свойством: их геномы имеют своеобразные участки, интроны, которые должны удаляться, чтобы экзоны могли соединиться вместе. Почему? Сегодня туман рассеивается: «Основное преимущество этого механизма заключается в том, что он позволяет разным клеткам выбирать альтернативные способы сплайсинга предшественника матричной РНК (пре-мРНК) и таким образом один ген образует различные послания», - объясняют они, - «а затем различные мРНК могут кодировать разные белки с различными функциями» . Из меньшего кода вы получаете больше информации, при условии, что внутри кода есть этот другой код, который знает, как это сделать.

Что и делает взлом кода сплайсинга настолько трудным, так это то, что факторы, контролирующие сборку экзонов, устанавливаются множеством других факторов: последовательностями, расположенными рядом с границами экзона, последовательностями интронов и регулирующими факторами, которые либо помогают, либо тормозят механизм сплайсинга. К тому же, «воздействия определенной последовательности или фактора могут изменяться в зависимости от её расположения относительно границ интрона-экзона или других регуляторных мотивов» , - поясняют Техедор и Валькарсел. «Поэтому самой сложной задачей в предсказании тканеспецифического сплайсинга является вычисление алгебры несметного числа мотивов и взаимоотношений между регуляторными факторами, которые их распознают» .

Для разрешения этой проблемы группа исследователей ввела в компьютер огромное количество данных о последовательностях РНК и условиях, в которых они образовались. «Затем компьютеру было дано задание - определить комбинацию свойств, которые лучше всего могли бы объяснить экспериментально установленный тканеспецифический отбор экзонов» . Другими словами, исследователи провели обратную разработку кода. Подобно дешифровальщикам времен Второй Мировой Войны, как только ученые узнают алгоритм, они могут делать предсказания: «Он правильно и с точностью установил альтернативные экзоны и предсказал их дифференциальное регулирование между парами типов тканей». И так же как любая хорошая научная теория, открытие дало новое понимание: «Это позволило нам по-новому объяснить ранее установленные регуляторные мотивы и указало на ранее неизвестные свойства известных регуляторов, а также неожиданные функциональные связи между ними» , - отметили исследователи. «Например, код подразумевает, что включение экзонов, ведущее к процессированным белкам, является общим механизмом управления процессом экспрессии генов во время перехода из эмбриональной ткани в ткань взрослого организма» .

Техедор и Валькарсел считают публикацию их статьи важным первым шагом: «Работу... лучше рассматривать как открытие первого фрагмента гораздо более крупного Розеттского камня, необходимого для расшифровки альтернативных сообщений нашего генома». По словам этих ученых, будущие исследования, несомненно, улучшат их знания об этом новом коде. В заключение своей статьи они вскользь упоминают эволюцию, и делают это очень необычным образом. Они говорят: «Это не значит, что эволюция создала эти коды. Это означает, что прогресс будет требовать понимания того, как коды взаимодействуют. Другой неожиданностью стало то, что наблюдаемая на сегодня степень сохранения поднимает вопрос о возможном существовании «видоспецифичных кодов» .

Код, вероятно, работает в каждой отдельной клетке и, поэтому, возможно должен отвечать более чем за 200 типов клеток млекопитающих животных. Также он должен справляться с огромным разнообразием схем альтернативного сплайсинга, не говоря уже о простых решениях о включении или пропуске отдельного экзона. Ограниченное эволюционное сохранение регулирования альтернативного сплайсинга (который по подсчетам составляет около 20% между людьми и мышами) поднимает вопрос о существовании видоспецифичных кодов. Более того, связь между процессингом ДНК и транскрипцией генов влияет на альтернативный сплайсинг, и последние данные указывают на упаковку ДНК гистоновыми белками и ковалентными модификациями гистонов (так называемый эпигенетический код) в регуляции сплайсинга. Поэтому будущим методам предстоит установить точное взаимодействие между гистоновым кодом и кодом сплайсинга. То же самое касается еще мало понимаемого влияния сложных структур РНК на альтернативный сплайсинг.

Коды, коды и снова коды. То, что ученые практически ничего не говорят о дарвинизме в этих статьях, указывает на то, что эволюционным теоретикам – приверженцам старых идей и традиций, предстоит много над чем поразмышлять после того, как они прочтут эти статьи. А вот те, кто с восторженностью относится к биологии кодов, окажутся на передовой. У них есть замечательная возможность воспользоваться увлекательным веб-приложением, которое дешифровщики создали для того, чтобы стимулировать проведение дальнейшего исследования. Его можно найти на сайте университета Торонто под названием «Веб-сайт прогнозирования альтернативного сплайсинга». Посетители напрасно будут искать здесь упоминания об эволюции, и это несмотря на старую аксиому, что ничего в биологии не имеет без неё смысла. Новая версия этого выражения 2010 года может звучать так: «Ничто в биологии не имеет смысла, если не рассматривается в свете информатики» .

Ссылки и примечания

Мы рады, что смогли рассказать вам об этой истории в день её публикации. Возможно, это одна из наиболее значимых научных статей года. (Конечно же, значимым является каждое большое открытие, сделанное другими группами ученых, как открытие Уотсона и Крика.) Единственное, что мы можем сказать на это: «Вот это да!» Это открытие – замечательное подтверждение Сотворения по замыслу и огромный вызов дарвиновской империи. Интересно, как эволюционисты попытаются исправить свою упрощенную историю случайных мутаций и естественного отбора, которая была придумана еще в 19 столетии, в свете этих новых данных.

Вы поняли, о чем говорят Техедор и Валькарсел? Виды могут иметь свой собственный код, свойственный только этим видам. «Поэтому будущим методам предстоит установить точное взаимодействие между гистоновым [эпигенетическим] кодом и кодом сплайсинга», - отмечают они. В переводе это означает: «Дарвинисты здесь не причем. Они просто не способны с этим справиться». Если простой генетический код Уотсона-Крика был проблемой для дарвинистов, то, что они скажут теперь о коде сплайсинга, который из одних и тех же генов создает тысячи транскриптов? А как они справятся с эпигенетическим кодом, который управляет экспрессией генов? И кто знает, может в этом невероятном «взаимодействии», о котором мы только начинаем узнавать, задействованы и другие коды, напоминающие Розеттский камень, только начинающий показываться из песка?

Теперь, когда мы размышляем о кодах и информатике, мы начинаем думать о разных парадигмах нового исследования. Что если геном частично действует как сеть хранения данных? Что если в нем имеет место криптография или происходят алгоритмы сжатия? Нам следует вспомнить о современных информационных системах и технологиях хранения информации. Может быть, мы даже обнаружим элементы стеганографии. Несомненно, существуют дополнительные механизмы устойчивости, такие как дублирования и исправления, которые возможно помогут объяснить существование псевдогенов. Копирования всего генома могут быть реакциями на стресс. Некоторые из этих явлений могут оказаться полезными показателями исторических событий, которые не имеют ничего общего с универсальным общим предком, но помогают исследовать сравнительную геномику в рамках информатики и дизайна устойчивости, а также помогают понять причину заболевания.

Эволюционисты оказываются в сильном затруднении. Исследователи попытались видоизменить код, а получили только рак и мутации. Как они собираются пройти по полю приспособленности, если оно всё заминировано катастрофами, ждущими своего часа, как только кто-то начинает вмешиваться в эти неразрывно связанные коды? Мы знаем, что существует некая встроенная устойчивость и переносимость, но вся картина представляет собой невероятно сложную, разработанную, оптимизированную информационную систему , а не беспорядочное соединение частей, которыми можно бесконечно играться. Вся идея кода является концепцией разумного замысла.

A. E. Уайлдер-Смит придавал этому особое значение. Код предполагает соглашение между двумя частями. Соглашение – это заблаговременное согласие. Оно подразумевает планирование и цель. Символ SOS, как сказал бы Уайлдер-Смит, мы используем по соглашению как сигнал бедствия. SOS не выглядит как бедствие. Оно не пахнет как бедствие. Оно не ощущается как бедствие. Люди не понимали бы, что эти буквы обозначают бедствие, если бы они не понимали суть самого соглашения. Подобным образом, кодон аланина, ГЦЦ, не выглядит, не пахнет и не ощущается как аланин. Кодон не имел бы никакого отношения к аланину, если бы между двумя кодирующими системами (кодом белка и кодом ДНК) не было заранее установленного соглашения о том, что «ГЦЦ должен означать аланин». Для передачи этого соглашения используется семейство преобразователей, аминоацил-тРНК-синтетаз, которые переводят один код в другой.

Это должно было укрепить теорию замысла в 1950-х годах и многие креационисты эффективно её проповедовали. Но эволюционисты похожи на красноречивых торговцев. Они сочинили свои сказки о фее Динь-Динь, которая разбирает код и создает новые виды путем мутации и отбора, и убедили многих людей в том, что чудеса могут происходить и сегодня. Ну, хорошо, сегодня за окном 21-й век и нам известен эпигенетический код и код сплайсинга – два кода, которые намного сложнее и динамичнее, чем простой код ДНК. Мы знаем о кодах внутри кодов, о кодах над кодами и под кодами – нам известна целая иерархия кодов. На этот раз эволюционисты не могут просто вставить палец в пистолет и с блефом убеждать нас своими красивыми речами, когда по обеим сторонам расставлены пушки – целый арсенал, направленный на их главные элементы конструкции. Всё это игра. Вокруг них выросла целая эра информатики, они давно вышли из моды и похожи на Греков, которые пытаются с копьями лезть на современные танки и вертолеты.

Грустно признавать, но эволюционисты не понимают этого, или даже если и понимают, то не собираются сдаваться. Между прочим, на этой неделе, как раз когда была опубликована статья о Коде сплайсинга, со страниц продарвиновских журналов и газет посыпалась наиболее злая и ненавистная за последнее время риторика, направленная против креационизма и разумного замысда. Нам предстоит услышать еще о многих подобных примерах. И пока они держат в своих руках микрофоны и контролируют институты, многие люди будут попадаться на их удочку, думая, что наука продолжает давать им достаточное основание. Мы рассказываем вам всё это для того, чтобы вы читали этот материал, изучали его, понимали и запаслись информацией, которая вам необходима для того, чтобы сразить истиной этот фанатичный, вводящий в заблуждение вздор. А теперь, вперёд!

Выстраиваются в цепочки и, таким образом, получаются последовательности генетических букв.

Генетический код

Белки практически всех живых организмов построены из аминокислот всего 20 видов. Эти аминокислоты называют каноническими. Каждый белок представляет собой цепочку или несколько цепочек аминокислот, соединённых в строго определённой последовательности. Эта последовательность определяет строение белка, а следовательно все его биологические свойства.

C

CUU (Leu/L)Лейцин
CUC (Leu/L)Лейцин
CUA (Leu/L)Лейцин
CUG (Leu/L)Лейцин

В некоторых белках нестандартные аминокислоты, такие как селеноцистеин и пирролизин , вставляются рибосомой, прочитывающей стоп-кодон, что зависит от последовательностей в мРНК . Селеноцистеин сейчас рассматривается в качестве 21-й, а пирролизин 22-й аминокислот, входящих в состав белков.

Несмотря на эти исключения, у всех живых организмов генетический код имеет общие черты: кодон состоят из трёх нуклеотидов, где два первых являются определяющими, кодоны транслируются тРНК и рибосомами в последовательность аминокислот.

Отклонения от стандартного генетического кода .
Пример Кодон Обычное значение Читается как:
Некоторые виды дрожжей рода Candida CUG Лейцин Серин
Митохондрии, в частности у Saccharomyces cerevisiae CU(U, C, A, G) Лейцин Серин
Митохондрии высших растений CGG Аргинин Триптофан
Митохондрии (у всех без исключения исследованных организмов) UGA Стоп Триптофан
Митохондирии млекопитающих, дрозофилы , S. cerevisiae и многих простейших AUA Изолейцин Метионин = Старт
Прокариоты GUG Валин Старт
Эукариоты (редко) CUG Лейцин Старт
Эукариоты (редко) GUG Валин Старт
Прокариоты (редко) UUG Лейцин Старт
Эукариоты (редко) ACG Треонин Старт
Митохондрии млекопитающих AGC, AGU Серин Стоп
Митохондрии дрозофилы AGA Аргинин Стоп
Митохондрии млекопитающих AG(A, G) Аргинин Стоп

История представлений о генетическом коде

Тем не менее в начале 60-х годов XX века новые данные обнаружили несостоятельность гипотезы «кода без запятых». Тогда эксперименты показали, что кодоны, считавшиеся Криком бессмысленными, могут провоцировать белковый синтез в пробирке, и к 1965 году был установлен смысл всех 64 триплетов. Оказалось, что некоторые кодоны просто-напросто избыточны, то есть целый ряд аминокислот кодируется двумя, четырьмя или даже шестью триплетами.

См. также

Примечания

  1. Genetic code supports targeted insertion of two amino acids by one codon. Turanov AA, Lobanov AV, Fomenko DE, Morrison HG, Sogin ML, Klobutcher LA, Hatfield DL, Gladyshev VN. Science. 2009 Jan 9;323(5911):259-61.
  2. Кодон AUG кодирует метионин, но одновременно служит стартовым кодоном - с первого AUG-кодона мРНК как правило начинается трансляция.
  3. NCBI: «The Genetic Codes», Compiled by Andrzej (Anjay) Elzanowski and Jim Ostell
  4. Jukes TH, Osawa S, The genetic code in mitochondria and chloroplasts. , Experientia. 1990 Dec 1;46(11-12):1117-26.
  5. Osawa S, Jukes TH, Watanabe K, Muto A (March 1992). «Recent evidence for evolution of the genetic code ». Microbiol. Rev. 56 (1): 229–64. PMID 1579111 .
  6. SANGER F. (1952). «The arrangement of amino acids in proteins.». Adv Protein Chem. 7 : 1-67. PMID 14933251 .
  7. М. Ичас Биологический код. - Мир, 1971.
  8. WATSON JD, CRICK FH. (April 1953). «Molecular structure of nucleic acids; a structure for deoxyribose nucleic acid.». Nature 171 : 737-738. PMID 13054692 .
  9. WATSON JD, CRICK FH. (May 1953). «Genetical implications of the structure of deoxyribonucleic acid.». Nature 171 : 964-967. PMID 13063483 .
  10. Crick FH. (April 1966). «The genetic code - yesterday, today, and tomorrow.». Cold Spring Harb Symp Quant Biol. : 1-9. PMID 5237190 .
  11. G. GAMOW (February 1954). «Possible Relation between Deoxyribonucleic Acid and Protein Structures.». Nature 173 : 318. DOI :10.1038/173318a0 . PMID 13882203 .
  12. GAMOW G, RICH A, YCAS M. (1956). «The problem of information transfer from the nucleic acids to proteins.». Adv Biol Med Phys. 4 : 23-68. PMID 13354508 .
  13. Gamow G, Ycas M. (1955). «STATISTICAL CORRELATION OF PROTEIN AND RIBONUCLEIC ACID COMPOSITION. ». Proc Natl Acad Sci U S A. 41 : 1011-1019. PMID 16589789 .
  14. Crick FH, Griffith JS, Orgel LE. (1957). «CODES WITHOUT COMMAS. ». Proc Natl Acad Sci U S A. 43 : 416-421. PMID 16590032 .
  15. Hayes B. (1998). «The Invention of the Genetic Code.» (PDF reprint). American Scientist 86 : 8-14.

Литература

  • Азимов А. Генетический код. От теории эволюции до расшифровки ДНК. - М.: Центрполиграф, 2006. - 208 с - ISBN 5-9524-2230-6 .
  • Ратнер В. А.Генетический код как система - Соросовский образовательный журнал, 2000, 6, № 3, с.17-22.
  • Crick FH, Barnett L, Brenner S, Watts-Tobin RJ. General nature of the genetic code for proteins - Nature, 1961 (192), pp. 1227-32

Ссылки

  • Генетический код - статья из Большой советской энциклопедии

Wikimedia Foundation . 2010 .