Исследования генома человека. Генетика человека: понятие, основы, методы изучения Стабильность и прогресс

25 апреля теперь уже далекого 1953 г. журнал Nature опубликовал небольшое письмо молодых и никому неизвестных Ф.Крика и Дж.Уотсона редактору журнала, которое начиналось словами: «Мы хотели бы предложить свои соображения по поводу структуры соли ДНК. Эта структура имеет новые свойства, которые представляют большой биологический интерес». Статья содержала около 900 слов, но – и это не преувеличение – каждое из них было на вес золота.

«Ершистая молодежь» посмела выступить против нобелевского лауреата Лайнуса Полинга, автора знаменитой альфа-спирали белков. Полинг буквально накануне опубликовал статью, согласно которой ДНК представляла собой трехцепочечную спиральную структуру, наподобие девичьей косы. Тогда никто не знал, что у Полинга был просто недостаточно очищенный материал. Но и Полинг оказался отчасти прав – сейчас трехцепочечность некоторых участков наших генов хорошо известна. Это свойство ДНК даже пытались одно время использовать в борьбе с раком, выключая с помощью олигонуклеотидов те или иные раковые гены (онкогены).

Биологии нуклеиновых кислот долго не везло. Достаточно сказать, что первую нобелевскую премию за открытие строения нуклеотидов немец А.Коссель получил еще в 1910 г. А знаменитая реакция Фельгена для окрашивания ДНК была предложена накануне Первой мировой войны и усовершенствована в 1920-е гг. Тогда и могла бы начаться новая эра биологии, однако...

Однако биологи были уверены, что «монотонная» ДНК с ее только четырьмя различающимися основаниями просто не могла нести генетическую информацию о миллионах самых разнообразных белков. И хотя уже применялась азбука Морзе с тремя кодирующими элементами, менталитет исследователей еще не достиг уровня информационной эры с ее двоичной системой записи («0» и «1») любой информации.

Лишь к началу 1950-х гг. отдельные ученые стали обращать внимание на ДНК, роль которой в передаче наследственных признаков у микроорганизмов установил в 1943 г. Освальд Эйвери. Результатам Эйвери поверил Сальвадор Лурия, который вместе с Максом Дельбрюком организовал неподалеку от Нью-Йорка лабораторию на биостанции в местечке Колд-Спринг Харбор.

Заметим в скобках, что физик М.Дельбрюк был учеником Н.В. Тимофеева-Ресовского в биологии и соавтором их совместной с К.Циммером знаменитой статьи, посвященной определению размеров гена. Лурия с Дельбрюком изучали жизненный цикл бактериофагов – вирусов микроорганизмов, в результате чего и пришли к предположениям о биологической роли ДНК. Лурия послал своего аспиранта Джеймса Уотсона в Кавендишскую лабораторию в Кембридже, где Морис Уилкинс и Розалинд Франклин исследовали строение ДНК с помощью рентгена (англичане лидировали в рентгеноструктурном анализе биомолекул).

В лаборатории Уилкинса работал также еще довольно молодой физик Фрэнсис Крик, известный в узких лабораторных кругах своим научным скепсисом: для него просто не существовало никаких авторитетов, чем он и заработал себе репутацию скандалиста. Статью Полинга в лабораторию принес его сын, который помог, кстати, Уотсону и Крику уяснить роль попарного комплементарного соединения азотистых оснований. Статья стала последней каплей перед озарением, или пониманием... тем, что оформилось в открытие молодых ученых.

Научное сообщество, однако, не сразу признало их открытие. Достаточно сказать, что сначала Нобелевскую премию за работы в области ДНК «судьи» из Стокгольма присудили в 1959 г. известным американским биохимикам Северо Очоа и Артуру Корнбергу. Очоа был первым (1955), кто сумел синтезировать рибонуклеиновую кислоту (РНК). Корнберг же получил премию за синтез ДНК в пробирке (1956).

В 1962 г. настал черед Крика, Уотсона и Уилкинса. Р.Франклин к тому времени уже умерла от рака в возрасте 37 лет, иначе это был бы единственный случай в истории Нобелевских премий, когда награду вручили бы четверым, хотя это и не допускается уставом. Вклад Франклин в развитие рентгеноструктурного анализа ДНК был просто неоценим.

После открытия Уотсона и Крика важнейшей проблемой стало выявление соответствия между первичными структурами ДНК и белков. Поскольку в составе белков обнаруживается 20 аминокислот, а нуклеиновых оснований всего 4, то для записи информации о последовательности аминокислот в полинуклеотидах необходимо не менее трех оснований. На основании таких общих рассуждений варианты «трехбуквенных» генетических кодов предложили физик Г.Гамов и биолог А.Нейфах. Однако их гипотезы были чисто умозрительными и не вызвали большого отклика среди ученых.

Трехбуквенный генетический код к 1964 г. расшифровал Ф.Крик. Вряд ли он тогда предполагал, что в обозримом будущем станет возможной расшифровка генома человека. Эта задача долгое время казалась неразрешимой. Однако два открытия позволили сдвинуть проблему с места.

В 1970 г. не известные широкой научной общественности Г.Темин и Д.Балтимор опубликовали в Nature статьи, посвященные обратной транскриптазе (ОТ) – ферменту РНК-содержащих, в том числе раковых, вирусов, которые синтезируют ДНК на матрице РНК, т.е. осуществляют реакцию, обратную той, которую до тех пор наблюдали в клетках.

Открытие обратной транскриптазы позволило выделить первые гены. Но процесс этот был крайне трудоемким и чрезвычайно дорогим. А спустя 15 лет некий химик из Калифорнии предложил на суд коллег уникальную полимеразную цепную реакцию (ПЦР), сразу же ставшую знаменитой. В этой реакции фермент, полимераза, «ходит как челнок» по фрагменту ДНК, поэтому ПЦР позволяет нарабатывать любые количества этого фрагмента, необходимые для анализа*.

ПЦР, а также появление новейшей электронной техники и компьютеров сделали вполне реальной задачу расшифровки всего генома человека. Долгие дебаты закончились в конце сентября 1988 г., когда во главе проекта HUGO – Организации по расшифровке генома человека – был поставлен Дж.Уотсон.

Журнал Time назвал в связи с этим Уотсона «охотником за генами». Сам же ученый сказал следующее: «Это захватывающая перспектива. Тридцать лет назад мы не могли и мечтать о том, чтобы узнать структуру генома даже мельчайшего вируса. А сегодня мы уже расшифровали геном вируса СПИДа и почти полностью прочитали геном кишечной палочки объемом в 4,5 млн букв ген-кода. Точное знание детальной структуры генома человека – это восхитительно!».

И вот геном прочитан
Завершение работ по расшифровке генома человека консорциумом ученых планировалось к 2003 г. – 50-летию открытия структуры ДНК. Однако конкуренция сказала свое слово и в этой области.

Крейг Вентер основал частную компанию «Селера», которая продает генные последовательности за большие деньги. Включившись в гонку по расшифровке генома, она за один год сделала то, на что у международного консорциума ученых из разных стран ушло десять лет. Это стало возможным благодаря новому методу чтения генетических последовательностей и использованию автоматизации процесса чтения.

Итак, геном прочитан. Казалось бы, надо радоваться, но ученые пришли в недоумение: уж очень мало генов оказалось у человека – примерно в три раза меньше, чем ожидалось. Раньше думали, что генов у нас около 100 тыс., а на самом деле их оказалось около 35 тыс. Но даже не это самое главное.

Недоумение ученых понятно: у дрозофилы 13 601 ген, у круглого почвенного червя – 19 тыс., у горчицы – 25 тыс. генов. Столь малое количество генов у человека не позволяет выделить его из животного царства и считать «венцом» творения.

Зато там, где располагаются гены, активность ДНК и ферментов, синтезирующих ее копии в виде молекул информационной РНК, повышается в 200–800 раз! Это – «горячие точки» генома.

В геноме человека ученые насчитали 223 гена, которые сходны с генами кишечной палочки. Кишечная палочка возникла примерно 3 млрд лет назад. Зачем нам такие «древние» гены? Видимо, современные организмы унаследовали от предков какие-то фундаментальные структурные свойства клеток и биохимические реакции, для которых необходимы соответствующие белки.

Нет поэтому ничего удивительного и в том, что половина белков млекопитающих имеют сходство аминокислотных последовательностей с белками мухи дрозофилы. В конце концов мы дышим одним и тем же воздухом и потребляем животные и растительные белки, состоящие из одних и тех же аминокислот.

Удивительно, что с мышью мы имеем 90% общих генов, а с шимпанзе – вообще 99%!

В нашем геноме много последовательностей, доставшихся нам в «наследство» от ретровирусов. Эти вирусы, к которым относятся вирусы рака и СПИДа, вместо ДНК в качестве наследственного материала содержат РНК. Особенностью ретровирусов является, как уже говорилось, наличие обратной транскриптазы. После синтеза ДНК по РНК вируса вирусный геном встраивается в ДНК хромосом клетки.

Таких ретровирусных последовательностей у нас много. Время от времени они «вырываются» на волю, в результате чего возникает рак (но рак в полном соответствии с законом Менделя проявляется лишь у рецессивных гомозигот, т.е. не более чем в 25% случаев). Совсем недавно было сделано открытие, которое позволяет понять не только механизм встраивания вирусов, но и назначение некодирующих последовательностей ДНК. Оказалось, что для встраивания вируса необходима специфическая последовательность из 14 букв генетического кода. Таким образом, можно надеяться, что вскоре ученые научатся не только блокировать агрессивные ретровирусы, но и целенаправленно «внедрять» нужные гены, и генотерапия из мечты превратится в реальность.

В организме млекопитающих ретровирусы играют и еще одну немаловажную роль. В отношении млекопитающих, у которых плод развивается внутри организма матери, правомерен вопрос: почему иммунная система матери позволяет развиваться организму, который наполовину генетически ей чужероден, поскольку половина генома плода отцовская?

Все дело в ретровирусах, которые блокируют активность иммунных Т-лимфоцитов, ответственных за отторжение органов и тканей, содержащих чужеродные белки, например, после трансплантации органов. Эти ретровирусы активируются в геноме клеток плаценты, которая образуется тканями плода.

Недавно был обнаружен вирус, который блокирует развитие (экспрессию) ретровируса. Если этим вирусом-блокатором заразить беременную мышь, то мышата рождаются нормальными и в срок. Но если его ввести в клетки плаценты, то происходит выкидыш плода, так как активируются Т-лимфоциты матери.

Не стоит забывать, что ретровирусные последовательности возникают также непосредственно на концах хромосом – теломерах. Как известно, теломеры состоят из одноцепочечной ДНК, которая синтезируется ферментом теломеразой по матрице РНК. Считается, что теломеры являются нашими молекулярными часами, поскольку они укорачиваются с каждым клеточным делением. Раньше считалось, что в теломерах нет генов, однако расшифровка генома показала, что генов там довольно много и они активны в детстве и молодом возрасте, постепенно «угасая» по мере старения организма.

Не так уж бездеятельны и тандемные повторы. В норме они имеют определенное число повторяющихся троек, пятерок и даже семерок букв. Но в некоторых случаях в результате мутаций число повторов начинает нарастать, что ведет к нестабильности генома. Дело доходит даже до «поломок» концов хромосом. Фрагментация концевых участков хромосомы может привести к перемещениям (транслокации) участков ДНК в другую хромосому, а также синтезу таких форм белка, которые вызывают гибель нервных клеток, как это наблюдается при наследственной хорее Гентингтона.

К.Вентер говорил, что понимание генома потребует сотни лет. Ведь мы до сих пор не знаем функций и роли более чем 25 тыс. генов. И даже не знаем, как подступиться к решению этой задачи, поскольку большинство генов просто «молчит» в геноме, никак себя не проявляя.

Следует учитывать, что в геноме накопилось множество псевдогенов и генов-«перевертышей», которые также неактивны. Похоже, что некодирующие последовательности являются как бы изолятором активных генов. В то же время, хотя генов у нас и не слишком много, они обеспечивают синтез до 1 млн (!) самых разных белков. Как же это достигается при таком ограниченном наборе генов.

Как оказалось, в нашем геноме существует специальный механизм – альтернативный сплайсинг. Заключается он в следующеем. На матрице одной и той же ДНК происходит синтез разных альтернативных и-РНК. Сплайсинг и означает «расщепление», когда образуются разные молекулы РНК, которые как бы «расщепляют» ген на разные варианты. Этот приводит к невообразимому разнообразию белков при ограниченном наборе генов.

Функционирование генома человека, как и всех млекопитающих, регулируется различными транскрипционными факторами – специальными белками. Эти белки связываются с регуляторной частью гена (промотером) и таким образом регулируют его активность. Одни и те же факторы могут по-разному проявлять себя в разных тканях. У человека есть свои собственные, присущие только ему, транскрипционные факторы. Выявить эти чисто человеческие особенности генома еще только предстоит ученым.

СНП
Существует и еще один механизм генетического разнообразия, который выявился только в процессе прочтения генома. Это сингулярный нуклеотидный полиморфизм, или, так называемые факторы СНП.

Полиморфизмом в генетике называют ситуацию, когда гены одного и того же признака существуют в разных вариантах. Примером полиморфизма, или, другими словами, множественных аллелей, служат группы крови, когда в одном хромосомном локусе (участке) могут находиться варианты генов А, В или О.

Сингулярность по-латыни означает одиночество, что-то единственное. СНП – это изменение «буквы» генетического кода без «последствий для здоровья». Считается, что у человека СНП встречается с частотой 0,1%, т.е. каждый человек отличается от других одним нуклеотидом на каждую тысячу нуклеотидов. У шимпанзе, представляющей собой более древний вид, и к тому же гораздо более гетерогенный, число СНП при сравнении двух разных особей достигает 0,4%.

Но если различия в СНП не сказываются на здоровье особей, то чем они интересны и важны? Во-первых, изучение СНП имеет большое теоретическое значение. Именно они позволяет сравнивать возрасты популяций и определять пути их миграции. Так, например, в мужской половой хромосоме (Y) выделены 22 фактора СНП, анализ которых у 1007 европейцев позволил определить, что 80% европейских мужчин имеют сходный «СНП-паттерн», т.е. «рисунок». Это говорит о том, что тысячи поколений назад 4/5 европейских мужчин имели общего предка!

Но и практическое значение СНП велико. Возможно, не все знают, что сегодня самые распространенные лекарства эффективны не более чем для четверти населения. Минимальные генетические отличия, обусловленные СНП, определяют эффективность лекарств и их переносимость в каждом конкретном случае. Так, у больных диабетом выявили 16 специфических СНП. Всего при анализе 22-й хромосомы определили местоположение 2730 СНП. В одном из генов, кодирующих синтез рецептора адреналина, выявлено 13 СНП, которые могут комбинироватьcя друг с другом, давая 8192 различных варианта (гаплотипа).

Насколько скоро и полно начнет использоваться полученная информация, пока не совсем ясно. Пока же приведем еще один конкретный пример.

Среди астматиков довольно популярно лекарство албутерол, который взаимодействует с указанным рецептором адреналина и подавляет приступ удушья. Однако из-за разнообразия гаплотипов людей лекарство действует не на всех, а некоторым больным оно вообще противопоказано. Это обусловлено СНП: люди с последовательностью букв в одном из генов ТЦТЦЦ (Т–тимин, Ц–цитозин) не реагируют на албутерол, если же концевой цитозин заменен на гуанин (ТЦТЦГ), то реакция есть, но частичная. Для людей же с тимином вместо концевого цитозина в этом участке – ТЦТЦТ – лекарство токсично!

Протеомика
Эта совершенно новая отрасль биологии, изучающая структуру и функции белков и взаимосвязи между ними, названа по аналогии с геномикой, занимавшейся геномом человека. Само рождение протеомики уже объясняет, зачем нужна была программа «Геном человека». Поясним на примере перспективы нового направления.

В далеком 1962 г. вместе с Уотсоном и Криком в Стокгольм были приглашены из Кембриджа Джон Кэндрью и Макс Перутц. Они были удостоены Нобелевской премии по химии за впервые осуществленную расшифровку трехмерной структуры белков миоглобина и гемоглобина, ответственных за перенос кислорода в мышцах и эритроцитах соответственно.

Напомним, что даже в начале 1990-х гг. расшифровка структуры каждого нового белка представляла значительные трудности. Каждый анализ занимал до десятка лет. И хотя сейчас вместо рентгеновских лучей используют ядерно-магнитный резонанс (ЯМР), однако времени и денег на определение пространственной структуры каждого белка уходит очень много.

Протеомика позволяет ускорить и удешевить эти работы. К.Вентер отметил, что он 10 лет потратил на выделение и секвенирование гена адреналинового рецептора человека, теперь же его лаборатория тратит на это 15 с. Еще в середине 90-х гг. нахождение «адреса» гена в хромосомах занимало 5 лет, в конце 90-х – полгода, а в 2001 г. – одну неделю! Кстати, ускорению определения положения гена помогает информация о СНП, которых сегодня насчитываются уже миллионы.

Вернемся к протеомике. Знание аминокислотных последовательностей и трехмерной структуры определенных белков позволило разработать программы сопоставления генетических последовательностей с аминокислотными, а затем программы предположительного расположения их в трехмерной структуре полипептидов. Знание трехмерной структуры позволяет быстро находить химические варианты молекул, в которых блокирован, например, активный центр, или определять положение активного центра у мутантного фермента.

Известно, что повышение артериального давления вызывается ферментом АСЕ, сокращенное название которого переводится с английского как ангиотензин-конвертирующий фермент. Образующийся под действием фермента ангиотензин воздействует на стенки артерии, что и ведет к гипертонии. Уже относительно давно были найдены блокаторы фермента АСЕ, которые стали продаваться в качестве лекарств от повышенного давления. Однако, эти лекарственные средства оказались малоэффективными.

Анализ генома позволил выделить ген АСЕ-2, который кодирует более распространенный и эффективный вариант фермента. Затем была определена виртуальная структура белкового продукта, после чего подобраны химические вещества, активно связывающиеся с белком АСЕ-2. Так был найден новый препарат против артериального давления, причем за вдвое меньшее время и всего лишь за 200 вместо 500 млн долларов!

Признаемся, что это был пример «догеномного» периода. Теперь же, после прочтения генома, на первый план выходит протеомика, цель которой – быстрее разобраться с тем миллионом белков, которые потенциально могут существовать в наших клетках. Протеомика позволит более тщательно диагностировать генетические отклонения и блокировать неблагоприятное действие мутантных белков на клетку.

А со временем можно будет планировать и «исправление» генов.

Начальными этапами изучения генома человека можно считать разработку методов определения последовательности нуклеотидов или секвенирования ДНК (Гилберт У., Берг П., Сенджер Ф.), за которую в 1980 г была присуждена Нобелевская премия по химии. Через четыре года начались работы по полному секвенированию генома человека (Human Genome Projekt, финансированный конгрессом США - 3 млрд. долларов). К 2003 г была завершена полная расшифровка нуклеотидной последовательности генома человека. Последней была секвенирована самая большая хромосома человека (№ 1). Теперь каждый желающий теоретически может секвенировать весь свой геном за несколько минут, что обойдется ему в 1500 долларов.

В настоящее время считают, что в геноме человека 20-25 тысяч структурных генов, причем только 1% всей ДНК приходится на экзоны. Достаточно людям взглянуть друг на друга, чтобы понять, что существует генетическая вариабельность вида Homo sapiens. Структура геномов разных рас и национальностей идентична на 99,9%, а индивидуальная вариабельность составляет 0,1%. Различия между генотипами людей обусловлены в основном мутациями. Такую вариабельность и называют генетическим полиморфизмом, под которым понимают небольшие различия нуклеотидной последовательности, дающие нормальный фенотип. К полиморфизмам относят, например, однонуклеотидные замены – SNP, которые встречаются через каждые 300-400 п.о. в геноме человека. Большинство этих SNP располагаются в некодирующих участках. SNP легко идентифицировать ввиду их стабильности, и они могут использоваться в качестве маркеров для картирования генов, ответственных за такие мультифакториальные болезни, как диабет и атеросклероз. В настоящее время идентифицировано 4,0 млн. SNP, среди них значимыми внутригенными SNP являются 2,6 млн.

Следующим этапом исследования генома человека являлась программа ENCODE «Encyclopedia of DNA Elements». Геном человека или число нуклеотидов в гаплоидном наборе клетки насчитывает 3 млрд. пар оснований, из которых 10-20% являются кодирующими, а 80-90% являются некодирующими последовательностями, и поэтому основная часть ДНК не несет информацию о структуре белков, составляющих основу любого живого организма. Некодирующие последовательности представлены повторами разной протяженности, и для половины из них функции пока не известны, но предполагается, что в них содержится информация о программе индивидуального развития, которую называют партитурой «симфонии жизни». Именно она регулирует работу генов, процессинг РНК, точность матричных процессов, конъюгации и кроссинговера. Некодирующая ДНК может обеспечить компартментализацию геномов разных видов или может создавать основу для большей генетической изменчивости. Транскрибируемая часть генома составляет лишь 10%, причем из них 25% приходится на синтез РНК, и 5% транслируется до белков.

По данным ENCODE последовательности ДНК, не несущие инфрмацию о структуре белка, кодирует разные виды РНК - тРНК, рРНК и регуляторные РНК: малые интерферирующие РНК (small interfering RNA, si RNA) и микроРНК (microRNA, mi RNA). Все малые регуляторные РНК влияют на экспрессию генов на разных уровнях – синтеза РНК и посттранскрипционных модификаций, сплайсинга пре-РНК, стабилизации РНК, трансляции, они участвуют в геномном импринтинге, метилировании ДНК и ремоделировании хроматина. Действие таких РНК основано на феномене РНК-интерференции, суть которого заключается в подавлении экспрессии генов на уровне транскрипции или трансляции.

Указанные выше si RNA работают как кофакторы РНК-азных комплексов, вызывающих деградацию определенных ненужных клетке и-РНК. РНК-интерференцию можно использовать для нокдауна генов. Различают понятия «нокаут» и «нокдаун» генов. При нокауте гена индуцируются мутации, повреждающие и выключающие ген. При нокдауне гена вызывается деградация синтезированной с него и-РНК с помощью si-RNA. Введение siРНК в клетки пациентов является частью инновационной стратегии, снижающей активность генов, при лечении некоторых видов рака, гепатита и других заболеваний.

Микро РНК - mi RNA класс некодирующих шпилечных РНК, которые имеют длину около 22 нуклеотидов. Структура mi-РНК закодирована в геноме, гены mi-РНК расположены в областях инвертированных повторов интронов белок - кодирующих генов, в экзонах или межгенных областях. Они могут временно выключать трансляцию белков за счет своей гибридизации с комплементарным участком и-РНК, образуя двойную спираль РНК-РНК в норме не характерную для клеток.

Кроме того обнаружены другие классы регуляторных РНК, к которым относятся - малые ядерные РНК (snRNA), участвующие в сплайсинге иРНК; теломеразные РНК; малые ядрышковые РНК (snoRNA) и рибозимы - cRNA, участвующие в модификации других РНК; длинные некодирующие РНК - lincRNA (long noncocling RNAs) с неизвестной пока функцией, содержащие примерно более 200н; piRNA (piwi - interacting RNA)- короткие молекулы длиной в 24–30 нуклеотида, закодированные в центромерных и теломерных областях хромосомы, возможно участвующие в организации хроматина. Оказалось, что последовательности нуклеотидов piRNA комплементарны мобильным генетическим элементам и могут подавлять активность МГЭ на уровне транскрипции и репликации. Гены piRNA активны только в зародышевых клетках во время эмбриогенеза.

Все виды регуляторных РНК синтезируются с ¾ нашего генома, т.е. примерно 80,4% геномных последовательностей так или иначе участвуют в регуляторных процессах.

Оказалось, что у больных с наследственной патологией одинаковые SNP-замены расположены в генах регуляторных РНК, а не в структурных генах белков.

3. Методы изучения мутаций у человека .

В зависимости от типа мутации, которую предполагают выявить у человека, используют либо цитогенетические, либо молекулярно-генетические методы. С помощью цитогенетических методов можно выявлять у пациентов хромосомные и геномные мутации, а с помощью молекулярно-генетических – генные мутации.

Созданного 4 года назад с целью максимально полной расшифровки информации, закодированной в геноме человека, сообщили о завершении первого этапа работы. Более 300 исследователей из США и других стран провели детальный анализ структуры и функции одной сотой части человеческого генома (30 млн пар оснований из 3 млрд). В клетках человека обнаружено неожиданно большое разнообразие транскриптов — молекул РНК, синтезированных на матрице геномной ДНК. Выяснилось, что первичному прочтению (транскрипции) подвергается 80% генома, несмотря на то, что кодирует белки лишь 2% генома. Этот и другие результаты говорят о том, что механизмы функционирования генома сложнее, чем принято считать, и сам «язык», на котором записана наследственная информация, нам еще не до конца понятен.

Хотя геном человека был объявлен «прочтенным вчерне» еще в 2000-2001 гг., а в 2003-2004 гг. заговорили о «почти совсем полном прочтении», наука по-прежнему далека от полного понимания закодированной в геноме информации. Для решения этой глобальной задачи в 2003 году Национальным институтом по изучению генома человека (National Human Genome Research Institute, NHGRI) был запущен проект ENCODE (Enc yclopedia o f D NA E lements), объединивший сотни ученых и десятки научных коллективов из США и других стран.

Задача-максимум, стоящая перед участниками проекта, состоит в том, чтобы выяснить, зачем нужен и что кодирует каждый из 3 млрд нуклеотидов человеческого генома. Причем выяснить не только теоретически, in silico (путем компьютерного анализа последовательностей ДНК), но и подтвердить результаты экспериментально. До решения этой задачи, разумеется, еще очень далеко. Пока же ученые отрапортовали о завершении первого этапа работы, целью которого была в основном отработка методик и проба сил.

Ученые использовали весь обширный арсенал средств и методов современной генетики, геномики и молекулярной биологии. В частности, широко использовалось сравнение человеческого генома с геномами других млекопитающих (см.: Геном макака резуса расскажет об эволюции человека , «Элементы», 19.04.2007; Прочтение генома опоссума доказало ключевую роль транспозонов в эволюции млекопитающих , «Элементы», 13.05.2007). Такое сравнение позволяет выявить «консервативные», то есть схожие у разных видов участки генома. Консерватизм обычно свидетельствует о функциональной важности данного участка (см.: Сравнение геномов человека и мыши помогло обнаружить новый способ регуляции работы генов , «Элементы», 21.04.2007).

Но главным «коньком» проекта ENCODE является тотальный анализ транскриптома , то есть тех молекул РНК, которые синтезируются клеткой на матрице геномной ДНК в ходе транскрипции — «прочтения» генетической информации. Напомним, что информация, закодированная в классических белок-кодирующих генах, реализуется в два этапа: сначала на матрице ДНК синтезируется РНК (транскрипция), затем на матрице РНК синтезируется белок (трансляция).

Ранее уже было известно, что только 2% генома человека кодируют белки. Лишь эти два процента генетического «текста» подвергаются не только транскрипции, но и трансляции. Было известно и то, что транскрипции подвергаются также и многие нетранслируемые участки генома. Это, во-первых, гены функциональных РНК (транспортных, рибосомных и разнообразных регуляторных), во-вторых — интроны, некодирующие «вставки», имеющиеся в большинстве белок-кодирующих генов. Перед трансляцией интроны вырезаются из молекул РНК (это называется сплайсингом). Одно из главных достижений проекта ENCODE состоит в том, что наконец удалось выяснить, какая доля геномной ДНК подвергается транскрипции в человеческих клетках. Оказалось — целых 80%, гораздо больше, чем предполагалось. До начала выполнения проекта было известно, что в той сотой части генома, которую предстояло изучить, есть 8 генов нетранслируемых РНК. Оказалось, что в действительности их тысячи.

Исследователи пока не могут точно сказать, какую функцию выполняют все эти транскрипты. Не исключено, что некоторые из них не выполняют никакой специальной функции и являются всего лишь побочным продуктом деятельности ферментов РНК-полимераз — деятельности, которая, вероятно, является отчасти хаотической (о хаотических аспектах работы некоторых белков см.: Работу регуляторного белка впервые пронаблюдали под микроскопом , «Элементы», 31.05.2007; Разгадан механизм движения «шагающего белка» , «Элементы», 29.05.2007). Но многие из обнаруженных транскриптов все-таки зачем-то нужны. Это подтверждается тем, что в них имеются консервативные участки, почти одинаковые у человека и мыши.

Изучение транскриптов, считанных с обычных белок-кодирующих генов, тоже преподнесло сюрпризы. Всего в пределах изученного участка генома находится 400 таких генов. Более чем у 80% из них анализ транскриптов выявил наличие неизвестных ранее функциональных фрагментов — экзонов (экзонами, в отличие от интронов, называют те участки гена, которые кодируют белок). Некоторые из этих экзонов, как выяснилось, находятся в геномной ДНК на расстоянии тысяч пар нуклеотидов от всех остальных экзонов того же гена, иногда они даже оказываются внутри другого гена. То, что гены высших организмов состоят из кодирующих кусочков-экзонов, разделенных некодирующими вставками-интронами, было известно давно, но никто не знал, что экзоны многих человеческих генов находятся так далеко друг от друга и так причудливо разбросаны. Более того: были обнаружены транскрипты, содержащие экзоны двух разных генов.

Всё это заставляет признать, что мы до сих пор не очень хорошо представляем себе, что же такое ген и как он работает. Некоторые из участников проекта позволили себе даже высказаться в прессе в том смысле, что, мол, ген — понятие отчасти устаревшее, а на самом деле фундаментальными единицами генома являются транскрипты (как сказал кто-то из теоретиков — «мы до сих пор живем в мире РНК»). Другие не согласны с этим: по их мнению, ген остается центральным объектом молекулярной биологии, только вот определение этого понятия нужно подкорректировать.

В ходе выполнения проекта исследователи разработали целый ряд новых методик, которые пригодятся им в дальнейшем — например, научились гораздо лучше искать регуляторные участки ДНК, в том числе сайты начала транскрипции (промоторы) — последовательности нуклеотидов, сигнализирующие РНК-полимеразам о том, что в этом месте следует начинать транскрипцию. До начала выполнения проекта ENCODE в этой части генома человека было известно 532 промотора, сейчас их уже 775, и вдобавок много предположительных, ожидающих экспериментального подтверждения.

Назовем еще некоторые из полученных результатов:

Гистоны — специальные белки, на которые «наматывается» геномная ДНК в клеточном ядре — определенным образом модифицируются вблизи сайтов начала транскрипции и других регуляторных элементов; по характеру этих модификаций можно даже предсказывать наличие тех или иных регуляторных элементов в данном участке ДНК.

Примерно 5% нуклеотидов в геноме млекопитающих безусловно находятся под действием стабилизирующего (очищающего) отбора, иными словами, они консервативны — темп их эволюционных изменений сильно замедлен.

Для 60% этих консервативных оснований имеются экспериментальные подтверждения наличия функции — то есть они действительно зачем-то нужны, что-то кодируют.

Многие фрагменты ДНК с экспериментально подтвержденной функциональной ролью не являются, однако, эволюционно консервативными — последовательность нуклеотидов в них быстро менялась в ходе эволюции млекопитающих. По-видимому, многие из этих участков кодируют функции, не являющиеся жизненно важными. Такие участки могут служить хорошим «материалом для отбора». Кстати, сами исследователи именно этот результат считают наиболее неожиданным: раньше думали, что практически всё функциональное в геноме должно быть консервативным.

Функциональные фрагменты ДНК имеют разную степень вариабельности в пределах человеческой популяции: одни из них почти одинаковы у всех людей, другие могут очень сильно различаться.

Стоимость первого этапа исследований составила $42 млн. На продолжение работы NHGRI намерен выделять $23 млн ежегодно. Предполагается, что через 4 года весь геном человека будет подвергнут столь же глубокому анализу, как и изученная на сегодняшний день сотая часть. Ускорение и удешевление процесса будет обеспечено за счет новых методик, разработанных участниками проекта.

Источники:
1) The ENCODE Project Consortium. Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project (полный текст — Pdf, 4,5 Мб) // Nature . 2007. V. 447. P. 799-816.
2) Elizabeth Pennisi. DNA Study Forces Rethink of What It Means to Be a Gene // Science . 2007. V. 316. P. 1556-1557.

Об исследованиях генома человека см. также:
1) Проект «Геном человека» .
2) Эволюция человека сопровождалась изменением активности генов-регуляторов , «Элементы», 13.03.2006.
3) Люди отличаются от шимпанзе не тем, чем хотели , «Элементы», 30.11.2006.
4) Будут ли расшифрованы генетические основы разума? , «Элементы», 09.10.2006.
5) Почему шимпанзе не болеют раком , «Элементы», 08.02.2006.

Как наука генетика возникла на рубеже XIX и XX веков. Многие официальной датой ее рождения считают 1900 год, когда Корренс, Чермак и де Фриз независимо друг от друга обнаружили определенные закономерности в передаче наследственных признаков. Открытие законов наследственности состоялось, по существу, вторично - еще в 1865 году чешский ученый-естествоиспытатель Грегор Мендель получил те же результаты, экспериментируя с садовым горохом. После 1900 года открытия в области генетики следовали одно за другим, исследования, посвященные строению клетки, функциям белков, строению нуклеиновых кислот, открытых Мишером в 1869 году, шаг за шагом приближали человека к разгадке тайн природы, создавались новые научные направления, совершенствовались новые методы. И, наконец, в конце XX века генетика вплотную подошла к решению одного из фундаментальных вопросов биологической науки - вопроса о полной расшифровке наследственной информации о человеке.

В реализации грандиозного проекта по расшифровке генетического кода ДНК, получившего название HUGO (Human Genome Organization) приняли участие 220 ученых из разных стран, в том числе и пять советских биологов. В нашей стране была создана собственная программа «Геном человека», руководителем которой стал академик Александр Александрович Баев.

Впервые идея организации подобной программы была выдвинута в 1986 году. Тогда идея показалась неприемлемой: геном человека, то есть совокупность всех его генов содержит около трех миллиардов нуклеотидов, а в конце 80-х годов затраты на определение одного нуклеотида составляли около 5 долларов США. Кроме того технологии 80-х позволяли одному человеку определять не более 100 000 нуклеотидов в год. Тем не менее, уже в 1988 году Конгресс США одобрил создание американского проекта исследований в этой области, руководитель программы Дж. Уотсон так определил ее перспективы: «Я вижу исключительную возможность для улучшения человечества в ближайшем будущем». Осуществление российской программы началось в 1989 году.

Сейчас определение одного нуклеотида обходится всего в один доллар, созданы аппараты, способные секвенировать (от лат. sequi - следовать) до 35 млн. последовательностей нуклеотидов в год. Одним из важных достижений стало открытие так называемой полимеразной цепной реакции, позволяющей из микроскопических количеств ДНК за несколько часов получить объем ДНК, достаточный для генетического анализа. По оценкам специалистов существует возможность завершения проекта через 15 лет, и уже сейчас программа приносит полезные результаты. Суть работ заключается в следующем: сначала проводится картирование генома (определение положения гена в хромосоме), локализация некоторых генов, а после этого секвенирование (определение точной последовательности нуклеотидов в молекуле ДНК). Первым геном, который удалось локализовать, стал ген дальтонизма, картированный в половой хромосоме в 1911 году. К 1990 году число идентифицированных генов достигло 5000, из них картированных 1825, секвенированных - 460. Удалось локализовать гены, связанные с тяжелейшими наследственными болезнями, такими, как хорея Гентингтона, болезнь Альцгеймера, мышечная дистрофия Дюшена, кистозный фиброз и др.

Таким образом, проект исследования генома человека имеет колоссальное значение для изучения молекулярных основ наследственных болезней, их диагностики, профилактики и лечения. Следует обратить внимание на то, что за последние десятилетия в индустриально развитых странах доля наследственных болезней в общем объеме заболеваний значительно увеличилась. Именно наследственностью обусловлена предрасположенность к раковым и сердечно-сосудистым заболеваниям. В значительной степени это связано с экологической ситуацией, с загрязнением окружающей среды, так как многие отходы промышленности и сельского хозяйства являются мутагенами, то есть изменяют человеческий генофонд. Учитывая современный уровень развития генетики можно предположить, что научные открытия будущего позволят путем изменения генома адаптировать человека к неблагоприятным условиям внешней среды. Что же касается борьбы с наследственными заболеваниями, то их лечение путем замены больных генов на здоровые кажется реальным уже сейчас. Все это означает, что человек получит возможность не только изменять живые организмы, но и конструировать новые формы жизни. В связи с этим возникает целый ряд серьезных вопросов.

На мой взгляд одним из наиболее важных вопросов является вопрос об использовании генетической информации в коммерческих целях. Несмотря на то, что и участники проекта HUGO, и представители международных организаций, в частности ЮНЕСКО, единодушны в том, что любые результаты исследований по картированию и секвенированию генома должны быть доступны всем странам и не могут служить источником прибыли, частный капитал начинает играть все большую роль в генетических исследованиях. Когда появилась программа HUGO, возникли так называемые геномные компании, которые занялись самостоятельно занялись расшифровкой генома. В качестве примера можно привести американскую организацию под названием Institute of Genomic Research (TIGR) или компанию Human Genome Sciences Inc. (HGS). Между крупными фирмами идет ожесточенная борьба за патенты. Так в октябре 1994 Крэк Вентер, глава вышеупомянутой компании TIGR, о том, что в распоряжении его корпорации находится библиотека из 35000 фрагментов ДНК, синтезированных с помощью РНК на генах, полученных лабораторным путем. Эти фрагменты сравнили с 32 известными генами наследственных заболеваний. Оказалось, что 8 из них полностью идентичны, а 19 гомологичны. TIGR оказался обладателем ценнейшей научной информации, но его руководители заявили, что химическое строение всех последовательностей из этой библиотеки засекречено и будет сделано достоянием гласности только в том случае, если за компанией будет признано право собственности на все 35000 фрагментов. Это не единственный случай, а между тем, развитие генетики намного опережает развитие соответствующей законодательной базы. Хотя шаги в этом направлении предпринимаются (в России, например, в конце 1996 года был принят закон "О государственном регулировании в области генно-инженерной деятельности", в1995 был принят закон о биоэтике во Франции, в США Акт о гражданских правах запрещает дискриминацию при найме на работу по расовым, половым, религиозным и национальным признакам, при этом ген серповидноклеточной анемии, в частности у негров, может считаться расовым признаком, другой закон запрещает дискриминацию при найме на работу лиц с пониженной трудоспособностью, а таковыми могут считаться и лица с отягощенной наследственностью, большое значение имеет так называемый принцип Тарасовой, обязывающий врачей нарушать конфиденциальность врачебных сведений с целью предотвращения возможного вреда обществу), международных актов, регулирующих все стороны деятельности, связанной с генетикой, пока не существует.

Также по теме

Китай создает бомбардировщик прорыва пво сша Будет ли лучший в мире истребитель

Состояние и перспективы развития ввс сша

Свердловская область — Ураловед Где стояла встарь изба - перекресток и труба

Масленица: народные обычаи, обряды и ритуалы

Чем объяснить сходство между меркурием и луной