Введение в геномику. Геном человека, основные черты организации

1. Геном, клонирование, происхождение человека. – Под ред. Л.И. Корочкина. – Фрязино: «Век 2», 2004. – 224 с.

2. Вымершие звери и птицы, которых проще всего клонировать. – Электронный ресурс. – 2013.

3. Андреева, Л.Е., В.З. Тарантул. Трансгенные животные: фундаментальные и прикладные аспекты / Л.Е. Андреева, В.З. Тарантул // Проблемы и перспективы молекулярной генетики. Том 1 / Отв. ред. Е.Д.Свердлов. – М.: Наука, 2003. – С. 184 – 217.

4. Клонирование человека. Вопросы этики. – Париж, Изд-во ЮНЕСКО, 2004. – 21 с.

Тема № 4. Современные методы исследования генома

Краткое содержание:

1. Классический подход к расшифровке последовательностей ДНК

2. Принцип высокопроизводительного пиросеквенирования ДНК

3. Достижения и перспективы секвенирования

4. Использование методов биоинформатики в секвенировании

5. История прочтения генома человека

Невозможно представить себе современную биологию (не только молекулярную биологию и биохимию, но и систематику, теорию эволюции, антропологию, медицину) без мегабайтов прочитанных последовательностей ДНК, этой плоти и крови биоинформатики , самой динамично развивающейся области биологической науки. Успех в этой области был достигнут в конце ХХ в. благодаря прорыву в создании технических устройств и технологий расшифровки геномов. Определение последовательностей нуклеотидов в молекуле ДНК получило название секвенирования (от англ. sequence – последовательность), а приборы, предназначенные для этой цели, именуются секвенаторами .

1. Классический подход к расшифровке последовательностей днк

Самый распространенный на сегодняшний день способ секвенирования ДНК - «метод терминации цепи », или «дидезокси метод », разработанный в 70-х гг. прошлого века Фредериком Сэнгером (дважды лауреат Нобелевской премии по химии: за определение аминокислотной последовательности инсулина (1955 г.) и за разработку метода секвенирования ДНК (1980 г.)). Дешевизна, точность, а также сравнительная простота автоматизации делает этот метод своеобразным «золотым стандартом » среди всех существующих способов определения последовательности нуклеотидных остатков ДНК. Так был расшифрован весь геном человека, и именно метод Сэнгера до сих пор является рутинным в повседневной лабораторной практике.

амплифицируются

Вначале фрагменты ДНК, последовательность которых предстоит определить, многократно копируются (амплифицируются ), затем нарезаются на короткие куски, которые служат матрицей для синтеза комплементарных цепей ДНК. Синтез в общих чертах напоминает процесс копирования ДНК в живой клетке.

Особенность метода заключается в использовании химически модифицированных разновидностей четырех дезоксирибонуклеотидов , составляющих цепи ДНК. Каждая разновидность «помечена» флуоресцентной молекулой-маркером, на жаргоне «краской». Короткий фрагмент ДНК, называемый затравкой, или праймером , инициирует синтез ДНК в определённой точке цепи ДНК-матрицы. Синтезирует комплементарную цепь особый фермент - ДНК-полимераза . При этом флуоресцентно меченные разновидности нуклеотидов, которые присутствуют в реакционной смеси в значительно меньших количествах, чем обычные нуклеотиды, обрывают синтез, когда один из них оказывается на конце растущей ДНК-цепи. (Все дело в том, что видоизмененные нуклеотиды не имеют той самой химической группы, к которой должен присоединяться следующий нуклеотид для продолжения цепи.) В результате получается смесь, содержащая полный набор ново-синтезированных фрагментов ДНК, каждый из которых начинается в одном и том же месте, но заканчивается во всех возможных положениях вдоль цепи ДНК-матрицы.

Современные автоматизированные секвенаторы разделяют эти фрагменты, пропуская всю смесь через тончайшие капилляры, наполненные гелем. Чем короче фрагмент, тем быстрее он движется в геле по капилляру под действием электрического поля. (Фрагменты ДНК - по сути, ионы, движущиеся в электрическом поле от «минуса» к «плюсу».) Процесс, называемый капиллярным электрофорезом , настолько эффективен, что фрагмент, только что вышедший из капилляра, оказывается ровно на один нуклеотид длиннее, чем предшествующий ему. По мере того как фрагмент появляется, он освещается лазером, что заставляет светиться меченый нуклеотид на его конце. Компьютер определяет разновидность этих нуклеотидов по цвету вспышки и регистрирует последовательность их появления, складывая «буквы» (нуклеотиды) в «текст» (последовательность ДНК). В случае расшифровки целого генома так нарабатываются миллиарды коротких «текстов», которые поступают в специальную программу, запускаемую на суперкомпьютерах. Программа находит места перекрывания «текстов» и, располагая их в нужном порядке, выстраивает полную последовательность генома.

Большинство новых технологических разработок направлено на миниатюризацию , мультиплексирование (в данном случае, параллельное соединение низкопроизводительных блоков системы для повышения общей производительности) и автоматизацию процесса секвенирования. Все они могут быть разделены на два класса. Первый объединяет методы «секвенирования синтезом», в которых основания определяются по мере того, как они встраиваются в растущую цепь ДНК.

Ко второму классу относятся технологии расшифровки последовательности оснований единичной молекулы ДНК. Некоторые из них достаточно экзотичны - как, например, чтение нуклеотидных остатков ДНК электронным или оптическим способом по мере того, как молекула «протискивается» через нанопору . Длинный перечень улучшений системы капиллярного электрофореза в сочетании с возрастающей автоматизацией и усовершенствованием программного обеспечения позволили снизить стоимость секвенирования в 13 раз с тех пор, как первые автоматические секвенаторы появились в 90-е годы.

Но все это выглядит несколько бледно на фоне возможностей нового метода секвенирования синтезом - изощрённого варианта пиросеквенирования, разрабатываемого и внедряемого компанией 454 Life Sciences.

2. Принцип высокопроизводительного пиросеквенирования ДНК

Технология, разработанная компанией 454 Life Sciences, называется пирофосфатным секвенированием, или пиросеквенированием . Сама идея пиросеквенирования, надо сказать, не нова: она возникла ещё в начале 90-х годов прошлого века, но опубликованный тогда метод не сумел вытеснить традиционный дидезокси метод Сэнгера. Однако разработчики из 454 Life Sciences дополнили его возможностями современных нанотехнологий, и количество перешло в качество. Поэтому, точнее будет назвать метод «пиросеквенированием ДНК в плотно упакованных пиколитровых реакторах».

Скорость является одним из главных преимуществ нового метода секвенирования. Название метода заимствовано у знаменитого на Западе автомобиля Chevrolet Chevelle SS 454 1970-го года с двигателем мощностью 360 лошадиных сил.

Весь геном, все его молекулы ДНК, случайным образом фрагментируются на кусочки по 300–500 пар оснований. Затем комплементарные цепи фрагмента разделяются, к каждой цепи фрагментов пришивается одинаковый для всех олигонуклеотид-«адаптер », который позволяет отдельным цепям налипать на пластиковые бусинки . (Последовательность этого олигонуклеотида позволяет позднее в процессе секвенирования распознавать ДНК-матрицу.) При этом смесь разъединённых на комплементарные цепи фрагментов разбавляют таким образом, что каждая бусинка получает лишь по одной (!) индивидуальной цепи.

Каждая бусинка оказывается заключённой в капельку, окруженную маслом и содержащую смесь для осуществления полимеразной цепной реакции (ПЦР), которая и проходит отдельно в каждой капельке эмульсии (так называемая эмульсионная ПЦР , эПЦР). Это приводит к «клональной амплификации» цепей ДНК, а говоря по-русски, к тому, что на поверхности бусинки удерживается уже не одна, а около 10 млн копий («клонов») уникальной ДНК-матрицы.

Далее эмульсия разрушается, вновь двуцепочечные фрагменты ДНК (образовавшиеся в ходе ПЦР) разделяются, и бусинки, несущие одноцепочечные копии ДНК-матрицы, помещаются в лунки «предметного стекла » - слайда особой конструкции. Каждая лунка такого слайда образует отдельный пиколитровый «реактор» , в котором и будет происходить реакция секвенирования.

Слайд представляет собой срез блока , полученного путём нескольких циклов вытягивания и сплавления оптических волокон. В результате каждого цикла диаметр индивидуальных волокон уменьшается по мере того, как волокна формируют пучки шестигранной упаковки увеличивающегося поперечного диаметра. Каждое волокно имеет сердечник диаметром 44 мкм, окружённый 2–3 мкм слоем оболочки. Затем сердечники вытравливаются, и в результате получаются лунки ≈55 мкм глубиной, с расстоянием ≈50 мкм между центрами соседних лунок. Объём таких «реакторов» - 75 пиколитров; плотность размещения на поверхности слайда - 480 лунок на квадратный миллиметр. Каждый слайд несёт около 1,6 миллионов лунок, в каждую из которых попадает одна (!) бусинка с ДНК-матрицей. Слайд помещается в проточную камеру таким образом, что над отверстиями лунок создаётся канал высотой 300 мкм, по которому в лунки поступают необходимые реактивы.

Доставляемые в проточную камеру реактивы текут в слое, перпендикулярном оси лунок. Такая конфигурация позволяет одновременно осуществлять реакции на бусинках, несущих ДНК-матрицы, внутри отдельных лунок. Добавление и удаление реагентов и продуктов реакции происходит за счёт конвекционного и диффузионного переноса. Время диффузии между потоком и лунками составляет около 10 секунд и зависит от высоты проточной камеры и глубины лунок. Глубина лунок тщательным образом рассчитана исходя из следующих соображений:

1. Лунки должны быть достаточно глубокими, чтобы бусинки, несущие ДНК-матрицу, не выскакивали из них под действием конвекции.

2. Они должны быть достаточно глубокими, чтобы исключить диффузию продуктов реакции из лунок, где имело место включение нуклеотида, в лунки, где включения не произошло.

3. Лунки должны быть мелкими настолько, сколько требуется для осуществления быстрой диффузии нуклеотидов в лунку и быстрого вымывания оставшихся нуклеотидов и продуктов реакции в конце каждого цикла, что, в свою очередь, необходимо для обеспечения высокой продуктивности секвенирования и снижения расходов реактивов.

Помимо бусинок с ДНК-матрицей, в каждую лунку «насыпают» ещё бусинок помельче - каждая с «сидящими» на её поверхности (иммобилизованными ) ферментами , необходимыми для пирофосфатного секвенирования. Нуклеотиды (одного вида за раз) и другие реактивы, необходимые для реакции секвенирования, подаются последовательно в проточную камеру, куда помещается слайд.

Каждый раз, когда определённый нуклеотид встраивается в растущую цепь ДНК в какой-нибудь из лунок, в ней высвобождается молекула пирофосфата , которая, в свою очередь, является необходимым предшественником компонента другой ферментативной реакции. Её катализирует особый фермент, люцифераза светлячка Photinus pyralis. Но для её осуществления необходим аденозинтрифосфат (АТФ). Новообразованный пирофосфат превращается в лунке в АТФ под действием ещё одного фермента - АТФ-сульфурилазы . И тогда люцифераза окисляет люциферин до оксилюциферина, а эта реакция сопровождается хемилюминесценцией - по-простому, маленькой вспышкой света. Дно слайда находится в оптическом контакте с оптико-волоконным световодом, подключённым к прибору с зарядовой связью (CCD-сенсор, charge coupled device ). Это позволяет регистрировать излучаемые фотоны со дна каждой индивидуальной лунки, в которой произошло встраивание известного нуклеотида. Общая схема пиросеквенирования дана на рис. 1.

Связывая зарегистрированные от каждой лунки вспышки с типом нуклеотида, присутствующего в проточной камере в данный момент времени, компьютер последовательно отслеживает рост цепочек ДНК в сотнях тысяч лунок одновременно. Время, необходимое для протекания ферментативной реакции, производящей детектируемую «вспышку», составляет порядка 0,02–1,5 секунд. Таким образом, скорость реакции определяется скоростью массопереноса, что оставляет место для улучшений за счёт ускорения доставки реактивов. После поступления в проточную камеру каждого нуклеотида, она промывается раствором, содержащим фермент апиразу . Таким образом, перед тем как «запустить» в камеру следующий нуклеотид, из всех лунок удаляются любые нуклеотиды, остававшиеся там от предыдущего раунда.

Включение того или иного нуклеотида детектируется в результате высвобождения неорганического пирофосфата и последующего излучения света. Определить лунки, содержащие бусинки с матричной цепью ДНК, можно, прочитав «последовательность - ключ» адаптерного олигонуклеотида, пришитого к началу каждой ДНК-матрицы. Из регистрируемого сигнала вычитается уровень фона, затем сигнал нормализуется и корректируется.

Интенсивность нормализованного сигнала для каждой конкретной лунки во время поступления в проточную камеру определённого нуклеотида пропорциональна числу встроенных нуклеотидов. Линейность зависимости сохраняется для гомополимеров длиной как минимум в восемь нуклеотидов. При таком секвенировании синтезом очень небольшое число ДНК-матриц на каждой бусинке теряет синхронизм , т. е. вырываются вперёд или начинают отставать от других матриц. Исправление таких сдвигов необходимо, поскольку потеря синхронизма создаёт кумулятивный эффект , сильно снижающий качество прочтения при увеличении его длины. С учетом этого, сотрудники компании 454 разработали особый алгоритм, позволяющий оценивать и вносить поправки на «перелёт» и неполную достройку цепи, происходящие в отдельных лунках. Высокая точность расшифровки последовательности достигается тем, что система осуществляет многочисленное прочтение одного и того же фрагмента, что позволяет построить единую обобщённую (так называемую консенсусную ) последовательность.

Отдельные прочтения (риды – от англ. reаd, читать) одного и того же участка ДНК выравниваются относительно друг друга исходя из интенсивности сигналов в момент протекания через камеру того или иного нуклеотида, а не на основе последовательности этих прочтений. Затем соответствующие сигналы усредняют, и только тогда записывают полученную последовательность. Такой подход значительно улучшает качество расшифровки последовательности и предоставляет возможность оценки её качества.

В 2005 г. учёные из 454 Life Sciences, используя свою технологию, сумели расшифровать состоящий из 600 тысяч нуклеотидов геном бактерии Mycoplasma genitalium с точностью 99,4%, а также состоящий из 2,1 млн нуклеотидов геном Streptococcus pneumoniae .

Рисунок 1 - Схема пиросеквенирования. А - ДНК фрагментируется, к фрагментам пришиваются олигонуклеотиды-«адаптеры»; полученные двуцепочечные молекулы ДНК разделяются на две комплементарные цепи. Б - Одноцепочечные молекулы ДНК прикрепляются к бусинкам в условиях, стимулирующих попадание лишь одной молекулы на бусинку. Отдельные бусинки заключаются в капли реакционной смеси, окруженные маслом. Количество молекул на бусинке увеличивается в миллионы раз в результате эмульсионной полимеразной цепной реакции (эПЦР). В - Эмульсия разбивается, и цепи ДНК-фрагментов, образовавшиеся в результате эПЦР, разделяются. Бусинки, несущие на своей поверхности миллионы одноцепочечных копий первоначального фрагмента ДНК, помещаются в лунки оптико-волоконного слайда, по одной в каждую лунку. Г - В каждую лунку добавляются бусинки поменьше, несущие на своей поверхности ферменты, необходимые для пиросеквенирования. Д - Микрофотография эмульсии, изображающая «пустые» капли и капли, содержащие бусинки с ДНК-матрицей. Толстая стрелка указывает на 100-мкм каплю, тонкая - на 28-мкм бусинку. Е - Микрофотография фрагмента оптико-волоконного слайда, полученная при помощи сканирующего электронного микроскопа. Видны оболочки оптических волокон и пустые лунки

В статье, в которой впервые был представлен и опробован новый метод, сообщается, что весь геном Mycoplasma genitalium был прочтён за один раз! Сначала весь геном был фрагментирован и превращён в библиотеку кусочков ДНК, как описано выше (труд одного человека на протяжении 4-х часов). После проведения эмульсионной ПЦР и помещения полученных бусинок с ДНК-матрицами на 60 мм 2 слайд (на что одному сотруднику потребовалось 6 часов), процесс завершился 4-х часовой автоматической работой инструмента, состоящей из 42 циклов.

В результате сборки прочитанных последовательностей (каждый около 108 пар оснований) было получено 25 отдельных непрерывных фрагментов, так называемых контигов (от англ. contigious –соприкасающийся), средней длиной в 22,4 тысяч пар оснований. Эти фрагменты покрыли около 96,54% всего генома микоплазмы. Из оставшихся непрочтёнными 4,6% генома, 3% приходились на неразрешимые повторы . Таким образом, за один раз было отсеквенировано 99,5% уникальной последовательности генома.

3. Достижения и перспективы секвенирования

Хотя первая версия инструмента от компании 454 Life Sciences легко могла заменить более 50 капиллярных секвенаторов Applied Biosystem 3730XL по цене в шесть раз меньшей, реакция научного сообщества была на удивление прохладной. Вместо того чтобы принять новую технологию и начать использовать её неисчерпаемый потенциал, многие учёные, привыкшие к использованию метода Сэнгера, заговорили о таких проблемах, как точность расшифровки, длина отдельных прочтений, стоимость инфраструктуры... А кто-то просто восставал против необходимости работать с большими массивами информации, производимыми с использованием новой технологии.

Большинство критиков, однако, не заметили, что множество препятствий, стоящих на пути метода секвенирования следующего поколения, преграждали на первых порах путь и методу Сэнгера. Тогда длина прочтений составляла всего 25 пар оснований, и достигла 80 только после появления терминирующих дидезокси-нуклеотидов Фреда Сэнгера. Технология «секвенирования синтезом», основанная на выделении пирофосфата, изначально позволяла прочитывать отрезки длиной не более 100 нуклеотидов. Спустя 16 месяцев на биотехнологическом рынке, этот показатель был улучшен до 250 пар оснований. Последние разработки позволяют считывать уже около 500 пар оснований, приближая новый метод к методу Сэнгера с его ≈1000 нуклеотидами.

Другим важным фактором, помимо длины отдельных прочтений, является число прочтений , производимое в результате одного «прогона » секвенатора, нормированное на стоимость такого «прогона». Этот вопрос хорошо решается конкурентами 454 Life Sciences, системы которых производят в десять раз больше прочтений, платя за это укорочением их длины, составляющей всего 35 (или меньше) нуклеотидов. Сегодня на рынке существует три коммерческих системы нового поколения для секвенирования ДНК:

Roche (454) GS FLX Genome Analyzer, распространяемый Roche Applied Sciences. (Компания 454 LIfe Sciences выкуплена гигантом Roche Diagnostics в марте 2007 г. за 154,9 млн. долларов, но продолжает оставаться независимым подразделением);

Секвенатор Illumina Solexa 1G и

Наиболее свежая система SOLiD от Applied Biosystems.

Другие системы для расшифровки ДНК, которые уже появились на рынке, относятся к «третьему поколению » и основываются на анализе одиночных молекул. Они разрабатывались компаниями VisiGen и Helicos.

И хотя прочтение бактериального генома за раз было впечатляющим достижением, поначалу не было ясно, какие биологические задачи , недоступные старому доброму методу Сэнгера, можно будет решать, взяв на вооружение новый метод пиросеквенирования. И действительно, первые проекты с участием инструмента Roche 454 GS20 заключались лишь в «перечитывании» уже расшифрованных бактериальных геномов и подкреплении дополнительными данными уже идущих больших «Сэнгеровских проектов». В то же время исследования в области метагеномики , помимо работы с огромными массивами данных, порою бóльшими, чем геном человека, страдали от искажений, вносимых на стадиях конструирования библиотек и клонирования фрагментов для секвенирования.

В этом смысле технология 454, сочетающая эПЦР и пиросеквенирование, обладает неоспоримым преимуществом перед методом Сэнгера. Эмульсионная ПЦР позволяет амплифицировать без всяких предпочтений единичные молекулы ДНК, заключая их в капельку эмульсии и устраняя конкуренцию со стороны других ДНК-матриц за ограниченное число ДНК-полимераз. Пиросеквенирование, в свою очередь, осуществляет параллельное прочтение этих матриц со световым сигналом на выходе, который может считываться компьютером. Первые подобные исследования, опубликованные в 2006 году, показали необыкновенную гибкость метода нового поколения, использованного при изучении микробного многообразия подземных экосистем глубокой шахты, глубоководных морских экосистем, морских вирусных «сообществ» («виромов ») в нескольких океанах.

Интересное исследование, сочетающее в себе метагеномный анализ и «ДНК-палеонтологию », было проведено в конце 2005 г. Одного запуска инструмента Roche (454) GS20 было достаточно для анализа 13 млн. пар оснований последовательности генома 28 000-летнего мамонта . Эта работа проложила дорогу для технически более трудного проекта расшифровки генома неандертальца . Трудность такого проекта состоит в том, что количество выделяемой из образцов костей древней ДНК неандертальца составляет всего лишь 5% от количества, получаемого из «свежего материала». Следовательно, секвенировать приходится в 20 раз дольше, чем это необходимо для генома современного человека. Кроме того, вклад разрушения ДНК в образцах, сохраняемых при умеренных температурах, в сочетании с ошибками, присущими новому методу пиросеквенирования, часто превосходит уровень различия, установленный для геномов неандертальца и современного человека. Поэтому утверждать, что полученная последовательность действительно древняя, а не случайно попавшая в препарат современная ДНК, значительно легче в случае с мамонтом - современные слоны, в отличие от людей, не часто встречаются в лабораториях. Для того чтобы получить настоящую последовательность древнего генома млекопитающего, необходимо провести множество раундов прочтения каждого участка генома, а также удостовериться в происхождении прочитанных участков.

Вместе с прорывом в области секвенирования сложных смесей ДНК, такие проекты сделают возможным изучение любой экосистемы на планете на уровне последовательностей ДНК. Это откроет доступ к флоре и фауне 100-тысячелетней давности - возможности, превосходящие самые смелые ожидания совсем недалекого прошлого.

На клеточном уровне секвенирование нового поколения (здесь и далее речь идёт не только о пиросеквенировании, но и о других новых методах секвенирования синтезом) впервые позволяет учёным идентифицировать мутации в любом организме для всего генома. Так были найдены аллели, отвечающие за устойчивость к антибиотику у Mycobacterium tuberculosis , а также идентифицированы все мутации в геноме размером в 9 млн пар оснований у штамма бактерии, эволюционировавшей на протяжении 1000 поколений. Эти ранние попытки не только продемонстрировали способность новой технологии обнаруживать мутации и ошибки в опубликованных научных статьях, но и связанные с её использованием трудности, такие как ошибки прочтения гомополимерных последовательностей при пиросеквенировании (454) или быстрое уменьшение качества прочтения ближе к 3’-концу последовательности в системах с короткой длиной индивидуальных прочтений (Solexa или SOLiD от Applied Biosystem).

Раньше для преодоления этих трудностей данные, полученные пиросеквенированием, дополняли информацией, полученной классическим сэнгеровским путём. Но поскольку стоимость и затраты, требуемые сэнгеровской составляющей эксперимента, остаются отталкивающе высокими, многие лаборатории сегодня полагаются только на методы нового поколения, обычно сочетая относительно длинные прочтения пиросеквенирования с короткими, но дешевыми (а значит, и многочисленными) прочтениями, осуществляемыми системами Solexa и SOLiD. Такое сочетание различных платформ позволяет производить независимую оценку качества их работы, а также проверять эталонные последовательности, хранящиеся в общественных базах данных.

Получение большого количества последовательностей ДНК из различных близкородственных организмов движет вперед и развивает подход, названный повторным секвенированием (resequencing), в котором работа с последовательностями ведётся иначе, чем при сборке свежесеквенированного генома. При повторном секвенировании сборка направляется уже имеющейся под рукой эталонной последовательностью, и поэтому требует значительно меньшего покрытия (8–12-ти кратного), чем при сборке генома de novo (25–70-ти кратного). Этот подход был применён в работе по расшифровке 10 митохондриальных геномов млекопитающих, которая сделала возможными исследования в области генетики популяций, основанные не на коротких отрезках последовательности, а на полных геномах митохондрий. В настоящий момент многочисленные проекты по расшифровке микробных геномов ведутся не только для расширения списка доступных геномов, но и для проведения будущих сравнительных исследований, сопоставляющих генотип и фенотип организма на геномном уровне.

Далеко может продвинуться также и работа по изучению организмов, которые не стоят в планах по геномному секвенированию - благодаря возможностям новых методов секвенирования напрямую расшифровывать последовательности транскриптов (точнее, кДНК - ДНК-копий матричных РНК) в клетке. Изучение транскриптов посредством прямого секвенирования обладает рядом преимуществ перед методом гибридизации на ДНК-микрочипах. Главное здесь то, что секвенирование не требует никаких знаний о геномной последовательности организма a priori , поскольку последовательность транскрипта может быть немедленно сравнена с эталонной последовательностью близкородственного вида из базы данных, используя стандартные алгоритмы биоинформатики. Знание последовательностей транскриптов может в корне изменить исследования организмов, геномы которых сегодня не стоят в очереди на расшифровку, а в некоторых случаях никогда там и не окажутся. Первые работы в этой области показали, что существует возможность сопоставлять последовательности (кДНК и геномные, соответственно) двух таких далёких друг от друга видов, как бобовое Meticago truncatula и растение-эталон Arabidopsis thaliana . Также было обнаружено множество не описанных ранее транскриптов кукурузы Zea mays .

Прямой анализ транскриптов поможет обойти проблему, которую ставят перед учёными организмы с непомерно большими геномами. Несмотря на успешно проведённые проекты по расшифровке вирусных, бактериальных и больших геномов млекопитающих, метод Сэнгера оставил задачу по расшифровке геномов полиплоидных растений своим преемникам. Эти гигантские геномы, частенько принадлежащие важным хозяйственным растениям (например, геном пшеницы составляет 16 млрд пар оснований), делали все предыдущие попытки по расшифровке бесплодными. Однако перспектива дешёвого секвенирования экспрессируемых участков генома (то есть транскриптов) позволяет надеяться на успешное изучение геномов таких растений хотя бы на функциональном уровне.

И наконец, новые методы секвенирования имеют практическое применение и в медицине. Например, в генетике раковых заболеваний, специфические раковые аллели могут быть отслежены в тканях посредством высокопроизводительного секвенирования геномной ДНК в тех случаях, когда метод Сэнгера терпит поражение. И здесь большим преимуществом нового метода оборачивается многократное прочтение последовательности.

Несмотря на то, что новые методы секвенирования ДНК уже стимулировали большое количество всевозможных исследований, осуществление которых было невозможно ещё в недалёком прошлом, учёным и инженерам, занимающимися разработкой этих технологий - а равно как и компаниям, продвигающим эти технологии на рынке, - предстоит многое сделать для её улучшения. Прежде всего, снизить стоимость . Уменьшение цены на один-два порядка необходимо для осуществления надежд на персональную геномику , цель которой - повторное секвенирование индивидуальных геномов по цене, не превышающей 1000 долларов. В дополнение к этому, снижение процента ошибок будет также горячо приветствоваться - не только для методов следующего поколения, но и для метода Сэнгера, который будет продолжать вносить вклад и в обозримом будущем. Возможно, появятся искусственно изменённые специализированные ДНК -полимеразы , предоставляющие информацию о последовательности ДНК в виде испускаемого светового сигнала. По мере того, как стоимость технологий будет снижаться, количество накапливаемой информации будет расти лавинообразно, что может создать «узкое место» в исследованиях. Поэтому часть усилий по разработке новых технологий секвенирования необходимо направить на развитие биоинформатики .

Геном человека

Расшифровка генома человека – событие столь же важное в истории человечества, как открытие электричества, изобретение радио или создание компьютеров.

Немного истории. В 1988 году Национальный институт здоровья США начал проект «Геном человека» , возглавил который нобелевский лауреат Джеймс Уотсон . Основная цель проекта – выяснить последовательность нуклеотидных оснований во всех молекулах ДНК человека и установить локализацию, т.е. полностью картировать все гены человека.

Планировалось, что работа но определению нуклеотидной последовательности ДНК человека (секвенирование ДНК ) должна окончиться в 2005-м году . Однако после первого года работы стало ясно, что скорости секвениронания ДНК очень низкие и для полного завершения работы такими темпами потребуется около 100 лет .

Стало очевидно, что необходим поиск новых технологий секвенирования, создание новой вычислительной техники и оригинальных компьютерных программ. Это было невыполнимо в рамках отдельно взятого государства , и к программе подключились другие страны.

Широкомасштабные координированные исследования стали проводиться под эгидой международной организации ^ Human Genom Organisation (HUGO). С 1989 г. в проект включилась и Россия. Все хромосомы человека были поделены между странами-участницами, и России для исследования достались 3-, 13- и 19-я хромосомы . В проекте оказались задействованы несколько тысяч ученых из 20 стран .

В 1996 были созданы всемирные банки данных по ДНК человека. Любая вновь определенная последовательность нуклеотидов размером более 1 тыс. оснований должна была быть обнародована через Интернет в течение суток после ее расшифровки, в противном случае статьи с этими данными в научные журналы не принимались. Любой специалист в мире мог воспользоваться этой информацией.

К началу 1998 г. было секвенировано всего около ^ 3% генома . В это время к работе неожиданно подключилась частная американская компания из штата Мериленд «Celera Genomics» под руководством Крега Вентера , которая объявила, что закончит свою работу на 4 года раньше международного консорциума.

Началась беспримерная в науке гонка. Два коллектива работали независимо, не жалея сил, чтобы придти к финишу первыми. В ходе выполнения проекта «Геном человека» было разработано много новых методов исследования, большинство из которых значительно ускоряет и удешевляет работу по расшифровке ДНК. Эти методы анализа сейчас используются в медицине, криминалистике и т.д.

В июне 2000 года два конкурирующих коллектива объединили свои данные, официально объявив о завершении работ. А в феврале 2001 года появились научные публикации чернового варианта структуры генома человека. Качество секвенирования достаточно высокое и предполагает всего 1 ошибку на 50 тыс.п.н .

«Геном человека» вошел в историю как один из самых трудоемких и дорогостоящих проектов. На него было потрачено в сумме более ^ 6 миллиардов долларов.

Возникает естественный вопрос: геном какого же человека определен в результате этих титанических усилий, кто этот конкретный человек? Согласно имеющимся данным, фирма Celera в основном ориентировалась на геном одного человека, о котором известно лишь, что это белый мужчина среднего возраста. Скорее всего, это был сам глава корпорации Крег Вентер. Международный консорциум использовал в своей работе материал не менее семи различных людей.

Геном человека состоит из 24 хромосом и 3,2 млрд. п.н. Хромосомы человека были пронумерованы согласно размеру : наибольший - у хромосомы 1, наименьший - у хромосомы 22. Со временем выяснилось, что хромосома 22 содержит больше ДНК, чем хромосома 21, но порядок нумерации не стали менять, чтобы не вносить путаницу. Отдельно идут две половые хромосомы: X и Y (условно их можно назвать томами № 23 и № 24 Энциклопедии человеческого генома).

^ В геноме женщин содержится лишь 23 хромосомы из 24-х , и все они представлены в соматических клетках двумя экземплярами. У мужчин в клетках содержится полная Энциклопедия человека, все 24 хромосомы, но две из них (хромосомы X и Y) существуют в единичных экземплярах.

Разные хромосомы сильно отличаются друг от друга по числу и свойствам генов (в первой, самой большой, хромосоме содержится 263 млн. п.н., составляющих 2237 гена, а в 21 хромосоме – 50 млн.п.н. и 82 гена). www . ensembl . org

Также отличаются хромосомы и по важности записанной в них информации. Число генов, ассоциируемых с различными болезнями больше всего в Х хромосоме – 208; в 1 хмс – 157; и в 11 хмс – 135. Меньше всего таких генов в Y хмс – всего 3. Тем не менее, только совокупность всех хромосом обеспечивает клетки полной информацией, позволяющей человеку нормально развиваться и жить. В отсутствие любой из пар хромосом жизнь конкретного индивидуума становится невозможной.

При потере по каким-либо причинам только одной из пары хромосом состояние человека сильно отличается от нормы. Например, частичная моносомия 5-ой хромосомы приводит к синдрому кошачьего крика . У детей с этой аномалией отмечается необычный плач, что обусловлено изменением гортани, а также черепа и лица.

В клетках человека также имеется ДНК , расположенная не в хромосомах, а в митохонд-риях. Это тоже часть генома человека, называемая М-хромосомой . В отличие от ядерного генома митохондриальные гены располагаются компактно, как в геноме бактерий, и имеют свой собственный генетический код (своеобразный «генетический жаргон»). МитДНК ответственна в клетке за синтез всего лишь нескольких белков. Но эти белки очень важны для клетки, поскольку участвуют в обеспечении клетки энергией.

Предполагают, что митохондрии появились в клетках эукариот в результате симбиоза высших организмов с аэробными бактериями.

МитДНК передается из поколения в поколение только по женской линии . При оплодотворении в яйцо проникает сперматозоид с набором отцовских хромосом, но без отцовских митохондрий. Только яйцеклетка предоставляет зароды-шу свою митДНК. Поэтому митДНК удобно использовать для определения степени родства как внутри вида, так и между различными таксонами.

Одной из целей исследования генома человека являлось построение точной и подробной карты всех хромосом. Генетическая карта представляет собой схему, описывающую порядок расположения на хромосоме генов и других генетических элементов. (снипсы-повторы-гены ).

В кодировании белков принимает участие не более 1,5 % хромосомной ДНК человека (т.е. генетические инструкции по формированию человеческого индивидуума занимают лишь 3 см на двухметровой молекуле ДНК человека ).

Анализ генома человека позволил выявить у него порядка ^ 40 тыс . генов (на сегодня). Самые короткие гены содержат всего 20 п.н. (гены эндорфинов , вызывающих ощущение удовольствия). Самый длинный ген, кодирующий один из белков мышц (миодистрофин), содержит порядка 2,5 млн. п.н.

^ Плотность расположения генов в хромосомах сильно различается. Средняя плотности составляет около 10 генов на 1 млн.п.н. Однако в хромосоме 19 плотность составляет 20 генов , а в Y-хромосоме - всего 1,5 гена на млн. Если сравнить плотность генов с плотностью расселения людей, то Y-хромосома напоминает нашу Сибирь, а хромосома 19 - Европейскую часть России. Плотность расположения генов падает по мере эволюционного усложнения организмов. Для сравнения: в геноме бактерий содержится свыше 1000 генов на 1,0 млн. и. н., у дрожжей около 450 генов на 1,0 млн. п. н., а у червя С. elegans - около 200 .

Как у людей имеются семьи, так и гены объединяют в семейства по их схожести. В геноме человека присутствуют около 1,5 тыс. таких семейств. Причем только около сотни из них специфичны для человека и позвоночных животных. Основная же масса генных семейств имеется как у человека, так и у дождевого червя.

Разные гены одного семейства возникали в ходе эволюции из одного гена-предшественника как следствие мутаций. «Родственные» гены чаще всего выполняют сходную функцию. Например, геном человека имеет около 1 000 генов-рецепторов обоняния.

В семействах генов иногда встречаются псевдогены . Это гены, утратившие способность к экспрессии. Перед их названием ставят греческую букву . He совсем ясно, зачем геному нужны такие гены, почему он сохранил их в эволюции и не избавился от них. В геноме человека имеется около 20 000 таких псевдогенов . В частности, в огромной семействе генов обоняния около 60% являются псевдогенами. Считается, что массивная потеря функциональных генов произошла за последние 10 млн. лет в связи со снижением роли обоняния у человека по сравнению с другими млекопитающими.

Около 20 % генов человека функционируют во всех типах клеток человека. Остальные же гены работают только в определенных тканях и органах. Например, глобиновые гены экспрессируются только в клетках крови, поскольку основная их функция – обеспечивать перенос кислорода.

Примером высочайшей специализации генов служат обонятельные гены . В каждой клетке органа обоняния человека – обонятельной луковице - работает только 1 ген из 1000 возможных. Сильнейшее недоумение ученых вызвал тот факт, что некоторые из этих генов, кроме обонятельной луковицы, активизируются еще в одном типе клеток – сперматозоидах . Как это связано с восприятием запаха, пока не совсем ясно.

Картирование хромосом также позволило выявить локализацию участков, отвечающих за некоторые болезни человека.

Например, в первой хромосоме гены связанны с раком протоков молочной железы. Во второй – с ожирением. В третьей – с шизофренией. В четвертой хромосоме обнаружен ген, мутации которого приводят к развитию алкоголизма. Мутации в концевом участке Х -хромосомы вызывают предрасположенность к гомосекесуализму.

Внимание специалистов также привлекли гены, связанные с некоторыми особенностями поведения человека . Эти гены кодируют белки, участвующие в передаче сигналов между нервными клетками (например, белок серотонин). Ген, кодирующий рецептор серотонина, ученые назвали «геном самоубийства». Мутации по этому гену вызывают у людей склонностью к отрицательным эмоциям и суицидные наклонности.

Другой передатчик сигналов в нервной системе - дофамин – вещество, играющего ключевую роль в работе центров удовольствия мозга. Избыток дофамина вызывает у животных исследовательскую гиперактивность.. Было обнаружено, что один из генов, кодирующих белки-рецепторы дофамина, может существовать в разных аллельных формах (длинной и короткой). Люди с длинной аллелью больше склонны к поиску новых впечатлений, поэтому обнаруженный ген так и назвали «геном поиска новизны». У американцев длинная аллель гена рецептора дофамина встречается в 25 раз чаще, чем, скажем, у жителей Южной и Восточной Азии. Из истории мы знаем, как заселялась Америка европейцами. В первую очередь, это были энергичные люди, склонные к авантюризму, любопытные и импульсивные. Вот они то и внесли длинную аллель «гена поиска новизны» в современную американскую популяцию.

Недавно обнаружены два гена, которые отвечают за материнские инстинкты (эти гены так и были названы генами «материнского инстинкта» ). При этом, ко всеобщему удивлению, выяснилось, что оба гена дочки получают от отцов. Животные, у которых гены «материнского инстинкта» отсутствовали, не заботились о новорожденных.

Необходимо подчеркнуть, что, в отличие от генов, ответственных за физические параметры, наличие «больных» генов, формирующих психику и поведение, еще не означает стопроцентную обреченность человека па определенные отрицательные проявления. Во-первых, как правило, не один, а совокупность генов отвечает за душевные характеристики. Между ними существует очень сложное и порой весьма неоднозначное взаимодействие, эффект которого зависит от множества различных факторов. Во-вторых, как считает большинство ученых, психика и поведение человека лишь процентов на 50 определяются генами .

Одним из методов изучения влияния окружающей среды на проявление генотипа является наблюдение за однояйцовыми близнецами. Такой подход в генетике получил название «близнецовый метод ».

Однояйцовые близнецы образуются в результате деления одной и той же зиготы и содержат идентичные геномы. Хотя появление близнецов - довольно редкое явление (считается, что у человека одна двойня приходится па 80-85 родов), тем не менее, имеющихся случаев достаточно для проведения соответствующих исследований.

Одним из наиболее четких способов идентификации человека являются отпечатки пальцев . Характерные «узоры» закладываются у зародыша уже на третьем месяце развития и сохраняются без изменения в течение всей жизни. При сравнении кожных «узоров» у близнецов было выявлено, что они очень похожи, но, что удивительно, не всегда полностью идентичны.

При исследовании ряда других признаков также наблюдали их небольшие вариации у близнецов: цвет глаз и волос, форма уха.

Крупномасштабное сравнение однояйцовых близнецов друг с другом показало, что возникновение таких инфекционных заболеваний , как корь, коклюш, ветряная оспа практически полностью зависит от возбудителя заболевания, а вот полиомиелит и туберкулез определяются кроме того наследственными свойствами человека. В частности, заболеваемость туберкулезом обоих однояйцовых близнецов более чем в 3 раза выше, чем у двух разнояйцовых близнецов.

Исследование близнецов, проведенное в Каролинском институте в Стокгольме, убедительно показало существенное воздействие факторов окружающей среды (курения, загрязнений, питания, образа жизни) на развитие некоторых форм злокачественных заболеваний. Вместе с тем отмечено влияние генетических факторов на возникновение рака простаты, рака прямой кишки и рака груди.

При анализе близнецов удалось выяснить, что умственное развитие также могут объясняться генетически. Если один из пары однояйцовых близнецов слабоумен, то второй оказывается таким же почти всегда.

Российскими учеными было проведено исследование детей-близнецов в возрасте от 7 до 12 месяцев на предмет того, в какой мере генетика и среда влияют на агрессивность, раздражительность, активность и общительность . Оказалось, что первые три черты темперамента находятся под жестким генетическим контролем: агрессивность поведения младенца:на 94 процента определяется его генотипом, активность - па 89 процентов, раздражительность - па 85 процентов. А общительность почти на 90% формируется под влиянием среды, которую создают родители.

Благодаря методу близнецового анализа на генетический уровень вышла и широко обсуждаемая проблема гомосексуализма . Уже имеются достоверные данные, что около 57% однояйцовых близнецов, братьев мужчин-гомосексуалов также являются гомосексуалами. Для женщин-лесбиянок эта цифра составляет приблизительно 50%.

Осознание гомосексуализма как наследственной болезни возможно поможет решить как проблему гомофобии (плохо ненавидеть больных людей), так и проблему агрессивного гомосексуализма (эти люди требуют признания их здоровыми и полноценными, порой даже гордятся своей особенностью). Однако, если рассматривать гомосексуализм как болезнь, как патологию, ситуация кардинально меняется. Трудно представить себе человека, гордо стоящего с плакатом: «Я страдаю шизофренией, поэтому требую к себе уважения, как к полноценному члену общества!».

Согласно современным оценкам, продолжительность жизни человека, также связана с генетическими факторами, роль которых оценивается на уровне 65-70%.

Многочисленные и разнообразные данные позволяют утверждать, что геном определяет многое в нас, но и окружающая среда весьма заметно вмешивается в нашу сущность. Взаимосвязь между генами и окружающей средой ученые иногда сравнивают с заряженным пистолетом и курком. Пистолет не выстрелит, пока не будет нажат курок. Также обстоит ситуация и в клетке, где в качестве заряженного пистолета служит ген, а функцию курка выполняют всевозможные факторы окружающей среды. Имеется и другое сравнение - с карточной игрой: хороший игрок может выиграть и с плохими картами.

Чтобы разобраться в тех многочисленных взаимосвязях, которые существуют между проявлением отдельных вариантов генов и влиянием па этот процесс различных факторов окружающей среды, был создан специальный международный проект - The Environmental Genome Project. Среди множества задач данного проекта главной является, конечно же, изучение влияния окружающей среды па продолжительность жизни, а также на возникновение и развитие различных заболевании человека. В конечном итоге этот проект может оказаться не менее важным и сложным, чем знаменитый и очень дорогостоящий проект по секвенированию генома человека. А в том, что он будет продолжаться по времени значительно дольше, чем геномный проект, нет никакого сомнения.

25 апреля теперь уже далекого 1953 г. журнал Nature опубликовал небольшое письмо молодых и никому неизвестных Ф.Крика и Дж.Уотсона редактору журнала, которое начиналось словами: «Мы хотели бы предложить свои соображения по поводу структуры соли ДНК. Эта структура имеет новые свойства, которые представляют большой биологический интерес». Статья содержала около 900 слов, но – и это не преувеличение – каждое из них было на вес золота.

«Ершистая молодежь» посмела выступить против нобелевского лауреата Лайнуса Полинга, автора знаменитой альфа-спирали белков. Полинг буквально накануне опубликовал статью, согласно которой ДНК представляла собой трехцепочечную спиральную структуру, наподобие девичьей косы. Тогда никто не знал, что у Полинга был просто недостаточно очищенный материал. Но и Полинг оказался отчасти прав – сейчас трехцепочечность некоторых участков наших генов хорошо известна. Это свойство ДНК даже пытались одно время использовать в борьбе с раком, выключая с помощью олигонуклеотидов те или иные раковые гены (онкогены).

Биологии нуклеиновых кислот долго не везло. Достаточно сказать, что первую нобелевскую премию за открытие строения нуклеотидов немец А.Коссель получил еще в 1910 г. А знаменитая реакция Фельгена для окрашивания ДНК была предложена накануне Первой мировой войны и усовершенствована в 1920-е гг. Тогда и могла бы начаться новая эра биологии, однако...

Однако биологи были уверены, что «монотонная» ДНК с ее только четырьмя различающимися основаниями просто не могла нести генетическую информацию о миллионах самых разнообразных белков. И хотя уже применялась азбука Морзе с тремя кодирующими элементами, менталитет исследователей еще не достиг уровня информационной эры с ее двоичной системой записи («0» и «1») любой информации.

Лишь к началу 1950-х гг. отдельные ученые стали обращать внимание на ДНК, роль которой в передаче наследственных признаков у микроорганизмов установил в 1943 г. Освальд Эйвери. Результатам Эйвери поверил Сальвадор Лурия, который вместе с Максом Дельбрюком организовал неподалеку от Нью-Йорка лабораторию на биостанции в местечке Колд-Спринг Харбор.

Заметим в скобках, что физик М.Дельбрюк был учеником Н.В. Тимофеева-Ресовского в биологии и соавтором их совместной с К.Циммером знаменитой статьи, посвященной определению размеров гена. Лурия с Дельбрюком изучали жизненный цикл бактериофагов – вирусов микроорганизмов, в результате чего и пришли к предположениям о биологической роли ДНК. Лурия послал своего аспиранта Джеймса Уотсона в Кавендишскую лабораторию в Кембридже, где Морис Уилкинс и Розалинд Франклин исследовали строение ДНК с помощью рентгена (англичане лидировали в рентгеноструктурном анализе биомолекул).

В лаборатории Уилкинса работал также еще довольно молодой физик Фрэнсис Крик, известный в узких лабораторных кругах своим научным скепсисом: для него просто не существовало никаких авторитетов, чем он и заработал себе репутацию скандалиста. Статью Полинга в лабораторию принес его сын, который помог, кстати, Уотсону и Крику уяснить роль попарного комплементарного соединения азотистых оснований. Статья стала последней каплей перед озарением, или пониманием... тем, что оформилось в открытие молодых ученых.

Научное сообщество, однако, не сразу признало их открытие. Достаточно сказать, что сначала Нобелевскую премию за работы в области ДНК «судьи» из Стокгольма присудили в 1959 г. известным американским биохимикам Северо Очоа и Артуру Корнбергу. Очоа был первым (1955), кто сумел синтезировать рибонуклеиновую кислоту (РНК). Корнберг же получил премию за синтез ДНК в пробирке (1956).

В 1962 г. настал черед Крика, Уотсона и Уилкинса. Р.Франклин к тому времени уже умерла от рака в возрасте 37 лет, иначе это был бы единственный случай в истории Нобелевских премий, когда награду вручили бы четверым, хотя это и не допускается уставом. Вклад Франклин в развитие рентгеноструктурного анализа ДНК был просто неоценим.

После открытия Уотсона и Крика важнейшей проблемой стало выявление соответствия между первичными структурами ДНК и белков. Поскольку в составе белков обнаруживается 20 аминокислот, а нуклеиновых оснований всего 4, то для записи информации о последовательности аминокислот в полинуклеотидах необходимо не менее трех оснований. На основании таких общих рассуждений варианты «трехбуквенных» генетических кодов предложили физик Г.Гамов и биолог А.Нейфах. Однако их гипотезы были чисто умозрительными и не вызвали большого отклика среди ученых.

Трехбуквенный генетический код к 1964 г. расшифровал Ф.Крик. Вряд ли он тогда предполагал, что в обозримом будущем станет возможной расшифровка генома человека. Эта задача долгое время казалась неразрешимой. Однако два открытия позволили сдвинуть проблему с места.

В 1970 г. не известные широкой научной общественности Г.Темин и Д.Балтимор опубликовали в Nature статьи, посвященные обратной транскриптазе (ОТ) – ферменту РНК-содержащих, в том числе раковых, вирусов, которые синтезируют ДНК на матрице РНК, т.е. осуществляют реакцию, обратную той, которую до тех пор наблюдали в клетках.

Открытие обратной транскриптазы позволило выделить первые гены. Но процесс этот был крайне трудоемким и чрезвычайно дорогим. А спустя 15 лет некий химик из Калифорнии предложил на суд коллег уникальную полимеразную цепную реакцию (ПЦР), сразу же ставшую знаменитой. В этой реакции фермент, полимераза, «ходит как челнок» по фрагменту ДНК, поэтому ПЦР позволяет нарабатывать любые количества этого фрагмента, необходимые для анализа*.

ПЦР, а также появление новейшей электронной техники и компьютеров сделали вполне реальной задачу расшифровки всего генома человека. Долгие дебаты закончились в конце сентября 1988 г., когда во главе проекта HUGO – Организации по расшифровке генома человека – был поставлен Дж.Уотсон.

Журнал Time назвал в связи с этим Уотсона «охотником за генами». Сам же ученый сказал следующее: «Это захватывающая перспектива. Тридцать лет назад мы не могли и мечтать о том, чтобы узнать структуру генома даже мельчайшего вируса. А сегодня мы уже расшифровали геном вируса СПИДа и почти полностью прочитали геном кишечной палочки объемом в 4,5 млн букв ген-кода. Точное знание детальной структуры генома человека – это восхитительно!».

И вот геном прочитан
Завершение работ по расшифровке генома человека консорциумом ученых планировалось к 2003 г. – 50-летию открытия структуры ДНК. Однако конкуренция сказала свое слово и в этой области.

Крейг Вентер основал частную компанию «Селера», которая продает генные последовательности за большие деньги. Включившись в гонку по расшифровке генома, она за один год сделала то, на что у международного консорциума ученых из разных стран ушло десять лет. Это стало возможным благодаря новому методу чтения генетических последовательностей и использованию автоматизации процесса чтения.

Итак, геном прочитан. Казалось бы, надо радоваться, но ученые пришли в недоумение: уж очень мало генов оказалось у человека – примерно в три раза меньше, чем ожидалось. Раньше думали, что генов у нас около 100 тыс., а на самом деле их оказалось около 35 тыс. Но даже не это самое главное.

Недоумение ученых понятно: у дрозофилы 13 601 ген, у круглого почвенного червя – 19 тыс., у горчицы – 25 тыс. генов. Столь малое количество генов у человека не позволяет выделить его из животного царства и считать «венцом» творения.

Зато там, где располагаются гены, активность ДНК и ферментов, синтезирующих ее копии в виде молекул информационной РНК, повышается в 200–800 раз! Это – «горячие точки» генома.

В геноме человека ученые насчитали 223 гена, которые сходны с генами кишечной палочки. Кишечная палочка возникла примерно 3 млрд лет назад. Зачем нам такие «древние» гены? Видимо, современные организмы унаследовали от предков какие-то фундаментальные структурные свойства клеток и биохимические реакции, для которых необходимы соответствующие белки.

Нет поэтому ничего удивительного и в том, что половина белков млекопитающих имеют сходство аминокислотных последовательностей с белками мухи дрозофилы. В конце концов мы дышим одним и тем же воздухом и потребляем животные и растительные белки, состоящие из одних и тех же аминокислот.

Удивительно, что с мышью мы имеем 90% общих генов, а с шимпанзе – вообще 99%!

В нашем геноме много последовательностей, доставшихся нам в «наследство» от ретровирусов. Эти вирусы, к которым относятся вирусы рака и СПИДа, вместо ДНК в качестве наследственного материала содержат РНК. Особенностью ретровирусов является, как уже говорилось, наличие обратной транскриптазы. После синтеза ДНК по РНК вируса вирусный геном встраивается в ДНК хромосом клетки.

Таких ретровирусных последовательностей у нас много. Время от времени они «вырываются» на волю, в результате чего возникает рак (но рак в полном соответствии с законом Менделя проявляется лишь у рецессивных гомозигот, т.е. не более чем в 25% случаев). Совсем недавно было сделано открытие, которое позволяет понять не только механизм встраивания вирусов, но и назначение некодирующих последовательностей ДНК. Оказалось, что для встраивания вируса необходима специфическая последовательность из 14 букв генетического кода. Таким образом, можно надеяться, что вскоре ученые научатся не только блокировать агрессивные ретровирусы, но и целенаправленно «внедрять» нужные гены, и генотерапия из мечты превратится в реальность.

В организме млекопитающих ретровирусы играют и еще одну немаловажную роль. В отношении млекопитающих, у которых плод развивается внутри организма матери, правомерен вопрос: почему иммунная система матери позволяет развиваться организму, который наполовину генетически ей чужероден, поскольку половина генома плода отцовская?

Все дело в ретровирусах, которые блокируют активность иммунных Т-лимфоцитов, ответственных за отторжение органов и тканей, содержащих чужеродные белки, например, после трансплантации органов. Эти ретровирусы активируются в геноме клеток плаценты, которая образуется тканями плода.

Недавно был обнаружен вирус, который блокирует развитие (экспрессию) ретровируса. Если этим вирусом-блокатором заразить беременную мышь, то мышата рождаются нормальными и в срок. Но если его ввести в клетки плаценты, то происходит выкидыш плода, так как активируются Т-лимфоциты матери.

Не стоит забывать, что ретровирусные последовательности возникают также непосредственно на концах хромосом – теломерах. Как известно, теломеры состоят из одноцепочечной ДНК, которая синтезируется ферментом теломеразой по матрице РНК. Считается, что теломеры являются нашими молекулярными часами, поскольку они укорачиваются с каждым клеточным делением. Раньше считалось, что в теломерах нет генов, однако расшифровка генома показала, что генов там довольно много и они активны в детстве и молодом возрасте, постепенно «угасая» по мере старения организма.

Не так уж бездеятельны и тандемные повторы. В норме они имеют определенное число повторяющихся троек, пятерок и даже семерок букв. Но в некоторых случаях в результате мутаций число повторов начинает нарастать, что ведет к нестабильности генома. Дело доходит даже до «поломок» концов хромосом. Фрагментация концевых участков хромосомы может привести к перемещениям (транслокации) участков ДНК в другую хромосому, а также синтезу таких форм белка, которые вызывают гибель нервных клеток, как это наблюдается при наследственной хорее Гентингтона.

К.Вентер говорил, что понимание генома потребует сотни лет. Ведь мы до сих пор не знаем функций и роли более чем 25 тыс. генов. И даже не знаем, как подступиться к решению этой задачи, поскольку большинство генов просто «молчит» в геноме, никак себя не проявляя.

Следует учитывать, что в геноме накопилось множество псевдогенов и генов-«перевертышей», которые также неактивны. Похоже, что некодирующие последовательности являются как бы изолятором активных генов. В то же время, хотя генов у нас и не слишком много, они обеспечивают синтез до 1 млн (!) самых разных белков. Как же это достигается при таком ограниченном наборе генов.

Как оказалось, в нашем геноме существует специальный механизм – альтернативный сплайсинг. Заключается он в следующеем. На матрице одной и той же ДНК происходит синтез разных альтернативных и-РНК. Сплайсинг и означает «расщепление», когда образуются разные молекулы РНК, которые как бы «расщепляют» ген на разные варианты. Этот приводит к невообразимому разнообразию белков при ограниченном наборе генов.

Функционирование генома человека, как и всех млекопитающих, регулируется различными транскрипционными факторами – специальными белками. Эти белки связываются с регуляторной частью гена (промотером) и таким образом регулируют его активность. Одни и те же факторы могут по-разному проявлять себя в разных тканях. У человека есть свои собственные, присущие только ему, транскрипционные факторы. Выявить эти чисто человеческие особенности генома еще только предстоит ученым.

СНП
Существует и еще один механизм генетического разнообразия, который выявился только в процессе прочтения генома. Это сингулярный нуклеотидный полиморфизм, или, так называемые факторы СНП.

Полиморфизмом в генетике называют ситуацию, когда гены одного и того же признака существуют в разных вариантах. Примером полиморфизма, или, другими словами, множественных аллелей, служат группы крови, когда в одном хромосомном локусе (участке) могут находиться варианты генов А, В или О.

Сингулярность по-латыни означает одиночество, что-то единственное. СНП – это изменение «буквы» генетического кода без «последствий для здоровья». Считается, что у человека СНП встречается с частотой 0,1%, т.е. каждый человек отличается от других одним нуклеотидом на каждую тысячу нуклеотидов. У шимпанзе, представляющей собой более древний вид, и к тому же гораздо более гетерогенный, число СНП при сравнении двух разных особей достигает 0,4%.

Но если различия в СНП не сказываются на здоровье особей, то чем они интересны и важны? Во-первых, изучение СНП имеет большое теоретическое значение. Именно они позволяет сравнивать возрасты популяций и определять пути их миграции. Так, например, в мужской половой хромосоме (Y) выделены 22 фактора СНП, анализ которых у 1007 европейцев позволил определить, что 80% европейских мужчин имеют сходный «СНП-паттерн», т.е. «рисунок». Это говорит о том, что тысячи поколений назад 4/5 европейских мужчин имели общего предка!

Но и практическое значение СНП велико. Возможно, не все знают, что сегодня самые распространенные лекарства эффективны не более чем для четверти населения. Минимальные генетические отличия, обусловленные СНП, определяют эффективность лекарств и их переносимость в каждом конкретном случае. Так, у больных диабетом выявили 16 специфических СНП. Всего при анализе 22-й хромосомы определили местоположение 2730 СНП. В одном из генов, кодирующих синтез рецептора адреналина, выявлено 13 СНП, которые могут комбинироватьcя друг с другом, давая 8192 различных варианта (гаплотипа).

Насколько скоро и полно начнет использоваться полученная информация, пока не совсем ясно. Пока же приведем еще один конкретный пример.

Среди астматиков довольно популярно лекарство албутерол, который взаимодействует с указанным рецептором адреналина и подавляет приступ удушья. Однако из-за разнообразия гаплотипов людей лекарство действует не на всех, а некоторым больным оно вообще противопоказано. Это обусловлено СНП: люди с последовательностью букв в одном из генов ТЦТЦЦ (Т–тимин, Ц–цитозин) не реагируют на албутерол, если же концевой цитозин заменен на гуанин (ТЦТЦГ), то реакция есть, но частичная. Для людей же с тимином вместо концевого цитозина в этом участке – ТЦТЦТ – лекарство токсично!

Протеомика
Эта совершенно новая отрасль биологии, изучающая структуру и функции белков и взаимосвязи между ними, названа по аналогии с геномикой, занимавшейся геномом человека. Само рождение протеомики уже объясняет, зачем нужна была программа «Геном человека». Поясним на примере перспективы нового направления.

В далеком 1962 г. вместе с Уотсоном и Криком в Стокгольм были приглашены из Кембриджа Джон Кэндрью и Макс Перутц. Они были удостоены Нобелевской премии по химии за впервые осуществленную расшифровку трехмерной структуры белков миоглобина и гемоглобина, ответственных за перенос кислорода в мышцах и эритроцитах соответственно.

Напомним, что даже в начале 1990-х гг. расшифровка структуры каждого нового белка представляла значительные трудности. Каждый анализ занимал до десятка лет. И хотя сейчас вместо рентгеновских лучей используют ядерно-магнитный резонанс (ЯМР), однако времени и денег на определение пространственной структуры каждого белка уходит очень много.

Протеомика позволяет ускорить и удешевить эти работы. К.Вентер отметил, что он 10 лет потратил на выделение и секвенирование гена адреналинового рецептора человека, теперь же его лаборатория тратит на это 15 с. Еще в середине 90-х гг. нахождение «адреса» гена в хромосомах занимало 5 лет, в конце 90-х – полгода, а в 2001 г. – одну неделю! Кстати, ускорению определения положения гена помогает информация о СНП, которых сегодня насчитываются уже миллионы.

Вернемся к протеомике. Знание аминокислотных последовательностей и трехмерной структуры определенных белков позволило разработать программы сопоставления генетических последовательностей с аминокислотными, а затем программы предположительного расположения их в трехмерной структуре полипептидов. Знание трехмерной структуры позволяет быстро находить химические варианты молекул, в которых блокирован, например, активный центр, или определять положение активного центра у мутантного фермента.

Известно, что повышение артериального давления вызывается ферментом АСЕ, сокращенное название которого переводится с английского как ангиотензин-конвертирующий фермент. Образующийся под действием фермента ангиотензин воздействует на стенки артерии, что и ведет к гипертонии. Уже относительно давно были найдены блокаторы фермента АСЕ, которые стали продаваться в качестве лекарств от повышенного давления. Однако, эти лекарственные средства оказались малоэффективными.

Анализ генома позволил выделить ген АСЕ-2, который кодирует более распространенный и эффективный вариант фермента. Затем была определена виртуальная структура белкового продукта, после чего подобраны химические вещества, активно связывающиеся с белком АСЕ-2. Так был найден новый препарат против артериального давления, причем за вдвое меньшее время и всего лишь за 200 вместо 500 млн долларов!

Признаемся, что это был пример «догеномного» периода. Теперь же, после прочтения генома, на первый план выходит протеомика, цель которой – быстрее разобраться с тем миллионом белков, которые потенциально могут существовать в наших клетках. Протеомика позволит более тщательно диагностировать генетические отклонения и блокировать неблагоприятное действие мутантных белков на клетку.

А со временем можно будет планировать и «исправление» генов.

Медицинская генетика – направление, посвященное наследственности, наследственным патологиям и здоровью, лечению и профилактике генетических заболеваний, а также проблемам наследственной передачи предрасположенности к болезням.

Что таке генетика?

Важной частью медицинской генетики является клиническая генетика, чьей задачей является обнаружение, и профилактика наследственной патологии.

Трудно переоценить роль генетики в современной медицине. Как выяснилось, она огромна, и даже те немалые знания, которые накоплены в этой области к настоящему времени, представляют собой, по мнению ученых, лишь вершину айсберга.

Так, врачами, проводящими , было установлено, что многие виды рака наследственно обусловлены, в частности:

лейкоз;
большинство онкологических заболеваний детского возраста;
и др.

Новые технологии, дары научно-технического прогресса, открыли новые возможности для генетики, и из преимущественно теоретической дисциплины она стала прикладной. Расшифровка генома человека открыла возможность вмешательства в геном, исключения одних генов и активации других – вот то направление, в котором развивается медицинская генетика.

Одно из важных направлений, которым занимается генетика – репродукция. Столь популярный метод лечения бесплодия, как ЭКО, который прочно вошел в медицинскую практику, тоже стал возможным благодаря развитию медицинской генетики. Кроме того, при всегда проводится генетическая диагностика при наличии показаний у пациента.

Методы зарубжной генетики

Существуют следующие методы генетики человека:

Генеалогический. Метод состоит в отслеживании и изучении родословных, позволяет определять закономерности, по которым наследуются те или иные признаки, в том числе и те, что отвечают за наследственно-обусловленные болезни.
Близнецовый. Метод изучает влияние среды на генотип человека при помощи сравнения однояйцевых близнецов, проживающих в разных условиях.
Цитогенетический. Метод, состоящий в микроскопическом исследовании хромосом. С его помощью определяются хромосомные заболевания (например, один из вариантов синдрома Дауна).
Секвестрирование. Метод, состоящий в изучении ДНК человека на молекулярном уровне.
Дерматоглифический. Метод основывается на изучении рельефа кожи пальцев, ладоней и стоп. С его помощью диагностируется ряд наследственных патологий.
Биохимический. Используется для исследования наследственно-обусловленных заболеваний обмена веществ, в основе которых лежат ферментные нарушения.
Популяционно-статистический метод – изучение закономерностей наследственных признаков в больших группах населения.

Генетическая диагностика за рубежом

Консультация генетика включает в себя генетическую диагностику. Генетический анализ позволяет определить не только возможность появления наследственных болезней, но и предрасположенности к целому ряду распространенных заболеваний.

Для проведения генетического анализа берется кровь (5 мл), кроме того, проводится тщательное изучение анамнеза пациента – это нужно для того, чтобы правильно интерпретировать полученные результаты.

Чаще всего люди обращаются в генетический центр или или любой другой стране при наличии определенных подозрений на возможную наследственную патологию, при наличии такой патологии у одного из членов семьи (в том числе и рожденного ребенка) и во время беременности, при наличии определенных показаний.

Генетическая диагностика у беременных, при обоснованных подозрениях на возможность наследственно-обусловленной патологии, проводится в том числе и инвазивными методами:

Лечение генетических заболеваний за границей

Генетика за рубежом, благодаря наличию ультрасовременного оборудования и подготовленных специалистов, имеет большие возможности в диагностике наследственной патологии всех видов. В отделение генетики пациенты обращаются как по направлению врача при наличии определенных показаний (например, семьи, планирующие ребенка, при наличии подтвержденной генетической патологии у уже рожденных детей) или по собственному желанию.

Независимо от того, будет ли это крупный институт генетики, центр генетики или отделение генетики, пациент получит квалифицированную помощь в полном объеме.

Каждый медико-диагностический центр, занимающийся ЭКО, также располагает возможностью генетической диагностики по современным стандартам – вот почему среди детей, рожденных при помощи искусственного оплодотворения, практически нет тех, кто страдал бы наследственными заболеваниями.

Стоимость лечения в центрах генетики за границей

Если вам нужна консультационная помощь по вопросам генетики, сайт UNIMED предлагает заполнить вам контактную форму и связаться с нами. Мы предоставим Вам исчерпывающую информацию, в том числе и касательно возможной стоимости генетической диагностики и лечения. Также на этом портале вы можеет узнать официальные и других странах.

5710 0

Существует точка зрения, которую разделяет немалое число специалистов, что все заболевания человека за исключением травм связаны с генетическими дефектами. Очевидно, это крайняя точка зрения, тем не менее она отражает важность генетических факторов в определении состоянии здоровья людей. Генетические дефекты бывают разной значимости и состояния.

Хотя обычно считают диабет и мышечную дистрофию заболеванием, а расщепление неба или цветовую слепоту - наследственными дефектами - все это является результатом мутаций в генетическом материале. Показано также, что предрасположенность к заболеванию также зависит от генетической конституции.

Генетические дефекты или мутации в последовательности ДНК выражаются в замене одного нуклеотида другим, потере целого фрагмента или его переносе на другое положение в геноме и пр. Такие изменения могут привести к изменениям структуры (и функции) белка, который кодируется данным фрагментом ДНК или к изменению регуляторных участков генов, гибельным для клеток. Говоря о наследственных заболеваниях, мы имеем в виду мутации, которые появляются в половых клетках и передаются потомству.

В соматических клетках на протяжении жизни также накапливаются мутации, которые могут стать причиной заболевания, но они по наследству не передаются. Ранее считалось, что все мутации вредны. Это связано с тем, что именно с таких мутаций, вызывающих заболевания, было начато изучение генетических характеристик человека. Но сейчас, когда прочитан практически весь нуклеотидный текст человека, стало ясно, что большая часть мутаций является нейтральной. Вредные мутации, приводящие к грубому нарушению развития организма, отсеиваются отбором - их носители не выживают или не дают потомства.

Огромный прорыв в понимании, как унаследованные гены влияют на физические и психологические особенности человека, произошел за последние десятилетия благодаря открытиям, сделанным при исследовании генома человека. Установлены и диагностируются как целый ряд генетических заболеваний, так и предрасположенность к ним, причем на самых ранних этапах развития эмбриона. Большие надежды на расширение возможностей современной медицины связаны с реализацией проекта «Геном человека».

Реализация научного проекта «Геном человека»

Научный проект «Геном человека» - это международная программа, конечной целью которой являлось определение нуклеотидной последовательности (секвенирование) всей геномной ДНК человека, а также идентификация генов и их локализация в геноме (картирование). В 1988 г. Министерство энергетики США и Национальный институт здоровья США представили обширный проект, в задачи которого входило секвенирование геномов человека, а также бактерий, дрожжей, нематоды, плодовой мушки и мыши - организмов, которые широко использовались в качестве модельных систем в изучении генетики человека.

На реализацию этого проекта Конгресс выделил 3 млрд дол. (по одному доллару за каждый нуклеотид человеческого генома). Директором проекта был назначен лауреат Нобелевской премии Джеймс Уотсон. К проекту присоединились другие страны - Англия, Франция, Япония и др.

В 1989 г. по инициативе академика А.А. Баева в нашей стране был организован научный совет по программе «Геном человека». В 1990 г. была создана Международная организация по изучению генома человека (HUGO), вице-президентом которой в течение нескольких лет был академик А.Д. Мирза-беков. Независимо от вклада и государственной принадлежности отдельных участников программы с самого ее начала вся получаемая ими в ходе работ информация была открыта и доступна для всех его участников.

Двадцать три хромосомы человека были поделены между странами-участницами. Российские ученые должны были исследовать структуры 3-й и 19-й хромосом. Однако вскоре финансирование работ по этому проекту было сильно сокращено, и реального участия в секвенировании наша страна не принимала. Тем не менее работы по геномному проекту в нашей стране не прекратились: программа была пересмотрена и сконцентрирована на развитии биоинформатики -математических методов, вычислительной техники, программного обеспечения, совершенствовании способов описания и храненеия геномной информации, которые бы помогли понять и осмыслить расшифрованную информацию.

На расшифровку генома человека было отведено 15 лет. Однако постоянное развитие технологии секвенирования позволило завершить проект на 2 года раньше. Немалую роль в интенсификации работ сыграла частная американская компания Celera, возглавляемая Дж. Вентером (в прошлом - биолог Национального института здоровья США). Если в начальные годы осуществления проекта по всему миру секвенировали несколько миллионов нуклеотидных пар в год, то в конце 1999 г. Celera расшифровывала не менее 10 млн нуклеотидных пар в сутки. Для этого работы велись круглосуточно в автоматическом режиме 250 роботизированными установками, информация сразу же передавалась в банки данных, где систематизировалась, аннотировалась и выкладывалась в Интернет.

При проведении работ в 1995 г. Вентер с соавторами разработал и опубликовал совершенно новый подход к секвенированию генома, названный методом произвольного секвенирования полного генома (более известный как произвольное секвенирование методом дробления), который позволял собрать полный геном из частично секвенированных фрагментов ДНК при помощи компьютерной модели.

Этим методом впервые был полностью секвенирован геном самореплицирующегося свободно живущего организма - бактерии Haemophilus in-fluenzae Rd. Копии ДНК бактерии были разрезаны на куски произвольной длины от 200 до 1 600 п.о. Эти фрагменты секвенировали по несколько сот с каждого конца. Кроме того, были секвенированы и более длинные фрагменты по 15-20 тыс. п.о. Полученные последовательности были внесены в компьютер, который их сравнивал, распределял по группам и по сходству.

Первыми идентифицировались неповторяющиеся последовательности, затем -повторяющиеся последовательности фрагментов. Длинные фрагменты помогали установить порядок часто повторяющихся, почти идентичных последовательностей. Затем заполнялись пробелы между полученными основными кусками ДНК. Секвенирование генома Haemophilus influenzae заняло один год и при этом была определена последовательность 1 830 137 п.о. и 1 749 генов, расположенных на 24 304 фрагментах.

Это был несомненный успех, который доказал, что новая технология может быть применима для быстрого и точного секвенирования целых геномов. В 1996 г. картировали геном первой эукариотической клетки - дрожжевой, а в 1998 впервые секвенировали геном многоклеточного организма - круглого земляного червя Caenorhabolits elegans.

В феврале 2001 г. рабочий вариант генома человека (выполненный на 90 %) был одновременно опубликован в журналах «Nature» - результаты HUGO и «Science» - результаты исследований компании Celera. Анализ полученного варианта генома человека выявил около 25 тыс. генов. Ранее предполагалось, что это количество должно достигать 140 тыс. (если исходить из постулата «один ген кодирует один белок»). В настоящее время представляется возможным, что один ген может кодировать 5-6 белков. Многообразие белков, кодируемых одним и тем же геном, обеспечивается несколькими механизмами: с помощью альтернативного сплайсинга, посттрансляционных превращений белков - фосфорилирования, ацетилирования, метилирования, гликозилирования и многих других.

В 2003 г. был опубликован окончательный вариант полной последовательности генома человека. Вся эта информация является доступной и находится в Интернете на нескольких сайтах. Однако до сих пор некоторые элементы генома не поддаются секвенированию современными технологиями, а наши знания о геноме остаются неполными. Оказалось, что лишь 30 % генома кодируют белки и участвуют в регуляции действия генов.

Каковы функции остальных участков генома и есть ли они вообще, остается совершенно неясным. Около 10 % генома составляют так называемые Alu-элементы длиной около 300 п.о. Они появились неизвестно откуда в ходе эволюции только у приматов. Попав к человеку, они размножились до полумиллиона копий и распределились по хромосомам самым причудливым образом.

Что касается кодирующих участков ДНК, то при чисто молекулярно-компьютерном анализе они были названы генами по сугубо формальным критериям: наличию знаков пунктуации, необходимых для прочтения информации и синтеза конкретного генного продукта. При этом время и действие большинства потенциальных генов пока неясны, и для определения их функций может потребоваться не меньше ста лет.

Н.А. Воинов, Т.Г. Волова