Полностью прочитанных геномов животных уже больше двухсот. Геном человека: как это было и как это будет Как были достигнуты результаты


Международные проект «Геном человека» был начат в 1988 г. Это один из самых трудоемких и дорогостоящих проектов в истории науки. Если в 1990 г. на него было потрачено около 60 млн. долларов в целом, то в 1998 г. одно только правительство США израсходовало 253 млн. долларов, а частные компании – и того больше. В проекте задействованы несколько тысяч ученых из более чем 20 стран. С 1989 г. в нем участвует и Россия, где по проекту работает около 100 групп. Все хромосомы человека поделены между странами-участницами, и России для исследования достались 3-, 13- и 19-я хромосомы.

Основная цель проекта – выяснить последовательность нуклеотидных оснований во всех молекулах ДНК человека и установить локализацию, т.е. полностью картировать все гены человека. Проект включает в качестве подпроектов изучение геномов собак, кошек, мышей, бабочек, червей и микроорганизмов. Ожидается, что затем исследователи определят все функции генов и разработают возможности использования полученных данных.

Что же представляет собой основной предмет проекта – геном человека?

Известно, что в ядре каждой соматической клетки (кроме ядра ДНК есть еще и в митохондриях) человека содержится 23 пары хромосом, каждая хромосома представлена одной молекулой ДНК. Суммарная длина всех 46 молекул ДНК в одной клетке равна приблизительно 2 м, они содержат около 3,2 млрд. пар нуклеотидов. Общая длина ДНК во всех клетках человеческого тела (их примерно 5х1013) составляет 1011 км, что почти в тысячу раз больше расстояния от Земли до Солнца.

Как же помещаются в ядре такие длиннющие молекулы? Оказывается, в ядре существует механизм «насильственной» укладки ДНК в виде хроматина - уровни компактизации.

Первый уровень предполагает организацию ДНК с гистоновыми белками – образование нуклеосом. Две молекулы специальных нуклеосомных белков образуют октамер в виде катушки, на которую наматывается нить ДНК. На одной нуклеосоме размещается около 200 пар оснований. Между нуклеосомами остается фрагмент ДНК размером до 60 пар оснований, называемый линкером. Этот уровень укладки позволяет уменьшить линейные размеры ДНК в 6–7 раз.

На следующем уровне нуклеосомы укладываются в фибриллу (соленоид). Каждый виток составляет 6-7 нуклеосом, при этом линейные размеры ДНК уменьшаются до 1 мм, т.е. в 25-30 раз.

Третий уровень компактизации – петельная укладка фибрилл – образование петельных доменов, которые под углом отходят от основной оси хромосомы. Их можно увидеть в световой микроскоп как интерфазные хромосомы типа «ламповых щеток». Поперечная исчерченность, характерная для митотических хромосом, отражает в какой-то степени порядок расположения генов в молекуле ДНК.

Если у прокариот линейные размеры гена согласуются с размерами структурного белка, то у эукариот размеры ДНК намного превосходят суммарные размеры значимых генов. Это объясняется, во-первых, мозаичным, или экзон-интронным, строением гена: фрагменты, подлежащие транскрипции – экзоны, перемежаются незначащими участками – интронами. Последовательность генов сначала полностью транскрибируется синтезирующейся молекулой РНК, из которой затем вырезаются интроны, экзоны сшиваются и в таком виде информация с молекулы иРНК считывается на рибосоме. Второй причиной колоссальных размеров ДНК является большое количество повторяющихся генов. Некоторые повторяются десятки или сотни раз, а есть и такие, у которых встречается до 1 млн. повторов на геном. Например, ген, кодирующий рРНК повторяется около 2 тыс. раз.

Еще в 1996 г. считалось, что у человека около 100 тыс. генов, сейчас специалисты по биоинформатике предполагают, что в геноме человека не более 60 тыс. генов, причем на их долю приходится всего 3% общей длины ДНК клетки, а функциональная роль остальных 97% пока не установлена.

Каковы же достижения ученых за десять с небольшим лет работы над проектом?

Первым крупным успехом стало полное картирование в 1995 г. генома бактерии Haemophilus influenzae. Позднее были полностью описаны геномы еще более 20 бактерий, среди которых возбудители туберкулеза, сыпного тифа, сифилиса и др. В 1996 г. картировали ДНК первой эукариотической клетки – дрожжей, а в 1998 г. впервые был картирован геном многоклеточного организма – круглого червя Caenorhabolitis elegans. К 1998 г. установлены последовательности нуклеотидов в 30 261 гене человека, т.е. расшифрована примерно половина генетической информация человека.

Ниже приведены известные данные по количеству генов, вовлеченных в развитие и функционирование некоторых органов и тканей человека.

Название органа, ткани, клетки и количество генов

1. Слюнная железа 17

2. Щитовидная железа 584

3. Гладкая мускулатура 127

4. Молочная железа 696

5. Поджелудочная железа 1094

6. Селезенка 1094

7. Желчный пузырь 788

8. Тонкий кишечник 297

9. Плацента 1290

10. Скелетная мышца 735

11. Белая кровяная клетка 2164

12. Семенник 370

13. Кожа 620

14. Мозг 3195

15. Глаз 547

16. Легкие 1887

17. Сердце 1195

18. Эритроцит 8

19. Печень 2091

20. Матка 1859

За последние годы были созданы международные банки данных о последовательностях нуклеотидов в ДНК различных организмов и о последовательностях аминокислот в белках. В 1996 г. Международное общество секвенирования приняло решение о том, что любая вновь определенная последовательность нуклеотидов размером 1–2 тыс. оснований и более должна быть обнародована через Интернет в течение суток после ее расшифровки, в противном случае статьи с этими данными в научные журналы не принимаются. Любой специалист в мире может воспользоваться этой информацией.

В ходе выполнения проекта «Геном человека» было разработано много новых методов исследования, большинство из которых в последнее время автоматизировано, что значительно ускоряет и удешевляет работу по расшифровке ДНК. Эти же методы анализа могут использоваться и для других целей: в медицине, фармакологии, криминалистике и т.д.

Остановимся на некоторых конкретных достижениях проекта, в первую очередь, конечно, имеющих отношение к медицине и фармакологии.

В мире каждый сотый ребенок рождается с каким-либо наследственным дефектом. К настоящему времени известно около 10 тыс. различных заболеваний человека, из которых более 3 тыс. – наследственные. Уже выявлены мутации, отвечающие за такие заболевания, как гипертония, диабет, некоторые виды слепоты и глухоты, злокачественные опухоли. Обнаружены гены, ответственные за одну из форм эпилепсии, гигантизм и др. Ниже приведены некоторые болезни, возникающие в результате повреждения генов, структура которых полностью расшифрована к 1997 г.

Болезни, возникающие в результате повреждения генов

1. Хpoнический грануломатоз
2. Кистозный фиброз
3. Болезнь Вильсона
4. Ранний рак груди/яичника
5. Мышечная дистрофия Эмери-Дрейфуса
6. Атрофия мышц позвоночника
7. Альбинизм глаза
8. Болезнь Альцгеймера
9. Наследственный паралич
10. Дистония

Вероятно, в ближайшие годы станет возможной сверхранняя диагностика тяжелых заболеваний, а значит, и более успешная борьба с ними. Сейчас активно разрабатываются методы адресной доставки лекарств в пораженные клетки, замены больных генов здоровыми, включения и выключения боковых путей метаболизма за счет включения и выключения соответствующих генов. Уже известны примеры успешного применения генотерапии. Так, например, удалось добиться существенного облегчения состояния ребенка, страдающего тяжелым врожденным иммунодефицитом, путем введения ему нормальных копий поврежденного гена.

Кроме болезнетворных генов обнаружены еще некоторые гены, имеющие прямое отношение к здоровью человека. Выяснилось, что существуют гены, обуславливающие предрасположенность к развитию профессиональных заболеваний на вредных производствах. Так, на асбестовых производствах одни люди болеют и умирают от асбестоза, а другие устойчивы к нему. В будущем возможно создание специальной генетической службы, которая будет давать рекомендации по поводу возможной профессиональной деятельности с точки зрения предрасположенности к профессиональным заболеваниям.

Оказалось, что предрасположенность к алкоголизму или наркомании тоже может иметь генетическую основу. Открыто уже семь генов, повреждения которых связаны с возникновением зависимости от химических веществ. Из тканей больных алкоголизмом был выделен мутантный ген, который приводит к дефектам клеточных рецепторов дофамина – вещества, играющего ключевую роль в работе центров удовольствия мозга. Недостаток дофамина или дефекты его рецепторов напрямую связаны с развитием алкоголизма. В четвертой хромосоме обнаружен ген, мутации которого приводят к развитию раннего алкоголизма и уже в раннем детстве проявляются в виде повышенной подвижности ребенка и дефицита внимания.

Интересно, что мутации генов не всегда приводят к негативным последствиям – они иногда могут быть и полезными. Так, известно, что в Уганде и Танзании инфицированность СПИДом среди проституток доходит до 60–80%, но некоторые из них не только не умирают, но и рожают здоровых детей. Видимо, есть мутация (или мутации), защищающая человека от СПИДа. Люди с такой мутацией могут быть инфицированы вирусом иммунодефицита, но не заболевают СПИДом. В настоящее время создана карта, примерно отражающая распределение этой мутации в Европе. Особенно часто (у 15% населения) она встречается среди финно-угорской группы населения. Идентификация такого мутантного гена могла бы привести к созданию надежного способа борьбы с одним из самых страшных заболеваний нашего века.

Выяснилось также, что разные аллели одного гена могут обуславливать разные реакции людей на лекарственные препараты. Фармацевтические компании планируют использовать эти данные для производства определенных лекарств, предназначенных различным группам пациентов. Это поможет устранить побочные реакции от лекарств, точнее, понять механизм их действия, снизить миллионные затраты. Целая новая отрасль – фармакогенетика – изучает, как те или иные особенности строения ДНК могут ослабить или усилить воздействие лекарств.

Расшифровка геномов бактерий позволяет создавать новые действенные и безвредные вакцины и качественные диагностические препараты.

Конечно, достижения проекта «Геном человека» могут применяться не только в медицине или фармацевтике.

По последовательностям ДНК можно устанавливать степень родства людей, а по митохондриальной ДНК – точно устанавливать родство по материнской линии. Разработан метод «генетической дактилоскопии», который позволяет идентифицировать человека по следовым количествам крови, чешуйкам кожи и т.п. Этот метод с успехом применяется в криминалистике – уже тысячи людей оправданы или осуждены на основании генетического анализа. Сходные подходы можно использовать в антропологии, палеонтологии, этнографии, археологии и даже в такой, казалось бы, далекой от биологии области, как сравнительная лингвистика.

В результате проведенных исследований появилась возможность сравнивать геномы бактерий и различных эукариотических организмов. Выяснилось, что в процессе эволюционного развития у организмов увеличивается количество интронов, т.е. эволюция сопряжена с «разбавлением» генома: на единицу длины ДНК приходится все меньше информации о структуре белков и РНК (экзоны) и все больше участков, не имеющих ясного функционального значения (интроны). Это одна из больших загадок эволюции.

Раньше ученые–эволюционисты выделяли две ветви в эволюции клеточных организмов: прокариоты и эукариоты. В результате сравнения геномов пришлось выделить в отдельную ветвь архебактерии – уникальные одноклеточные организмы, сочетающие в себе признаки прокариот и эукариот.

В настоящее время также интенсивно изучается проблема зависимости способностей и талантов человека от его генов. Главная задача будущих исследований – это изучение однонуклеотидных вариаций ДНК в клетках разных органов и выявление различий между людьми на генетическом уровне. Это позволит создавать генные портреты людей и, как следствие, эффективнее лечить болезни, оценивать способности и возможности каждого человека, выявлять различия между популяциями, оценивать степень приспособленности конкретного человека к той или иной экологической обстановке и т.д.

Напоследок необходимо упомянуть об опасности распространения генетической информации о конкретных людях. В связи с этим в некоторых странах уже приняты законы, запрещающие распространение такой информации, и юристы всего мира работают над этой проблемой. Кроме того, проект «Геном человека» иногда связывают с возрождением евгеники на новом уровне, что тоже вызывает тревогу специалистов.

Анализ генома человека завершен.

В Вашингтоне 6 апреля 2000 г. состоялось заседание комитета по науке Конгресса США, на котором д-р Дж.Крейг Вентер заявил, что его компания, Celera Genomics, завершила расшифровку нуклеотидных последовательностей всех необходимых фрагментов генома человека. Он ожидает, что предварительная работа по составлению последовательностей всех генов (их около 80 тыс., и они содержат примерно 3 млрд. «букв» ДНК) будет завершена через 3–6 недель, т.е. гораздо раньше, чем планировалось. Скорее всего, окончательная расшифровка генома человека будет завершена к 2003 г.

Компания Celera включилась в исследования по проекту «Геном человека» 22 месяца назад. Используемые ею подходы сначала подвергались критике со стороны так называемого открытого консорциума участников проекта, однако завершенный ею в прошлом месяце подпроект по расшифровке генома плодовой мушки показал их действенность.

На этот раз никто не критиковал прогнозы К.Вентера, сделанные им в присутствии советника президента США по науке д-ра Н.Лэйна и представителя консорциума, крупнейшего специалиста по секвенированию генома д-ра Роберта Ватерстона.

Предварительная карта генома будет содержать около 90% всех генов, но, тем не менее, она будет большим подспорьем в работе ученых и врачей, поскольку позволит довольно точно отыскивать необходимые гены. Д-р Вентер заявил, что теперь собирается использовать свои 300 секвенаторов для анализа генома мыши, знание которого поможет понять, как работают гены человека.

Расшифрованный геном принадлежит мужчине, поэтому содержит как X-, так и Y-хромосомы. Имя этого человека не известно, и это не имеет значения, т.к. обширные данные по индивидуальной изменчивости ДНК собраны и продолжают собираться как компанией Celera, так и консорциумом исследователей. Между прочим, консорциум использует в своих исследованиях генетический материал, полученный от различных людей. Д-р Вентер охарактеризовал полученные консорциумом результаты как 500 тыс. расшифрованных, но не упорядоченных фрагментов, из которых очень трудно будет составить целые гены.

Д-р Вентер заявил, что после того, как структура генов будет определена, он устроит конференцию для того, чтобы привлечь сторонних экспертов к установлению положения генов в молекулах ДНК и определению их функций. После этого другие исследователи получат бесплатный доступ к данным по геному человека.

Между Вентером и консорциумом исследователей велись переговоры о совместной публикации полученных результатов, причем один из основных пунктов соглашения должен был предусматривать, что патентование генов возможно лишь после точного определения их функций и положения в ДНК.

Однако переговоры были прерваны из-за разногласий по поводу того, что считать завершением расшифровки генома. Проблема состоит в том, что в ДНК эукариот, в отличие от ДНК прокариот, есть фрагменты, которые не поддаются расшифровке современными методами. Размеры таких фрагментов могут быть от 50 до 150 тыс. оснований, но, к счастью, эти фрагменты содержат очень немного генов. В то же время и в участках ДНК, богатых генами, есть фрагменты, которые также не могут быть пока расшифрованы.

Определение положения и функций генов предполагается осуществить с помощью специальных компьютерных программ. Эти программы будут анализировать структуру генов и, сравнивая ее с данными по геномам других организмов, предлагать варианты их возможных функций. По мнению компании Celera, работу можно считать завершенной, если гены определены практически полностью и точно известно, как расшифрованные фрагменты располагаются на молекуле ДНК, т.е. в каком порядке. Этому определению удовлетворяют результаты Celera, в то время как результаты консорциума не позволяют однозначно определить положение расшифрованных участков относительно друг друга.

Компания Celera предполагает после составления полной карты генома человека сделать эти данные доступными для других исследователей по подписке, при этом для университетов плата за пользование банком данных будет очень низкой, 5–15 тыс. долларов в год. Это составит серьезную конкуренцию базе данных Genbank, принадлежащей университетам.

Участники заседания комитета по науке резко критиковали такие компании, как Incyte Pharmaceuticals и Human Genome Sciences, которые каждую ночь копировали данные консорциума, доступные по Интернету, а затем подавали заявки на патентование всех генов, обнаруженных ими в этих последовательностях.

На вопрос, не могут ли данные о геноме человека быть использованы для создания биологического оружия нового типа, например, опасного только для некоторых популяций, д-р Вентер ответил, что гораздо большую опасность представляют данные по геномам болезнетворных бактерий и вирусов. На вопрос одного из конгрессменов, не станет ли теперь реальностью целенаправленное изменение человеческой расы, д-р Вентер ответил, что для полного определения функций всех генов может потребоваться около ста лет, а до тех пор о направленных изменениях в геноме говорить не приходится.

Напомним, что в декабре 1999 г. исследователи Великобритании и Японии объявили об установлении структуры 22-й хромосомы. Это была первая декодированная хромосома человека. Она содержит 33 млн. пар оснований, и в ее структуре остались нерасшифрованными 11 участков (около 3% длины ДНК). Для этой хромосомы определены функции примерно половины генов. Установлено, например, что с дефектами этой хромосомы связано 27 различных заболеваний, среди которых такие, как шизофрения, миелоидная лейкемия и трисомия 22 – вторая по значению причина выкидышей у беременных.

В то время британские ученые резко критиковали методы секвенирования, используемые компанией Celera, считая, что они потребуют слишком длительного времени для расшифровки последовательностей и определения взаимного расположения их фрагментов. Тогда на основе известного объема декодированного материала делались прогнозы, что следующими будут картированы 7-, 20- и 21-й хромосомы.

Через неделю после объявления о завершении расшифровки нуклеотидных последовательностей в геноме человека, состоялось собрание Американской ассоциации за прогресс в науке, на которой министр по энергетике США Билл Ричардсон объявил, что ученые Объединенного института генома определили структуры 5-, 16- и 19-й хромосом человека.

Эти хромосомы содержат примерно 300 млн. пар оснований, что составляет 10–15 тыс. генов, или около 11% генетического материала человека. Пока удалось картировать 90% ДНК этих хромосом – остались не поддающиеся дешифровке участки, содержащие незначительное число генов.

На картах хромосом обнаружены генетические дефекты, которые могут приводить к некоторым заболеваниям почек, раку простаты и прямой кишки, лейкемии, гипертонии, диабету и атеросклерозу. По словам Ричардсона, ближе к лету информация о структуре хромосом будет доступна всем исследователям бесплатно.



Проект «Геном человека» является наиболее амбициозной биологической исследовательской программой за всю историю науки. Знание генома человека внесет неоценимый вклад в развитие медицины и биологии человека. Исследования человеческого генома так же необходимо человечеству, как когда-то было необходимо знание человеческой анатомии. Осознание этого пришло в 1980-х, и это привело к тому, что появился проект «Геном человека». В 1988-м с аналогичной идеей выступил выдающийся российский молекулярный биолог и биохимик, академик А. А. Баев (1904–1994). С 1989 г. и в США, и в СССР функционируют соответствующие научные программы; позднее возникла Международная организация по изучению генома человека (HUGO). Вклад России в международное сотрудничество признан в мире: 70 отечественных исследователей являются членами HUGO.

Итак, прошло 10 лет с того времени, когда проект «Геном человека» был завершен. Есть повод вспомнить, как это было...

В 1990 г. при поддержке министерства энергетики США, а также Великобритании, Франции, Японии, Китая и Германии, был запущен этот трехмиллиардный проект. Возглавил его д-р Фрэнсис Коллинз, глава . Целями проекта являлись:

  • идентификация 20 000–25 000 генов ДНК;
  • определение последовательности 3 млрд. пар химических оснований, составляющих ДНК человека, и сохранение этой информации в базе данных;
  • усовершенствование приборов для анализа данных;
  • внедрение новейших технологий в область частного использования;
  • исследование этических, правовых и социальных вопросов, возникающих при расшифровке генома.

В 1998 г. аналогичный проект был запущен д-ром Крейгом Вентером и его фирмой «Celera Genomics ». Д-р Вентер поставил перед своей командой задачу более быстрого и дешевого секвенирования человеческого генома (в отличие от трехмиллиардного международного проекта, бюджет проекта д-ра Вентера ограничивался 300 млн долл.). Кроме того, фирма «Celera Genomics » не собиралась открывать доступ к своим результатам.

6 июня 2000 г. президент США и премьер-министр Великобритании объявили о расшифровке человеческого генетического кода, и таким образом соревнование закончилось. На самом деле, был опубликован рабочий черновик человеческого генома, и лишь к 2003 г. он был расшифрован практически полностью, хотя и сегодня все еще проводят дополнительный анализ некоторых участков генома.

Тогда умы ученых были взбудоражены необыкновенными возможностями: новые, действующие на генетическом уровне лекарства, а значит, не за горами создание «персональной медицины», настроенной точно под генетический характер каждого отдельно взятого человека. Существовали, конечно, и опасения, что может быть создано генетически зависимое общество, в котором людей буду делить на высшие и низшие классы по их ДНК и соответственно ограничивать их возможности. Но все же была надежда, что этот проект окажется столь же прибыльным, сколь и Интернет.

И вдруг все затихло... надежды не оправдались... казалось, что 3 млрд долл., вложенных в эту затею, выброшены на ветер.

Нет, не совсем так. Быть может, полученные результаты не столь грандиозны, как предполагалось во времена зарождения проекта, но они позволят достичь в будущем значительных успехов в различных областях биологии и медицины.

В результате исполнения проекта «Геном человека» был создан открытый банк генокода. Общедоступность полученной информации позволила многим исследователям ускорить свою работу. Ф. Коллинз привел в качестве иллюстрации такой пример: «Поиск гена фиброзно-кистозной дегенерации был успешно завершен в 1989 г., что стало результатом нескольких лет исследований моей лаборатории и еще нескольких других и стоило США около 50 млн долл. Сейчас это способен сделать смышленый выпускник университета за несколько дней, и все, что ему понадобится, - это Интернет, несколько недорогих реактивов, термоциклический аппарат для увеличения специфичности сегментов ДНК и доступ к ДНК-секвенатору, читающему ее по световым сигналам».

Еще один важный результат проекта - дополнение истории человека. Раньше все данные об эволюции были почерпнуты из археологических находок, а расшифровка генокода не только дала возможность подтвердить теории археологов, но в будущем позволит точнее узнать историю эволюции как человека, так и биоты в целом. Как предполагается, анализ сходства в последовательностях ДНК различных организмов сможет открыть новые пути в исследовании теории эволюции, и во многих случаях вопросы эволюции теперь можно будет ставить в терминах молекулярной биологии. Такие важнейшие вехи в истории эволюции, как появление рибосомы и органелл, развитие эмбриона, иммунной системы позвоночных, можно будет проследить на молекулярном уровне. Ожидается, что это позволит пролить свет на многие вопросы о сходстве и различиях между людьми и нашими ближайшими сородичами: приматами, неандертальцем (чей генокод недавно был реконструирован из 1,3 млрд фрагментов, подвергавшихся тысячелетнему разложению и загрязненных генетическими следами археологов, державших в руках останки этого существа), а также и всеми млекопитающими, и ответить на вопросы: какой же ген делает нас Homo sapiens , какие гены отвечают за наши поразительные таланты? Таким образом, поняв, как прочитать информацию о нас в генокоде, мы сможем узнать, как гены влияют на физические и умственные характеристики и даже на наше поведение. Возможно, в будущем, посмотрев на генетический код, можно будет не только предсказать, как будет выглядеть человек, но и, к примеру, будет ли у него актерский талант. Хотя, естественно, никогда нельзя будет это определить со 100%-ной точностью.

Кроме того, межвидовое сравнение покажет, чем отличается один вид от другого, как они разошлись на эволюционном древе. Межпопуляционное сравнение покажет, как этот вид эволюционирует. Сравнение ДНК отдельных особей внутри популяции покажет, чем объясняется различие особей одного вида, одной популяции. Наконец, сравнение ДНК различных клеток внутри одного организма поможет понять, как происходит дифференцирование тканей, как они развиваются и что идет не так в случае заболеваний, таких например, как рак.

Вскоре после расшифровки большей части генокода в 2003 г., ученые обнаружили, что существует гораздо меньше генов, чем они ожидали, но впоследствии убедились в противоположном. Традиционно ген определяли как участок ДНК, который кодирует белок. Однако, расшифровывая генокод, ученые выяснили, что 98,5% участков ДНК не кодируют белки, и назвали эту часть ДНК «бесполезной». И выяснилось, что эти 98,5% участков ДНК имеют едва ли не большее значение: именно эта часть ДНК отвечает за ее функционирование. Например, определенные участки ДНК содержат инструкции для получения похожих на ДНК, но небелковых молекул, так называемых двухцепочечных РНК. Эти молекулы являются частью молекулярно-генетического механизма, контролирующего активность гена (РНК-интерференция). Некоторые двухцепочечные РНК могут подавлять гены, препятствуя синтезу их белковых продуктов. Таким образом, если данные участки ДНК также считать генами, то их количество удвоится. В итоге исследования изменилось само представление о генах, и сейчас ученые считают, что ген - это единица наследственности, которую нельзя понимать как просто участок ДНК, кодирующий белки.

Можно сказать, что химический состав клетки - ее «хард», а информация, закодированная в ДНК, - предварительно загруженный «софт». Никто раньше и не предполагал, что клетка является чем-то большим, чем просто совокупностью составных частей, и что для ее построения недостаточно закодированной в ДНК информации, что столь же важным является процесс саморегулирования генома - и путем сообщения между соседними генами, и путем воздействия других молекул клетки.

Открытый доступ к информации позволит объединить опыт врачей, информацию о патологических случаях, результаты многолетнего изучения отдельных особей, и потому станет возможным соотнести генетическую информацию с данными анатомии, физиологии, поведения человека. И уже это сможет привести к лучшей медицинской диагностике и прогрессу в лечении.

Например, исследователь, изучающий определенную форму рака, сможет сузить круг поиска до одного гена. Сверив свои данные с данными открытой базы генома человека, он сможет проверить, что другие написали об этом гене, включая (потенциально) трехмерную структуру его производного белка, его функции, его эволюционную связь с другими генами человека или с генами мышей, дрожжей или дрозофилы, возможные пагубные мутации, взаимосвязь с другими генами, тканями тела, в которых ген активируется, заболеваниями, связанными с этим геном, или другие данные.

Более того, понимание хода заболевания на уровне молекулярной биологии позволит создать новые терапевтические методы. Учитывая, что ДНК играет огромную роль в молекулярной биологии, а также ее центральное значение в функционировании и принципах работы живых клеток, углубление знаний в этой области откроет путь для новых методов лечения и открытий в различных областях медицины.

Наконец, и «персональная медицина» теперь кажется уже более реальной задачей. Д-р Уиллс выразил надежду, что лечение заболеваний путем замены поврежденного участка ДНК нормальным станет возможным уже в следующее десятилетие. Сейчас проблемой, препятствующей развитию такого метода лечения, является то, что ученые не умеют доставлять ген в клетку. Пока единственный известный способ доставки - заражение животного вирусом с необходимыми генами, но это опасный вариант. Однако д-р Уиллс предполагает, что в скором времени в этом направлении будет совершен прорыв.

Сегодня уже существуют простые способы проведения генетических тестов, которые могут показать предрасположенность к различным заболеваниям, включая рак молочной железы, нарушение свертываемости крови, кистозный фиброз, заболевания печени и др. Такие заболевания, как рак, болезнь Альцгеймера, диабет, как было выяснено, связаны не с общими для всех, а с огромным количеством редких, практически индивидуальных мутаций (причем не в одном гене, а в нескольких; например, мышечную дистрофию Шарко-Мари-Тут может вызвать мутация 39 генов), в результате чего эти болезни трудно поддаются диагностике и воздействию медицинских препаратов. Именно это открытие является одним из камней преткновения «персональной медицины», поскольку, прочитав генокод человека, пока невозможно точно определить состояние его здоровья. Исследуя генокоды разных людей, ученые были разочарованы результатом. Около 2000 участков ДНК человека статистически относилось к «болезненным», которые при этом не всегда относились к работающим генам, т. е. не представляли угрозы. Похоже, что эволюция избавляется от мутаций, вызывающих болезнь, до того, как они станут общими.

Проводя исследования, группа ученых в Сиэтле обнаружила, что из всего человеческого генокода лишь 60 генов претерпевают спонтанную мутацию каждое поколение. При этом мутировавшие гены могут вызвать различные заболевания. Так, если у каждого из родителей было по одному «испорченному» и одному «неиспорченному» гену, то у детей болезнь может и не проявиться или проявится в очень слабой форме, если они получат один «испорченный» и один «неиспорченный» ген, но если ребенок унаследует оба «испорченных» гена, то это может привести к болезни. К тому же, поняв, что общечеловеческие болезни вызываются индивидуальным мутациями, ученые пришли к выводу, что необходимо исследовать полностью весь генокод человека, а не его отдельные участки.

Несмотря на все затруднения, уже созданы первые генетические лекарства против рака, которые блокируют эффекты генетических отклонений, приводящих к росту опухолей. Также недавно было одобрено лекарство компании «Amgen » от остеопороза, которое основывается на том, что болезнь вызывается гиперактивностью определенного гена. Последнее достижение - проведение анализа биологических жидкостей на присутствие мутации определенного гена для диагностики рака толстой кишки. Такой тест позволит избавить людей от неприятной процедуры колоноскопии.

Итак, привычная биология ушла в прошлое, наступил час новой эры науки: постгеномной биологии. Она полностью развенчала идею витализма, и хотя в него уже больше столетия не верил ни один биолог, новая биология не оставила места и для призраков.

Не только интеллектуальные озарения играют важную роль в науке. Такие технические прорывы, как телескоп в астрономии, микроскоп в биологии, спектроскоп в химии, приводят к неожиданным и замечательным открытиям. Похожую революцию в геномике производят сейчас мощные компьютеры и информация, содержащаяся в ДНК.

Закон Мура говорит о том, что компьютеры увеличивают свою мощность вдвое примерно каждые два года. Таким образом, за последнее десятилетие их мощность возросла более чем в 30 раз при постоянно снижающейся цене. В геномике пока нет имени для аналогичного закона, но его следовало бы назвать законом Эрика Лэндера - по имени главы Broad Institute (Cambridge , Massachusetts , крупнейший американский центр, занимающийся расшифровкой ДНК). Он подсчитал, что по сравнению с прошлым десятилетием цена расшифровки ДНК снизилась на сотни тысяч долларов. При расшифровке последовательности геномов в International Human Genome Sequencing Consortium использовали метод, разработанный еще в 1975 г. Ф. Сенджером, что заняло 13 лет и стоило 3 млрд долл. А значит, расшифровка генетического кода была под силу только мощным компаниям или центрам по исследованию генетической последовательности. Сейчас, используя последние устройства для расшифровки от фирмы «Illumina » (San Diego , California ), человеческий геном может быть прочитан за 8 дней, и стоить это будет около 10 тыс. долл. Но и это не предел. Другая калифорнийская фирма, «Pacific Biosciences» и з Менло Парка, разработала способы, позволяющие прочитать геном всего с одной молекулы ДНК. Вполне возможно, что скоро расшифровка генома будет занимать минут 15 и стоить менее 1000 долл. Аналогичные разработки существуют и в «Oxford Nanopore Technologies » (Великобритания). Раньше фирмы использовали решетки проб ДНК (ДНК-чипы) и искали определенные генетические символы - SNP. Сейчас известно несколько десятков таких символов, но есть основания предполагать, что среди трех миллиардов «букв» генетического кода их гораздо больше.

До недавнего времени полностью было расшифровано всего несколько генокодов (в проекте «Геном человека» были использованы кусочки генокода множества людей, а затем собраны в единое целое). Среди них генокоды К. Вентера, Дж. Уотсона, д-ра Ст. Куэйка, двух корейцев, китайца, африканца, а также больного лейкемией, национальность которого ныне уже трудно установить. Теперь, с постепенным усовершенствованием техники чтения последовательностей генов, станет возможным расшифровка генокода все большего и большего числа людей. В будущем свой генокод сможет прочитать любой человек.

Кроме стоимости расшифровки, важным показателем является его точность. Считается, что приемлемым уровнем является не более одной ошибки в 10 000–100 000 символов. Сейчас уровень точности находится на уровне 1 ошибки в 20 000 символов.

На настоящий момент в США ведутся споры по поводу патентования «расшифрованных» генов. Однако многие исследователи считают, что патентование генов станет препятствием для развития науки. Главная стратегическая задача будущего сформулирована следующим образом: изучить однонуклеотидные вариации ДНК в разных органах и клетках отдельных индивидуумов и выявить различия между индивидуумами. Анализ таких вариаций даст возможность не только подойти к созданию индивидуальных генных «портретов» людей, что, в частности, позволит лучше лечить болезни, но и определить различия между популяциями, выявлять географические районы повышенного «генетического» риска, что поможет давать четкие рекомендации о необходимости очистки территорий от загрязнения и выявлять производства, на которых есть большая опасность поражения геномов персонала.

SNP - одиночный генетический символ, который меняется от человека к человеку. Его открыли специалисты «International HapMap Project », изучая такую мутацию генокода, как однонуклеотидный полиморфизм. Целью проекта по картированию участков ДНК, различных для разных этнических групп, был поиск уязвимости этих групп к отдельным заболеваниям и возможностей их преодоления. Эти исследования могут также подсказать, как человеческие популяции адаптировались к различным заболеваниям.

Ученые, работавшие над расшифровкой последовательности генетического кода человека, заявили, что завершили свой труд на два года раньше запланированного срока.

Это объявление последовало менее чем через три года после опубликования в мировой прессе "черновика" генома. В июне 2000 года премьер-министр Великобритании Тони Блэр и тогдашний президент США Билл Клинтон заявили, что расшифровано 97% "книги жизни".

Сейчас последовательность ДНК человека раскодирована практически на 100%. При этом остаются небольшие пробелы, заполнение которых считается слишком дорогостоящим, но система, способная делать из генетических данных медицинские и научные выводы, уже хорошо отработана.

Институт Сэнгера, единственное британское учреждение, участвующее в масштабном международном проекте, выполнил почти треть всего объема работ. Большего вклада в расшифровку генома не сделал ни один научный институт в мире.

По словам его директора профессора Алана Брэдли, расшифровка генома человека - это важнейший шаг на долгом пути, и те выгоды, которые со временем получит медицина от этих исследований, поистине феноменальны.

"Только одна часть нашей работы - последовательность хромосомы 20 - уже позволила ускорить поиски генов, ответственных за развитие диабетов, лейкемии и детской экземы, - говорит профессор. - Не стоит ожидать немедленного прорыва, но нет сомнений в том, что мы завершаем одну из самых удивительных глав книги жизни".

Высокие стандарты

Не менее значительная доля работы по раскодированию легла на плечи американских ученых.

Доктор Фрэнсис Коллинс, директор Национального института исследований генома США, также указывает на долгосрочные перспективы. "Один из наших проектов предусматривал идентификацию генов предрасположенности к диабету II типа, - говорит он. - Этим заболеванием страдает каждый 20-й человек старше 45 лет, и эта доля со временем только возрастает. При помощи общедоступной карты генетических последовательностей мы сумели отобрать один ген в хромосоме 20, наличие которого в геноме, похоже, как раз и увеличивает вероятность возникновения диабета II типа".

Когда о проекте расшифровки генома человека было официально объявлено, некоторые специалисты утверждали, что на его реализацию потребуется лет 20 или даже больше. Но ход выполнения работ невероятно ускорили появление роботов-манипуляторов и суперкомпьютеров. Подстегнула деятельность ученых в этом направлении и информация о том, что параллельно геном человека расшифровывает и частно финансируемая компания Celera Genomics.

В последние три года основной целью биологов было заполнение брешей, остававшихся в уже раскодированных последовательностях ДНК, и более детальное уточнение всех остальных данных, на основе которых можно было бы выработать "золотой стандарт", который лег бы в основу дальнейших разработок в этой области.

"Нам удалось намного раньше, чем мы надеялись, достичь тех пределов, которые мы установили в своей работе, - говорит доктор Джейн Роджерс, глава отделения ДНК-последовательностей в институте Сэнгера, - сохранив при этом невероятно высокие стандарты качества. Эта работа позволяет исследователям немедленно приступить к целому ряду биомедицинских проектов. Теперь у них нас есть великолепно отшлифованный конечный продукт, который окажет им неоценимую помощь. Это как перейти от записи первой демонстрационной музыкальной кассеты к работе над полноценным классическим компакт-диском".

Зная практически всю последовательность почти трех миллиардов букв-нуклеотидов генетического кода нашей ДНК, ученые смогут вплотную заняться теми проблемами жизни человека, которые вызываются генетическими причинами.

Еще в начале апреля сэр Джон Салстон, возглавляющий британскую часть работы над проектом почти с самого его начала, заявил, что эти исследования позволят "раскопать генетические данные человека, которыми можно будет пользоваться всегда".

Работа по идентификации генов теперь может длиться дни, а не годы, как раньше. Но главная задача практической медицины заключается теперь в том, чтобы знание о том, какие именно гены работают неправильно или вызывают определенные нарушения, трансформировать в знание того, что с этим можно сделать.

А для этого им понадобится лучше понять, как, строя и поддерживая наше тело, взаимодействуют между собой белки (они же протеины) - сложные молекулы, построенные по генетическим "шаблонам" ДНК.

Наука геномика уже существует и активно развивается, но наука протеоника еще только в зачаточном состоянии. И здесь, как сказал профессор Брэдли, впереди еще "долгий путь".

Проект Геном Человека

Логотип проекта

Проект по расшифровке генома человека (англ. The Human Genome Project , HGP ) - международный научно-исследовательский проект, главной целью которого было определить последовательность нуклеотидов , которые составляют ДНК и идентифицировать 20,000-25,000 генов в человеческом геноме .

Изначально планировалось определение более трёх миллиардов последовательности нуклеотидов , содержащихся в гаплоидном человеческом геноме их. Затем несколько групп обьявили о попытке расширить задачу до секвенирования диплоидного генома человека, среди них международный проект HapMap (англ.), Applied Biosystems , Perlegen, и клонированных животных) уникален, поэтому определение последовательности человеческого генома в принципе должно включать в себя и секвенирование многочисленных вариаций каждого гена. Однако, в задачи проекта «Геном человека» не входило определение последовательности всей ДНК, находящейся в человеческих клетках; а некоторые гетерохроматиновые области (в общей сложности около 8 %) остаются несеквенированными до сих пор.

Проект

Предпосылки

Проект стал кульминацией нескольких лет работы поддержаной министерством энергетики США , в частности семинаров проводившихся в 1984-м и 1986-м годах, и последовавшими министерства энергетики . Отчёт 1987 года чётко указывает: «Окончательной целью данного начинания является понимание человеческого генома» и «знание человеческого генома так же необходимо для прогресса медицины и других наук о здоровье, как знание анатомии было необходимо для достижения её нынешнего состояния». Поиски технологий, подходящих для решения предложенной задачи, начинались еще во второй половине 80-х годов.

В силу широкой международной кооперации и новых достижений в области геномики (особенно в секвенировании), а также значительных достижений в вычислительной технике, «черновик» генома был закончен в 2000 (о чём было объявлено совместно тогдашним президентом США Билом Клинтоном и британским премьер-министром Тони Блером 26 июня 2000 ). Продолжение секвенирования привело к объявлению в апреле 2003 года о почти полном завершении работы, на 2 года раньше чем планировалось . В мае , была пройдена другая веха на пути к завершению проекта, когда в журнале « .

Завершённость

Существуют многочисленные определения «полной последовательности человеческого генома». Согласно некоторым из них, геном уже полностью секвенирован, а согласно другим, этого ещё предстоит добиться. В популярной прессе было множество статей, сообщающих о «завершении» генома. Согласно определению, которое использует Международный проект по расшифровке генома человека, геном расшифрован полностью. График истории расшифровки проекта показывает, что большая часть человеческого генома была закончена в конце 2003 года. Однако еще остаётся несколько регионов, которые считаются незаконченными:

  • Прежде всего, центральные регионы каждой хромосомы, известные как центромеры , которые содержат большое количество повторяющихся последовательностей ДНК ; их сложно секвенировать при помощи современных технологий. Центромеры имеют длину миллионы (возможно десятки миллионов) пар нуклеотидов, и, по большому счёту, остаются не секвенированными.
  • Во-вторых, концы хромосом, называемые теломерами , также состоящие из повторяющихся последовательностей, и по этой причине в большинстве из 46 хромосом их расшифровка не завершена. Точно не известно, какая часть последовательности остаётся не расшифрованной до теломер, но как и с центромерами, существующие технологические ограничения препятствуют их секвенированию.
  • В-третьих, в геноме каждого индивидуума есть несколько локусов, которые содержат членов мультигенных семейств, которые также сложно расшифровать с помощью основного на сегодняшний день метода фрагментирования ДНК (англ.). В частности, эти семейства кодируют белки, важные для иммунной системы.
  • Кроме перечисленных регионов, остаётся ещё несколько брешей, разбросанных по всему геному, некоторые из которых довольно крупные, но есть надежда, что все они будут закрыты в ближайшие годы.

Б́ольшая часть остающейся ДНК сильно повторяющаяся, и маловероятно, что она содержит гены, однако это останется неизвестным, пока они не будут полностью секвенированы. Понимание функций всех генов и их регуляции далека от завершения. Роль мусорной ДНК , эволюция генома, различия между индивидуумами, и многие другие вопросы по-прежнему являются предметом интенсивных исследований в лабораториях всего мира.

Цели

Последовательность человеческой ДНК сохраняется в базах данных , доступных любому пользователю через интернет . Национальный центр биотехнологической информации США (и его партнёрские организации в Европе и Японии) хранят геномные последовательности в базе данных известной как GenBank (англ.), вместе с последовательностями известных и гипотетических генов и белков. Другие организации, к примеру Калифорнийский Университет в Санта-Круз (англ.) и Ensembl (англ.) поддерживают дополнительные данные и аннотации а также мощные инструменты для визуализации и поиска в этих базах. Были разработаны компьютерные программы для анализа данных, потому что сами данные без таких программ интерпретировать практически невозможно.

Процесс идентификации границ генов и других мотивов в необработанных последовательностях ДНК называется аннотацией генома (англ.) и относится к области биоинформатики . Эту работу при помощи компьютеров выполняют люди, но они делают её медленно и, чтобы удовлетворять требованиями высокой пропускной способности проектов секвенирования геномов, здесь также всё шире используют специальные компьютерные программы. Лучшие на сегодняшний день технологии аннотации используют статистические модели основанные на параллелях между последовательностями ДНК и человеческим языком , пользуясь такими концепциями информатики как формальные грамматики .

Другая, часто упускаемая из виду целью проекта «Геном человека» - исследование этических, правовых и социальных последствий расшифровки генома. Важно исследовать эти вопросы и найти наиболее подходящие решения до того, как они станут почвой для разногласий и политических проблем.

Почти все цели, которые ставил перед собой проект, были достигнуты быстрее, чем предполагалось. Проект по расшифровке генома человека был закончен на два года раньше, чем планировалось. Проект поставил разумную, достижимую цель секвенирования 95 % ДНК. Исследователи не только достигли её, но и превзошли собственные предсказания, и смогли секвенировать 99,99 % человеческой ДНК. Проект не только превзошёл все цели и выработанные ранее стандарты, но и продолжает улучшать уже достигнутые результаты.

Проект финансировался правительством США и британским благотворительным обществом Wellcome Trust (англ.), которое финансировало , а также множество других групп по всему свету. Геном был разбит на небольшие участки, примерно по 150 000 пар нуклеотидов в длину. Эти куски затем встраивали в вектор , известный как как Искусственная бактериальная хромосома (англ.) или BAC. Эти векторы созданы из бактериальных хромосом, измененных методами генной инженерии . Векторы, содержащие гены, затем можно вставлять в бактерии, где они копируются бактериальными механизмами репликации . Каждый из кусочков генома потом секвенировали раздельно методом «фрагментирования», и затем все полученные последовательности собирали воедино уже в виде компьютерного текста. Размеры полученных больших кусков ДНК, собираемых для воссоздания структуры целой хромосомы, составляли около 150 000 пар нуклеотидов. Такая система известна под именем «иерархического метода фрагментирования», потому что вначале геном разбивается на куски разного размера, положение которых в хромосоме должно быть заранее известно.

Сопоставление данных общего и частного проектов

Крейг Вентер

В 1998 году, американский исследователь Крейг Вентер и его фирма Celera Genomics запустили аналогичное исследование, финансированное частным капиталом. В начале 1990-х когда проект «Геном человека» только начинал работу, Вентер тоже работал в Национальном институте здоровья. Целью его собственного $300-миллионного проекта Celera было более быстрое и дешёвое секвенирование человеческого генома, чем в $3-миллиардном государственном проекте.

Celera использовала более рискованную разновидность метода фрагментации генома (англ.), которую использовали ранее для секвенирования бактериальных геномов размером до шести миллионов пар нуклеотидов в длину, но никогда для чего-либо столь большого, как человеческий геном, состоящий из трёх миллиардов пар нуклеотидов.

Вначале Celera анонсировала, что она будет добиваться патентной защиты «всего лишь 200 или 300» генов, но позднее внесла поправки, что ищет «защиту интеллектуальной собственности» на «полное описание важнейших структур», составляющих примерно 100-300 целей. Наконец фирма подала предварительные патентные заявки на 6,500 целых или частичных генов . Celera также обещала опубликовать результаты своей работы согласно условиям «Бермудского заявления (англ.)» 1996 года , выпуская новые данные ежеквартально (проект «Геном человека» выпускал новые данные ежедневно), однако, в отличие от проекта с государственным финансированием, фирма не дает разрешения на свободное распространение или коммерческое использование своих данных.

В марте 2000 года, президент США Билл Клинтон заявил что последовательность генома не может быть запатентована и должна быть свободно доступна для всех исследователей. После заявления президента акции компании Celera сильно упали, что потянуло вниз весь биотехнологический сектор рыночной капитализации за два дня.

Хотя рабочий вариант генома был анонсирован в июне 2000 года, Celera и учёные работавшие в проекте «Геном человека» опубликовали детали своей работы только в феврале 2001. Специальные выпуски журнала ) и журнала Science (который опубликовал статью Celera ) описали методы, использовавшиеся для производства черновика последовательности, и предложили ее анализ. Эти черновики покрывали примерно 83 % генома (90 % эухроматиновых регионов с 150 000 брешей, а также содержали порядок и ориентацию многих всё ещё не законченных сегментов). В феврале 2001 года, во время подготовки совместных публикаций, были выпущены пресс-релизы , говорящие о том, что проект был завершён обеими группами. В 2003 и 2005 гг. были анонсированы улучшенные черновики, содержавшие приблизительно 92 % последовательности.

Соревнование очень хорошо сказалось на проекте, заставив участников государственного проекта модифицировать свою стратегию, чтобы ускорить ход работы. Вначале конкуренты согласились объединить результаты, но союз распался после того, как Celera отказалась сделать свои результаты доступными через публичную базу данных GenBank с неограниченным доступом для всех пользователей. Celera включила данные проекта «Геном человека» в собственную последовательность, однако запретила попытки использовать свои данные для всех сторонних пользователей.

В 2004, исследователи из Международного Консорциума по Секвенированию Человеческого Генома (англ. International Human Genome Sequencing Consortium ) (IHGSC) проекта «Геном человека» огласили новую оценку числа генов в человеческом геноме составившую от 20,000 до 25,000 . Ранее предсказывалось от 30,000 до 40,000, а в начале проекта оценки доходили до 2,000,000. Это число продолжает колебаться и в настоящее время ожидается что ещё в течение многих лет не удастся прийти к согласию по поводу точного количества генов в человеческом геноме.

История частного проекта

Детали по данной теме смотри в статье История генетики .

В 1995 г. было показано, что данная техника применима к секвенированию первого бактериального генома (1,8 миллиона пар нуклеотидов) свободно живущего организма Haemophilus influenzae и первого генома животного (~100 млн пар оснований) . Метод включает использование автоматизированных секвенаторов, что позволяет определять более длинные индивидуальные последовательности (в то время однократно получалось приблизительно 500 пар нуклеотидов). Пересекающиеся последовательности размером примерно в 2000 пар нуклеотидов «читали» в двух направлениях, это были критические элементы, создание которых повлекло за собой разработку первых компьютерных программ сборки генома, необходимых для реконструирования больших регионов ДНК, известных под названием контиги ("contigs").

Три года спустя, в 1998, заявление только что созданной компании Celera Genomics, о том что она собирается масштабировать метод фрагментирования ДНК на человеческий геном, в некоторых кругах было встречено скептически . Техника фрагментирования разрывает ДНК на фрагменты различных размеров, от 2,000 до 300,000 пар нуклеотидов в длину, образуя то, что называется «библиотекой» ДНК. Затем ДНК «читают» с помощью автоматического секвенатора кусками по 800 пар нуклеотидов длиной с обоих концов каждого фрагмента. С помощью сложного алгоритма сборки и суперкомпьютера , кусочки собирают воедино, после чего геном может быть реконструирован из миллионов коротких фрагментов длиной в 800 пар нуклеотидов. Успех как государственного, так и частного проектов зависел от новой, более высоко автоматизированной капиллярной секвенирующей ДНК машины, которая называлась Applied Biosystems 3700 . Она прогоняла цепочки ДНК через необычайно тонкую капиллярную трубку , а не через плоский гель, как это делали в ранних моделях секвенаторов. Ещё более критическим фактором была разработка новой, более масштабной программы сборки генома, ассемблера, который мог бы обрабатывать 30-50 миллионов последовательностей, требующихся для секвенирования всего человеческого генома. В то время такой программы не существовало. Одним из первых крупных проектов в Celera Genomics стала разработка данного ассемблера, который был написан параллельно с созданием большой, высокоавтоматизированной фабрики секвенирования геномов. Разработка ассемблера велась под руководством Брайена Рамоса (англ. Brian Ramos ). Первая версия появилась в 2000 году, когда команда Celera объединила силы с профессором Джеральдом Рубином (англ.) для секвенирования генома фруктовой мушки Дрозофила меланогастер методом фрагментирования генома . Собрав 130 миллионов пар нуклеотидов, программа обработала, по меньшей мере, в 10 раз больше данных, чем любой ранее собранный из результатов метода фрагментирования геном. Год спустя команда Celera опубликовала свою сборку трёх миллиардов пар нуклеотидов человеческого генома.

Как были достигнуты результаты

IHGSC для ориентации и проверки правильности сборки последовательности каждой человеческой хромосомы использовал секвенирование концевых фрагментов в сочетании с картированием больших (около 100 тыс. пар оснований) плазмидных клонов, полученных методом фрагментирования генома, а также применял метод фрагментирования меньших субклонов тех же плазмид, а также множество других данных .

Группа Celera понимала важность метода фрагментирования генома и тоже использовала саму последовательность, чтобы ориентировать и найти правильное местоположение секвенированных фрагментов внутри хромосомы. Однако компания использовала и публично доступные данные из проекта «Геном человека», чтобы контролировать процесс сборки и ориентации, что поставило под вопрос независимость ее данных .

Доноры генома

В межгосударственном проекте «Геном человека» (HGP), исследователи из IHGSC взяли у большого числа доноров образцы крови (женщин) и спермы (мужчин). Из числа собранных образцов источником ДНК стали лишь несколько. Таким образом, личности доноров были скрыты, чтобы ни доноры, ни учёные не могли знать, чья именно ДНК была секвенирована. Во всём проекте были использованы многочисленные клоны ДНК из различных библиотек (англ.). Большинство из этих библиотек были созданы доктором Питером де Хонгом (англ. Pieter J. de Jong ). Неформально сообщалось, и в сообществе генетиков хорошо известно, что большая часть ДНК в государственном проекте получена от единственного анонимного донора - мужчины из Буффало (кодовое название RP11) .

В проекте компании Celera Genomics для секвенирования использовалась ДНК, поступившая от пяти различных человек. Крейг Вентер , в то время бывший главным научным руководителем Celera Genomics, позднее признался (в публичном письме в журнал Science), что его ДНК была одним из 21 образцов в общем фонде, пять из которых были отобраны для использования в проекте .

4 сентября 2007 года, команда под руководством Крейга Вентера опубликовала полную последовательность его собственной ДНК , впервые сняв покров тайны с шестимиллиарднонуклеотидной последовательности генома единственного человека.

Перспективы

Работа над интерпретацией данных генома находится всё ещё в своей начальной стадии. Ожидается что детальное знание человеческого генома откроет новые пути к успехам в медицине и биотехнологии . Ясные практические результаты проекта появились ещё до завершения работы. Несколько компаний, например Myriad Genetics (англ.), начали предлагать простые способы проведения генетических тестов, которые могут показать предрасположенность к различным заболеваниям, включая рак груди , нарушения свёртываемости крови , кистозный фиброз , заболевания печени и многим другим. Также ожидается, что информация о геноме человека поможет поиску причин возникновения рака , болезни Альцгеймера и другим областям клинического значения и, вероятно, в будущем может привести к значительным успехам в их лечении.

Также ожидается множество полезных для биологов результатов. Например, исследователь, изучающий определённую форму рака может сузить свой поиск до одного гена. Посетив базу данных человеческого генома в сети , этот исследователь может проверить что другие учёные написали об этом гене включая (потенциально) трёхменую структуру его производного белка, его функции, его эволюционную связь с другими человеческими генами или с генами в мышах или дрожжах или дрозофиле, возможные пагубные мутации, взаимосвязь с другими генами, тканями тела в которых ген активируется, заболеваниями, связанными с этим геном или другие данные.

Более того, глубокое понимание процесса заболевания на уровне молекулярной биологии может предложить новые терапевтические процедуры. Учитывая установленную огромную роль ДНК в молекулярной биологии и её центральную роль в определении фундаментальных принципов работы клеточных процессов , вероятно, что расширение знаний в данной области будет способствовать успехам медицины в различных областях клинического значения, которые без них были бы невозможны.

Анализ сходства в последовательностях ДНК различных организмов также открывает новые пути в исследовании теории эволюции . Во многих случаях вопросы эволюции теперь можно ставить в терминах молекулярной биологии . И в самом деле, многие важнейшие вехи в истории эволюции (появление рибосомы и органелл , развитие эмбриона , имунной системы позвоночных) можно проследить на молекулярном уровне. Ожидается что этот проект прольёт свет на многие вопросы о сходстве и различиях между людьми и нашими ближайшими сородичами (приматами , а на деле и всеми млекопитающими).

Проект определения разнообразия человеческого генома (англ.) (HGDP), отдельное исследование, нацеленное на картирование участков ДНК, которые различаются между этническими группами , который был, по слухам, приостановлен, но на самом деле продолжает работу и в настоящее время накапливает новые результаты. В будущем HGDP, вероятно, сможет получить новые данные в области контроля заболеваний, развития человека и антропологии. HGDP может открыть секреты уязвимости этнических групп к отдельным заболеваниям и подсказать новые стратегии для их преодоления (см. Раса и здоровье (англ.)). Он может также показать, как человеческие популяции адаптировались к этим заболеваниям.

Ссылки

Внешние ссылки

  • Delaware Valley Personalized Medicine Project - использует данные из проекта генома человека, чтобы сделать медицину более персонализированной;
  • National Human Genome Research Institute (NHGRI) - NHGRI возглавил работу над проектом в Национальном Институте Здравоохранения. Этот проект, который имел своей основной целью секвенирование трёх миллиардов пар нуклеотидов, из которых состоит человеческий геном, был успешно завершён в апреле 2003 года.