«Генеалогия для всех людей» — ученые создали самое большое генеалогическое древо человечества
Исследователи из Оксфордского университета сделали важный шаг к картированию всех генетических взаимоотношений между людьми: единой генеалогии, которая прослеживает происхождение всех нас.
За последние два десятилетия произошли выдающиеся достижения в области генетических исследований человека, в результате которых были получены геномные данные для сотен тысяч людей, в том числе тысяч доисторических людей.
Это открывает захватывающую возможность проследить происхождение генетического разнообразия человека, чтобы составить полную карту того, как люди во всем мире связаны друг с другом.
До сих пор основными проблемами этого видения были разработка способа объединения последовательностей генома из множества различных баз данных и разработка алгоритмов для обработки данных такого размера. Однако новый метод, опубликованный исследователями из Института больших данных Оксфордского университета, может легко комбинировать данные из нескольких источников и масштабироваться для размещения миллионов последовательностей генома.
Доктор Ян Вонг, эволюционный генетик из Института больших данных и один из авторов, объясняет: «Мы построили огромное генеалогическое древо, генеалогию для всего человечества, которая максимально точно моделирует историю, породившую все генетические вариации, которые мы находим у людей сегодня. Эта генеалогия позволяет нам увидеть, как генетическая последовательность каждого человека связана с любой другой во всех точках генома».
Поскольку отдельные области генома наследуются только от одного родителя, матери или отца, происхождение каждой точки генома можно рассматривать как дерево.
Набор деревьев, известный как «последовательность деревьев» или «граф наследственной рекомбинации», связывает генетические области во времени с предками, где впервые появились генетические вариации.
«По сути, мы реконструируем геномы наших предков и используя их для формирования обширной сети отношений. Затем мы можем оценить, когда и где жили эти предки. Сила нашего подхода заключается в том, что он делает очень мало предположений об исходных данных и может также включать как современные, так и древние образцы ДНК» — говорят ученые.
Исследование объединило данные о современных и древних геномах человека из восьми различных баз данных и включило в общей сложности 3609 последовательностей отдельных геномов из 215 популяций.
Древние геномы включали найденные по всему миру образцы возрастом от 1000 до более 100 000 лет. Алгоритмы предсказывали, где в эволюционных деревьях должны присутствовать общие предки, чтобы объяснить закономерности генетической изменчивости. Получившаяся сеть содержала почти 27 миллионов предков.
— Исследование предсказывает общих предков, в том числе примерно, когда и где они жили.
— Анализ восстанавливает ключевые события в истории эволюции человека, включая миграцию из Африки.
— Лежащий в основе метод может найти широкое применение в медицинских исследованиях, например, для выявления генетических предикторов риска заболеваний.
После добавления данных о местоположении в эти образцы геномов авторы использовали сеть, чтобы оценить, где жили предсказанные общие предки. Результаты успешно восстановили ключевые события в истории эволюции человека, включая миграцию из Африки.
Хотя генеалогическая карта уже является чрезвычайно богатым ресурсом, исследовательская группа планирует сделать ее еще более полной, продолжая включать генетические данные по мере их появления.
Поскольку последовательности деревьев хранят данные очень эффективным способом, набор данных может легко вместить миллионы дополнительных геномов.
«Это исследование закладывает основу для следующего поколения секвенирования ДНК. По мере улучшения качества последовательностей генома из современных и древних образцов ДНК деревья будут становиться еще более точными, и в конечном итоге мы сможем создать единую унифицированную карту, которая объясняет происхождение всех генетических вариаций человека, которые мы видим сегодня» — говорят исследователи.
«Хотя в центре внимания этого исследования находятся люди, этот метод действителен для большинства живых существ; от орангутанов до бактерий. Это может быть особенно полезно в медицинской генетике, чтобы отделить истинные связи между генетическими областями и болезнями от ложных связей, возникающих из нашей общей истории предков».