Взломщики генома продемонстрировали, что ни одна ДНК уже не будет анонимной

https://www.wired.com/story/genome-hackers-show-no-ones-dna-is-anonymous-anymore/
  • Перевод

В 2013 году молодой специалист по вычислительной биологии, Янив Эрлих, шокировал исследовательское сообщество, показав, как можно раскрыть личности людей, перечисленных в анонимной генетической базе данных, используя только соединение с интернетом. Регуляторы отреагировали на это, ограничив доступ к наборам анонимных биомедицинских генетических данных. Представитель Национальных институтов здоровья сообщил тогда: «Шансы на то, что это случится, для большинства людей малы, хотя и не нулевые».

Перенесёмся через пять лет, и мы обнаружим, что количество информации о ДНК, хранящейся в цифровых базах, увеличился взрывообразно, и этот рост не собирается замедляться. Потребительские компании вроде 23andMe и Ancestry составили генетические профили на более 12 млн людей, согласно недавним оценкам. Пользователи, скачавшие свою информацию, могут по желанию добавить её на публичные генеалогические сайты, например, GEDmatch, приобретший в этом году дурную славу благодаря своей роли в наводке полиции на подозреваемого в деле «убийцы Золотого штата».

Эти пересекающиеся семейные деревья, объединяющие людей через части ДНК, разрослись уже так сильно, что их можно использовать для обнаружения половины населения США. Согласно новому исследованию Эрлиха, опубликованному в журнале Science в октябре 2018, более 60% американцев с европейскими корнями можно определить по их ДНК, используя открытые генеалогические базы данных, вне зависимости от того, отправляли ли они туда свою ДНК.

«В результате получается, что уже неважно, сдавали ли вы анализ или нет», — говорит Эрлих, главный научный сотрудник MyHeritage, третьей по величине потребительской генетической компании, после 23andMe и Ancestry. «Вас можно идентифицировать, поскольку базы данных уже покрывают большую часть США, особенно европейского происхождения».

Чтобы вывести эти оценки, Эрлих и его коллеги из Колумбийского университета и Еврейского университета в Иерусалиме проанализировали базу данных MyHeritage, содержащую 1,28 млн анонимных пользователей, по большей части с белой кожей, как и подавляющее большинство генетических баз данных мира. Расценивая каждого пользователя, как «цель», они подсчитали количество его родственников с большими долями совпадающей ДНК, и обнаружили, что 60% из поисковых запросов нашли по меньшей мере его троюродного родственника. Следователям для розыска «убийцы Золотого штата» и раскрытия ещё 17 дел потребовался только такой уровень родства, известный в правоохранительном деле, как «поиск дальних родственников». Для подтверждения своей находки команда Эрлиха загрузила в GEDmatch 30 генетических профилей и обнаружила сходные результаты – 76% поисковых запросов выдали родственников не дальше троюродных.

Анализ выдавал список из примерно 850 человек, в зависимости от плодотворности предков объекта. С этой отправной точки можно довольно быстро сократить базовую демографическую информацию. Общественные архивы, из которых следует место проживания человека с точностью до 160 км, сокращают набор кандидатов в два раза. Возраст с точностью до пяти лет исключает 9 из 10 человек. Пол, который можно установить на основе генетики, урезает список до порядка 16 человек. Точный год рождения может оставить вам одного-двух кандидатов.

Для демонстрации лёгкости процесса, исследователи выбрали анонимную женщину из 1000 Genomes Project – проекта с открытыми геномными кодами – бывшую замужем за мужчиной, которого Эрлих до этого идентифицировал в своей популярной работе 2013 года. Они переформатировали данные по её ДНК так, чтобы они напоминали данные типичного клиента онлайн-сервиса и загрузили их на GEDmatch. Сервис нашёл двух родственников, одного в Северной Дакоте и одного в Вайоминге. Из совпадения следовало их дальнее родство, в пределах 4-6 поколений. Через час прочёсывания общественных архивов команда обнаружила их мужа и жену. Отталкиваясь от этого, исследователи проследили родословные сотен потомков и вычислили личность их цели. Всё это заняло один день.

Эрлих считает, что недалёк тот день, когда такой поиск можно будет провести по любому человеку, оставившему где-либо свою ДНК. В исследовании обнаружилось, что когда генетическая БД покроет примерно 2% взрослого населения любой этнической популяции, совпадение не далее троюродных родственников можно будет найти практически для любого человека. В базе выборки богаче у людей, чьими предками были американцы или европейцы, и для них этот рубеж может быть достигнут уже в течение нескольких лет, если интерес к развлекательным проверкам ДНК будет поддерживаться на том же уровне. Судя по данным последней переписи США, два процента популяции составят всего четыре миллиона человек.

Подобный ресурс серьёзно увеличит количество и разновидности подозреваемых, к данным которых появится доступ у правоохранительных органов во время расследований. Базы данных нарушителей закона, в которых полиция хранит ДНК почти 17 млн человек – это приговорённые преступники, а в некоторых штатах, и просто люди, подвергшиеся аресту – в основном содержит данные по неграм и латиноамериканцам. С ранних дней тестирования ДНК технологические несовместимости разных методов создали стену между базами данных преступников и базами людей, сдающих ДНК в развлекательных или исследовательских целях. Правоохранители собирают и анализируют высоко вариативные некодирующие части генома, подсчитывая количество повторов «мусорных» частей ДНК. Это, по сути, просто последовательность чисел, и она ничего не говорит о личности человека. Однако она уникальна для каждого человека, что-то вроде штрих-кода или отпечатка пальцев. Также этот метод быстрый и дешёвый – идеально для целей полиции.

Медицинские и развлекательные же записи ДНК включают в себя полную расшифровку или массивы генотипов – набор изменений, происходящих в одном месте гена. Это однонуклеотидный полиморфизм (ОНП), и именно он в ответе за то, что у вас зелёные глаза или вьющиеся волосы, или предрасположенность к болезням сердца. Также он куда как более полезен для поиска родственников. Поскольку два этих тип баз данных не связаны друг с другом, в случае с «убийцей Золотого штата» пришлось извлечь ДНК из старых образцов, создать ОНП-профиль и загрузить его в GEDmatch. Но теперь даже это уже не обязательно.

В другой работе, опубликованной в октябре в журнале Cell, впервые продемонстрировано, как можно проводить поиск дальних родственников на основе данных из баз по преступникам. Группа Ноа Розенберга из Стенфордского университета уже показывала, что можно связать записи в двух этих базах, сопоставив ближайшие ОНП с некодирующими повторами. Работа была опубликована в прошлом году, и не привлекла особого внимания. «Тишина», — говорит Розенберг. Но его последняя работа, изучающая перекрёстную совместимость двух баз данных, получает уже новый смысл в свете дела об «убийце Золотого штата».

«Этот способ может расширить охват судебной генетики, и потенциально помочь раскрыть ещё больше старых дел, — говорит Розенберг. – Одновременно он будет раскрывать данные участников этих баз данных во время поисков, связанных с расследованием преступлений, чего те, наверное, не ожидали».

Правовые эксперты считаю большей проблемой тот факт, что из работы Розенберга следует, что в профиле ДНК, хранящемся в полицейских базах данных, содержится больше информации, чем считалось ранее. Его можно использовать для точного предсказания кодирующих участков генома – тех, что связаны с зелёными глазами, кудрявыми волосами и проблемами с сердцем. «Все решения Верховного суда по поводу того, что существующие базы данных преступников не нарушают Чётвёртую поправку, основаны на предположении, что из этой мусорной ДНК ничего нельзя извлечь», — говорит Андреа Рот, директор Центра юриспруденции и технологий Калифорнийского университета в Беркли. «И теперь всё это идёт прахом».

Розенберг не выпустил вместе с работой никакого ПО, поэтому на выполнение реальных вычислений уйдёт какое-то время. Но он говорит, что у любого человека с доступом к нескольким базам данных есть вся необходимая информация для того, чтобы начать использовать эту технологию. А значит, встроенная защита частной жизни может посыпаться довольно быстро. Работа задумана, как предупреждение, чтобы показать регуляторам возможности современных технологий, и Розенберг надеется, что она запустит давно назревшую дискуссию по поводу хранения и использования генетической информации.

Эрлих с соавторами пошли ещё дальше в выработке рекомендаций по изменениям, необходимым для того, чтобы ресурсы типа GEDmatch, предоставляющие важный сервис для людей, разыскивающих пропавших родственников, и для приёмных детей, ищущих биологических родителей, оставаться в онлайне и быть безопасными. Они призвали Министерство здравоохранения и социальных служб США пересмотреть рамки информации о здоровье, относящейся к личным данным, и включить в неё обезличенные геномы. Они описали стратегию шифрования, которая сможет создать цепочку ответственных за сохранность информации, чтобы базы данных могли отмечать пользователей, пытающихся анализировать чужие генетические данные. Но даже если затащить в эту систему абсолютно все компании, предоставляющие услуги, связанные с геномами, этого может оказаться недостаточно.

«Думаю, итог состоит в том, что теперь все люди будут ещё и под колпаком генетического наблюдения, если мы не будем регулировать возможности правительства по проведению генетических поисков», — говорит Рот. Он предлагает систему, похожую на существующее в Калифорнии регулирование более традиционных поисков родственников по базам данных преступников. Их можно использовать только для расследований насильственных преступлений – убийств, насилия – а рамки поиска ограничены, чтобы не вовлекать в него информацию о сотнях невинных людей. Существуют наблюдательные комиссии, способные предотвратить неосторожное раскрытие чувствительной информации, если, допустим, чей-то отец окажется не биологическим отцом. «В этом состоит вся ирония, — говорит Рот. – Если ваш родственник есть в базе CODIS [база преступников], у вас гораздо больше прав на генетическую приватность, чем если у вас есть родственник в GEDMatch». Но с достаточным количеством вашего ДНК уже неважно, захотите ли вы, чтобы вас нашли, или нет. Отказы больше не принимаются.
Поделиться публикацией

Комментарии 54

    –6
    в основном содержит данные по неграм

    Так, для общего развития — у нас еще нет закона, который запрещает называть негров неграми?
      +1
      А должен быть? Где это нельзя называть негров неграми? В США можно.

      www.census.gov/data-tools/demo/race/MREAD_1790_2010.html
        0
        Точно можно? Что-то все источники говорят об обратном.
        Да и не только про США www.sovsport.ru/football/articles/499715-slovo-negr-pod-zapretom-luisa-suaresa-i-dzhona-terri-zhdut-surovye-nakazanija-za-rasistskie-oskorblenija-na-pole
          0
          США нам не указ
            +4
            Я вам ссылку привел, что официально в США можно негров неграми называть.
            А оскорбление это или нет, решает контекст.
              0
              Ну, во-первых, ваша ссылка отдает 403, а выковыривать из гуглового кеша не очень удобно.
              Во-вторых, я очень рад за США, но вопрос-то был не о них, правда? Да и там это далеко не везде приветствуется, в т.ч. и на законодательном уровне www.theguardian.com/world/2007/mar/01/usa.edpilkington
              В-третьих, к вопросу «А должен быть» — а почему бы и нет. Нацистская символика повсеместно зпрещена, коммунистическая — в отдельных странах запрещена. И вообще, есть вот такой замечательный список rkn.gov.ru/mass-communications/p840/p842/p844. Я ответил на ваш вопрос?
                +2
                А почему бы вообще не запретить называть вещи своими именами? Негров неграми, воров ворами, лжеца лжецом? А Роскомнадзор будет за этим следить…
                  0
                  Не нужно устраивать демагогию. Почему бы и нет, потому бы и вот. То, о чем вы заговорили не имеет вообще никакого отношения к вопросу.
                    0
                    Ну о неграх не я заговорил, вообще-то. Действительно, к теме статьи этот вопрос никакого отношения не имеет.
                      0
                      Вы США зачем-то приплели и начали обобщать. И так и не ответили на вопрос. Флуд как он есть :)
                        0
                        Нет такого закона. Пока. Но вы можете разработать законопроект.
                    0
                    А Роскомнадзор

                    лицемерами.

                    +1

                    В России не было негров-рабов, не понимаю, почему мы должны менять свой язык из-за того, что другая нация держала их в рабстве и теперь как бы испытывает раскаяние, а в качестве компенсации за столетия рабства предлагает называть их другим именем. Как вы предлагаете называть их здесь, "афророссиянами"?
                    Театр абсурда.

                    0
                    Я с Вами и не спорю. Но моя знакомя (русская), когда была в США, произнесла слово «негр» в беседе со своим спутником. К ней тут же подскочил совершенно незнакомый «афроамериканец» и… далее цитирую её: «Я до сих пор не могу забыть эти толстые, шлепающие губы. Как он на меня орал!». К счастью, в нашей стране пока еще можно называть черное «черным», а женщину «женщиной».
                      +1
                      А один писатель рассказывал, если не ошибаюсь уже за давностью дет, что водитель такси в США как-то резко отреагировал на разговор о «книге» его клиентов, приехавших на литературную конференцию.
                      Как говориться, угадайте расу таксиста.
                        +1
                        Неужели еть еще люди, которые не понимают, что слова негр и niger имеют абсолютно разное значение. Негр — представитель негроидной рассы, niger — оскорбление, которое можно примерно приравнять к нашему «холоп» или «челядь», но гораздо более грубое. Это конечно не дает права случайным неграм орать на людей на улице, но по опыту Сиэтла — местные фрики и без этого найдут за что на вас поорать. Просто рассуждения уровня Задорнова «ну тупые, у них даже негров неграми называть нельзя» начинают доставать.
                          0

                          В том-то и дело, что между словами "negro", "nigger" и "black" не делают различий. Слышали новость о том, что употребление словосочетания "черный список" признано неполиткорректным? Вангую, что следующими обидятся белые, жёлтые, красные, зелёные и голубые.

                            0
                            Да кто ж вам такое сказал-то? Очень даже делают различия. Пример:

                            www.savannahga.gov/1924/Negro-Heritage-Trail
                              +2
                              Знаете, за что я ненавижу все вот эти «топ 10 смешных законов сша», «в сша черные помидоры признали расистскими» и т.д.? За то что в наш век интернета никто не предоставляет пруфы на законодательные акты, решения судов и т.д. хотя все они есть в свободном доступе. Цель ведь не рассказать как оно на самом деле, а как там «тупые американцы» загнивают, правда? А факты и подтверждения — да кому они нужны.
                              +1
                              Niger — это вообще страна в африке, где протекает одноимённая река.
                                0

                                "Холоп" и "челядь", это скорее аналоги слова "homeboy", которое у обитателей гетто имеет скорее позитивную эмоцинальную окраску. А аналог пресловутого N-word это скорее "чернь". Но опять же, для русского языка это архаизмы, а в американском английском элемент разговорной речи, но аналогично нашей обсценной лексике, употребление данных выражений ограничено.

                          0
                          You don't have permission to access «www.census.gov/data-tools/demo/race/MREAD_1790_2010.html» on this server.
                            0
                            А через VPN европейский или американский попробуйте.
                          +1
                          Я знал о чём будет первый комментарий.
                            +1
                            С чего бы это? Зато у нас есть закон запрещающий называть кавказцев кавказцами если они что-то натворят.
                              0
                              Пока расу не переименуют из негроидной в афроамериканоидную — не будет закона
                              0
                              Базы данных нарушителей закона, в которых полиция хранит ДНК почти 17 млн человек – это приговорённые преступники, а в некоторых штатах, и просто люди, подвергшиеся аресту


                              The National DNA Index (NDIS) contains over 13,528,363 offender(1) profiles, 3,280,752 arrestee profiles and 887,807 forensic profiles as of September 2018.

                              (1)Offender profiles include Convicted Offender, Detainee, and Legal profiles at NDIS.

                              Уже почти 18 млн.
                              Как видно, в большинстве штатов, а не в некоторых, хранят и данные просто арестованных.
                                +1
                                «SNP» обычно не переводится как «ОНП». SNP давно уже устоявшаяся аббревиатура.
                                  0

                                  Спасибо. А то я пытался угадать, что за ОНП такое, не вышло.

                                • НЛО прилетело и опубликовало эту надпись здесь
                                    0
                                    как минимум был на месте совершения преступления?


                                    Подстав не боитесь?
                                    Образцов ДНК, достаточных для современных методов обнаружения, добыть «не просто, а очень просто». Короче, бородатый анекдот про гангстера, который хотел ограбить банк и оставить отпечатки своей тещи, выходит на очередной виток…
                                    • НЛО прилетело и опубликовало эту надпись здесь
                                        0
                                        Объясню «на пальцах». Теперь тому гангстеру достаточно оставить в ограбленном банке волоски и чешуйки кожи той самой тещи — а их получить значительно проще, чем слепки пальцев.
                                          +2

                                          Речь как раз о том, что бы оставить волос. Сейчас, если ваш волос оставят, это вам ничем не грозит — не найдут же. Через пять лет может потребоваться предоставить алиби на случайный день в прошлом. Риск наверняка не высок, но как-то не особо приятно.

                                          • НЛО прилетело и опубликовало эту надпись здесь
                                              0
                                              Нет, не надуманная. Не у каждого случайного есть надежное алиби чтоб не сесть, а задают вопросы каждому чей волос нашли на месте преступления,
                                                0
                                                Всё, не хожу в парикмахерскую, а то вдуг… (Хотя, вроде, волос без луковицы в ДНК-тестах бесполезен, но могу и ошибаться).
                                                0

                                                Речь не о возможности оставить волос. Речь о возможности по волосу найти человека. Сейчас её просто нет (в России). Но я не утверждаю, что риск большой. Просто рассматриваю его как возможный.

                                                  0

                                                  Имею ввиду, что сама возможность оставить волос сейчас есть, но в настоящее время это ничего не даст. А через 10 лет — может привести к обвинениям.

                                                  • НЛО прилетело и опубликовало эту надпись здесь
                                                      0
                                                      В США люди даже от «jury duty» пытаются отмазаться всеми силами, т.к. колоссальная потеря времени и денег. А ведь присяжных даже никто ни в чем не обвиняет. А вы спрашиваете что плохого в том, что вас ложно обвинят в преступлении. Да ничего такого, посидите в камере предварительного заключение, потеряете кучу нервов на допросах, кучу денег из-за пропуска работы а так же репутацию(даже если вас оправдают, всегда ведь найдутся люди с мнением «дыма без огня не бывает» и т.д.)
                                                      • НЛО прилетело и опубликовало эту надпись здесь
                                                          0
                                                          А что делают за волосы на месте преступления?

                                                          Вот пять лет назад какой-нибудь парикмахер маньяк оставил на месте трех изнасилований ваши волосы и возможно даже кровь(«ой, извините, я случайно ножницами задел.») Через пять лет ваше ДНК или ДНК ваших родственников светится в какой-то генеалогической базе и вас вычисляет полиция. Вы вспомните, что вы делали в три разных дня пять лет назад и сможете алиби себе обеспечить?

                                                          А по поводу ареста или не ареста из-за «всего-лишь волос» — человека арестовали и осудили на 50 лет на основе показаний жертвы и присутствия у неё ПТСР, а также отсутвия собаки, которую он якобы застрелил у неё на глазах(не смотря на показания ветеринара о том, что такая собака рс таким именем реально есть у семьи, куда обвиняемый её отдал по его словам)
                                                          www.law.umich.edu/special/exoneration/pages/casedetail.aspx?caseid=5375
                                                          То-есть человека арестовали, заклеймили педофилом и осудили на основании устных показаний жертвы. А тут блин целый волос с вашим ДНК.
                                                          • НЛО прилетело и опубликовало эту надпись здесь
                                                              0
                                                              Я ничего не предлагаю, я отвечаю на ваше заявление о том, что ваш волос на месте преступления — это ничего страшного. Страшно, очень страшно.
                                                              • НЛО прилетело и опубликовало эту надпись здесь
                                                                  0
                                                                  50 лет? Пффф, конечно это лишнее время.
                                                                    0
                                                                    Вы слепой?

                                                                    Я ничего не предлагаю

                                                                    Это значит, что я не предлагаю отказываться от теста ДНК и даже не предлагаю запретить его использование в качестве улики. Я просто отвечал на ваш комментарий:

                                                                    И чем это плохо? Вот найдут человека который был на месте преступления. Если он не связан с преступлением, то его отпустят и все. В чем проблема?

                                                                    Я только донес до вас что плохого может произойти в том случае если ваш волос найдут на месте преступления. А то по вашему выходило, что вам дядя полицейский погрозит пальчиком и отпустит, никаких проблем.

                                                                    То есть вы считаете это нормальным что тысячи преступников уйдут от отвественности просто потому что вы не хотите потратить свое драгоценное время если ваше ДНК вдруг найдут на месте преступления?

                                                                    Это вам сильно повезет, если вы просто потратите время. А если не повезет — вас просто несправедливо осудят. А раз уж вы спросили — отвечу. Я вполне согласен с принципом «лучше оправдать десять виновных, чем осудить одного невиновного». Так что потратить время — согласен, а вот отсидеть — нет. ДНК ДОЛЖНО использоваться как улика, но нельзя обвинить человека ТОЛЬКО на основе ДНК, но это конечно зависит от того, в каком виде оно осталось. Волос точно не может быть использован для обвинения, а вот семя на одежде несовершеннолетней — может.
                                                                      0
                                                                      Может вы уже совершили преступление

                                                                      Ad hominem никак не укрепляет вашу позицию.

                                                                    0

                                                                    Речь не о предложении, речь о формулировке проблемы. А уж после того, как проблема признана реально существующей, можно подумать, что с ней делать, как решать.

                                                              0

                                                              Отпустят. Когда (и если) выяснят, что он не связан с преступлением. У вас есть алиби на случайный день на 10 лет в прошлом? Если нет, давайте вы пока город не будете покидать годик, пока расследование идёт (у меня есть пример, когда год сидели под подпиской).


                                                              Я не говорю, что опасность высокая, но уж точно нельзя сказать, что проблемы совсем нет.

                                                    0
                                                    Судя по данным последней переписи США, два процента популяции составят всего четыре миллиона человек.

                                                    В США сейчас проживает около 329 миллионов людей. Или последняя перепись населения куда-то выкинула более 100 миллионов жителей?
                                                      0
                                                      У автор статьи генетические проблемы с математекой :)
                                                        0
                                                        они умерли случайной смертю

                                                      Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                                      Самое читаемое