Pull to refresh

Comments 91

В этой базе самый свежий год рождения 1991, при этом за 1990 записей больше, что позволяет выдвинуть предположение, что база была украдена где то между этими года +18 лет, т.е. как раз в районе 2008 года.
паспорта выдают в +18 лет. 20% населения турции — моложе 14. вот и ответ, почему их нет в базе и почему там самые молодые родились в 1991.
Так ведь я именно это и сказал. Просто 1990-1991 + 18 это 2008-2009, а сейчас, напомню, 2016.
Я думаю, национальный идентификатор, имя, фамилия, имя матери и отца, пол, дата и город рождения мало у кого поменялись с тех пор.
Почему именно +18 лет?
Если верить Википедии, там всего примерно 77 миллионов человек. Поучается, в базе есть 3/4 населения?
Почти все совершеннолетние (с паспортом)
Как бы у нас в России такая ситуация не повторилась, с госуслугами.
Интересно на сколько этот сайт защищен от взлома и слива информации.
Если вспомнить лихой 2008, то был в то время сайт Radarix, эдакий поисковик по слитым базам данных различных ведомств России и СНГ. Не знаю наверняка, о скольких людях там можно было найти информацию, но по-моему данных там было куда больше, чем в этой базе, и не только по количеству, но и по качеству. И не смотря на то, что тот сайт прожил не больше года, используемые ими базы по прежнему пылятся на форумах и мало кому интересны, ведь сейчас услуга типа "пробей друга по номеру телефона" обойдётся в сущие копейки, и данные будут самые актуальные, а не из старых баз, неизвестно когда слитых.
Что за услуга? Интересно, расскажите
Смотрите русские форумы в торе по веществам и не только.
Услуга с одной стороны позволяет сотрудникам тех поддержки пользователей (или тем, у кого есть возможность делать запросы к базе клиентов) зарабатывать дополнительные деньги на раскрытии персональных данных клиентов, а с другой стороны позволяет заинтересованным в данной информации людям её получать. Более подробную информацию о возможностях и стоимость можно найти на различных специализированных форумах.
Сейчас Radarix частично заменяет сайт nomer-org
Как телефонный справочник сайт хороший, но в radarix же можно было находить информацию о паспортах физ лиц, регистрацях юр лиц, судимостях и штрафах, постановления авто на учёт, возможно что-то ещё. Но насколько я понимаю, сейчас даже телефонные справочники под запретом.
Да, слышал о таких широких возможностях Radarixа.
Тут не только телефонный справочник, а и дата рождения с пропиской (см. Вся Украина — жители). Кому-то и этого достаточно.
КС или ВС недавно не признал номер паспорта персональными данными.
Только что проверил, открывается.
А мне пишет «Вы исчерпали лимит. Зайдите завтра...», хотя я там и не был)
Наверное, какое-то ограничение по IP. Проверял на isup.me, всё ок, It's just you)
то есть, тебя не удивляют продажи дисков с данными?
проблема не в защите технологий, к сожалению, никто не «мешает» сотрудникам выносить данные.
И скорее всего это они и делают.
Я видел в них данные и они действительно реальные. проверили на нескольких товарищей.
Ни разу об этом не слышал. Печально если данные жителей страны продают.
В локальной сети как минимум одного из провайдеров скачивал такие данные на себя: Фамилия, имя, отчество, полные данные паспорта, включая адрес регистрации, номер сотового телефона. Там же была моя мать. Данные реальные, утянуты у сотового оператора. К счастью, сейчас абсолютно все данные из нее устарели
С нашим бумажным документооборотом, архивами, кучей ведомств, которые требуют справки от других ведомств, пока ещё вряд ли такое возможно.
С нашим бумажным документооборотом
Страна уже несколько лет успешно переходит на электронный документооборот. В каком городе вы живёте?
кучей ведомств, которые требуют справки от других ведомств, пока ещё вряд ли такое возможно
Ознакомьтесь: 210fz.ru/mdx Это работает.
Страна уже несколько лет успешно переходит на электронный документооборот

Я застал то самое время, когда страна только начала переход на ЭД, при чем был руководителем отдела внедрения одной такой СЭД, так что можно сказать — варился во всем этом деле. Всех активно заставляли любыми судьбами увеличивать количество электронных гос. услуг (пресловутая СМЭВ), от чего гос. органы готовы были выплевывать любые данные.
В то время наш любимый, подающий большие надежды, молодой и очень умный министр информатизации и связи Коля активно пиарил СЭД из Казани (знаете как называется? Очень "практичная" система), от чего практически все регионы начали ее использовать. Правда "использовать" — это слишком сильно сказано, ибо для изучения рынка, я сделал несколько звонков в некоторые центральные регионы России, дабы поинтересоваться результатами применения этой СЭД. Оказалось что люди даже не знаю что у них есть СЭД. Короче стандартный РосПил.
Теперь, после пяти лет активного изучения рынка, ПО и методов продвижения ЭД в России я заявляю вам — страна уже несколько лет успешно пилит бюджет, но не реализовало еще и десятой доли того, что было заявлено (если я не ошибаюсь) Димой. Что скажете?
ИМХО, уж лучше реализовать 1/20 от намеченных планов, чем 0/20.
Поверьте, не лучше. Проблема тут не в том, что созданный план не успели реализовать к намеченному сроку. Проблема в том, что на созданный план ежегодно закладывается бюджет. И ни дай бог если этот бюджет не будет «использован», в следующем году бюджет таким «провинившимся» гос. органам сократят. А теперь подумайте, план выполнили на десятую долю, а бюджет «использовали» на все сто. Вопрос знатокам: на что был использован бюджет?
Ваши предложения? Переехать в мир розовых пони?)
Да какой толк от моих предложений? Критическая масса в России не сформирована.
Формирование критической массы начинается с «газет и радио» ) Как учил дедушка Ленин, помните?
Хабр — не жалобная книга
А ваши рассказы про «роспил» смотрятся как-то совсем беспредметно, уж простите.
У меня все.
Почему же беспредметно,?! Я кучу примеров привожу ))
Вот что я вам скажу. Более информированного собеседника о системе, которую вы пытаетесь полить грязью вы не могли найти.
Я руковожу разработкой этой самой «практичной» системы, так что у меня на руках факты, а не слухи: количество подключенных пользователей, количество пользователей, заходящих в систему, выезды в заказчикам и прочее. Я уже пятый год этим занимаюсь.
И все мои знания противоречат тому, что вы говорите.
Я руковожу разработкой этой самой «практичной» системы

Это замечательно ) Если мы действительно говорим об одной и той же системе, то ответьте мне пожалуйста, честно и беспрестрастно на три вопроса:
  1. Почему система написана на PHP?
  2. Почему в системе такой г**но код? Сам не видел, рассказывали потенциальные клиенты этой системы, которым был дан доступ (по их же словам).
  3. Почему система продвигается министром информатизации и связи нашей любимой РФ? Разве внедрять должна не та система, которая больше подходит для конкретного ведомства? Я видел интерфейс этой системы, и не могу сказать, что ее функционал в чем либо превосходит большинство монстров рынка СЭД. О безопасности судить не могу, но на сколько помню системе предоставляется в виде SaaS и через тырнет, что требует дополнительных затрат на прокладку защищенных каналов и прочее.


количество подключенных пользователей, количество пользователей, заходящих в систему, выезды в заказчикам

Какие то слабые факты у вас, честно говоря. Приведу пример системы и внедрения, которым я горжусь до сих пор, а вы скажите, есть у вас подобный опыт?
Хороший пример
Мною была разработана, внедрена и сопровождалась в течении 3х лет система управления делами нескольких связанных гос. конторок. Система была настолько проста, удобна, эффективна и любима секретарем (которой, к слову, около 50 лет и с компьютером она на Вы), что перед уходом в отпуск, она не сообщив мне (об этом я узнал после ее возвращения с отпуска) самостоятельно обучила работе с этой системой своего заместителя. Сделала она это не потому, что мое участие стоило бы для них каких то средств (плата ежегодная и статичная).

Чтоб было с чем сравнивать, приведу другой пример.
Плохой пример
Параллельно с описанной выше системой мы разрабатывали похожую систему для других гос. органов. Объем работ был в разы больше, как и число приобретаемых лицензий. Системой никто пользоваться не стал, деньги были успешно РосПилены, лицензии поставлены, выезды засчитаны, дабы не спалиться, от пользователей их же начальники потребовали периодически посещать эту систему, а от меня — регистрировать эти посещения )))
Почему система написана на PHP?
Смешной вопрос. А почему она должна быть написано не на PHP?
Почему в системе такой г**но код? Сам не видел, рассказывали потенциальные клиенты этой системы, которым был дан доступ (по их же словам).
Ваши потенциальные клиенты эксперты в чём? В качестве кода? Что стоит их оценка?
Почему система продвигается министром информатизации и связи нашей любимой РФ?
Причём здесь министр? Министр её хвалит, потому что она ему нравится. Тендер на внедрение министр выигрывает что ли?
Приведу пример системы и внедрения, которым я горжусь до сих пор, а вы скажите, есть у вас подобный опыт?
Я кажется чётко сообщил чем я занимаюсь: разработкой, не внедрением, вы просите рассказать мой опыт внедрения. Возможно вы перепутали нашу организацию с конторками, где все всем занимаются? Это не про нас.
Смешной вопрос. А почему она должна быть написано не на PHP?

Да, мы тоже посмеялись сначала, даже не поверили ))
Ваши потенциальные клиенты эксперты в чём?

Думаю специалисты министерства информатизации республики, которые головой отвечали за выбор СЭД для онной, должны быть экспертами не только в качестве кода будущей системы, но и во многих смежных областях. Вы, конечно, можете сомневаться в их компетенции, это ваше право. Кстати, в той республике была выбрана другая СЭД, не смотря на «предложения» Коли.
Причём здесь министр?

Думаете совсем не причем? ))
Тендер на внедрение министр выигрывает что ли?

Нет, министр «рекомендует» систему, регионы либо соглашаются с выбором министра, либо выбирают другую систему. Во втором случае они, как будто, говорят министру — херовину вы предлагаете, Коля. Не многие отважутся такое сказать министру ) А тендер выигрывается просто, ТЗ заполняется совершенно ненужными клиенту, но отсутствующими у конкурентов функциями или невероятными сроками (внедрить за 4 дня).
Возможно вы перепутали нашу организацию с конторками, где все всем занимаются? Это не про нас

Тобишь вы пишите систему, но у вас даже нет практического опыта использования вашей же системы в организации? ))) Когда я пишу новую систему, я днями пропадаю у клиента дабы узнать, что ему действительно нужно. Ну ок, понял порядок работы вашей компании )
Я сначала решил обстоятельно ответить вам на каждый пункт, но вижу по какому пути вы хотите пойти — передёргивания, личных нападок и так далее. Мне этот путь не подходит.

По тому, что вы сообщили, я сделал вывод, что вся ваша злость — злость бывшего конкурента.
передёргивания, личных нападок и так далее

Да вроде на личности я не переходил, все в области деятельности гос. органов РФ и способа РосПила.
По тому, что вы сообщили, я сделал вывод, что вся ваша злость — злость бывшего конкурента.

Я нисколько не злюсь на вас или вашу компанию, поверьте. Я много лет назад понял, как гос. органы выбирают куда тратить деньги, потому злюсь только на них. Вы для меня, как и я сам, просто бизнесмен, который лучше приспособился к современному рынку нежели другие, не более того. Бизне есть бизнес )
Я не помню точно, но вроде как вы несколько лет назад писали, что эта система в Татарстане обкатывается. Не могли ли бы вы рассказать как успехи? Пользуются ли ей люди и какие возможности она предоставляет? Когда ожидается переход в другие регионы? А может уже произошёл? Прошу прощения, если вопросы банальные, я сильно не в теме, но было бы очень интересно узнать как развивается электронный документооборот в России. Может быть даже отдельную статью в хабре создать? На чём пишется, какие сервера, какая нагрузка, разные кейсы? =)
Это такой серьёзный вопрос, что обстоятельный ответ потянул бы на отдельную статью, а меня совершенно нет сил на её написание :) Давайте я постараюсь кратко ответить на каждый из вопросов.
Не могли ли бы вы рассказать как успехи? Пользуются ли ей люди и какие возможности она предоставляет?
Пользуются, основные достоинства — система облачная, работать можно через Мобильный Офис (толстый клиент, меньше возможностей, обычно через него работают начальники) и через браузер (тонкий клиент, больше возможностей, как правило работают те, кто рангом пониже, но есть исключения).
Когда ожидается переход в другие регионы? А может уже произошёл?
Сейчас инсталляций довольно много, в других регионах в том числе. Из крупных нашим продуктом пользуются Мэрия Москвы и Мэрия Московской Области.
Может быть даже отдельную статью в хабре создать? На чём пишется, какие сервера, какая нагрузка, разные кейсы?
Вот на это меня точно не хватит :) Сейчас загрузка выше крыши в связи с переходом с Оракла на Постгрес.
Скоро увидим заголовки о том, что тысячи учёток турецких граждан были взломаны (почта, соц сети, и т.п.) — если конечно много людей всё ещё используют контрольный вопрос «девичья фамилия матери». Не знаю, применимо ли это вообще в турции.
в слитой базе, нет девичьй фамилии матери (только имена отца и матери)
Ну так наверное не только ИМЯ, но и фамилия (пусть не девичья) матери?
Если так — то далее смотрим данные матери (в той же базе), и видим фамилию родителей — это и будет девичьей фамилией матери.

P.S. базу лень качать, чтобы проверить предположение.
в базе как раз имена родителей
(видимо по логике турков нет смысла фамилию хранить т.к. по умолчанию у отца, матери и ребенка они совпадают)

Но безопасность систем на «девичей фамилии матери» оч. зыбкая.

Например у турков в этой б.д. распределение фамилий такое, что наиболее распространенные 12 фамилий охватывают 10% населения, а наиболее распространенных 50 фамилий у 20% населелия
Хороший повод для Эрдогана запретить все эти ваши итернеты
Что характерно, утечки баз данных не прекратятся до тех пор, пока не запретят базы данных. Запрет интернетов, очевидно, не поможет.
Главное самим «защищаемым» про это не рассказывать и все будет хорошо у любого президента.
Само собой не поможет, но повод хороший
И какой интересно указан пол у Эрдогана в этой базе?
Утечка данных при современных технологиях вещь практически неизбежная.
Это смотря как строится архитектура храния данных. Если ночью в налоговую приходит чел, бьет по башке охранника и выносит сервер. (реальный случай в начале 2000-х Онтарио), то наиболее распространенный случай.

Но если данные хранятся в частями в разных серверах и сливаются тока по запросу, то как сервера выноси, данных не получить.
UFO just landed and posted this here
Да, как говорится пока петух в жопу не клюнул. Хотя не думаю что сильно что-то поменялось.
Человек имел ввиду что утечка данных происходит рано или поздно в любой системе, даже самой защищенной. Вопрос только в том насколько часто это происходит. Это просто вопрос статистики, то есть вероятность утечки ВСЕГДА >0. Единственный способ утаить информацию — записать все на винчестер, зашифровать и выкинуть на Солнце)
Очевидно, если все данные так усердно собирают в базы, то они рано или поздно утекут все. Это только вопрос времени.
Поэтому нужно сделать так, чтобы не было никакого толку в утёкших данных.
Чтобы по данным кредитки+паспорта+адреса нельзя было оформить левый контракт, взять кредит, купить что-нибудь, взломать аккаунт и т.п.
А данные делать как можно более открытыми, как в одной из скандинавских стран, где в открытый доступ выкладывают все налоговые декларации.
Например по базе авиабилетов несложно узнать кто когда с кем летал — если даже человек весь из себя правильный и любовницу, с которой он регулярно летает в "командировки", так не вычислить ввиду её отсутсвия — то так вычисляется пустующая квартира пока чел. с семьёй на канарах.
В общем вечный холивар о степени открытости жизни...
»Данные включают национальный идентификатор, имя, фамилию, имя матери и отца, пол, дату и город рождения, а также адрес места жительства.

Пфффф. Зайдите в ВК или Фейсбук, там эти данные люди сами выкладывают, а по Инстаграму можно еще и построить карту самых частых точек посещения.
Вот если бы утечка произошла в Сингапуре, где в интернеты используются самым широким образом, то там фигурировали бы не только национальный идентификатор, имя, фамилию, имя матери и отца, пол, дату и город рождения, а также адрес места жительства, но другие интересные данные. База данных населения жителей Эфиопии-Турции никому и даром не надь, и за деньги не надь.
Вряд-ли люди выкладывают в соц сети свой адрес с точностью до номера квартиры.
странно, что на хабре еще нет статьи про утечку 11.5 млн документов компании по регистрации оффшоров для отмывания денег. Можно гуглить по "PanamaPapers".
Там утечка не связана с IT напрямую, а тащить сюда новость только из-за того что она такая масштабная и сенсационная (хотя кто бы сомневался, что так дела и обстоят), наверно, было бы неправильно.
Это ж до какой степени нужно было обидеться…
Если вы знаете, что на сервере лежит куча документов, связанных с крупными мафиозными шишками, политиками, сотрудниками спецслужб со всего мира, то нужно быть сумасшедшим (или самоубийцей), чтоб всё это куда-то слить. Потому как ведь найдут, и хорошо бы до момента нахождения успеть застрелиться…
Вы требуете логики и осторожности от обиженной женщины? Алексей, вы женаты?
Так оно пока что утекло только в руки к каким то журналистам, если они не планируют в открытый доступ выкладывать исходные документы, то ничего не мешает этим журналистам придумывать истории от балды или приукрашивать полученную информацию.
Да всего архива, возможно пока нет, а возможно я недостаточно искал. Но частично архив выложен. Вам ссылок накидать или умеете гугл?
Если частично, это 150 документов из 11.5 миллионов (т.е. 0.001%), то спасибо, такие ссылки я и сам смог найти. Интересуют именно те самые 2.6Тб. А то получается как wikileaks, к нам утекло, но вам мы оригиналы не покажем, только обработанную нашими журналистами информацию, а то вдруг ещё увидите чего лишнего.
Посмотрите на прошлый панамский слив от 2013 года, там из 260Gb выложено документов с гулькин нос. Причем, «документ» — это например copy-paste email'a даже без служебных заголовков.
Если честно, как тут правильно отметил anatolius «Утечка данных при современных технологиях вещь практически неизбежная.», но сайте, где выложили эти данные, есть фраза, которая меня очень неприятно удивила:
«Lesson to learn for Turkey:
Bit shifting isn't encryption.»
Если я правильно понял, то получается, что данные лежали практически в открытом виде.
Рабочую базу особо и не получится зашифровать: если к базе постоянно идут обращения системы, то шифрование только всё затруднит, по таким данным уже не построить индексы и прочее…
MSSQL and Oracle позволяют настроить прозрачное шифрование на уровне таблиц и полей.
Данные обычно сливаются через интерфейсы работающей системы, тут никакое шифрование не поможет.
Поэтому сотрудники в таких системах обычно не могут слить всю базу, он даже не может ее смотреть, а только делать в нее запросы по ФИО, ИНН, номеру телефона и т.п.
То есть пробить конкретного человека, да можно, слить базу нет
Нет, данные были «типа зашифрованны».
Удивляет, что кто-то удивляется в то время, как для России это ещё не давно было (а может и есть, давно не интересовался) нормой жизни, подобные базы продавали в метро и они были у каждого школьника.
В метро еще встречаются такие деятели, но в гораздо меньших количествах, чем лет 5 назад.
Благодаря этой базе можно узнать, что у турок самые распространенные мужские имена
Мехмет (1.17М), Мустафа(900K), Ахмет(720K), Али(660K), Хусаин(520K)…
а женские:
Фатма (1.15М), Аише (890К), Эмине (756К), Хатидже(660К), Зейнеп (315К)…
Возможно так же интересно посмотреть на:
Количество записей по году рождения
1318 1
1323 1
1326 1
1329 1
1330 4
1332 20
1333 155
1334 1
1335 1
1336 6
1337 4
1338 10
1339 16
1340 24
1341 16
1342 56
1343 121
1344 29
1345 11
1346 5
1347 1
1348 1
1352 1
1353 1
1354 1
1355 1
1394 2
1888 1
1892 2
1894 65
1895 27
1896 33
1897 22
1898 51
1899 124
1900 68
1901 82
1902 111
1903 115
1904 375
1905 194
1906 307
1907 325
1908 751
1909 1506
1910 1913
1911 2488
1912 3590
1913 4547
1914 7912
1915 7184
1916 8885
1917 9608
1918 12725
1919 20912
1920 25588
1921 32420
1922 46761
1923 54858
1924 83850
1925 91504
1926 123175
1927 135264
1928 149804
1929 165225
1930 203896
1931 199941
1932 254903
1933 313187
1934 255012
1935 210472
1936 249897
1937 277966
1938 314358
1939 307207
1940 356717
1941 306263
1942 370843
1943 346370
1944 384702
1945 446248
1946 397719
1947 443514
1948 491065
1949 545440
1950 664328
1951 472603
1952 574020
1953 611205
1954 699795
1955 827995
1956 828893
1957 612113
1958 688826
1959 785779
1960 965010
1961 765783
1962 885179
1963 894883
1964 1011845
1965 1080864
1966 1027736
1967 794745
1968 917911
1969 976998
1970 1045109
1971 1054244
1972 1112227
1973 1153070
1974 1228699
1975 1097350
1976 1111588
1977 1208954
1978 1256054
1979 1284212
1980 1362790
1981 1424503
1982 1298211
1983 1250523
1984 1272332
1985 1258091
1986 1262629
1987 1242773
1988 1045151
1989 1271867
1990 1267091
1991 349145
Кто-то родился в 14-м веке? ^__^

Вспоминаеться цитата из ''Формулы Любви''
— Вас, вероятно, изумляет столь древняя дата моего рождения?
— Нет, не изумляет. У нас писарь в уезде был, в пачпортах год рождения одной только циферкой обозначал. Чернила, шельмец, вишь, экономил. Потом дело прояснилось, его в острог, а пачпорта переделывать уж не стали. Документ все-таки. Ефимцев, купец, третьего года рождения записан, Куликов — второго… Кутякин — первого...

Немного огорчает, что буквы без диакритики, но гуглопоиском можно восстановить…
Почему просто не открыть эти данные раз и навсегда? В Норвегии даже годовой доход публикуют.
Думаю это часть политических игр, возможно хотят подорвать доверие к власти, быть может руками ЦРУ и сделано, Эрдоган многим последнее время поперёк горла…
Тут политические диспуты не любят. Тут одни пацифисты. Меня тут заминусовали -30 за такие высказывания.
Сомневаюсь, что фразу с сомнениями про пол Эрдогана можно отнести к политическим диспутам, это скорее политмнение в стиле ok.ru
Как думаете, что будет если сделать сайт с поисковиком по этим данным?
Sign up to leave a comment.

Articles