Pull to refresh
11
0
Никита Назаров @shaddyk

Технический директор HFLabs

Send message

Для этого есть специальный термин --- мультиаккаунтинг. Регистрация нескольких аккаунтов запрещена правилами всех легальных казино, т.к. позволяет пользователю получать больше бонусов, чем ему положено. Ну и есть всякие другие схемы, про них уже на других сайтах подробно пишут :)

Обычно это прописано в договоре оферты, который пользователь принимает в момент регистрации, поэтому тут всё честно.

Можно :)

Существуют великие и ужасные методические рекомендации Роскомнадзора от 2013 года, которые отвечают на вопрос о том, что является деперсонализацией, а что нет. Но только для госорганов.

Так вот, в них явно упоминается метод перемешивания — да, можно просто менять данные местами, и они станут обезличенными. А дальше начинается интересное: рекомендации не актуализируются, а судебная практика идет вперед. И из неё мы узнаём, что имейл персданными не является, телефон — иногда да, иногда нет, а паспорт — всегда да, хотя казалось бы, те же 10 цифр. Так что можно, но не совсем.

Вчера Минцифра анонсировала закон об обезличивании (может и раньше, мне на глаза только что попалось) — надеюсь, что там появится хоть что-то конкретное и учитывающее реальность вокруг, где и так данные каждого из нас поутекали из десятка разных мест.

  1. Ура, дозрели! Синтаксический сахар — это приятно.

  2. Наше решение использовалось вместе с зоопарком от 9 до 21 версий Оракла, универсального подхода для всех сразу не получилось. Но да, в итоге все это сводится к хранимкам — у нас такие тоже были.

  3. Аврального перехода и не происходит, но мотивация переходящих вполне понятна — патчи для возникающих ошибок теперь получить можно только с помощью сложных схем, да и в целом любое обращение в саппорт превращается в настоящий квест. Так что для промышленной эксплуатации приличных систем использовать Oracle уже не так приятно.
    А вот с мыслью о том, что Oracle — лучшая реляционная БД, я соглашусь. Оптимизатор, диагностика, стабильность работы... Эх :)

До Pentaho мы протестировали 5 вариантов: импорт/экспорт csv, dblink через гетерогенные сервисы оракла, dblink через oracle_fdw, ora2pg и SymmetricDS.

Ни один из них не давал нам возможности перелить полный объем в течение заявленного окна времени, а для итогового варианта с догрузкой дельт нам не хватало управляемости --- на тот момент ora2pg не умел забирать часть данных из таблицы, переливал её всегда целиком. Может сейчас научился?

Мы при развитии решения осознанно не выносили никакой бизнес-логики на БД --- триггеров в ней нет совсем, а десяток таки-появившихся хранимых процедур перенесли руками. Потребности в их автоматической миграции не возникло.

Так можно наши же подсказки и подключить — dadata.ru/suggestions/#address
Люди будут вводить привычные адреса, а сервис подтянет всю обвязку.
ФНС мало того что грозится принимать всю отчетность по ФИАС, так они ещё и сам ФИАС должны с административного на муниципальное деление перевести. Не знаю как именно это будет выглядеть, но что-то такое было.
А с Почтой пока нет новостей — коллеги не горят желанием публиковать собственную базу, к сожалению.
В ФИАС уже есть всё, что когда-то было в КЛАДР. К тому же последний с 1 января признан мертвым, а о них или хорошо, или никак :)
Максим, довольно просто — всех, кто раньше наполнял базу хэшей, отправим адреса ногами проверять. Но только по ночам, чтобы основная работа не страдала :)
Год назад под другой статьей про адреса я сказал, что банки обязаны использовать ФИАС. Так вот, это ещё не было правдой, но я-то знал! Ребята в ГНИВЦ — милахи!
С одной стороны я писал только о склонениях, с другой — сервис по вашей ссылке определяет «Иванко Мария» мужчиной с уверенностью 0.932. Вы можете сказать, что я его неправильно держу (с), но это уже вопрос веры.
Поздравляю, вы почти собрали буллшит-бинго! Микросервисы уже не в моде, а блокчейн только набирает силу. Что остается? Правильно, бигдата!
Нейронные сети и машинное обучение не имеют никакого отношения к этой задаче — свалить них всю ответственность весело, но здесь нужно не нейроны крутить, а справочники внимательно пополнять.
Сервис от ahunter — огонь!
В примерах есть три ФИО:
1. Грозный Иван Васильевич — не распознался совсем.
2. Чак Норрис — не распознался совсем.
3. Жак Ширак — распознался как Жак Ишрак, FEMALE.

К Иванову Ивану Ивановичу он предложил мне два таких варианта как «Иавнов Иван Иванович» и «Иванво Иван Иванович». Я в растерянности.

Wim.agency напомнил мне школу, где на информатике было задание написать определялку пола по имени. Так вот, подход к реализации не обсуждался — если имя заканчивается на гласную, то признаем человека женщиной. А я — Никита. Эх.

А вот Петрович визуально понравился. Сайт какой-то весь такой стильный. Даже неважно как склоняет :)

С Дадатой и Морфером интересная история — Морфер действительно выглядит как Бендер, который готов склонить всех и вся, но у Дадаты сервис склонения явно не основной. Тут уж действительно надо сравнивать стоимость.
На латиницу среагировала только Дадата — транслитерировала и потом просклоняла.
К качеству транслитерации есть вопросы, но в целом ок. После строки «Moskva, Panfilovcev heroes street» я вообще не верю в возможность автоматически побороть фантазию людей, указывающих свои адреса на посылках из Китая.
Не для всего. Есть цена для php, 1c и excel, а вот Java и .NET под завесой тайны.
Да, АСВ вроде как дружит теперь только с ФИАС. По крайней мере приказ на эту тему вышел ещё в прошлом году, а уж кто и что использует — это отдельная история.
Чем опасна? Мне казалось, что если просто не указать индекс, то Почта откуда-то из своих недр его родит в процессе доставки.
Но в статье есть такое:
Но и с Почтой не все хорошо: там нет части индексов, которые есть в ФИАС (например, 742602, 103340 и нескольких тысяч других индексов).

Справится ли Почта с доставкой отправления по индексу, о котором ничего не знает?
Насколько я знаю, адресного стандарта у нас в стране всё ещё нет. Банки обязаны работать с ФИАС, страховые с КЛАДР (какие-то там загоны общества страховщиков, которое проставляет коэффициенты для ОСАГО/КАСКО), Почта с собственной базой, а все остальные с монстрами, слепленными из десяти источников.

Ситуация с отсутствием индексов в базе Почты выглядит совершенно фантастически. Это вообще как? Туда посылки доставляются? :)
В dadata.ru/api/clean/#request-phone достаточно давно можно вынимать и провайдера, и регион, и даже таймзону. Только отмены мобильного рабства пока вроде не предусмотрено.
Сколько памяти нужно для QV на сервере, где будут строиться пятисотмилионнострочные отчеты, которыми будут пользоваться 10 человек?

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Works in
Date of birth
Registered
Activity