Как стать автором
Обновить
11
0
Никита Назаров @shaddyk

Технический директор HFLabs

Отправить сообщение

Для этого есть специальный термин --- мультиаккаунтинг. Регистрация нескольких аккаунтов запрещена правилами всех легальных казино, т.к. позволяет пользователю получать больше бонусов, чем ему положено. Ну и есть всякие другие схемы, про них уже на других сайтах подробно пишут :)

Обычно это прописано в договоре оферты, который пользователь принимает в момент регистрации, поэтому тут всё честно.

Можно :)

Существуют великие и ужасные методические рекомендации Роскомнадзора от 2013 года, которые отвечают на вопрос о том, что является деперсонализацией, а что нет. Но только для госорганов.

Так вот, в них явно упоминается метод перемешивания — да, можно просто менять данные местами, и они станут обезличенными. А дальше начинается интересное: рекомендации не актуализируются, а судебная практика идет вперед. И из неё мы узнаём, что имейл персданными не является, телефон — иногда да, иногда нет, а паспорт — всегда да, хотя казалось бы, те же 10 цифр. Так что можно, но не совсем.

Вчера Минцифра анонсировала закон об обезличивании (может и раньше, мне на глаза только что попалось) — надеюсь, что там появится хоть что-то конкретное и учитывающее реальность вокруг, где и так данные каждого из нас поутекали из десятка разных мест.

  1. Ура, дозрели! Синтаксический сахар — это приятно.

  2. Наше решение использовалось вместе с зоопарком от 9 до 21 версий Оракла, универсального подхода для всех сразу не получилось. Но да, в итоге все это сводится к хранимкам — у нас такие тоже были.

  3. Аврального перехода и не происходит, но мотивация переходящих вполне понятна — патчи для возникающих ошибок теперь получить можно только с помощью сложных схем, да и в целом любое обращение в саппорт превращается в настоящий квест. Так что для промышленной эксплуатации приличных систем использовать Oracle уже не так приятно.
    А вот с мыслью о том, что Oracle — лучшая реляционная БД, я соглашусь. Оптимизатор, диагностика, стабильность работы... Эх :)

До Pentaho мы протестировали 5 вариантов: импорт/экспорт csv, dblink через гетерогенные сервисы оракла, dblink через oracle_fdw, ora2pg и SymmetricDS.

Ни один из них не давал нам возможности перелить полный объем в течение заявленного окна времени, а для итогового варианта с догрузкой дельт нам не хватало управляемости --- на тот момент ora2pg не умел забирать часть данных из таблицы, переливал её всегда целиком. Может сейчас научился?

Мы при развитии решения осознанно не выносили никакой бизнес-логики на БД --- триггеров в ней нет совсем, а десяток таки-появившихся хранимых процедур перенесли руками. Потребности в их автоматической миграции не возникло.

Так можно наши же подсказки и подключить — dadata.ru/suggestions/#address
Люди будут вводить привычные адреса, а сервис подтянет всю обвязку.
ФНС мало того что грозится принимать всю отчетность по ФИАС, так они ещё и сам ФИАС должны с административного на муниципальное деление перевести. Не знаю как именно это будет выглядеть, но что-то такое было.
А с Почтой пока нет новостей — коллеги не горят желанием публиковать собственную базу, к сожалению.
В ФИАС уже есть всё, что когда-то было в КЛАДР. К тому же последний с 1 января признан мертвым, а о них или хорошо, или никак :)
Максим, довольно просто — всех, кто раньше наполнял базу хэшей, отправим адреса ногами проверять. Но только по ночам, чтобы основная работа не страдала :)
Год назад под другой статьей про адреса я сказал, что банки обязаны использовать ФИАС. Так вот, это ещё не было правдой, но я-то знал! Ребята в ГНИВЦ — милахи!
С одной стороны я писал только о склонениях, с другой — сервис по вашей ссылке определяет «Иванко Мария» мужчиной с уверенностью 0.932. Вы можете сказать, что я его неправильно держу (с), но это уже вопрос веры.
Поздравляю, вы почти собрали буллшит-бинго! Микросервисы уже не в моде, а блокчейн только набирает силу. Что остается? Правильно, бигдата!
Нейронные сети и машинное обучение не имеют никакого отношения к этой задаче — свалить них всю ответственность весело, но здесь нужно не нейроны крутить, а справочники внимательно пополнять.
Сервис от ahunter — огонь!
В примерах есть три ФИО:
1. Грозный Иван Васильевич — не распознался совсем.
2. Чак Норрис — не распознался совсем.
3. Жак Ширак — распознался как Жак Ишрак, FEMALE.

К Иванову Ивану Ивановичу он предложил мне два таких варианта как «Иавнов Иван Иванович» и «Иванво Иван Иванович». Я в растерянности.

Wim.agency напомнил мне школу, где на информатике было задание написать определялку пола по имени. Так вот, подход к реализации не обсуждался — если имя заканчивается на гласную, то признаем человека женщиной. А я — Никита. Эх.

А вот Петрович визуально понравился. Сайт какой-то весь такой стильный. Даже неважно как склоняет :)

С Дадатой и Морфером интересная история — Морфер действительно выглядит как Бендер, который готов склонить всех и вся, но у Дадаты сервис склонения явно не основной. Тут уж действительно надо сравнивать стоимость.
На латиницу среагировала только Дадата — транслитерировала и потом просклоняла.
К качеству транслитерации есть вопросы, но в целом ок. После строки «Moskva, Panfilovcev heroes street» я вообще не верю в возможность автоматически побороть фантазию людей, указывающих свои адреса на посылках из Китая.
Не для всего. Есть цена для php, 1c и excel, а вот Java и .NET под завесой тайны.
Да, АСВ вроде как дружит теперь только с ФИАС. По крайней мере приказ на эту тему вышел ещё в прошлом году, а уж кто и что использует — это отдельная история.
Чем опасна? Мне казалось, что если просто не указать индекс, то Почта откуда-то из своих недр его родит в процессе доставки.
Но в статье есть такое:
Но и с Почтой не все хорошо: там нет части индексов, которые есть в ФИАС (например, 742602, 103340 и нескольких тысяч других индексов).

Справится ли Почта с доставкой отправления по индексу, о котором ничего не знает?
Насколько я знаю, адресного стандарта у нас в стране всё ещё нет. Банки обязаны работать с ФИАС, страховые с КЛАДР (какие-то там загоны общества страховщиков, которое проставляет коэффициенты для ОСАГО/КАСКО), Почта с собственной базой, а все остальные с монстрами, слепленными из десяти источников.

Ситуация с отсутствием индексов в базе Почты выглядит совершенно фантастически. Это вообще как? Туда посылки доставляются? :)
В dadata.ru/api/clean/#request-phone достаточно давно можно вынимать и провайдера, и регион, и даже таймзону. Только отмены мобильного рабства пока вроде не предусмотрено.
Сколько памяти нужно для QV на сервере, где будут строиться пятисотмилионнострочные отчеты, которыми будут пользоваться 10 человек?

Информация

В рейтинге
Не участвует
Откуда
Москва, Москва и Московская обл., Россия
Работает в
Дата рождения
Зарегистрирован
Активность