я в 2019 сделал скрипты для этого на python.
1 — обход папок на веб странице, проверка что уже скачано локально и закачивание новых, запуск раз в сутки (появляются вечером)
2 — обход архивов. В БД есть таблице в которой храниться что было спарсено, чтобы понимать какие архивы надо парсить еще. Дальше распаковка, преорбазование в json и запись в БД каждой отдельной выписки. Некоторые поля отдельно сразу выносил — ИНН, дату архива, дату выписки, чтобы быстро потом находить все выписки по данному ИНН
Так же для ЕГРИП.
Если кому-то надо можете ввести ИНН или имя компании в бота @FNS_SEARCH_Bot и получить инфу оттуда, включая официальную выписку с печатью от ФНС.
Как решаете вопрос если надо все таки обратиться к апи? Вебхук тут не поможет.
Например отправить уведомления надо.
Через те самые celery tasks идете в telegram bot api ?
Кто вообще из дата саентистов говорил что трансформеры понимают смысл? Задачи такой не ставилось. Перевод и поиск улучшился.
А эти исследователи ваши предложили хоть чтото, какой то свой адкватный тест или у них только критика glue ?
Есть разные типы задач. Строго формализованные задачи, в которых должен быть четкий порядок сможет написать программист. Именно их вы и перечислили. А вот ИИ насколько мне известно в текущий момент это называется машинное обучение — имеет вероятностную природу. Т.е. вобщем то он для другого нужен, там где надо действовать в условиях неопределенности и находить оптимальное решение. Например строить прогноз рынка, детектировать свойства обьекта на изображении, различать текст в аудио, выявлять аномалии в сигналах датчиков
Похоже на то что от набора эвристик перешли напрямую к анализу данных и нашли грааль. Было бы очень интересно узнать все в подробностях. Может он напишет статейку?
Но это неточно ;) спрос на разработчиков только растет. С появлением спроса на машинное обучение появился целый пласт задач, так что меньше точно не станет. Вообще не понимаю как тут чтото можно в годах измерять.
1 — обход папок на веб странице, проверка что уже скачано локально и закачивание новых, запуск раз в сутки (появляются вечером)
2 — обход архивов. В БД есть таблице в которой храниться что было спарсено, чтобы понимать какие архивы надо парсить еще. Дальше распаковка, преорбазование в json и запись в БД каждой отдельной выписки. Некоторые поля отдельно сразу выносил — ИНН, дату архива, дату выписки, чтобы быстро потом находить все выписки по данному ИНН
Так же для ЕГРИП.
Если кому-то надо можете ввести ИНН или имя компании в бота @FNS_SEARCH_Bot и получить инфу оттуда, включая официальную выписку с печатью от ФНС.
Именно что пропустили. Какая то странная статья с перечислением игр без какой либо системности.
И где fallout ?
Вам надо было голосования прикрепить к статье. Логично же. Есть гипотезы. Сразу бы проверили.
Как решаете вопрос если надо все таки обратиться к апи? Вебхук тут не поможет.
Например отправить уведомления надо.
Через те самые celery tasks идете в telegram bot api ?
Есть еще где-то?
А так же все таки список VPS заруежных, которые вы сами протестировали и оно работает.
us-cert.cisa.gov/ncas/alerts/aa21-062a
Кто нибудь уже сделал зеркало твитов?
Думаю можно изменять в чате поддержки сообщения добавляя в них теги со статусом — новое, отвечено и т.п.
О добавили еще один способ идентификации к многим другим ;)
Может это сам fb продает, чтобы добавить негатива телеграму на фоне проблем с whatsapp ?
Хз почему минусуют но именно такое решение приходит в голову первым делом.
Кто вообще из дата саентистов говорил что трансформеры понимают смысл? Задачи такой не ставилось. Перевод и поиск улучшился.
А эти исследователи ваши предложили хоть чтото, какой то свой адкватный тест или у них только критика glue ?
Есть разные типы задач. Строго формализованные задачи, в которых должен быть четкий порядок сможет написать программист. Именно их вы и перечислили. А вот ИИ насколько мне известно в текущий момент это называется машинное обучение — имеет вероятностную природу. Т.е. вобщем то он для другого нужен, там где надо действовать в условиях неопределенности и находить оптимальное решение. Например строить прогноз рынка, детектировать свойства обьекта на изображении, различать текст в аудио, выявлять аномалии в сигналах датчиков
Похоже на то что от набора эвристик перешли напрямую к анализу данных и нашли грааль. Было бы очень интересно узнать все в подробностях. Может он напишет статейку?
У текущих админов, которые теперь уже девопсы зп иногда побольше чем у директора
Но это неточно ;) спрос на разработчиков только растет. С появлением спроса на машинное обучение появился целый пласт задач, так что меньше точно не станет. Вообще не понимаю как тут чтото можно в годах измерять.