Статьи / Закладки / Профиль php7 / Хабр

nanton 26 янв 2018 в 09:43

Как я сделал AI для выявления фейковых новостей с точностью в 95% и чуть не рехнулся

6 мин

57K

Блог компании InlyITМашинное обучение * Спам и антиспам

Перевод

Краткий пересказ: мы сделали программу, определяющую надежность новостей с точностью 95% (на валидационной выборке) при помощи машинного обучения и технологий обработки естественного языка. Скачать ее можно здесь. В условиях реальной действительности точность может оказаться несколько ниже, особенно по прошествии некоторого времени, так как каноны написания новостных статей будут меняться.

Глядя, как бурно развиваются машинное обучение и обработка естественного языка, я подумал: чем черт не шутит, может быть, мне удастся создать модель, которая выявляла бы новостной контент с недостоверной информацией, и тем самым хоть чуть-чуть сгладить катастрофические последствия, которые приносит сейчас распространение фейковых новостей.

С этим можно поспорить, но, на мой взгляд, самый сложный этап в создании собственной модели машинного обучения — сбор материалов для обучения. Когда я обучал модель для распознавания лиц, мне пришлось несколько дней собирать фотографии каждого из игроков лиги НБА в сезоне 2017/2018. Теперь же я и не подозревал, что мне придется провести погруженным в этот процесс несколько мучительных месяцев и столкнуться с очень неприятными и жуткими вещами, которые люди пытаются выдать за настоящие новости и надежную информацию.

Читать дальше →

+36

nnseva 12 дек 2017 в 16:07

Конструирование сайта, защищенного от блокировок

4 мин

22K

Информационная безопасность * Законодательство в ITNginx * Lua * IT-инфраструктура *

Привет всем! В связи с ростом блокировок, в том числе необоснованных, сайтов со стороны государства, вашему вниманию предлагается описание идеи, а также прототип настроек сайта, защищенного от блокировок по конкретному пути и доменному имени. Идеи по защите от блокировок:

со звездочкой
по адресу IP

будут изложены в других постах. Кому интересна тема, заходите под кат.

Читать дальше →

+30