Как стать автором
Обновить

Технологические компании занимаются распознаванием сарказма

Время на прочтение1 мин
Количество просмотров15K
Французская компания Spotter разработала инструмент, который, по их словам, способен идентифицировать сарказм в комментариях в Интернете.

imageСозданная программная платформа сканирует социальные медиа и другие интернет-источники для создания отчетов о репутации своих клиентов — среди которых есть Европейская комиссия, Air France и другие крупные заказчики. Как и большая часть подобного ПО, приложение занимается анализом семантики, лингвистики и эвристики. Однако, как и любая другая система с машинным анализом данных, их инструмент часто испытывает проблемы с такими тонкими частями человеческой речи, как сарказм и ирония — и, вроде бы, как раз эту проблему Spotter и удалось преодолеть — пусть их руководители и признают, что результат пока что далек от идеального, и что полностью доверять машине еще рано. Процент распознавания достигает 80%, и, по заявлению авторов, еще несколько лет назад даже подобный результат был немыслим — тогда сарказм опознавался в 50% случаев. Авторы говорят, что алгоритм работает с 29 языками (включая русский и китайский), а чаще всего им приходится иметь дело с распознаванием сообщений о плохом уровне обслуживания.

Кстати, как сообщает Slashdot, подобной проблемой занимается не только Spotter: IBM, Salesforce и еще несколько крупных IT-компаний также активно трудятся над аналитическим ПО, которое сможет распознавать комментарии пользователей, любящих подобную иносказательность.

Чисто теоретически, подобные системы создаются лишь с целью оценки репутации компаний и выяснения того, какие продукты хорошо чувствуют себя на рынке, а не на бумаге. Но это если только совсем теоретически…

Источники: bbc.co.uk, Slashdot
Теги:
Хабы:
+3
Комментарии12

Публикации

Изменить настройки темы

Истории

Ближайшие события

Weekend Offer в AliExpress
Дата20 – 21 апреля
Время10:00 – 20:00
Место
Онлайн
Конференция «Я.Железо»
Дата18 мая
Время14:00 – 23:59
Место
МоскваОнлайн