Обновить

Эффект Даннинга — Крюгера в нейросети. OCR распознавание текста LLM: доверяй, но проверяй

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели8.6K
Всего голосов 7: ↑7 и ↓0+9
Комментарии12

Комментарии 12

Файнридеру тоже доверяю с трудом, активный словарь подставляет аналогичные чудеса

Молчи!

Тебе нельзя волноваться!

Дорогие женщины!

Не пилите своих мужей!

Вам с этими опилками ещё жить..

22 октября

С международным днём защиты мужской первой системы от фашистских действий со стороны женщин!

Что это было? Осеннее обострение?

Пример работы DeepSeek-OCR.

Вполне неплохо, но вот творческая замена некоторых слов - напрягает и лишает доверия.

В чеках строже, но и там иногда есть "творческое переосмысление".

Один раз я ехал в гости на улицу Гагарина, а приехал на Космонавтов в тот же дом и квартиру

Вас зовут, случайно, не Евгений Лукашин?

Нет)

Похоже, что первичный OCR надо делать другим инструментом, не нейросетью или хотя бы не этой нейросетью. А потом делать исправление ошибок, сверку по ФИАС.

То же при переводе некоторых текстов - вылезают дикие фантазии. Причём текст выглядит стройным и осмысленным, проверить результат сложно.

Но позвольте — «50 лет Пионерии» стала «50 лет Победы» а «Пионерская» — «Комсомольской»?

Пионеры победили, в честь этого их приняли в комсомол. Вроде все логично, не понимаю претензий

Логично!

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации