Хабр доступен 24/7 благодаря поддержке друзей

Комментарии 12
Файнридеру тоже доверяю с трудом, активный словарь подставляет аналогичные чудеса
У DeepSeek недавно вышла новая модель для OCR. Насчет качества ничего не скажу, не пробовал.
Один раз я ехал в гости на улицу Гагарина, а приехал на Космонавтов в тот же дом и квартиру
Похоже, что первичный OCR надо делать другим инструментом, не нейросетью или хотя бы не этой нейросетью. А потом делать исправление ошибок, сверку по ФИАС.
То же при переводе некоторых текстов - вылезают дикие фантазии. Причём текст выглядит стройным и осмысленным, проверить результат сложно.
Но позвольте — «50 лет Пионерии» стала «50 лет Победы» а «Пионерская» — «Комсомольской»?
Пионеры победили, в честь этого их приняли в комсомол. Вроде все логично, не понимаю претензий
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Эффект Даннинга — Крюгера в нейросети. OCR распознавание текста LLM: доверяй, но проверяй