Как стать автором
Обновить

Комментарии 8

Распознавание слов

На прошлой неделе имел печальный опыт общения с ИИ. Сдал в одно из издательств уже готовую вёрстку книги. Но меня предупредили, что текст будет проверен ИИ. Мне стало интересно, тем более что текст проверялся и перепроверялся, а сам я программист и понимаю цену ИИ.

В результате мне пришёл вот такой ответ из издательства:

текст содержит много орфографических ошибок и описок, приведены ниже:
Так же в книге представлены грамматически не верные переносы слов,
примерно 5% от всего текста, нормой считается 1%. По п. 5 и 6
необходимо принять решение оставляем как есть или будем вносить
корректировки.

Вот далеко неполный перечень присланных мне ошибок:

Я просто опешил, но присмотревшись понял что так называемый ИИ не понимает русской буквы ё/Ё, переносы воспринимает как ошибку в слове, а словарный запас беден. ИИ не знает слов импортозамещение, спецпроверки и много ещё другого. В итоге у меня состоялся нелицеприятный разговор. Я предложил даже взять себя на полставки, чтобы протестировать их ИИ. Так что с ИИ надо быть осторожней, мало ли чего ему взбредёт в "голову". А с издательством мы в итоге разобрались. Я думаю всё будет нормально и книга будет выпущена.

Немного уточню: "имел печальный опыт общения с ИИ с издательством". И уж коль "издательство" шлёт Вам такие письма, это говорит не качестве ИИ, а о качестве и отношении к работе "издательства".

Полагаете, продолжение сотрудничества с ним будет плодотворным?! :)

(Вы же, наверное, не первый кого "издательство" подобным образом "проверяло", и такие письма слало.)

Для начала они извинились и отозвали свои "претензии". А дальше посмотрим...

интересно сколько денег потратило издательство на переименование функции проверки орфографии в ИИ?

Для того, чтобы работать с буквами и словами, нужно их представлять в виде векторов признаков.

Это упрощенный и в общем неверный взляд. См. Семиотика.

Я имею в виду, что нужно представлять токены таким образом для того, чтобы работать с ними в глубоком обучении, чтобы нейросеть могла их обрабатывать

А я имел ввиду что из таких векторов даже иерархию понятий не вытянешь, не говоря уже о чем то более сложном. для нейросетей ok)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации