Да, вы правильно понимаете. То, что расширение работает в той или иной конфигурации, для LLM ничего не значит. Информацию надо передавать явным образом
С вероятностными системами в большинстве случаев вы можете достигнуть тех результатов, которые будут для вас приемлемыми. С кабачками все просто. 10 раз запустил - получил на выходе кабачки, а не что иное
Конечно нет. Тут принципиальное отличие от детерминированных систем. В детерминированной системе если этот документ распознался с ошибкой, то он и дальше будет распознаваться с этой же самой ошибкой, сколько не запускай. А здесь вероятность
При внедрении технологий искусственного интеллекта происходит следующее. Вы приходите со своим решением. У вас спрашивают: какая у вас вероятность ошибки? А вы отвечаете: А какая вам нужна? Такую и сделаем.
Допустим у вас ошибка 1 на 100 документов. Вам говорят: нет, нам нужна 1 на 10 000. Хорошо, говорите вы. Стоимость распознавания 100 документов 2 рубля. Будем распознавать каждый документ два раза. В случае несовпадения, будем распознавать в третий раз или отдавать человеку по вашему выбору. Так мы получим 1 к 10 000. Стоимость тогда будет 4 рубля на 100 документов. Устроит?
Можно и на слово. Почему бы вам не поверить человеку с большим опытом? Можно и на спор. Запустим на сотне разных документов (в нормальном разрешении) и проверим
Не пишите точками
Да, вы правильно понимаете. То, что расширение работает в той или иной конфигурации, для LLM ничего не значит. Информацию надо передавать явным образом
И как оно работает? Не надо вообще. Объясните, как оно складывает числа?
Думаете в природе существует словарь сложения всевозможных чисел?
С вероятностными системами в большинстве случаев вы можете достигнуть тех результатов, которые будут для вас приемлемыми. С кабачками все просто. 10 раз запустил - получил на выходе кабачки, а не что иное
Запускал на temperature=0, можно top_p попробовать, но провайдеры все равно нам говорят: что вы там не делайте, вероятность останется
С какими сложностями вы столкнулись, пробуя применить LLM?
Сканирует во что? Что на выходе?
Они преобразовывали изображение в текст. А дальше надо было писать парсер этого текста
Конечно нет. Тут принципиальное отличие от детерминированных систем. В детерминированной системе если этот документ распознался с ошибкой, то он и дальше будет распознаваться с этой же самой ошибкой, сколько не запускай. А здесь вероятность
Спасибо за развернутый ответ!
При внедрении технологий искусственного интеллекта происходит следующее. Вы приходите со своим решением. У вас спрашивают: какая у вас вероятность ошибки? А вы отвечаете: А какая вам нужна? Такую и сделаем.
Допустим у вас ошибка 1 на 100 документов. Вам говорят: нет, нам нужна 1 на 10 000. Хорошо, говорите вы. Стоимость распознавания 100 документов 2 рубля. Будем распознавать каждый документ два раза. В случае несовпадения, будем распознавать в третий раз или отдавать человеку по вашему выбору. Так мы получим 1 к 10 000. Стоимость тогда будет 4 рубля на 100 документов. Устроит?
Допустим, мы прогнали 1000 документов и получили 1 случайный отказ. Что это будет означать, по вашему?
Прогнать 1000 документов реально. Это будет стоить порядка 20 рублей.
А почему не пару миллиардов? Вы ведь выбираете такие цифры, которые, как вам кажется, защитят вашу позицию. Вы истину не ищете
Ну нет, так нет
Поток -> документ в 1С
Структура -> документ в 1С
Можете оценить разницу?
"А мне... ну это... как... вот одно ванильное, одно клубничное, потом два капучино... а не, не, не надо капучино, два американо"
Прикиньте, как вы это превратите в 1С-овский документ ЗаказПокупателя?
А теперь прикиньте, как вы превратите в документ вот это:
{
"items":[
{"name":"Клубничное мороженое","quantity":1},
{"name":"Ванильное мороженое","quantity":1},
{"name":"Кофе американо","quantity":2}
]
}
Можно и на слово. Почему бы вам не поверить человеку с большим опытом? Можно и на спор. Запустим на сотне разных документов (в нормальном разрешении) и проверим
Обращайтесь, сделаю
Не сойдет, он устойчивый
В статье про OpenAI и говорится
OCR это поток - поток
AI это поток - структура