Comments 45
google gemini flash стоит в 2 раза дешевле чем 4o mini и при этом может принимать на вход сразу аудио файлы, то есть из процесса можно убрать whisper
А по хорошему надо всё дублировать, использовать и 4omini и gemini если 4o не отвечает. И телеграм в этом смысле не очень, если он упал то он упал и ничего с этим не поделаешь Ж(

Здрасьте - а где бухгалтерия? сопряжение с 1С?
Толку от этих текстиков???
1с, например, в качестве бекофиса. А статья не про замену 1с или ркипер, а про добавление нового интерфейса взаимодействия на базе ИИ.
Интерфейс - он между чем и чем?
Скажем так, между человеками и базой данных
Так. А зачем малому бизнесу 1С? Чтобы что? Сложить два и два, а потом сделать xml файлик для налоговой? Так это и без 1С делается
Телеграм этот файлик для налоговой сделает? Малому бизнесу как и любому нужен учет товаров и приход/расход.
После статьи появилось сильное подозрение что сопряжение с учетом намеренно выведено из статьи и будет стоить как крыло от боинга
Элементы учета я вам в самом начале показал.
"добавь товар кофе мокко цена 130"
или
"пришел товар кофе в зернах 10 кило по цене 1200"
какая тут принципиальная разница? Скажу вам сразу: никакой
Поэтому стоить это будет все те же 2 доллара в день.
Подскажите, а о чем речь про ставший бесплатным WA для бизнеса с ноября 2024? WABA все еще платный, даже подорожал
Я использую встроенное STT-преобразование на стороне мобильного телефона для набора голосом. И Андроид, и Айфон справляются с русских хорошо. В LLM можно отправлять уже готовый текст. А это - минус $1 из $1.18. Спасибо за статью!
интересно бы послушать про хоть какой-то реальный кейс. например %% ошибок,как ретрансмируемых так и фатальных. с карточкой 1с то не сложно соединить , другое дело контроль - что там не насоздается море чего-то лишнего
У нас в компании используется ИИ для категоризации лидов. Реальный процент ошибок на практике в бою: 5-10%.
Есть необычная статистика: хуже всего он справляется в понедельник и лучше всего в четверг.
Такой процент ошибок уже позволяет его использовать в действующих бизнес процессах.
А в кейсе из статьи есть шикарный читкод: возможность проверки, корректировки и подтверждения заказа автором - это нивелирует ошибку
СПасибо, интересно, а в какой области продажи? ИТ ? А вот эта необычная статистика она не траффик зависима?
Делал прием заказов для хлебокомбината. Процент ошибок зависит от того, какого провайдера ИИ выбрать. С Яндексом было много, с OpenAI менее 5%. Тут надо понимать, что распознавание речи всегда дает процентов 8-10% ошибок (для русского языка, для других проценты другие, но в основном еще хуже или катастрофически хуже) И дальше вопрос уже в качестве LLM. Насколько стоящая на следующем шаге LLM способна "скушать" эти ошибки и понять о чем идет речь.
5% это довольно много. Для человеческого ввода эмпирической нормой считаю 1% (одна ошибка на 100 операций), да и то в учетных системах все обставляется дополнительными проверками, чтобы этот 1% кардинально снизить: например, тот же контроль остатков товаров на складе при списании - единственная его функция, это снизить число ошибок.
и какова цена ошибки будет при использовании внешнего не контролируемого сервиса?
риск менеджмент то был?
Я возможно не понял сути статьи, но зачем создавать магазин в telegram/WhatsApp, диктовать заказ голосом, распознавать эту аудио мешанину и т.д. Если можно создать условное веб-приложение (которое можно так же запустить в telegram, если уж вам так хочется) , где пользователь будет тыкать кнопочки, видеть картиночки, во время надиктовки заказа не забудет содержание корзины (по крайней мере сможет посмотреть), а также сможет сразу видеть статус своего заказа. Возможно дело в цене, ведь обслуживание всего 2 доллара в день, однако тут встаёт вопрос удобства пользователей. Лично я скорее закажу напрямую на кассе/в приложении, чем буду надиктовывать заказ (вероятно в шумной обстановке).
Они каких-то сотрудников хотят заставить этим пользоваться. Наверное сотрудники читать и писать не могут.
Надо сказать, что уже много лет назад меня поразил таксист. Узнав адрес он сказал навигатору что-то совершенно нечленораздельное на смеси якутского с арабским, но навигатор адрес всё равно понял.
Так что может вполне взлететь так, что с каким-нибудь официантом придется жестами объясняться...
Что предпочтет пользователь в массе своей, это вопрос на данный момент открытый. По моим личным ощущениям говорить, это процесс менее энергозатратный, чем тыкать в приложении. К тому же, у использования персонального устройства есть специфические плюсы. Например, клиент может прийти в кафе и сказать просто "мне как всегда". И это уже точно будет удобнее тыкания
Вы даже не представляете какое кол-во людей общается голосовыми сообщениями.. дай им волю и заказ они будут оформлять ровно вот так - голосовым сообщением. Тыкать в картинки/кнопки на экране это для них сверх напряжение, что уж говорить про тыкать в буковки.
Ну а в целом технология интересна и может пригодиться много где.
Я еще вижу при работе с LLM проблемы с тестированием. Для четких алгоритмов у человечества уже есть навык определения граничных случаев и состава тестов для проверки. Что делать с LLM? По опыту общения с chatGPT - не так уж просто заставить его не терять смысловые куски... вроде вот на маленьком примере все хорошо работает, а подаю на вход побольше данных и что-то из контекстного окна модели начинает выдавливаться и результат уже совсем другой. Как тесты под это писать? Забрасывать это все тестами на все возможные размерности входных данных? Это прям на порядки больше тестов должно быть.
Да и как проводить тесты, если норма ошибок 5%? Возможно ли вообще их будет привести к "все успешно прошли"?
Сначала одни дьяволопоклонники придумали эти голосовые сообщения, теперь другие предлагают вокруг них строить интерфейс. Воистину, настают последние дни!
Если серьёзно, то про цену вы тут хорошо рассказали, а выхлоп из всего этого какой?
Тадам, использование иностранных месседжеров для бизнес целей в логистике и доставке планирую запретить.
В чем смысл использования 4o если с подобными задачами справится даже LLama (которую кстати можно развернуть локально и в долгосрочной перспективе это выйдет сильно дешевле)?
Справляется, но как показала практика, недостаточно хорошо для бизнес-целей. Пробовали с клиентами и Yandex и LLama, в результате отказались в пользу OpenAI.
И, кстати, как это вы так посчитали, что выйдет дешевле? Насколько мне известно, выйдет дороже. Причем сильно дороже, можно сказать, что неподъемно для малого бизнеса
При стоимости запроса к нормальной модельке меньше 5 копеек дешевле не выйдет никогда.
Нет проблем написать интеграции для доп софта, 1С и прочего, бы ло бы правильное Т.З.
И уповать на искусственный интеллект не стоит, он тоже может ошибаться , и ошибается .Если нужно проверить и зажать в рамки с помощью удобного для вас языка программирования , можно получить желаемый результат.
А после принять решение, что все нужно переделывать.
Здравствуйте. Все таки как у разработчика непосредственно занимающегося разработками подобных систем возникает пару вопросов:
1) Озвучена цена в два доллара в день. А что если почитать время + затраты на программистов которые будут сращивать ваши супер революционные идеи и настоящие базы данных и тд.
2) У вас так классно добавлялся товар, но для машины это плоски данные с двумя свойствами(имя товара, цена). Если речь идет о боевой системе каждый товар это явно не плоская запись, а множество связанных таблиц. Как вы видите добавление в таком случае? ( ПРИМЕР: У клубничного мороженного могут быть 100500 разновидностей со всякими допинагми и разными размерами, мороженое с допингом это явно не одна позиция).
3) В дополнение к п.2. Что если товар будет иметь не 2 параметра а скажем 10?
Идея без сомнений классная, но вот хотелось бы посмотреть реальное практическое применение.
Добрый день!
1) Вопросы "сращивания" решается так же, как и у всех прочих сервисов, через API. Отправили запрос, получили список заказов. Сейчас такого рода интеграции не требуют особенных трудозатрат и высокой квалификации. Даже джуны справляются.
2) ИИ в общем-то все равно: работать с одним свойством, двумя, 10 или 50. Оно все "скушает" и жаловаться не будет. Как я вижу, тут ограничения возникают с другой стороны. Клиент приходит к вам. Он хочет описать в идеале одним, ну максимум двумя словами, что ему нужно и получить, что ему нужно. Если вы предложите клиенту расписать 25 характеристик товара, он просто развернется и уйдет. Обратите внимание, в ресторанах заказывают салат Цезарь или греческий, но не расписывают по ингредиентам желаемое блюдо. Но, повторюсь, со стороны ИИ тут ограничений нет. Если у вас задача несколько иная, чем прием заказа в общепите, то ИИ не будет вас ограничивать в количестве параметров. 10 так 10, хоть 100!
Если вам хочется поэкспериментировать, напишите в личку, я выдам вам бота
Сколько стоит искусственный интеллект для малого бизнеса