Обновить

Как Claude и Ollama решили мою вечную проблему на Ozon

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели23K
Всего голосов 18: ↑16 и ↓2+17
Комментарии13

Комментарии 13

сам являюсь селлером и продаю ножи

Извините, не удержусь: это не про вас реклама была в каждом втором телеграм канале "сам кую, продаю остатки!"?

Вчитался в текст - правда, статья не о впаривании, а о полезном применении ллм для облегчения жизни, за такое прямо спасибо!

не про меня)
и тут скорее проблема у меня в статья в том, чтобы вообще хотя бы показать товар покупателям, до продажи еще далеко))

Несколько месяцев на 1 тысячу позиций? Это точно не преувеличение?

Нет, потому что нужно взять картинку сертификата, переписать оттуда номер и дату, найти приложение к этому сертификату и выписать оттуда артикулы, которые к нему относятся. Таких сертификатов около 200 + 200-300 приложений к ним и все это заносится вручную через ЛК селлера по каждому сертификату. Несколько лет назад, я уже занимался этой проблемой (тогда вручную), поэтому знаю что на весь ассортимент уходят месяцы) Есть же еще другие дела

Скрытый текст

А надлежащим именованием файлов картинок сертификатов это разве почему-то не решается? По типу

<ID>-<date>_<supplID>.jpg

а потом достаточно простым батником генерировать список, который потом скармливать условному Postman для загрузки через API? Заморочек вроде бы на порядок меньше, чем с иишницей, и тоже - один раз настроил и пользуйся.

Да, с нормальными названиями было бы проще. Проблема в том, что не я их получаю от госоргана, а поставщик) а он может их создавать и называть по своей логике

Спасибо за комментарий, это важное уточнение, добавил в статью

было такое дело, но там меньше было, тоже лень было самому делать)
Gemini попросил, всё сделала)
но Claude конечно именно в кодинге превосходит гугл, но не в универсальности

тоже через скрипт для локальной модели? или прям gemini все спарсил?

она скрипт написала и сама запустила в Google Colab, правда переделывала скрипт раза 3-4, но Гугл со своими огромными ограничениями позволяет это делать хоть 100 раз

да и я локальные модели не использую, муторно, всегда делаю через Groq API, там щас есть модель на 120B, и устанавливать ничего не надо. просто просишь тот же Клауд создать сайт с твоим Groq API, там бесплатные токены довольно большие для одного человека, и у тебя считай собственная умная нейросеть чисто для тебя

можно с этого места поподробнее :)

как мне дадут возможность статью написать, первой статьёй выпущу сразу)

А вы не пробовали использовать вместо локальных ллм просто OCR?

Они существовали и до AI-бума, и не требуют настолько много ресурсов, при этом качество должно быть достаточно хорошим для печатного текста

Это один из тех случаев, когда инструмент просто выбран неправильно, и часть проблем просто можно было бы избежать, не используя микроскоп для забивания гвоздей.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации