Обновить
8K+
0
Владимир@sektor305

Руководитель проекта

2,1
Рейтинг
3
Подписчики
Отправить сообщение

ответ понятен. Благодарю.

Так там на "басурманском" - снова ИИ переводами заниматься, а как ежели наврёт с три короба? )))

ясно, благодарю за ответ.

Неочевидный вывод в том, что главная опасность ИИ сейчас — не галлюцинации, не агенты, которые грохают базы, и не утечка данных.
Главная опасность в том, что мы сами, добровольно и с энтузиазмом, помещаем этот инструмент в центр нашей эмоциональной жизни, разговаривая с ним «как с сыном» и воспринимая его «извините за это» за чистую монету.
Мы воспитываем поколение, для которого норма — это эмоциональная связь с программой. И текст «жалоб» в этом смысле — не столько инструкция по работе с багами, сколько исторический документ, фиксирующий момент, когда миллионы людей одновременно и навсегда разучились злиться на бездушный код и начали злиться на «Лёху из соседнего отдела»...

Елена неоднократно предлагает «написать свой парсер» или собрать «кастом на Mastra/LangGraph» как альтернативу готовым сервисам.
При этом полностью опускается вопрос совокупной стоимости владения таким решением (TCO), включая зарплату разработчика, время на поддержку, исправление багов и адаптацию к меняющимся API источников.
Это не слабость какого-то конкретного рецепта, а неполнота картины для новичка, который может недооценить скрытые издержки «бесплатного» опенсорса и кастомной разработки.
Я вполне приемлю тот факт, что для профи всё это - "семечки", но я лично не разработчик уровня "продвинутый" и уже вряд ли таковым стану и потому "полную картину" для простого пользователя есть желание лицезреть ;)

В разделе о конфигурации сервера БД приводятся конкретные значения для join_buffer_size и sort_buffer_size (по 4M).
При этом не упомянуто критически важное предостережение о том, что эти буферы выделяются на каждый запрос, и их необдуманное увеличение на сервере с сотнями одновременных соединений может привести к мгновенному исчерпанию оперативной памяти и падению всей системы.
Для новичка, который скопирует эти настройки бездумно, такая рекомендация несёт скорее вред, чем пользу.
И ещё один нюанс по-поводу внимания к диагностики и её неравномерности у автора.
Он стартует с методичной диагностики, но к концу повествования оное превращается в перечисление отдельных рецептов без чёткой связи с диагностированными проблемами.
Так и остаётся неясным: если я найду в slow query log проблему, но она не связана с UF-полями, N+1 или SELECT *, то что делать?
Методология неполна — диагностика детальна, а список решений ограничен и не покрывает всех возможных причин из лога...
Однако, автору респект ;)

Ключевые цифры указывают на системный спад: выручка в январе упала на 26% год к году (с 2,7 до 2 млн), а расходы выросли по всем фронтам (аренда, НДС, материалы). Рентабельность всего бизнеса в 7% при кредитах под 30%+ годовых — это хождение по лезвию.
На этом фоне финальное решение автора звучит как побег от реальности, а не как продуманная стратегия: «Хочу делать меньше серийных изделий, но с более высоким чеком — работать скорее как мастерская».
Это кардинальная смена бизнес-модели, но в тексте нет ни слова о том, есть ли платёжеспособный спрос на такие изделия в Ижевске, найден ли хоть один клиент, кроме упомянутых вскользь дизайнеров, и за счёт чего вообще будет обеспечиваться этот «более высокий чек».

Автор подаёт normalization="image" как инсайт от грандмастера Kaggle, эквивалентный RandomBrightnessContrast, но наоборот.
Возникает закономерный вопрос: если это, по сути, просто другой способ сделать то же самое, зачем может понадобиться эта неявная, неконтролируемая форма вместо явной и прозрачно параметризуемой?
Когда и почему один метод аффинного преобразования пикселей должен работать лучше другого?
Тезис о том, что это «бесплатная аугментация», остаётся недоказанным, а механизм её преимущества перед простым тюнингом параметров RandomBrightnessContrast не раскрыт.

По скорости — да, отставание системное, но есть подвижки

В марте 2026 года вышло сравнение движков «The Great LLM Inference Engine Showdown» . Вот такие цифры "нарыл":

  • vLLM, SGLang на A100/H100 — 1000–2000 токенов/с.

  • TensorRT-LLM — 2500–4000+ токенов/с.

  • Ollama — характеристика «низкая», вердикт «не продакшен-решение для сервинга». Чисто так, для справки: "Ollama нельзя ставить за балансировщик нагрузки и использовать как боевой API-эндпоинт для множества одновременных пользователей."

Причина архитектурная: Ollama — надстройка над llama.cpp, заточенная под простоту локального запуска, а не под максимальную утилизацию GPU.

Но работу над скоростью не забросили. В патче v0.23.1 добавили поддержку Gemma 4 MTP — multi-token prediction, один из вариантов спекулятивной расшифровки. Разработчики заявляют более чем двукратный прирост скорости для Gemma 4 31B на Mac, особенно на кодовых задачах . Пока точечно, не системно, но направление задано.

По монетизации — локальная версия никуда не делась...

Ollama Cloud действительно существует с апреля 2026.
Тарифы, про которые я уже где-то писал, не совсем "драконовские":

  • Free — с жёсткими дневными квотами, чисто попробовать.

  • Pro (~$20/мес) — инди-разработка и прототипы, лимиты расширены, но фиксированы.

  • Pro Max (~$200/мес) — продакшен-квоты, приоритетный доступ.

Лимиты уже меняли дважды с выхода из беты, и обозреватели отмечают: «ограничения важнее заявленной цены» .
Квоты плавающие — тут ты прав.

Но локальный Ollama бесплатен и полностью автономен. Модели крутятся на твоём железе, никаких подписок, никакой телеметрии в облако. Это не фримиум-ловушка — это два разных продукта под одним брендом.

Подведу черту:

Скорость инференса на высоконагруженных сценариях — больное место, признаю. Но точечные оптимизации идут. Облако с меняющимися лимитами — факт, но локальный движок никто не сворачивает.

По-моему, разрабам игр в том числе это полезно.. я не "гуру", но ollama "пользую почти год на простом ноуте... И знакомый по мобильным "донпомойкам" часто прибегает к подобному.

всё меняется в этом мире бренном, а уж в цифровом мире. Я лично уже не успеваю за новостями, если честно. Старый, что ли.. ))

Чиновничий беспредел крепчал и рос - шёл пятый год войны...

01.09.2027 года введут обязательную маркировку сгенерированного ИИ...
Маркировку введут...
Тогда для подобных комментаторов наступит рай, наверное :)

Это не S.P.A.M.
Рекомендую изучить "мат.часть"...

— А в чём сила, брат?
— А вот в чём! В деньгах вся сила, брат! Деньги правят миром, и тот сильней, у кого их больше...

Слишком логично и правильно. Именно поэтому ныть продолжат именно те, кто "звездился" )

Есть тренд; Есть хайп тренда (типа рекламы что-то)...
Есть хейт и есть хейтеры... они хейтят тренд, чтобы тот уже не был в тренде (понижается индекс цитируемости и т.п.);
Есть работяги и они работают, а есть бездельники и они бездельничают;
Вот тут уже немного серьёзнее, т.к. есть молотки, кувалды и станки.
...
А ещё есть промпт;
Для кого промпт - подсказка, а для кого (чего) - инструкция...
Наконец, существует промпт инжиниринг, который должен создавать эффективные и точные промпт-ы.
Есть же люди тестировщики... их ещё не любят кодировщики ;)

...

Чего бояться те, кто в комфорте на своей кочке и в своём болоте? Перемен...
Как там у Цоя?
"Пеpемен тpебyют наши сеpдца
Пеpемен тpебyют наши глаза
В нашем смехе, и в наших слезах, и в пyльсации вен
Пеpемен, мы ждём пеpемен "

Это когда может произойти замена всего и вся на то, что нарушает покой и что может оказаться чем угодно... даже промпт инженером.

P.S.
«Не дай вам бог жить в эпоху перемен»
Конфуций

Вполне возможно, т.к. только один факт "допов" в виде сигарет и чая подтверждает подобный вариант.

Информация

В рейтинге
1 521-й
Откуда
Владивосток, Приморский край, Россия
Зарегистрирован
Активность

Специализация

Директор проекта, заместитель генерального директора
Управление людьми
Управление бизнес-процессами
Руководство стартапом
Ведение переговоров
Развитие бизнеса
Управление проектами
Стратегическое планирование