Pull to refresh

Comments 37

Мы должны написать всё, что нужно написать сейчас!

И скачать весь интернет, пока его не отключили!

Ну и правда, не совсем понятно, как будет выглядеть рынок, когда все пилят одно и то же и у всех одинаковая подписка на ChatGPT.
Думаю, это решится естественным образом - будут очень дорогие и очень дешевые нейросети.
Богатые будут богатеть, а бедные беднеть.

Будут более эффективные чипы. Но качество/цена расти не будет, факт.

"будут очень дорогие и очень дешевые нейросети " - так давно уже... :)

Или, когда и если цены на подписки взлетят, то фирмы опять начнут охоту за живыми головами и мы, программисты, тогда ещё посмеемся на автоотказы от hh.ru! 😎

qwen3-coder-next вполне неплохо работает, запускается на одной h200, на rtx6000 96Gb за 800к вроде тоже можно запустить. С claude-code вполне совместима. Так что можно и без антропика будет прожить.

Отнюдь не всем задачам требуются дорогие агентские режимы - а себестоимость инференса для более простых задач, наоборот, падает. Так что "нижняя планка" скорее опустится, чем поднимется - даже в случае IPO.

Просто она теперь будет иметь жёсткий лимит на количество токенов.

С самого начала никто не скрывал, что подписки - глубоко субсидируемая маркетинговая история, пока важно показывать улетающую в небо кривую прироста пользователей. Вендоры точно будут:

  1. резать лимиты

  2. повышать стоимость подписок

  3. вводить новые ограничения

  4. строже банить за нарушение правил и автоматизацию

  5. мотивировать переходить на плату за API разными методами


Лучше планировать годовые бюджеты по стоимости API, пока удается сэкономить - радоваться.

Claude на подписках давно отдает в клиент "стоимость" по ценам API.
Судя по тому, что я вижу, утыкаясь в лимиты Макса за $200, по факту легко сжигаешь $4-10k.

Типикал схема убер-экономики - сначала сжигаем деньги инвесторов, потом сжигаем нервы корпоративных клиентов

Во первых, нужна реальная стоимость токена, чтобы можно было сказать с уверенностью, что они работают в убыток.

Сколько реально платится за энергию? Сколько выжигает 1 токен? Неужели 0.9 цента?

То есть, предполагать, что они работают сильно себе в убыток, не имея реальной стоимости затрат на руках - все равно, что гадать на кофейной гуще

Стоимость электроэнергии там скорее всего составляет достаточно ничтожную долю. Больше уходит на амортизацию, на поддержку работы дата центра, на зарплаты, на налоги, на прочие непрофильные расходы

Тут даже не знаю, насколько уместно употреблять термин "амортизация". Современные чипы — это практически расходники, при 100% загрузке живут 1-3 года.

скорей всего.

А пробовали не гадать? Амортизация, поддержка, что ещё придумаете?

Я переведу на русский - вы написали статью о своей фантазии. Не путайте людей и не забивайте чушью. Если не понимаете, как что-то работает, не надо навешивать свои ярлыки.

Ой, лол. Только сейчас увидел, что это ещё и перевод. Статья ради статьи, я понял

Десятки и сотни миллиардов уходят и продолжат уходить на строительство дата-центров, обучение моделей. Это тоже расходы.

Точные цифры скрыты под NDA, но чудес не бывает, видяхи стоят космических денег, а ресурс чипов ограничен

Статья - шиза, уж простите. Ну понятно, что всё ради захвата рынка, но приведённые вами цифры как-то нереалистично смотрятся даже навскидку. Вернее вообще всё не сходится, и это очень грустно, что так много людей это воспринимает как правду.
Если совсем на пальцах объяснять, то топовые модели сейчас - это moe, т.е. как аниме, но mixture of experts. Что это значит, нормисы, которые особо правильных и интересных вопросов не задают, общаются с не самыми умными, дешёвыми экспертами. И просто статистически так уж выходит, что нормисов больше, чем тяжёлых юзеров, то есть они, оплачивая подписку, покрывают расходы на тяжёлых юзеров.
Разделение на этих разных экспертов будет в будущем только эффективнее и эффективнее. Потом на подписке, если у вас не космический айкью(исключительно полезны ваши диалоги для обучения), дадут вам обычного программиста эксперта, который вполне окупаем в рамках вполне земных цен
Но вот когда вы говорите, что агенты должны быть по токенам - это да, к этому идёт. Для чатов роста цен либо не будет, а если будет - то незначительный.

Иронично, что вы назвали статью "шиза", но далее озвучили такие же предположения, под которыми ничего нет, как и автор статьи.

Вполне ясно изложены критически важные детали, которые в модели, представленной статьёй, напрочь игнорируются. Как будто оригинал той статьи был не более чем фармом траффика

Не все детали, но хватает, чтобы указать на недостаточную обоснованность выводов статьи

Для обычных юзеров оставят дешевую подписку, просто отупят модель до уровня табуретки, а за нормальные ответы придется платить

Во-первых, хоть что делай, а кроме как поставить себе личную видеокарту, не особо и выход. Но и с ней не особо выход: качество обрезанных опен-сорсных моделей не сильно радует на фоне грандов.

Во-вторых, а кто сказал, что api продают по точной цене. Api цена может быть и выше, и ниже.

В-третьих, предлагаю иметь не один, а два плана "на случай". Пока описанную ситуацию можно вот так планировать:

А если серьёзно, сейчас сети учатся. На наших с вами данных. Что будем потом - сами увидим, а не заполошный пост ради хайпа читать как откровение - в посте почти ничего нет.

Вы знаете сколько стоит билет на автобус? А сколько такси? Едут по одному маршруту, а цена в 10 раз больше! Так что готовьтесь и покупайте свои машины, потому что Альтман (который известен, что говорит правду, правду и только правду) сказал, что автобусы это что-то эдакое. Вот сделают билеты по цене такси и тогда на работу пешком ходить будете.

Есть статьи для накала страстей) Вот эта статья такая же. На самом деле есть много факторов которые повлияют на падение цен в будущем, возможно уже в течении года.

1. Китайские ИИ подбираются очень близко по возможностям, при этом очень недорогие.

2. Технологии совершенствуются всегда, гонка за терабайтами данных обернется выборкой нужных данных, будет много оптимизации процесса и в итоге также будет дешеветь обработка данных. Сейчас идет рост за счёт расширения всего что можно, завтра пойдёт рост за счёт роста качества обработки.

3. Сейчас вовсю идёт разработка новых решений не помню навскидку Cerebras например, много идет затрат на покупку железа. Ок железо накупят, уже большинство затрат снимется. Плюс Cerebras там придумали вообще не разрезать пластины (как я понял).

В общем факторов много, загадывать нельзя как оно будет.

Китайские ИИ подбираются очень близко по возможностям, при этом очень недорогие.

А что, китайцы работают не в убыток разве? Такое же субсидирование. И тоже начинают повышать цены, резать бесплатный доступ и т. д.

Но в плане оптимизации надо отдать должное - кажется, у них намного дешевле получается обучать модели.

Опытный пользователь, который несколько часов в день работает в Claude, загружает документы, составляет отчёты и анализирует данные, легко сжигает несколько миллионов токенов в неделю.

В день.

Китайцы уже на пятки наступают и шустро нагонят. Я уже молчу про черный рынок токенов, это вообще один большой прикол.

А есть и такой? Вот на чатгпт акки продавали по дешевке (на том же funpay), но как-то вдруг цены там выправились (видно, лавочка прикрылась), но токены-то из-под полы?

Да, там чё то в 4-5 раз дешевле, я в шоке был когда узнал что можно токены так левачить.

Аналогичная ситуация была с демпингом цен агрегаторов такси с 2020 по 2022 год

Исход скорее всего будет тот же: останутся игроки с большими кусками пирога

Вот да, похоже на такси. Ещё год назад жена могла позволить себе поехать в/из школы на такси, когда в сумке тетради нескольких классов на проверку. В этом году уже не может, по цене. Провожаю/встречаю её

Когда в основе предоставления услуги присутствует человек - это вовсе не аналогично

Ой как придёт Я.ГПТ, который есть и будет не лучше всех, а просто умудрится сделать всех недоступными...

Интересно бы узнать, заложен ли в юнит-экономике LLM аналог Закона Мура. Чипы оптимизируют, модели оптимизируют. Какова вероятность сценария, что через несколько лет себестоимость удешевится до такой степени, что цены на подписки порядка $20 станут прибыльны?

Пользоваться моделями, выпущенными "несколько лет" назад, вы и сейчас можете бесплатно и почти безлимитно.

Ну да, кто-то всерьез думал, что гонять кластеры H100 за 20 баксов в месяц это устойчивая бизнес-модель. Халява всегда конечна

На самом деле, если амортизацию видеокарт посчитать, там не так уж много получается. Тут надо прям считать, чтобы уразуметь, сколько токен на самом деле стоит. Мои прикидочные подсчёты дали число на порядок ниже, чем про то обычно говорят. Не знаю. То ли я дурак, то ли лыжи не едут. 

Sign up to leave a comment.

Articles