
Комментарии 5
$32 за миллион входящих токенов и $64 — за миллион исходящих
Интересно, насколько такая цена обусловлена реальными расходами на аппаратную поддержку работы модели, а насколько - попыткой собрать максимум с новой "фичи" которой нет у конкурентов, а также отбить затраты на обучение за счет компаний которые будут это API использовать для обучения своих подобных моделей?
Иными словами - есть ли шанс в обозримом будущем на демократизацию ситуации, когда такой функционал может стать если не локальным, то хотя бы доступным?
Илон Маск на днях выложил старый грок версии 2 в открытый доступ. Он гигантский (и при этом был жутко тупым).
Для того что бы запустить самые крупные модели нужны десятки видеокарт ценой по несколько миллионов каждая.

И это только запуск, а надо же ещё и разработку как то окупить.
У гугла есть и стоит 3/12 https://ai.google.dev/gemini-api/docs/pricing#gemini-2.5-flash-native-audio
Как это прикрутить к РФ номеру, арендованному у какого-нибудь Voximplant или Exolve? Из-за санкций - не работает ни черта. А костыли из проксей будут замедлять пинг, что делает технологию неработоспособной для живого звонка. Elevenlabs уже давно сделал крутой ИИ-колл-центр, но все упирается в санкции.
у Voximplant все работает, берите и прикручивайте https://voximplant.com/products/openai-client
c 11labs аналогично
OpenAI представила новый голосовой ИИ