Pull to refresh
53
0
Кирилл Косолапов@kirillkosolapov

CEO Amvera

Send message

Самый конкурентный, это США. Рынок Турции/Египта слишком мал, чтобы на него тратить усилия. Но говоря честно - сейчас рынки очень глобализированы (за редким исключением) и для пользователей мало разницы из какого вы региона.

Если у вас нет резидентства, это не так просто и дешево. Плюс вам еще нужен банковский счёт открыть, что без резидентсва сейчас почти нереально. Если вы гражданин РФ, проживающий в РФ, без совсем мутных схем открыть юр лицо и счет в Европе очень сложно. Можно рассматривать ОАЭ или Сингапур, но там просто дорого получается.

Мы выходили на LATAM таргетно + на общий англоязычный сегмент. Учитывайте, что наш продукт - это B2C. Его немного сложнее позиционировать для конкретных рынков, чем продукты с ручными продажами.

Как вариант. Но там и цена подороже и ценообразование не только от количества вызовов, но и от потребления ресурсов. И главное, лямбда-функции сложнее в настройке, и если допустить ошибку (в обработке исключений, как пример), можно попасть на сотни тысяч рублей, как в этой истории. Здесь же закинуть код в интерфейсе и заполнить "полторы строки" настроек.

За фактическое время с дискретизацией до минуты. Если код выполнится за 3 минуты, при лимите в 20, посчитает именно за эти 3 минуты работы Cron задачи.

Согласен. Я всегда ставлю длинное тире. Почему мне надо начинать безграмотно писать, чтобы быть похожим на человека.

И это дорого, плюс карта не серверная. Подойдет только если не нужна постоянная работа и масштабирование. Если уже есть, для локального тестирования, почему нет, но для остального проще токены купить по мере надобности.

Это достаточно дорого. Для запуска минимально объемной по параметрам LLM нужна дорогая карта. И почти все хорошие нейронки проприетарные. Разница между LLaMA и GPT/Gemini/Claude очень большая. И что делать если надо в параллель запросы обрабатывать, локально их не раскидать. Плюс работа 24/7 локально сложно осуществима. Просто тратить сотни тысяч/несколько миллионов (здесь от нейронки и требований зависит) на то, что работает хуже, оправданно только при особых требованиях безопасности.

У n8n есть особенность, что обновления идут почти каждый день. При такой частоте в них достаточно много багов. Нужно очень аккуратно выбирать и обновлять версии n8n, чтобы все работало стабильно. Всегда лучше в конфигурации указывать конкретную версию и избегать latest, иначе может быть сюрприз на проде в самый неподходящий момент.

Платим им деньги? На самом деле по такой модели работают многие западные облачные провайдеры, которые в рамках продуктов для ИИ предоставляют вывод моделей того-же OnenAI, или разные ИИ IDE, как курсор. Разница в том, что за границей пользователи могут и напрямую API купить, а для РФ-пользователей множество барьеров, начиная с оплаты в долларах, картами, которые мало у кого есть, заканчивая невозможностью работы с российских IP. Мы просто помогаем преодолеть эти сложности.

Пока поддерживаем только текстовый ввод-вывод. Мультимодальные возможности добавим чуть позже.

Ваш пример, это gpt-5-mini, это другая модель. Которая полная у них(gen) стоит 2500 (а не 500), у нас 1800. Но принцип ценообразования мы еще изменим, действительно пакеты не всем нравятся. Кто размещает проекты у нас в облаке, им удобнее в одном месте и с понятной ежемесячной подпиской. У нас все-таки основной бизнес не перепродажа токенов, а рантайм приложений.

P.S. Посмотрел вторую компанию(bothub), у них за вывод GPT 5 получается 7500 рублей за миллион выходных токенов (это вообще x10 к цене OpenAI), даже учитывая, что промт на 20% дешевле нашего, выйдет явно больше чем у нас в 99% случаев.

Это пример тарифа на пакет в 100 000 токенов GPT 5. Не дёшево, но чем больше пакет, тем дешевле стоит каждый токен. Этот как раз за токен самый дорогой, но за месяц самый дешёвый.

Тут тонкий момент, парсинг сайтов это одно, а обход каптчи часто используется для не совсем легитимных целей. Хотя с современными LLM скоро каптча уйдет в прошлое.

Так плюсовать свои статьи, стабильно по 20 накрученых плюсов, как только совести хватает. Вы бы хоть посмотрели, что посты плюсы не как статьи статистически набирают перед тем как накручивать,

В статье это же просто пример. Документы разные бывают, условная документация. Если придерживаться логики использования только своей инфраструктуры, сервисов и т.д., это достаточно утопичная идея для конпаний, если вы не условный FAANG

  1. В статье есть фраза "без посредников" 2. По вашей ссылке другие модели 3. Сейчас LLM в Amvera только выпустили, и основная ценность не в них, прежде всего ценность в простом деплое через git push. А API LLM можно любые использовать. Тем более, в ближайшее время появятся другие модели, которые могут стоить намного дешевле.

Если вы юридическое лицо и вам нужны закрывающие документы, такой способ не подойдет. Да и для физических лиц это дополнительные затраты времени, и уже каждый сам решает насколько его время дорого и стоит ли заморачиваться ради небольшой экономии.

Конкретно тех, что вы упоминули, сейчас сайт не работает)) Странно сравнивать VPS и движки приложений. В app engine всегда меньше ресурса, но он весь под работу приложения. На самом дешевом VPS у вас немаленькую часть съест ОС и т.д. Плюс все промо тарифы либо по времени ограничены, либо просят IP-купить. А в движках приложений типа Amvera у вас в тариф уже включены бэкапы, логирование с семантическим поиском (отдельно эластик на VPS это очень дорого поднимать, а так включено), метрики, алерты, плюс уже встроенный CI/CD c простым деплоем и обновлением, прокси до нейронок. Т.е. вы платите за удобство, и за то, что многое уже настроено и идет из коробки. А так, можно хоть на своем компе поднять, вообще бесплатно будет.

Сейчас это работает просто как семантический поиск. Но идея хорошая, если будет запрос от пользователей, сделаем поиск по метаинформации. Спасибо.

1
23 ...

Information

Rating
Does not participate
Works in
Date of birth
Registered
Activity