All streams
Search
Write a publication
Pull to refresh
9
0
Send message

Вполне рабочая схема. Бесплатные лимиты вполне достаточны, чтобы потестировать модель, написать и отладить свое приложение с ней. А затем, если запускаешь что-то в продакшн (и зарабатываешь на этом), бесплатные модели с ограничениями тебе бесполезны, и ты платишь по полному прайсу. Так и окупается.

Qwen3 Coder 480B A35B на OpenRouter стоит $0.80/M output tokens (input еще дешевле). Максимальный контекст 262,144 токенов. Даже по курсу 100р/$ (с учетом комиссий), 1500 - это $15. $15/0.8 = 18,75 млн токенов. 18,75/0,262144 ~ 70 сообщений максимально возможного размера, чего почти невозможно добиться.

Из моего опыта - на написание небольшого работающего приложения с нуля через Gemini Flash - нужно рублей 100, и это с учетом того, что он еще и отладит, исправит все ошибки.

Это где такое нашли?

Вы явно что-то делали не так и не туда. У всех моделей есть лимит на размер запроса (контекст). Такое может быть только если взять самый дорогой Claude Opus 4.1 с контекстом 0.2 млн токенов и ценой $75/M output tokens. И тогда два самых больших запроса обойдутся в 30 баксов. Но это надо очень постараться, чтобы модель в ответ выдала 200к токенов. Да и вообще не надо писать код в Opus, если вы точно в этом не уверены.

Обычно с кодом хорошо справляются Claude Sonnet 4 ($15/M output tokens) или Gemini 2.5 Flash ($2.50/M output tokens).

Ну или у вас очень жадный посредник))

Я пишу код через Roo Code и через Qwen Code CLI, пишу небольшие приложения работающие с ИИ, и мне, естественно, нужен доступ к моделям через API.

Сначала я пользовался ProxyAPI - спасибо им, отличный сервис, главная фишка - можно оплачивать от юр. лица полностью в белую. Но для пет проектов слишком дорого.

Потом перешел на OpenRouter. У них цены как у официальных провайдеров, плюс комиссия. Оплата криптой - один раз разобраться, и дальше спокойно платить. Завести кошелек MetaMask, зарегистрироваться на Bybit, научится всем этим пользоваться, покупать крипту через P2P с карты "Желтого" или "Зеленого" банка. Кстати, проще всего и выгоднее использовать монету POL - с ней комиссия минимальная.

А теперь вообще перешел на neuroapi.host - есть вопросы к удобству, скорости, стабильности, зато цены НИЖЕ, чем у официальных провайдеров (личный опыт, не реклама).

Много букв получилось, надеюсь, кому-то будет полезно.

А о чем, собственно, статья? Какая использована модель? Какие промпты? Имеет модель доступ только к дифу, или ко всему содержимому измененных файлов, или ко всему проекту? И как реализован доступ к другим файлами проекта, через mcp? Есть ли индексация кода проекта? Может быть Tree-sitter?

Как минимум потому, что все эти IDE требует нести им деньги, ты не можешь придти к ним со своим API и ключом, как это можно сделать в перечисленных выше плагинах. Есть очень неплохая для написания кода и дешевая Google: Gemini Flash 2.0, а есть и открытые модели, которые можно запустить локально. Это и экономия, и гарантия, что интеллектуальная собственность (код), не покинет периметра компании.

У кого-то был опыт, чтобы сравнить Claude Code, Cursor Agent и Windsurf с плагинами для IDE, такими как cline.bot , Roo-Code, continue.dev?

Если нужно решение как ngrok, только свое и открытое, советую посмотреть на проект frp. Про него ранее писал.

Если переписывали, так лучше бы сразу для WireGuard. Как раз мечтаю сделать что-то подобное, да никак руки не доходят)

По steal на AWS EC2 очень хорошо видно, как гипервизор зажимает инстансы t1/t2/t3 когда у них кончаются CPU Credits.
Например, для t3.nano гарантируют базовую производительность 5% при отсутствии кредитов. Тогда при продолжительной постоянной полной загрузке процессора, steal будет стремиться к 95%, чтобы у вас было не больше этих самых обещанных 5%.
Ну или будут автоматически добавляться кредиты за $$, но это уже совсем другая история.

Большое спасибо за перевод, на kaniko и buildah обязательно стоит посмотреть.


Но при этом возникают проблемы с безопасностью: например, приходится работать с разными файловыми системами (хоста и контейнера) или использовать кэш сборки из хост-системы. Вот почему мы и не хотели трогать Docker-in-Docker.

Странная аргументация. Разные файловые системы и кэш сборки слабо связаны с безопасностью.


Уже больше года используем цепочку CI/CD на Kubernetes, Drone.io, Docker-In-Docker. За это время ломалось все: Drone, СУБД, оборудование, сеть, файловые системы, Docker Registry, сам k8s, но вот сбоя Docker-In-Docker не было ни одного. Работает как часы. Хотя официально разработчики рекомендуют использовать его только для тестов.


К слову, описание деплоя: https://gist.github.com/delfer/03a4aab83f73305888593287e9735895


То есть, если хотим запустить Docker-демон в контейнере, нужно использовать вложенную виртуализацию.

Сильное заявление. Что там виртуального? Файловая система — изолированный слой. Оборудование — нет. Ядро — используется хостовое. Пространство процессов — тоже хостовое.

Не смущает)
Могу предположить, что документацию еще не обновили, так как Ubuntu 18.04 LTS (Bionic Beaver) поддерживается официальным скриптом установки Docker.
Однако, тот же скрипт (на момент публикации) поддерживает и Debian 7 (Wheeze), хотя «из коробки» у него ядро 3.2.0, тогда когда Docker требует ядро не старше 3.10. Исправить обещали 31 мая.
Совместимость с каждой доступной на DigitalOcean операционной системой была непосредственно протестирована
image
(таблица из README)
А если углубиться в теорию, то Docker вполне хорошо работает на любом Linux с ядром 3.10 или новее, cgroups и iptables. Запускал его даже на Astra Linux Special Edition 1.5 и Windows Subsystem for Linux (только старую версию Docker, которая не требовала iptables и cgroup). Могут быть небольшие проблемы с сетью (на Windows приходилось использовать --net=host) или хранилищем (в Centos «из коробки» будет глючный loop-lvm вместо нормального overlay2). На Ubuntu 18.04 — все прекрасно.
Обновил публикацию: добавил краткую инструкцию как запустить на Linode. Условия примерно те-же: сервера в Европе, бонус после регистрации и оплаты $5, $5 в месяц.
Хотя гарантий, что Linode также тотально не начнут блокировать — никаких.

Не повезло, есть небольшой шанс. Просто удалите Droplet (кнопка Destroy как написано в конце инструкции) и создайте новый (повторите действия начиная с раздела "Запуск сервера"). Со второго раза маловероятно, что попадется заблокированный IP.

Так сходу ответить сложно. Скажите какая ОС на клиенте и на сервере? Какой хостер? Что в логах openvpn при подключении?
Если честно, эта публикация и была задумана как инструкция, простая и доступная каждому.
Если что-то написано не достаточно понятно, то, пожалуйста, сообщите, будем дорабатывать.

Конечно можно! Просто заменяйте раздел "Создание сервера" на то, что соответствует любому другому хостеру. Все остальные пункты останутся без изменений. Никакого vendor-lock.
DigitalOcean здесь выбран просто как пример по ряду объективных параметров:


  • цена
  • качество
  • удобство

Не учитывались:


  • догадки
  • слухи
  • теории

Вы можете назвать любого другого хостера, которому лично вы больше доверяете, но это будет справедливо только в частном случае.
В общем-же случае, большинство уже сделало свой выбор.

1

Information

Rating
Does not participate
Works in
Registered
Activity