Search
Write a publication
Pull to refresh
1
0.1

AI инженер, локальные LLM модели, AI агенты.

Send message

А почему для создания собственного датасета Вы используете именно OpenRouter API?

Техническая поправка.

gpt-oss-120b можно запустить на 24GB VRAM и 128GB RAM . Да медленно, но что бы понять разницу с gpt-oss-20b достаточно.

Видно, что хотели как лучше.
Особенно доставил пункт: Отсутствие автономных изменений.
Сознательно программируется отставание. Так то считается, что Self-Adaptive Large Language Models — это путь к созданию полноценного AGI.

Сталкивался с подобным поведением  LLM. И ChatGPT, и Grok после определенного количества запросов забывают детали проекта. Что помогает:

1. Не перескакивать с одного проекта на другой (для рецепта борща использовать бесплатную версию).

2. В промпте использовать референсы: после текста с описанием задачи добавлять — «Reference: здесь добавить copy-paste code непосредственно относящиеся к текущей задаче.

3. Так же можно подгрузить последнюю версию проекта и жестко указать: Current version of «part of project» - use it as a base.

Это означает лишь то, что предвзятость модели создается на этапе создания и фильтрации датасета. С нетерпением жду модели которая будет самостоятельно собирать и формировать развитие собственного датасета.

Вряд ли создание мощного железа повлияет на ранжировку полного доступа к моделям. Здесь речь скорее идет о иерархии человеческого общества. По крайней мере до создания полноценного AGI.

Не думаю, что имущественный ценз является основным критерием доступа к полным (unrestricted) возможностям современных (Frontier AI) моделей. По крайней мере не в диапазоне сотен долларов. На уровне, где деньги смыкаются с властью (Х, Мета, правительства значимых стран) там полный доступ возможен, а для всех остальных доступ будет (да уже есть) ранжирован с учетом цветовой гаммы штанов.

Information

Rating
9,147-th
Registered
Activity