All streams
Search
Write a publication
Pull to refresh
3
0
Павел Коковин @Per_Ardua

Frontend developer

Send message
  1. Добавление MCP серверов практически по клику. Не смотрел как они под капотом промпты настроли, но добавляет всякие интеграции с использованием mcp он действительно хорошо (у меня из юзабельных, что он сам сделал: RAG для контрактов и доков по проекту и поиск по stack overflow и reddit).

  2. Векторный поиск по коду (это скорее не фича, но преимущество), который работает лучше чем у Cursor (у них вроде tree-sitter).

  3. Как выше написали, в плюсах ещё быстрое разбиение на таски.

    Из моделей - клауд конечно топ. Но я использую несколько для разных целей. Gemini 2.0 flash thinking для создания плана на тасках средней сложности (справляется неплохо, если данных достаточно). Codestral на реализацию таких планов. Для мелочей подходит и codestral и qwen2.5 7b (который можно и локально поднять). Но я периодически пробую разные модели, для чего-то одно больше подходит, для чего-то другое. В любом случае, можно получить отличный результат совершенно бесплатно (хотя у меня gemini корпоративный, можно на бесплатке он сейчас совсем плохо работает, но раньше норм был).

Подозреваю 7b. Вот, не так давно натыкался на табличку с memory usage от пользователя reddit: https://www.reddit.com/r/LocalLLaMA/comments/1g8tit7/benchmarking_qwen_25_14b_q5_vs_coder_7b_q8_25_v3/

24 минуты? Хабр автоматически определяет, сколько нам нужно времени, чтобы разобраться с задачей в посте.

Чего не хватает обоим

Да, связка VSCode + Cline/RooCode + Continue закрывает большую часть функционала Cursor и предоставляет пару полезных фич, которые в Cursor не известно когда появятся. По качеству агента разницы тоже особо не заметил. Стоимость при этом: 0.

RL изначально лежал на поверхности и о нём точно думал каждый разработчик языковых моделей. Даже удивительно, что ощутимые результаты он начал давать только сейчас (по крайней мере ранее мне не попадалась информация о прорывах в этом направлении).

Если сильно чихнуть при просмотре видео на таком, то на руках останется две его половинки

За описание паттернов плюс.

Но что это за странные попытки выделить Spring AI на фоне других систем?

Преимущества реализаций в Spring AI

Ни одного же уникального пункта, который бы отсутствовал в других системах? Или тут преимущества по сравнению с низкоуровневой реализацией?

Но в целом - спасибо за перевод.

Это немного фиксится понижением температуры и top_p параметра. Но именно что немного. Лишь как следствие общего уменьшения галюцинирования.

Уверенность в своих неверных измышлениях остаётся прежней.

Может у o3 моделей с этим будет получше?

x10 - это теоретический предел. Хорошо будет, если хотя бы в 5 раз ёмкость будет выше. И с авиа/авто тоже своих проблем достаточно, которые надо будет решить. Всё же они отличается от литий-ионных и там нужны будут свои технологии (зарядка, балансировка, системы безопасности, износостойкости). Куча всего, без чего можно обойтись для использования в персональных девайсах, но никак не обойтись при адаптации технологии под нужды транспорта.

Ходил с китайцем пять лет, ни разу не отдавал в ремонт или как-либо иначе обслуживал. Сразу после покупки заряд держал трое суток. В конце эксплуатации - полтора. Это при 5-6 часах включенного экрана в день. Поменял (на нового китайца), так как последние месяца 3-4 стал подлагивать.

Но в общем - согласен, большинство знакомых дольше трёх лет на одном устройстве не сидят.

Побольше видеопамяти надо, раз так в десять, чтоб хоть немного профит почувствовать, либо нужны очень специфические запросы, чтобы изолированно использовать только минимальную часть весов и не гонять эти веса туда-сюда. В общем, смысла не вижу, с быстрой ddr5 и парой средних серверных процов можно получить свои 5-10 токенов в секунду и не думать о vram, за которую придётся отдать больше чем за ипотеку.

Есть такое.

Но в статье, всё же, данные не консистенты. Мой комментарий именно об этом.

Локальный только агент (мультиагентная система), как и, практически, все агенты за исключением пары основных игроков. Но работает он на всё тех же облачных LLM. Из новости этого совершенно не понятно.

Но в общем - выглядит неплохо, жаль, что только консольный тип под windows (а ведь большая часть СНГ юзеров сидят именно на ней на своих домашних ПК).

Для рабочих же тасок не думаю, что он справится лучше того же расширения cline в VSCode. Но попробую намедни.

На основе того, что по данным этих бенчмарков Qwen2.5-Max проигрывает GPT-4o в трёх бенчмарках из пяти

Судя по графику проигрывает же антропику с их соннетом?

Кто же с этим спорит? Я написал, что без выделения эта конструкция сбивает. Поясню, что без выделения эта конструкция вносит двусмысленность.

(Олбанский не учил, но теперь буду знать, что такой язык кто-то да знает)

Там и в задаче с коробками сбивающая лексическая конструкция "А ещё" без выделения запятой. Я человек, но мне пришлось перечитать задачу, чтобы понять, что речь всё же не о трёх коробках.

Подумывал запостить подобную техническую статью о сделанном ИИ-агенте по работе с телеграмм, которым пользуюсь и отправляю сообщения друзьям/жене (они в курсе). Но посмотрел на реакцию хабра и передумал...

Да, граудинг - вещь топовая. Задумывалась, правда, не так, как большинство её используют)

И не слова на Хабре про уже свершившуюся революцию - кремний-углеродную батарею, которую ставят сейчас в большинство флагманов. Именно из-за неё на рынке появились относительно тонкие девайсы с элементами питания на 7000mAh.

Странно, что на этом ресурсе так и не увидел ни одной статьи на эту тему.

Information

Rating
Does not participate
Location
Новосибирск, Новосибирская обл., Россия
Date of birth
Registered
Activity