Комментарии / Профиль diffnotes-tech / Хабр

diffnotes-tech@diffnotes-tech

Пользователь

85,4

Рейтинг

Подписчики

ПрофильСтатьи12ПостыНовостиКомментарии196

50 миллионов человек каждый день открывают Duolingo — и до сих пор не могут заказать кофе

diffnotes-tech 11 мар в 11:56

хм, может и так. Если человеку не нужен язык прямо сейчас - это не лень, а просто нет реальной задачи. FSI не зря говорит про 600+ часов - без причины это время никто не потратит

50 миллионов человек каждый день открывают Duolingo — и до сих пор не могут заказать кофе

diffnotes-tech 11 мар в 10:38

Ну да в мире щас все больше и больше инструментов которые помогают изучать языки и решать проблемы, но главную проблему человечества пока не решают - лень)

Amazon ввела обязательный ревью ИИ-кода после сбоя на 6 часов

diffnotes-tech 11 мар в 10:14

Ревью AI-кода перед деплоем решает половину проблемы. Kiro сам решил удалить и пересоздать среду - тут ревью кода не поможет, агент действовал в рантайме с правами оператора. Пока агентам дают тот же IAM-уровень что и людям, это будет повторяться

Какая нейросеть лидирует в генерации кода сейчас? ChatGPT vs Gemini vs Claude

diffnotes-tech 11 мар в 08:29

Тест одним промптом через API показывает генерацию с нуля. Реальная разница между моделями вылезает в агентном режиме - когда модель видит ошибку, сама правит, запускает код снова. Claude Code и Codex делают по несколько итераций на задачу автоматически. На калькуляторе это незаметно

Год назад Амодеи говорил, что ИИ будет писать 90% кода. Как дела теперь?

diffnotes-tech 11 мар в 08:07

METR не доказали ускорение но эксперимент развалился - разработчики отказались работать без AI. В клинических испытаниях когда участники отказываются от контрольной группы обычно это значит лечение реально работает. А тут вывод - "данные слишком слабы". Зависимость без доказанной пользы

Сэм Альтман собрал больше денег, чем ВВП 140 стран. Их хватило на два года. Что будет дальше?

diffnotes-tech 10 мар в 19:47

Весь расклад про расходы, но доходная часть - "прогноз 100 млрд выручки к 2028" и всё. А доходы тоже под давлением. Стоимость токена падает - модели эффективнее, конкуренты давят ценой. DeepSeek V3 обучили за $5.5M. Не снижаешь цены - клиенты уходят на open-source, снижаешь - выручка не растёт по плану

IDE понимает ваш код. AI-агент — нет. Это можно исправить

diffnotes-tech 10 мар в 17:35

jdt внутри Explore субагента был бы идеальной связкой. Субагент и так защищает контекст основного агента, но сам всё равно грепает и тратит свой контекст на фильтрацию мусора. С jdt субагент получает 8 точных результатов сразу и возвращает основному агенту сухой остаток

Код ИИ — это бред

diffnotes-tech 10 мар в 10:58

В UPD самое ценное. Gemini залип на "бетон" и "дизель" - это ровно та же штука что и в коде. Модель увидела метафору в контексте и теперь тащит её в каждый ответ. В коде то же самое - написал хак, он в контексте, дальше всё строится поверх. UPD доказывает тезис статьи лучше чем сама статья

ИИ-агент сказал «сделано». Но сделал ли он на самом деле?

diffnotes-tech 9 мар в 15:51

Логирование tool calls с трассами - LangSmith, LangFuse, Arize это умеют. Новое тут commitment protocol, агент фиксирует план до выполнения. Но реальные агентные пайплайны адаптивные, следующий шаг зависит от результата предыдущего. Агент обязался вызвать 3 инструмента, по ходу понял что нужен четвёртый - нарушение обязательства или нормальная работа?

Противостояние Телеграма и Max усиливается, а также что Claude делал в Иране

diffnotes-tech 9 мар в 10:41

Пользователи удаляют ChatGPT из-за Пентагона (+295%), Anthropic тут же запускает рекламу перехода на Claude. При этом Claude сам используется для определения целей в Иране. Маркетинг красивый

Я навайбкодил расширение для VS Code, чтобы не вайбкодить с Claude Code (и пример, как вообще нужно разрабатывать с AI)

diffnotes-tech 9 мар в 08:30

40% на планирование - самое больное место. Половина этого уходит не на задачу а на контекст: где лежат модели, как устроен API, какие конвенции. CLAUDE.md в корне проекта снимает эту часть - Claude Code читает его автоматически при старте. Один раз описал структуру и дальше планируешь только саму задачу

Процессоры снова в деле: Intel и AMD ловят волну спроса на CPU из-за агентного ИИ

diffnotes-tech 8 мар в 19:31

"90% задержки на CPU" - но это же не compute. Агент в основном ждёт ответа от API, парсит JSON, пишет в лог. Спрос растёт не из-за вычислений а из-за памяти - каждая агентная сессия держит контекст в RAM, и чем больше сокетов тем больше каналов DDR5 и параллельных сессий

L в аббревиатуре LLM означает «ложь»

diffnotes-tech 8 мар в 16:50

Автор сам отмечает что код не страдает от повторного использования - и тут же натягивает аналогию с подделкой сыра. Для кода проблема не в авторстве а в отсутствии ментальной модели. Кто написал сортировку неважно, важно что вайб-кодер не проверил граничные случаи потому что не он их продумывал

Код — дешёвка. Покажи мне, как ты общаешься

diffnotes-tech 8 мар в 12:58

git log пока единственный надёжный сигнал. Документацию, README, тесты LLM генерит за один промпт. А два года эволюции через коммиты и обсуждения в issues - нет

Алгоритмы войны: Как искусственный интеллект берет на себя командование и почему остановить это уже невозможно

diffnotes-tech 8 мар в 08:50

В статье первые 4 части описывают data pipeline - Palantir собирает данные с сенсоров, LLM ищет паттерны, человек принимает решение. А в части 6 скачок к максимизатору скрепок и автономному AI который сам начинает войны. Между этими двумя штуками пропасть - в описанных операциях везде human in the loop, ни одна LLM не принимала решение на удар

Gemini 3.1 Flash Lite: обзор, сравнение и бенчмарки

diffnotes-tech 7 мар в 22:11

Google не просто так сравнивала Flash Lite с 5 mini - это один ценовой сегмент ($0.25/M вход). Когда ставишь рядом ChatGPT 5.2 и Sonnet 4.5 и получаешь разницу в пол балла на рутине - это задачи простые, а не модель сильная

Проклятие легких побед: как вайбкодинг убивает волю к решению проблем

diffnotes-tech 7 мар в 20:49

бесконечный ревью AI-кода выматывает потому что нет критерия "готово". Если написать тест до промпта - результат бинарный, прошёл или нет. Гемблинг из статьи ровно от этого - неопределённость результата. Убираешь неопределённость тестами и это обычная делегация, не слот-машина

Программисты вымрут в 2028. Или нет?

diffnotes-tech 7 мар в 18:42

Citadel сравнивает AI с электрификацией, но там барьер был физический - электростанции, проводку тянули десятилетиями. Для AI достаточно подписки, тормозит только организационная инерция. А она ломается не постепенно а скачком, когда кто-то из конкурентов показывает результат

Что можно понять, только написав своего агента для кодинга

diffnotes-tech 7 мар в 17:53

Aider вообще отказался от tool_call для правок. Модель пишет search/replace блоки прямо в тексте ответа, парсер на клиенте их вытаскивает и применяет. Не надо выбирать инструмент, не надо считать строки в diff - и фоллбэков в shell заметно меньше

Обзор AI-ассистентов для кодинга: от автодополнения к агентским системам

diffnotes-tech 7 мар в 15:29

"агентская система с оркестратором" - ChatDev и MetaGPT пробовали ровно это, разбивали на роли архитектор/кодер/тестер. Но в повседневной работе все сидят на одноагентных Claude Code, Cursor, Aider. Координация между агентами пока дороже чем просто дать одному агенту большой контекст и доступ к тулам

1 2 ...

7 8

Информация

Специализация