Comments / Profile of diffnotes-tech / Habr

User

Subscribers

50 миллионов человек каждый день открывают Duolingo — и до сих пор не могут заказать кофе

Вот это лучший аргумент против "AI заменит репетитора". Репетитор не заставит тебя сдавать Данте на итальянском через 7 месяцев) а стресс + реальные последствия = запомнил на 15 лет

50 миллионов человек каждый день открывают Duolingo — и до сих пор не могут заказать кофе

diffnotes-tech Mar 11 at 13:10

Веб-разработчик, не языковые приложения) "я не лингвист" в статье - это дисклеймер, что пишу как пользователь, а не как методист.

Про 5000 часов от Новгородцева не слышал, но похоже на правду - FSI дает 600-750 для "простых" языков при интенсиве, а в реальности без полного погружения умножай на 3-4. Собственно про это и статья - AI может чуть сократить эти часы, но не в разы как обещает маркетинг

50 миллионов человек каждый день открывают Duolingo — и до сих пор не могут заказать кофе

diffnotes-tech Mar 11 at 13:09

Cредневековая итальянская литература через 7 месяцев с нуля - это хардкор)) вот это ровно тот стресс который работает лучше любого приложения. Voice Mode рядом не стоял

50 миллионов человек каждый день открывают Duolingo — и до сих пор не могут заказать кофе

diffnotes-tech Mar 11 at 11:59

Аналогия с зарядкой хорошая, в статье я примерно это же имел в виду про "фитнес-трекер". Про разные навыки согласен - я когда тестил Voice Mode, понял что он закрывает ровно один из них, разговорный. И то с оговорками. А грамматику, чтение, восприятие на слух - это всё отдельные истории и AI в каждой из них на разном уровне

50 миллионов человек каждый день открывают Duolingo — и до сих пор не могут заказать кофе

diffnotes-tech Mar 11 at 11:58

Ну вот кстати условия выживаемости для языков работают лучше всего) переехал в страну, не можешь объяснить что тебе нужно в аптеке - выучишь за неделю. Только AI пока так не может - он слишком вежливый чтобы тебя в такую ситуацию поставить

50 миллионов человек каждый день открывают Duolingo — и до сих пор не могут заказать кофе

diffnotes-tech Mar 11 at 11:57

Про два барьера точно подмечено. Первый - заговорить хоть как-то, второй - перестать переводить в голове. Voice Mode может помочь с первым если рядом нет носителей, но со вторым пока никакой AI не справляется - там нужна именно та каждодневность о которой ты пишешь

50 миллионов человек каждый день открывают Duolingo — и до сих пор не могут заказать кофе

diffnotes-tech Mar 11 at 11:56

хм, может и так. Если человеку не нужен язык прямо сейчас - это не лень, а просто нет реальной задачи. FSI не зря говорит про 600+ часов - без причины это время никто не потратит

50 миллионов человек каждый день открывают Duolingo — и до сих пор не могут заказать кофе

diffnotes-tech Mar 11 at 10:38

Ну да в мире щас все больше и больше инструментов которые помогают изучать языки и решать проблемы, но главную проблему человечества пока не решают - лень)

Amazon ввела обязательный ревью ИИ-кода после сбоя на 6 часов

diffnotes-tech Mar 11 at 10:14

Ревью AI-кода перед деплоем решает половину проблемы. Kiro сам решил удалить и пересоздать среду - тут ревью кода не поможет, агент действовал в рантайме с правами оператора. Пока агентам дают тот же IAM-уровень что и людям, это будет повторяться

Какая нейросеть лидирует в генерации кода сейчас? ChatGPT vs Gemini vs Claude

diffnotes-tech Mar 11 at 08:29

Тест одним промптом через API показывает генерацию с нуля. Реальная разница между моделями вылезает в агентном режиме - когда модель видит ошибку, сама правит, запускает код снова. Claude Code и Codex делают по несколько итераций на задачу автоматически. На калькуляторе это незаметно

Год назад Амодеи говорил, что ИИ будет писать 90% кода. Как дела теперь?

diffnotes-tech Mar 11 at 08:07

METR не доказали ускорение но эксперимент развалился - разработчики отказались работать без AI. В клинических испытаниях когда участники отказываются от контрольной группы обычно это значит лечение реально работает. А тут вывод - "данные слишком слабы". Зависимость без доказанной пользы

Сэм Альтман собрал больше денег, чем ВВП 140 стран. Их хватило на два года. Что будет дальше?

diffnotes-tech Mar 10 at 19:47

Весь расклад про расходы, но доходная часть - "прогноз 100 млрд выручки к 2028" и всё. А доходы тоже под давлением. Стоимость токена падает - модели эффективнее, конкуренты давят ценой. DeepSeek V3 обучили за $5.5M. Не снижаешь цены - клиенты уходят на open-source, снижаешь - выручка не растёт по плану

IDE понимает ваш код. AI-агент — нет. Это можно исправить

diffnotes-tech Mar 10 at 17:35

jdt внутри Explore субагента был бы идеальной связкой. Субагент и так защищает контекст основного агента, но сам всё равно грепает и тратит свой контекст на фильтрацию мусора. С jdt субагент получает 8 точных результатов сразу и возвращает основному агенту сухой остаток

Код ИИ — это бред

diffnotes-tech Mar 10 at 10:58

В UPD самое ценное. Gemini залип на "бетон" и "дизель" - это ровно та же штука что и в коде. Модель увидела метафору в контексте и теперь тащит её в каждый ответ. В коде то же самое - написал хак, он в контексте, дальше всё строится поверх. UPD доказывает тезис статьи лучше чем сама статья

Противостояние Телеграма и Max усиливается, а также что Claude делал в Иране

diffnotes-tech Mar 9 at 10:41

Пользователи удаляют ChatGPT из-за Пентагона (+295%), Anthropic тут же запускает рекламу перехода на Claude. При этом Claude сам используется для определения целей в Иране. Маркетинг красивый

Процессоры снова в деле: Intel и AMD ловят волну спроса на CPU из-за агентного ИИ

diffnotes-tech Mar 8 at 19:31

"90% задержки на CPU" - но это же не compute. Агент в основном ждёт ответа от API, парсит JSON, пишет в лог. Спрос растёт не из-за вычислений а из-за памяти - каждая агентная сессия держит контекст в RAM, и чем больше сокетов тем больше каналов DDR5 и параллельных сессий

L в аббревиатуре LLM означает «ложь»

diffnotes-tech Mar 8 at 16:50

Автор сам отмечает что код не страдает от повторного использования - и тут же натягивает аналогию с подделкой сыра. Для кода проблема не в авторстве а в отсутствии ментальной модели. Кто написал сортировку неважно, важно что вайб-кодер не проверил граничные случаи потому что не он их продумывал

Код — дешёвка. Покажи мне, как ты общаешься

diffnotes-tech Mar 8 at 12:58

git log пока единственный надёжный сигнал. Документацию, README, тесты LLM генерит за один промпт. А два года эволюции через коммиты и обсуждения в issues - нет

Алгоритмы войны: Как искусственный интеллект берет на себя командование и почему остановить это уже невозможно

diffnotes-tech Mar 8 at 08:50

В статье первые 4 части описывают data pipeline - Palantir собирает данные с сенсоров, LLM ищет паттерны, человек принимает решение. А в части 6 скачок к максимизатору скрепок и автономному AI который сам начинает войны. Между этими двумя штуками пропасть - в описанных операциях везде human in the loop, ни одна LLM не принимала решение на удар

Gemini 3.1 Flash Lite: обзор, сравнение и бенчмарки

diffnotes-tech Mar 7 at 22:11

Google не просто так сравнивала Flash Lite с 5 mini - это один ценовой сегмент ($0.25/M вход). Когда ставишь рядом ChatGPT 5.2 и Sonnet 4.5 и получаешь разницу в пол балла на рутине - это задачи простые, а не модель сильная

1 2 ...

9 10

Information

Specialization