ИИ-бенчмарки больше не работают. И вот что с этим делать

Синтетические тесты в вакууме не показывают реальной пользы нейросетей. Индустрии пора переходить на метрики, где во главе угла стоят люди и жизненный контекст

Синтетические тесты в вакууме не показывают реальной пользы нейросетей. Индустрии пора переходить на метрики, где во главе угла стоят люди и жизненный контекст
Почему радикальные меры вроде возрастных цензов и отмены «Раздела 230» не сделают соцсети безопаснее.
От переводчика: ниже выжимка из этого длинного подкаста. Главные мысли и инсайты.
Суть в одном абзаце: В США прошли первые успешные «маркерные» суды против ИТ-гигантов (Meta*, YouTube), где истцы доказали: соцсети калечат психику подростков не из-за конкретных постов, а из-за самого дизайна платформ. Это создает прецедент, грозящий разрушить знаменитый «Раздел 230» — юридический щит, оберегавший корпорации последние 30 лет. Однако попытка политиков навести порядок и зарегулировать соцсети намертво сталкивается со свободой слова (Первой поправкой) и рискует обернуться тотальной цензурой в интернете.

Привет, Хабр! Меня зовут SlywerX, я студент 3 курса кафедры Программной инженерии МТУ (Алматы) и fullstack-разработчик. Несколько месяцев назад я задался вопросом: а как вообще работают языки программирования изнутри? Лучший способ разобраться — написать свой. Так появился SWX (Shadow Web eXploit) — скриптовый язык на базе Node.js с собственным синтаксисом, криптографией и даже HTML-рендерингом.
Сейчас SWX на версии 7.0.0. В этой статье расскажу как всё устроено, что было сложно и зачем это вообще нужно было делать.

Простые, но мощные паттерны для JavaScript: научитесь выбирать подходящий паттерн перед решением задачи и ускорьте своё решение алгоритмических задач.

Я давно пользуюсь FVD Speed Dial как основной экспресс‑панелью. Однажды после перенастройки сети (VPN, прокси, DNS) заметил неприятный эффект: любое слово, набранное в строке поиска новой вкладки, всегда улетало в Yahoo. Никаких настроек выбора поисковика в интерфейсе расширения не было — только встроенное поле, жёстко завязанное на внутреннюю логику FVD.
Системный поисковик Chrome я менял, но это никак не влияло на поведение FVD Speed Dial: расширение упрямо перенаправляло все запросы в Yahoo.

Бесплатных IDE для разработки микроконтроллеров не так уж много, а их интерфейс, основанный на Eclipse, вызывает у меня только страдания. В итоге разработка превращается в постоянное переключение с VSCode для редактирования кода в CubeIDE для его сборки и отладки.
Но почему бы не собрать все инструменты в VSCode в едином расширении, заодно подогнав автогенерацию проектов под стиль компании/личные предпочтения? Об и будет моя первая статья. Привет, Хабр!

Почему в биологических проектах уверенность нейронок часто опережает реальное научное понимание, и какие выводы из этого стоит сделать разработчикам.
Главный триумф AI в биологии - AlphaFold. Проект не возник из ниоткуда, он опирается на Protein Data Bank PDB базу данных, которую начали собирать еще в 1970-х. Успех модели обеспечили не только алгоритмы, но и десятилетия работы конкурса CASP, где эксперты верифицировали предсказания структур белков. Без жестких стандартов качества никакое GPU не дало бы результата. Многие команды пытаются применять ИИ там, где данных либо недостаточно, либо они не подходят. В медицине принято считать электронные медкарты золотой жилой, но для прорывов нужны новые биомаркеры и лабораторные исследования, которые сейчас недофинансированы.
Статья носит исключительно образовательный/ознакомительный характер. Она не служит цели, рекламировать какой-либо инструмент или ПО. Все наименования программного обеспечения, упомянутые в статье приведены из личного опыта.

Захотелось порассуждать вслух (впечать?) над мыслями из статьи. Я не буду нападать на представленную там математическую модель, потому что гуманитарий и нифига в них не понимаю (будете кидать тапками — кидай сразу оба — пару хоть продать можно). Но у меня вызвали недоумение исходные тезисы и вопросы автора и сама постановка проблемы.
Дисклеймер № 1: написано без внешних нейросетей. Только с помощью той, что в черепной коробке.
Дисклеймер № 2: написано без оглядки на хрупкую человеческую гордость. И с пониманием, что ко мне все ниже изложенное относится в той же мере, что и к любому другому человеку.

Тёплое зелёное свечение ИВ-11 и ИВ-6, современная электроника на STM32 и минималистичный корпус. Проект сочетает советскую эстетику 80-х с доступными современными компонентами.

Добрый день! Сегодня расскажу, как с помощью PHP создать генератор случайных байт ( чисел ) с помощью 12 таймеров. Энтропия данного генератора составляет примерно 7.1 бит на символ ( у меня ), но на более мощном железе может подняться до 7.9–8, что по идее неотличимо от истинной случайности. Вот, как работает весь «конвейер»:
Внимание! Проект экспериментальный, не сертифицирован, не рекомендуется для использования в системах, требующих официального криптографического одобрения. Для учебных целей и экспериментов — пожалуйста.

Модальные окна — один из самых недооценённых слоёв UI-архитектуры. Формы, подтверждения, панели действий — в любом крупном проекте их десятки. И почти в каждом проекте их управление со временем превращается в хаос.
Не потому что разработчики ленивые. А потому что модалки обманчиво просты. useState(false) — и готово. Пока модалка одна, в одном месте, с одним набором данных — проблем нет.

Часто слышу жалобы: мол, тебе повезло, ты снимать начинал почти 15 лет назад, тогда такой конкуренции не было. А как стать фотографом с нуля, если у каждого второго в кармане смартфон с тремя камерами, да еще и нейросети есть, чтобы любой кадр превратить в шедевр за минуту.
Забавно, но буквально такие же разговоры я слышал и много лет назад, когда только входил в профессию. Крутых мобильных камер не было, но купить зеркалку могли многие. Так что была и конкуренция, и демпинг, и необходимость доказывать, что твоя работа стоит столько. И у меня тоже порой были моменты, когда казалось, что успеха не добиться, и хотелось все бросить.
Поэтому я решил поделиться своей историей — как я делал первые шаги, что помогло не сдаться и в итоге найти себя в профессии. Возможно, это поможет тем, кто стоит на распутье, и мой путь позволит вам увидеть, что «подходящего момента» не бывает — он создается в процессе.

Зощенко умел писать точно, коротко и смешно. Попробовал с помощью Python математически установить лексические средства, которые делают язык писателя столь особенным и смешным.

Прочитал на Хабр статью [1], в которой автор простым языком даёт достаточно глубокое представление такого сложного и важного математического объекта как фильтр Калмана и захотел предложить читателям посмотреть на него (фильтр Калмана) несколько с другого ракурса. Сразу хочу предупредить, что перед чтением данной статьи хорошо бы прочесть статью [1], так как даже формулы были специально взяты ровно оттуда, дабы данная статья базировалась на материале упомянутой работы [1].
Представим, что у нас есть объект, работу которого необходимо отслеживать, но для этого нет прямой, а есть только косвенная информация. Например, мы имеем дело с погружным нефтяным насосом и необходима информация о его работе, в частности частота вращения двигателя данного насоса. В своём распоряжении мы имеем информацию лишь о напряжениях и токах его фаз и нам необходимо разработать виртуальный тахометр.
Общая идея такова: берём математическую модель двигателя и в режиме реального времени «запитываем» её показаниями датчиков напряжений фаз работающего двигателя насоса. Показания датчиков тока используем для того, чтобы в реальном времени втянуть виртуальную модель в такой режим, при котором виртуальные показания квазидатчиков тока математической модели станут равны показаниям реальных датчиков тока. То есть в этом случае мы получим виртуальную real time модель из которой можем взять любую информацию, которой она располагает, в частности частоту вращения электродвигателя.
А теперь изложенную идею попробуем воплотить в виде математических абстракций.

Это первая часть из задуманной серии статей про ИИ. Здесь мы на немного заступим в техническую часть памяти/контекста LLM моделей. Разберем, почему они частенько забывают или выдумывают факты и врут.

Не знаю, как вам, а мне кажется — не очень-то у него выходит.
Вообще-то, если смотреть не на слова, а на дела, различий между ними кот наплакал. Оба в конечном счёте принадлежат к одной и той же касте — касте техно-олигархов.
И давайте прямо сейчас расстанемся с иллюзиями и признаем одну простую вещь: мы нужны им ровно в двух ролях — как поставщики поведенческих данных и как потребители их блестящих безделушек.
Если их галлюцинирующие боты иногда и делают для нас что-то полезное, причина ровно одна: пока ни у кого из них нет монополии на ИИ-рынке.
Если тема управления задачами в Obsidian вам близка - заглядывайте в мой тг-канал, там я разбираю подобные вещи регулярно.

Кто давно читает публикуемые здесь материалы, тот знает про мой интерес к мозгу, психике и вопросу о продуктивности. Когда речь заходит о продуктивности, то возникает закономерный вопрос: могу ли я что-то принять, чтобы быть умнее, сосредоточеннее, усидчивее? С одной стороны, у нас уже есть кофе, который бодрит, но есть ли что-то более фундаментальное? Да, есть. Но то, как работают базовые «смарт-таблетки», не влияет на интеллект, и не улучшает качество когнитивных усилий. А вот что именно улучшают эти таблетки и как их тестировали – в материале.

В 2026 году крипторынок в России перестает быть серой зоной. Собрал законы (на начало апреля) и сделал обзор того, что сейчас происходит с P2P, криптообменниками, биржами, банками , госрегулированием и куда это нас ведет.
+ Бонус: чек-лист, для новичков, что бы минировать шансы блокировки при работе с криптой.