Обновить
1069.5

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Лифт не знает, куда ехать. И это лучший алгоритм, который мы придумали

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели1.2K

Вчера я 4 минуты стоял в подъезде и смотрел, как два лифта одновременно поехали вверх. Все два. На табло — 12, 15, 18. Я на первом. Мне на шестой. И я подумал: вот я кучу лет пишу софт, оптимизирую запросы к базе данных, кеширую всё что движется — а эти две коробки на тросах не могут разобраться, кто из них должен спуститься за мной.

Потом я погрузился в тему. И выяснил, что они не «не могут разобраться». Они математически не способны найти идеальное решение. Вообще никто не способен. Задача диспетчеризации группы лифтов — NP-трудная. То есть буквально: не существует алгоритма, который гарантированно найдёт оптимальный маршрут за разумное время.

И вот уже 60 лет лучшие инженеры мира решают эту задачу эвристиками. По сути — догадками.

Читать далее

Новости

8 уровней агентной инженерии

Уровень сложностиСредний
Время на прочтение12 мин
Охват и читатели2.6K

Способности AI в написании кода растут быстрее, чем наше умение этими способностями пользоваться. Поэтому рост баллов на SWE-bench не коррелирует с метриками продуктивности, которые волнуют инженерных руководителей. Когда команда Anthropic выкатывает продукт вроде Cowork за 10 дней, а другая команда не может довести до ума сломанный POC на тех же моделях, разница в одном: первые закрыли разрыв между возможностями моделей и практикой, вторые — нет.

Этот разрыв не закрывается за одну ночь. Он закрывается по уровням. Их 8. Большинство читающих эту статью, скорее всего, уже прошли первые несколько, и стоит стремиться к следующему, потому что каждый новый уровень — это резкий скачок производительности, а каждое улучшение моделей усиливает этот эффект ещё больше.

Читать далее

Первый в мире коммерческий мозговой имплант: Китай обошел Neuralink в нейротехнологической гонке

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели3.9K

Китайский регулятор выдал первую в мире лицензию на коммерческое использование инвазивного интерфейса «мозг-компьютер». Разрешение получило устройство NEO, которое позволяет парализованным пациентам силой мысли управлять роботизированной перчаткой.

Это решение переводит нейротехнологии из стадии экспериментальных клинических испытаний, на которой сейчас находятся американские аналоги вроде Neuralink, в статус легального серийного медицинского продукта. Выдача лицензии спровоцировала резкий скачок акций профильных биотехнологических компаний на азиатских биржах.

Читать далее

Отток до оттока: churn-модели в банковском проде

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели5.6K

В банковском churn проблема почти никогда не выглядит как «вчера клиент был с нами, а сегодня закрыл счет». Гораздо чаще отношения распадаются медленно: зарплата еще приходит в старый банк, но деньги почти сразу уходят наружу; карта остается открытой, но перестает быть основной; приложение клиент по-прежнему открывает, но все реже. Формально он еще с вами. Экономически — уже почти нет. Для аналитика это важное различие: объектом моделирования становится не только юридическое событие ухода, а деградация primary relationship — снижение остатков, миграция регулярных платежей, выпадение из цифрового контура и ослабление продуктовой связки. Этот контекст не абстрактный: BAI в обзоре на 2024 год выделял рост депозитов как один из главных приоритетов банков, а это автоматически повышает ценность раннего обнаружения деградации клиентских отношений.

В этой статье — не очередной обзор уровня «ML помогает удерживать клиентов», а разбор того, как churn-модели реально выглядят в банковском пайплайне: какие признаки обычно работают, где бинарная классификация ломается, зачем нужен uplift, почему survival analysis часто полезнее обычного churn-label и какие регуляторно-этические ограничения становятся нетривиальными, когда модель используется не только для скоринга, но и для принятия решений.

Читать далее

Семантический поиск vs полнотекстовый: сравниваем три embedding-модели на 10 000 категорий Ozon

Время на прочтение10 мин
Охват и читатели7.1K

Сравнил полнотекстовый поиск PostgreSQL (tsvector/tsquery + GIN-индекс) с семантическим поиском через pgvector (cosine distance) на датасете из 10 019 товарных категорий Ozon.

Три embedding-модели:

GigaChat EmbeddingsGigaR (Сбер, 2560-мерные векторы, API)

Qwen3-Embedding-0.6B (Alibaba, 1024-мерные, локальный инференс через HF Text Embeddings Inference на GPU)

text-embedding-3-small (OpenAI, 1536-мерные, API)

Прогнал 18 запросов в пяти категориях: синонимы и сленг, intent-запросы в свободной форме, подарочная тематика, cross-lingual (EN-запросы к RU-данным), абстрактные формулировки. Замерил латентность и top-5 с cosine similarity score.

Разбор каждого запроса, таблицы и код — под катом.

Читать далее

От конечных автоматов к биомиметике: детерминированный ИИ больше не нужен

Время на прочтение2 мин
Охват и читатели5.3K

ИИ-разработчики стали викторианскими хирургами, сшивая неживые алгоритмы. Почему детерминизм графов — это архитектурная клетка, и как синтетическая физиология подарит ИИ подлинную автономность.

Читать далее

Universität или Fachhochschule: что выбрать для бакалавриата по CS/AI в Германии

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели8.6K

Я работаю в классическом немецком университете и каждый год вижу одну и ту же картину: русскоязычные абитуриенты рассматривают исключительно классический Universität как место возможного получения высшего образования, не зная, что в Германии существует и другая модель образования — Fachhochschule. Не потому что она хуже, а просто потому, что про нее российские студенты и абитуриенты просто не знают. Я постараюсь это исправить и немного поговорить о том, в чем же сходство и различие этих двух высших учебных заведений. Сразу оговорюсь: ниже речь именно о бакалавриате по Computer Science (CS) и Artificial Intelligence (AI).

Читать далее

Ваш CLAUDE.md делает агента тупее. Исследование на 138 репозиториях это доказало

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели7.2K

Я написал CLAUDE.md на 200 строк. Исследование ETH Zurich на 138 репозиториях говорит: мой агент стал от этого тупее на 3%, а я плачу на 20% больше за токены. Разбираюсь, что пошло не так.

Читать далее

Краткая история искусственного распознавания запахов: от разработок Figaro Engineering до машинного обучения

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели6.4K

Полупроводниковые приборы довольно быстро внедрились во все области науки и техники, путь, а начатые в 1940-е годы исследования влияния газов на электрофизические характеристики полупроводников поставили на повестку дня и обратную задачу – определения газов по изменению этих характеристик полупроводника, и это заняло гораздо больше времени. Первопроходцем здесь считается японский изобретатель Наёси Тагучи.

Основанная им компания Figaro Engineering Inc. с 1969 года начала производство и продажу газовых детекторов сначала для самых опасных газов, а затем для самых разных летучих субстанций, как пахучих, так и без запаха, под товарным знаком Figaro.

Читать далее

Производство теряло деньги каждую смену. До внедрения видеоаналитики с ИИ никто не знал где

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели12K

Привет! На связи Олег Чебулаев, CEO Mad Brains. Хочу поделиться историей из практики — как обучить модель YOLO, запустить видеомониторинг на пищевом производстве и через неделю обнаружить кое-что, о чём на заводе предпочитали не говорить вслух.

Читать далее

OpenAI размещает рекламу в ChatGPT, Oracle тонет в долгах, а SoftBank точит когти. Что происходит со Stargate?

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели8K

Как бы ни старались бенефициары ИИ-пузыря прятать противоречия, разрывающие его изнутри, — правда вылезает наружу. Буквально на днях The Information оглушил всех очередным тревожным отчётом: между главными участниками проекта Stargate — OpenAI, SoftBank и Oracle — возникли серьёзные разногласия, которые могут похоронить весь проект.

Читать далее

Неофициальный Python-клиент для alphaxiv: как мы нашли скрытый API и упаковали его в пакет

Уровень сложностиСредний
Время на прочтение14 мин
Охват и читатели7.8K

У alphaxiv.org есть API — но найти его было непросто: публичная документация появилась совсем недавно, а до этого единственный способ разобраться в том, как он работает, — DevTools и живой трафик браузера. POST-запрос к api.alphaxiv.org/assistant/v2/chat, SSE-поток в ответе, модель aurelle-1.

На основе этого исследования мы собрали aurelle-py — Python-пакет для программного доступа к AI-ассистенту alphaxiv: задавать вопросы по arXiv-статьям, стримить ответы, встраивать в исследовательские пайплайны. Мы не первые, кто занялся этой темой, — но постарались сделать решение аккуратным и хорошо задокументированным.

Что внутри: синхронный и асинхронный клиенты, SSE-парсер с независимым юнит-тестированием, Pydantic v2 для валидации, типизированные исключения (AuthError, RateLimitError), MCP-сервер для интеграции с Claude Desktop и Claude Code.

pip install aurelle-py

В статье — как мы нашли эндпоинт, разобрали формат запроса и ответа, какие ограничения выявили опытным путём и как устроен пакет внутри.

GitHub: https://github.com/center4aai/aurelle-py

Читать далее

Тихая эволюция zero-shot энкодеров. От UniNER до GLiNER 2

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели9K

Пока все говорят про LLM агентов, есть целый класс задач где 205M энкодер делает ту же работу что ChatGPT — быстрее, дешевле, без vendor lock‑in. Я хочу рассказать про эволюцию энкодеров, которую вы возможно пропустили: начиная от UniNER, заканчивая GLiNER 2, с ключевыми инсайтами на каждом шаге.

Читать далее

Ближайшие события

Как обнаружить заказной негатив с помощью скриптов

Время на прочтение7 мин
Охват и читатели8.7K

По данным Data Insight 30% отказов от покупок связано с заказным негативом. Раньше ботов вычисляли по шаблонным фразам, но сейчас спамеры массово генерируют жалобы через LLM. Модерация геосервисов пропускает такой контент. Формально отзывы уникальны и не нарушают правила площадок. Ручная проверка тысяч комментариев требует десятков часов работы аналитика и не исключает человеческий фактор. Визуально отличить качественный фейк от мнения реального клиента стало невозможно.

Противостоять генеративным сетям можно только программными методами. Автоматизировать поиск аномалий в поведении пользователей помогают скрипты на Python. Этот контур защиты включает парсинг данных с обходом лимитов API, вычисление временных выбросов через Z-оценку и семантический анализ текстов с учетом морфологии русского языка (через библиотеку Natasha). Это базовый алгоритм, который позволяет перевести защиту репутации из ручной разметки в измеримый технический процесс.

Читать далее

Этот ИИ ведёт дневник, заводит баг-репорты, избегает сложных задач, а существует всего 5 дней

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели7.4K

Сейчас расскажу историю, от которой немного сносит крышу.

Разработчик по имени Лиюаньхао сел и написал 200 строк кода на Rust.

Всё. Крошечный, голый скрипт.

Но то, что произошло после нажатия кнопки «запустить», — из тех вещей, которые перечитываешь дважды, чтобы убедиться, что тебе не показалось.

Он назвал проект yoyo — самоэволюционирующий кодинг-агент. А потом — и вот это то, что по-настоящему цепляет — полностью отошёл. Убрал руки с клавиатуры.

Дал одну-единственную инструкцию: эволюционируй, пока не сравняешься с Claude Code. И просто сел смотреть.

Знаете это чувство — когда ткнёшь семечко в землю, напрочь забудешь про него, а потом проходишь мимо и видишь, как из земли лезет живое, настоящее растение? Вот примерно это и случилось. Только это растение не просто выросло. Оно проснулось и начало само заводить баг-репорты.

Читать далее

NVIDIA Nemotron, Claude фиксит Firefox, ИИ буллит программиста и суд против Google за смерть пользователя

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели7K

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя вышла насыщенной: гибридная 120B модель от NVIDIA, Claude нашёл 22 дыры в Firefox, а ChatGPT и Gemini интегрировались в Excel и Google Docs. Голливуд заставил ByteDance убрать видеомодель, а ЕС запретил дипфейки после скандала с Grok.

Всё самое важное — в одном месте. Поехали!

Читать дайджест →

Топ-10 бесплатных нейросетей для создания презентаций в 2026 году

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели7.7K

Помню, как в школе мне впервые задали сделать презентацию на классный час. Тогда я едва дружил с этими сервисами, и весь процесс казался настоящим испытанием. Я сидел несколько часов за красным фоном, пытаясь поставить текст и подобрать картинки. Волновался, переживал, и, честно говоря, результат был далёк от идеала.

Проходит время, а мы видим, как быстро всё меняется. Сегодня презентации можно создавать почти мгновенно, а нейросети умеют сами подбирать тексты, искать иллюстрации, предлагать оформление. Конечно, всегда результат требует доработки и факт-чекинга.

И именно поэтому сегодня хочется познакомить вас с десятью сервисами, которые помогут сделать презентацию. Они не всегда сделают всё за вас, но отлично формируют костяк, с которым можно работать дальше и получать действительно крутой результат.

Приятного чтения!

Читать далее

Что происходит с разработчиками, когда ИИ берёт на себя 80% их работы

Уровень сложностиПростой
Время на прочтение16 мин
Охват и читатели10K

На одном из недавних мероприятий эксперты из Сбера, Яндекса и red_mad_robot обсуждали внедрение ИИ в жизненный цикл разработки продукта — AI PDLC. В выступлениях снова и снова звучала одна и та же мысль: роль разработчика меняется. Всё чаще он не пишет код вручную, а формулирует задачу для ИИ, проверяет результат, удерживает архитектурный замысел и задаёт рамки.

Если выстроить эту дискуссию в логике «от стратегии к человеку, от человека — к производственной практике, а затем — к рыночным кейсам», картина становится особенно ясной. Сначала — взгляд Сбера на зрелость AI‑driven разработки. Затем — разбор того, что этот сдвиг делает с людьми. После этого — разговор о том, что действительно работает в корпоративной среде. И уже потом — внешние кейсы Яндекса и red_mad_robot, на которых видно, как меняется повседневная инженерная работа и экономика выпуска продукта.

Читать далее

Линейка HighFreq или как выжать из облака максимум для инференса, ML и других высоких нагрузок

Время на прочтение10 мин
Охват и читатели7.6K

«Больше» — не всегда значит «лучше». К пользовательским приложениям в облаках это замечание относится в полной мере. Производительность любой системы определяется ее самым медленным компонентом — «бутылочным горлышком».

Когда проект вырастает до высоких нагрузок, простое «накликивание» дополнительных виртуальных процессоров или оперативной памяти в стандартной конфигурации может не решить корневую проблему. Это все равно, что расширять дорогу перед железнодорожным переездом — новых полос много, но быстрее доехать не получится.

Сегодня мы разберем, почему стандартных, универсальных инструментов бывает недостаточно для высокопроизводительных задач. Мы также покажем, как правильно диагностировать узкие места и подбирать сбалансированную конфигурацию — процессор, диски, сеть — под конкретные рабочие нагрузки.

Сделаем это на примере реальных сценариев и продуктов. Посмотрим, что могут специализированные решения дать там, где универсальные подходы не справляются.

Читать далее →

Как я перестал переключать раскладку ради одного символа: Прокачиваем русскую клавиатуру в Windows для Markdown и кода

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели14K

Стремительное развитие ИИ в последние годы привело к невиданному росту популярности Markdown. Почти все современные LLM — от ChatGPT до Claude — по умолчанию выдают ответы в этом формате. Мы привыкли оформлять в нем заметки в Obsidian, писать промпты, вести документацию в GitHub и общаться в рабочих мессенджерах. Markdown стал «лингва-франка» современного интернета.

Но есть одна проблема. Использовать Markdown с русским языком — это боль.

Вам нужно поставить заголовок? Alt+Shift -> # -> Alt+Shift обратно. Нужно выделить код? Снова чечётка по клавишам переключения раскладки. Стандартная русская раскладка в Windows будто застряла в прошлом веке. Клавиша Shift+3 выдает нам символ , который в 2024 году нужен крайне редко, в то время как жизненно необходимые решетки, собаки и скобки заставляют нас постоянно прыгать между языками.

Я решил эту проблему для Windows с помощью небольшого скрипта на AutoHotkey (v2).

Читать далее
1
23 ...