Обновить
1091.54

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Как мы вкатывались в генеративный ИИ и куда катимся дальше

Уровень сложностиСредний
Время на прочтение14 мин
Охват и читатели3.1K

Сегодня я хочу рассказать о внедрении финансового генеративного чат-бота в финтех и о том опыте, который был приобретен за время запуска этого проекта. Эта статья написана с целью объяснить концепции и трудности, с которыми мы с командой столкнулись, поэтому постараюсь обойтись без особого погружения в технические детали.

Приступим

Новости

re!think it: Как я уместил корпоративный бэкенд в один промпт (История сборки)

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели4K

Краткая история о том, как утренняя переписка с моделью превратилась в создание системного промпта на 1000 токенов. Внутри заложен алгоритм размышлений, позволяющий модели работать вдумчиво и объясняющий ей на языке формул, как человек принимает решения (исходя из своего личного опыта и понимания).

То, чего я не ожидал на старте — на выходе получилась очень компактная системная инструкция. В действительности она заменяет огромное количество функций, которые ИИ-гиганты выстраивают вокруг моделей.

Читать далее

97 часов на одной RTX 4090: MoE с подключаемыми экспертами, самодистилляция и почему перплексия — плохая метрика

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели4.3K

Всё началось с простой идеи: что если подключать к языковой модели новые «навыки» как приложения к смартфону — без переобучения, без деградации, за полчаса? Я потратил 22 шага экспериментов и 97.5 GPU-часов на одной видеокарте, чтобы это проверить. Архитектура заработала идеально. А потом выяснилось, что модель, которая говорит на языке математики, совершенно не умеет решать задачи. Это история о том, как красивая метрика обманула исследователя.

Читать далее

ИИ в образовании: заменят ли нейросети репетиторов и преподавателей

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели4.8K

Представьте картину маслом: вторник, восемь вечера. Петя, ученик 9-го класса, тупит над квадратным уравнением. Рядом нет репетитора (дорого), родители заняты. Петя открывает ноутбук, заходит в ChatGPT и пишет: «Объясни квадратные уравнения просто, как будто мне 12». Через минуту он получает три разных способа решения, шутку про квадрат и контрольный пример для тренировки. Бесплатно.

А теперь представьте Марию Ивановну, учительницу математики с 30-летним стажем, которая в это же время проверяет тетради и случайно находит у Пети идеально решенную работу. Только вот почерк не Пети, а цифровой.

Вопрос, который мучает Марию Ивановну, Петю, его родителей и инвесторов Кремниевой долины: если нейросети уже умеют объяснять, решать и даже проверять, то зачем через пять лет вообще нужны живые учителя и репетиторы?

Паниковать начали не вчера. Еще в 2023 году исследование Walton Family Foundation показало, что больше половины американских студентов (51%) уже вовсю пользуются ChatGPT для учебы. Учителя тоже не отстают - каждый третий признался, что нейросеть помогает им составлять планы уроков. Российская Вышка докладывает: 2/3 преподавателей хотя бы раз ловили студента на работе, написанной нейросетью. Но те же 40% педагогов считают, что запрещать ИИ бесполезно, надо учить им пользоваться.

Пока чиновники и академики спорят о регулировании, рынок делает свое дело. В приложения вроде Photomath или Socratic от Google льются большие деньги. Идея идеального репетитора, который никогда не устает, не злится и стоит как подписка на кофе, звучит слишком соблазнительно.

Читать далее

Лифт не знает, куда ехать. И это лучший алгоритм, который мы придумали

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели12K

Вчера я 4 минуты стоял в подъезде и смотрел, как два лифта одновременно поехали вверх. Все два. На табло — 12, 15, 18. Я на первом. Мне на шестой. И я подумал: вот я кучу лет пишу софт, оптимизирую запросы к базе данных, кеширую всё что движется — а эти две коробки на тросах не могут разобраться, кто из них должен спуститься за мной.

Потом я погрузился в тему. И выяснил, что они не «не могут разобраться». Они математически не способны найти идеальное решение. Вообще никто не способен. Задача диспетчеризации группы лифтов — NP-трудная. То есть буквально: не существует алгоритма, который гарантированно найдёт оптимальный маршрут за разумное время.

И вот уже 60 лет лучшие инженеры мира решают эту задачу эвристиками. По сути — догадками.

Читать далее

8 уровней агентной инженерии

Уровень сложностиСредний
Время на прочтение12 мин
Охват и читатели7K

Способности AI в написании кода растут быстрее, чем наше умение этими способностями пользоваться. Поэтому рост баллов на SWE-bench не коррелирует с метриками продуктивности, которые волнуют инженерных руководителей. Когда команда Anthropic выкатывает продукт вроде Cowork за 10 дней, а другая команда не может довести до ума сломанный POC на тех же моделях, разница в одном: первые закрыли разрыв между возможностями моделей и практикой, вторые — нет.

Этот разрыв не закрывается за одну ночь. Он закрывается по уровням. Их 8. Большинство читающих эту статью, скорее всего, уже прошли первые несколько, и стоит стремиться к следующему, потому что каждый новый уровень — это резкий скачок производительности, а каждое улучшение моделей усиливает этот эффект ещё больше.

Читать далее

Первый в мире коммерческий мозговой имплант: Китай обошел Neuralink в нейротехнологической гонке

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели5.6K

Китайский регулятор выдал первую в мире лицензию на коммерческое использование инвазивного интерфейса «мозг-компьютер». Разрешение получило устройство NEO, которое позволяет парализованным пациентам силой мысли управлять роботизированной перчаткой.

Это решение переводит нейротехнологии из стадии экспериментальных клинических испытаний, на которой сейчас находятся американские аналоги вроде Neuralink, в статус легального серийного медицинского продукта. Выдача лицензии спровоцировала резкий скачок акций профильных биотехнологических компаний на азиатских биржах.

Читать далее

Отток до оттока: churn-модели в банковском проде

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели6K

В банковском churn проблема почти никогда не выглядит как «вчера клиент был с нами, а сегодня закрыл счет». Гораздо чаще отношения распадаются медленно: зарплата еще приходит в старый банк, но деньги почти сразу уходят наружу; карта остается открытой, но перестает быть основной; приложение клиент по-прежнему открывает, но все реже. Формально он еще с вами. Экономически — уже почти нет. Для аналитика это важное различие: объектом моделирования становится не только юридическое событие ухода, а деградация primary relationship — снижение остатков, миграция регулярных платежей, выпадение из цифрового контура и ослабление продуктовой связки. Этот контекст не абстрактный: BAI в обзоре на 2024 год выделял рост депозитов как один из главных приоритетов банков, а это автоматически повышает ценность раннего обнаружения деградации клиентских отношений.

В этой статье — не очередной обзор уровня «ML помогает удерживать клиентов», а разбор того, как churn-модели реально выглядят в банковском пайплайне: какие признаки обычно работают, где бинарная классификация ломается, зачем нужен uplift, почему survival analysis часто полезнее обычного churn-label и какие регуляторно-этические ограничения становятся нетривиальными, когда модель используется не только для скоринга, но и для принятия решений.

Читать далее

Семантический поиск vs полнотекстовый: сравниваем три embedding-модели на 10 000 категорий Ozon

Время на прочтение10 мин
Охват и читатели7.6K

Сравнил полнотекстовый поиск PostgreSQL (tsvector/tsquery + GIN-индекс) с семантическим поиском через pgvector (cosine distance) на датасете из 10 019 товарных категорий Ozon.

Три embedding-модели:

GigaChat EmbeddingsGigaR (Сбер, 2560-мерные векторы, API)

Qwen3-Embedding-0.6B (Alibaba, 1024-мерные, локальный инференс через HF Text Embeddings Inference на GPU)

text-embedding-3-small (OpenAI, 1536-мерные, API)

Прогнал 18 запросов в пяти категориях: синонимы и сленг, intent-запросы в свободной форме, подарочная тематика, cross-lingual (EN-запросы к RU-данным), абстрактные формулировки. Замерил латентность и top-5 с cosine similarity score.

Разбор каждого запроса, таблицы и код — под катом.

Читать далее

От конечных автоматов к биомиметике: детерминированный ИИ больше не нужен

Время на прочтение2 мин
Охват и читатели5.6K

ИИ-разработчики стали викторианскими хирургами, сшивая неживые алгоритмы. Почему детерминизм графов — это архитектурная клетка, и как синтетическая физиология подарит ИИ подлинную автономность.

Читать далее

Universität или Fachhochschule: что выбрать для бакалавриата по CS/AI в Германии

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели9.2K

Я работаю в классическом немецком университете и каждый год вижу одну и ту же картину: русскоязычные абитуриенты рассматривают исключительно классический Universität как место возможного получения высшего образования, не зная, что в Германии существует и другая модель образования — Fachhochschule. Не потому что она хуже, а просто потому, что про нее российские студенты и абитуриенты просто не знают. Я постараюсь это исправить и немного поговорить о том, в чем же сходство и различие этих двух высших учебных заведений. Сразу оговорюсь: ниже речь именно о бакалавриате по Computer Science (CS) и Artificial Intelligence (AI).

Читать далее

Ваш CLAUDE.md делает агента тупее. Исследование на 138 репозиториях это доказало

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели7.6K

Я написал CLAUDE.md на 200 строк. Исследование ETH Zurich на 138 репозиториях говорит: мой агент стал от этого тупее на 3%, а я плачу на 20% больше за токены. Разбираюсь, что пошло не так.

Читать далее

Краткая история искусственного распознавания запахов: от разработок Figaro Engineering до машинного обучения

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели6.6K

Полупроводниковые приборы довольно быстро внедрились во все области науки и техники, путь, а начатые в 1940-е годы исследования влияния газов на электрофизические характеристики полупроводников поставили на повестку дня и обратную задачу – определения газов по изменению этих характеристик полупроводника, и это заняло гораздо больше времени. Первопроходцем здесь считается японский изобретатель Наёси Тагучи.

Основанная им компания Figaro Engineering Inc. с 1969 года начала производство и продажу газовых детекторов сначала для самых опасных газов, а затем для самых разных летучих субстанций, как пахучих, так и без запаха, под товарным знаком Figaro.

Читать далее

Ближайшие события

Производство теряло деньги каждую смену. До внедрения видеоаналитики с ИИ никто не знал где

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели12K

Привет! На связи Олег Чебулаев, CEO Mad Brains. Хочу поделиться историей из практики — как обучить модель YOLO, запустить видеомониторинг на пищевом производстве и через неделю обнаружить кое-что, о чём на заводе предпочитали не говорить вслух.

Читать далее

OpenAI размещает рекламу в ChatGPT, Oracle тонет в долгах, а SoftBank точит когти. Что происходит со Stargate?

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели8.3K

Как бы ни старались бенефициары ИИ-пузыря прятать противоречия, разрывающие его изнутри, — правда вылезает наружу. Буквально на днях The Information оглушил всех очередным тревожным отчётом: между главными участниками проекта Stargate — OpenAI, SoftBank и Oracle — возникли серьёзные разногласия, которые могут похоронить весь проект.

Читать далее

Неофициальный Python-клиент для alphaxiv: как мы нашли скрытый API и упаковали его в пакет

Уровень сложностиСредний
Время на прочтение14 мин
Охват и читатели8.1K

У alphaxiv.org есть API — но найти его было непросто: публичная документация появилась совсем недавно, а до этого единственный способ разобраться в том, как он работает, — DevTools и живой трафик браузера. POST-запрос к api.alphaxiv.org/assistant/v2/chat, SSE-поток в ответе, модель aurelle-1.

На основе этого исследования мы собрали aurelle-py — Python-пакет для программного доступа к AI-ассистенту alphaxiv: задавать вопросы по arXiv-статьям, стримить ответы, встраивать в исследовательские пайплайны. Мы не первые, кто занялся этой темой, — но постарались сделать решение аккуратным и хорошо задокументированным.

Что внутри: синхронный и асинхронный клиенты, SSE-парсер с независимым юнит-тестированием, Pydantic v2 для валидации, типизированные исключения (AuthError, RateLimitError), MCP-сервер для интеграции с Claude Desktop и Claude Code.

pip install aurelle-py

В статье — как мы нашли эндпоинт, разобрали формат запроса и ответа, какие ограничения выявили опытным путём и как устроен пакет внутри.

GitHub: https://github.com/center4aai/aurelle-py

Читать далее

Тихая эволюция zero-shot энкодеров. От UniNER до GLiNER 2

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели9.2K

Пока все говорят про LLM агентов, есть целый класс задач где 205M энкодер делает ту же работу что ChatGPT — быстрее, дешевле, без vendor lock‑in. Я хочу рассказать про эволюцию энкодеров, которую вы возможно пропустили: начиная от UniNER, заканчивая GLiNER 2, с ключевыми инсайтами на каждом шаге.

Читать далее

Как обнаружить заказной негатив с помощью скриптов

Время на прочтение7 мин
Охват и читатели8.8K

По данным Data Insight 30% отказов от покупок связано с заказным негативом. Раньше ботов вычисляли по шаблонным фразам, но сейчас спамеры массово генерируют жалобы через LLM. Модерация геосервисов пропускает такой контент. Формально отзывы уникальны и не нарушают правила площадок. Ручная проверка тысяч комментариев требует десятков часов работы аналитика и не исключает человеческий фактор. Визуально отличить качественный фейк от мнения реального клиента стало невозможно.

Противостоять генеративным сетям можно только программными методами. Автоматизировать поиск аномалий в поведении пользователей помогают скрипты на Python. Этот контур защиты включает парсинг данных с обходом лимитов API, вычисление временных выбросов через Z-оценку и семантический анализ текстов с учетом морфологии русского языка (через библиотеку Natasha). Это базовый алгоритм, который позволяет перевести защиту репутации из ручной разметки в измеримый технический процесс.

Читать далее

Этот ИИ ведёт дневник, заводит баг-репорты, избегает сложных задач, а существует всего 5 дней

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели7.6K

Сейчас расскажу историю, от которой немного сносит крышу.

Разработчик по имени Лиюаньхао сел и написал 200 строк кода на Rust.

Всё. Крошечный, голый скрипт.

Но то, что произошло после нажатия кнопки «запустить», — из тех вещей, которые перечитываешь дважды, чтобы убедиться, что тебе не показалось.

Он назвал проект yoyo — самоэволюционирующий кодинг-агент. А потом — и вот это то, что по-настоящему цепляет — полностью отошёл. Убрал руки с клавиатуры.

Дал одну-единственную инструкцию: эволюционируй, пока не сравняешься с Claude Code. И просто сел смотреть.

Знаете это чувство — когда ткнёшь семечко в землю, напрочь забудешь про него, а потом проходишь мимо и видишь, как из земли лезет живое, настоящее растение? Вот примерно это и случилось. Только это растение не просто выросло. Оно проснулось и начало само заводить баг-репорты.

Читать далее

NVIDIA Nemotron, Claude фиксит Firefox, ИИ буллит программиста и суд против Google за смерть пользователя

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели7.3K

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя вышла насыщенной: гибридная 120B модель от NVIDIA, Claude нашёл 22 дыры в Firefox, а ChatGPT и Gemini интегрировались в Excel и Google Docs. Голливуд заставил ByteDance убрать видеомодель, а ЕС запретил дипфейки после скандала с Grok.

Всё самое важное — в одном месте. Поехали!

Читать дайджест →
1
23 ...