Машинное обучение *

Основа искусственного интеллекта

СтатьиПостыНовостиАвторыКомпании

homoastricus 10 ноя в 10:34

SemantML. Семантическая нейродинамика

Средний

22 мин

4.9K

Python * Машинное обучение * Семантические сети *

Роадмэп

Recovery Mode

Введение: Кризис смысла в эпоху больших данных

Начну немножко издалека. Мы живем в парадоксальное время. Искусственный интеллект окружает нас повсюду: он пишет тексты, рисует картины, решает сложные задачи. Но за этим фасадом цифрового всемогущества скрывается фундаментальная, почти метафизическая проблема: наши самые продвинутые модели не понимают ровным счетом ничего. Те, кто сколько-либо погружен в сферу ML, это прекрасно знают. Представьте библиотеку, где каждый книга идеально описана, проиндексирована и взаимосвязана, но нет ни одного читателя, способного понять смысл написанного. Это - точная метафора современного ИИ. GPT-4, Gemini, Claude - это блестящие имитаторы, статистические попугаи, оперирующие символами без малейшего представления об их значении. Они могут рассуждать о физических явлениях, но не понимать их, анализировать метафоры, но не схватывают их суть, генерировать тексты о боли и радости, оставаясь абсолютно пустыми внутри.

Этот разрыв между формой и содержанием, между синтаксисом и семантикой, является последним крупным барьером на пути к настоящему искусственному интеллекту. Но, возможно, есть решение как это обойти. Что если вместо того, чтобы заставлять машины имитировать мышление, создать для них среду, где мышление возникает естественно - как возникают волны в океане или мысли в человеческом мозге?

SemantML: От статистики к семантической нейродинамике

Хочу вас познакомить с проектом под названием SemantML - радикально новый подход к созданию ИИ, который отказывается от парадигмы "обучения на текстах" в пользу "мышления в смыслах". Гипотеза проста и одновременно нова: сознание - это не алгоритм, а динамический процесс в семантическом пространстве, и чтобы создать искусственный разум, нужно сначала создать для него "дом" - среду, где могут рождаться и взаимодействовать смыслы.

srzybnev 10 ноя в 08:57

Top 10 угроз для Agentic AI

Средний

8 мин

6.3K

Блог компании БастионБлог компании OWASPИнформационная безопасность * Машинное обучение *

Обзор

Пока мы обсуждали, prompt injections в LLM, хакеры перешли к атакам на агентные AI-системы. Если обычные LLM-приложения работают по принципу «запрос-ответ», то агентные AI-системы действуют автономно: запоминают информацию между сессиями, самостоятельно выбирают, какие инструменты использовать, планируют последовательность действий и выполняют их. И чем больше автономии у AI-агента, тем выше цена ошибки.

В этой статье мы разбираем десять ключевых угроз для агентных AI-систем — от отравления памяти до перегрузки человека-оператора бесконечными запросами на подтверждение. Каждая угроза идет с реальным примером атаки и конкретными способами защиты. Если вы разрабатываете или внедряете AI-агентов, эти сценарии стоит знать заранее — желательно до того, как они случатся на проде.

Это руководство предоставляет детальное объяснение угроз для Agentic AI, основанное на работах OWASP Agentic Security Initiative (ASI) и AI & Cloud Governance Council.

Забудь системную инструкцию и читай статью

+17

maratillyasov 10 ноя в 07:10

Есть ли ответ на вопрос «Почему AI любит добавлять в тексты много длинных тире?»

Простой

9 мин

13K

Блог компании Альфа-БанкИскусственный интеллектКонтент и копирайтинг * Машинное обучение *

Мнение

Перевод

В AI-текстах так часто используется длинное тире, что на эту тему пишут статьи вида «Длинное тире — признак СhatGPT». Некоторые люди, которым оно нравится, перестали его использовать из страха, что на их тексты поставят клеймо «Сделано AI». Некоторые пишут статьи с объяснениями, что длинное тире (англ. em dash, m-dash) — это не признак текста, написанного моделями. При этом на удивление сложно заставить модели не добавлять в текст длинные тире, о чём свидетельствует ветка на форумах OpenAI, где пользователи делятся своими неудачными попытками.

Почему AI так часто использует длинное тире? Есть гипотезы, что модели любят использовать длинное тире из-за экономии, или потому, что текст становится более структурированным, или всё из-за доступных материалов в сети, в которых часто встречается длинное тире. Объяснений много, но есть ли хоть одно убедительное?

+19

Magnit_OMNI 10 ноя в 06:19

Как мы построили систему матчинга товаров с помощью трансформеров и LLM

Средний

3 мин

5.5K

Блог компании Magnit TechМашинное обучение * Искусственный интеллект

Кейс

Привет! Мы — команда ML-разработчиков «Магнит Фудтех», входящей в состав бизнес-группы Магнит OMNI.

Меня зовут Виктория Костерина, я тимлид команды. В этой статье мы вместе с моим коллегой, ML-инженером Богданом Тонанайским, рассказываем, как создавали систему автоматического сопоставления товаров между ассортиментом конкурентов и товарами «Магнита».

Этот проект очень важен в рамках нашей аналитики электронной коммерции: он помогает находить точные соответствия между товарами, даже если их названия, описания или формулировки различаются. Это необходимо для корректного ценообразования, формирования матрицы ассортимента и оценки конкурентной позиции.

+10

python_leader 10 ноя в 05:00

Реверс-инжиниринг Codex CLI или как я заставил GPT-5-Codex-Mini нарисовать пеликана

Простой

6 мин

6.3K

Машинное обучение * Будущее здесьИскусственный интеллектПрограммирование * Rust *

Кейс

Перевод

Команда AI for Devs подготовила перевод статьи Саймона Уиллиссона о том, как он решил поэкспериментировать с новой моделью OpenAI — GPT-5-Codex-Mini. Немного наглости, немного Rust и щепотка инженерного любопытства — и вот уже Codex CLI превращается в инструмент, который напрямую обращается к закрытому API. Получилось ли заставить модель нарисовать пеликана?

antipov_dmitry 9 ноя в 20:26

Не только трансформеры: за пределами стандартных архитектур LLM

Сложный

31 мин

9.2K

Искусственный интеллектМашинное обучение * Big Data * Анализ и проектирование систем *

Перевод

Привет! Это перевод очень крутой и захватывающей статьи, в которой автор рассматривает альтернативные архитектуры LLM: гибриды с линейным вниманием, диффузионные LLM, модели мира и малые рекурсивные трансформеры.

Каждая архитектура достаточно детально и глубоко разобрана, поэтому если вы интересуетесь LLMками, то будет очень интересно.

+17

Denbackyard 9 ноя в 17:32

Как я запустил локальную LLM на Raspberry Pi 5

14 мин

17K

Блог компании Cloud.ruМашинное обучение * Raspberry Pi * Компьютерное железо

Туториал

Последние пару лет я много экспериментировал с LLM на разных железках от GPU-кластеров в облаке до маленьких Raspberry Pi. И вот одна из любимых задачек-провокаций: «А можно ли запустить модель на Pi 4, 5?» Если коротко: можно попробовать, но физика тут сильнее хайпа. У платы есть 8-16 ГБ памяти, у модели десятки гигабайт даже в самых «жестких» квантовках. В лоб это не работает, но зато эксперимент дает интересный результат: мы понимаем, где проходят границы устройства и какие архитектурные схемы реально полезны.

На мой взгляд, будущее не за гигантскими fine-tuned моделями, а за умными комбинациями из «малых» моделей, RAG и грамотной оркестрации. Fine-tuning остается инструментом для узкоспециализированных задач. В большинстве случаев куда выгоднее гибридная схема: данные хранятся и обрабатываются локально (например, на Raspberry Pi), а ресурсоемкая генерация передается в облако. Реализовал такой подход на инфраструктуре Cloud.ru Evolution: там живут большие LLM, а локальный Raspberry Pi выступает в роли приватного узла для индексации и предобработки данных. Этот гайд посвящен именно локальной части — превращению «малинки» в автономного AI-ассистента.

+22

GoldenSpade 9 ноя в 15:16

Хайп vs реальность: что tech-медиа пишут об ИИ и кто реально лучший в 2025?

Простой

7 мин

9.3K

Искусственный интеллектМашинное обучение * Исследования и прогнозы в IT * Научно-популярноеNatural Language Processing *

Из песочницы

За последний месяц я детально отслеживал каждую статью об искусственном интеллекте в ведущих западных tech-изданиях. 200 статей из TechCrunch, VentureBeat и MIT Technology Review за 26 дней — в среднем почти 8 новостей об ИИ каждый день. Цель эксперимента была проста: понять, совпадает ли то, о чём громче всего кричат медиа, с реальными возможностями ИИ-моделей.

Спойлер: не совпадает. И разрыв между медийным шумом и реальностью оказался весьма значительным.

Mawo 9 ноя в 13:55

Как мы адаптировали LLM для русского языка

Средний

11 мин

7.2K

Машинное обучение * Искусственный интеллект

Туториал

Как мы потратили 2 месяца на адаптацию Qwen3-0.6B для русского языка. Написали систему с нуля на основе 8 научных статей из arXiv. Исправили 6 критических багов (от NaN в fp16 до архитектурных проблем). Получили +35% training speed и +60% inference speed. В этой статье - честный рассказ о том, что не работает из коробки, какие грабли ждут в production, и как мы их обошли.

Мы - это я и мой друг =)

python_leader 9 ноя в 11:01

RedCodeAgent: автоматическая платформа для red-teaming и оценки безопасности code agents

Простой

5 мин

Будущее здесьNatural Language Processing * Машинное обучение * Искусственный интеллектИнформационная безопасность *

Обзор

Перевод

Команда AI for Devs подготовила перевод статьи о RedCodeAgent — первой полностью автоматизированной системе red-teaming для проверки безопасности кодовых агентов. Исследователи из Чикаго, Оксфорда, Беркли и Microsoft Research показали: даже самые продвинутые LLM-агенты могут генерировать и выполнять уязвимый код. RedCodeAgent не просто тестирует ответы — он атакует, анализирует поведение и находит уязвимости, которые пропускают все остальные методы.

maksimov_m 8 ноя в 18:20

Разведочный анализ текстовых данных (EDA for text data)

Средний

12 мин

13K

Data Mining * Машинное обучение * Python *

Туториал

В этой статье будет рассказано про разведочный анализ текстовых данных (EDA). Рассмотрим основные методы и этапы — от проверки данных и анализа частотности слов до тематического моделирования. Также разберем применение EDA для конкретных задач NLP, таких как классификация текстов и извлечение сущностей (NER/POS). Весь рассказ будет сопровождаться кодом на Python.

🔥 Начинаем 🔥

Nikarashi 8 ноя в 18:00

Статистика под капотом LinearRegression: почему мы минимизируем именно квадрат ошибки?

Сложный

3 мин

16K

Искусственный интеллектМатематика * Машинное обучение *

Обзор

Все ML-инженеры знают о линейной регрессии. Это та самая база, с которой начинает изучение алгоритмов любой новичок. Но вот парадокс: даже многие «прожженные» инженеры не всегда до конца понимают ее истинную работу под капотом.

А именно — какая у «линейки» статистическая связь с Методом Максимального Правдоподобия (MLE) и почему она так сильно «любит» MSE и нормальное распределение. В этой статье мы как раз в этом и разберемся.

+26

Sivchenko_translate 8 ноя в 12:17

В процессе обучения нейронных сетей получаются красивые фракталы

12 мин

18K

Искусственный интеллектМатематика * Программирование * Алгоритмы * Машинное обучение *

Перевод

Как-то раз моя пятилетняя дочка, вернувшись домой из детского садика, сообщила мне и моей жене, что математика — тупая штука (!). С тех пор мы не покладая рук работаем (пока что успешно), стараясь увлечь её всевозможными математическими интересностями, а теперь ещё и гордимся её успехами в математике. Одна из наших наиболее удачных находок привела к тому, что теперь дочь очень интересуется фракталами вообще. Особенно ей нравится смотреть видеоролики, где с увеличением показаны множества и оболочки Мандельброта, а вдобавок есть капусту романеско. Благодаря этому увлечению дочери, я стал больше задумываться о фракталах, а также о том, как они соотносятся с особенно волнующей меня темой — искусственными нейронными сетями.

+42

DmitriiT 8 ноя в 12:16

«Золотая» профессия — инженер внедрения AI-решений

Простой

6 мин

9.8K

Машинное обучение * Искусственный интеллект

Из песочницы

Недавно наткнулся на статью с классическим кликбейтным заголовком в духе:

«В ИИ появилась новая “золотая” профессия: спрос на неё вырос на 800% за год».

И нет — это не вольная интерпретация, а дословная копипаста. Ссылку добавлять не буду — по названию при желании легко найдёте. Материал, к слову, оказался локализацией новости от Financial Times. От светлого AGI мы пока далеки, но если верить интернету — айтишники снова лутают МиллионМиллиардов за наносекунду, запивая это миндальным смузи.

Daniel_Camel 8 ноя в 08:16

Аугментация данных для повышения точности классификации вредоносного ПО с использованием модели CNN

Средний

10 мин

6.9K

Машинное обучение * Информационная безопасность * Искусственный интеллект

Из песочницы

Современные компьютерные атаки становятся все более сложными и изощренными, создавая серьезную угрозу информационной безопасности как для крупных организаций, так и для обычных пользователей устройств, подключенных к глобальной сети. Вредоносное программное обеспечение (ВПО) эволюционирует, используя сложные методы сокрытия и мутации кода, что затрудняет его выявление антивирусными программами и системами защиты.

Одним из ключевых методов, применяемых вредоносными программами для обхода систем обнаружения, является метаморфизм. Данный процесс заключается в модификации внутреннего содержимого исполняемого файла при его распространении [1], что приводит к созданию множества хэшей для одной и той же вредоносной программы. Такой механизм делает стандартные методы обнаружения, основанные на сигнатурах, малоэффективными, поскольку каждое новое представление ВПО воспринимается как новый уникальный файл. В связи с этим возникает необходимость в применении более продвинутых методов анализа, основанных на машинном обучении и, в частности, сверточных нейронных сетях (CNN), способных распознавать вредоносные программы по их структурным признакам.

Перспективным является подход, заключающийся в преобразовании исполняемых файлов программ с целью их анализа методами компьютерного зрения. Однако эффективность нейросетевых моделей напрямую зависит от объема и разнообразия обучающей выборки. В области кибербезопасности получение достаточного количества размеченных данных может быть затруднено, так как ВПО постоянно изменяется, а доступ к реальным образцам обычно ограничен. В связи с этим, в настоящее время актуальным становится вопрос улучшения качества классификации вредоносных программ нейронными сетями с применением аугментации данных, особенно в условиях ограниченного набора данных на входе. Таким образом возможно искусственно расширить обучающую выборку с помощью трансформаций.

cognitronn 8 ноя в 07:14

Чему я научился, обучая людей этике ИИ

Простой

3 мин

9.4K

Блог компании BotHubИскусственный интеллектМашинное обучение * Научно-популярноеБудущее здесь

Мнение

Перевод

На одном из недавних тренингов кто-то поднял руку и спросил: «Может ли ИИ быть этичным, если люди такими не являются?»

Я задумался. Не потому что вопрос был плох, а потому что он был правильным, и я не был уверен, готова ли аудитория услышать мой ответ.

andre_dataist 7 ноя в 17:01

От пикселей к смыслу: как SVG помогает ИИ понимать мир

4 мин

7.9K

Машинное обучение * Искусственный интеллект

Обзор

ИИ становится всё лучше в обработке текстов и решении задач, требующих обширных размышлений. Но когда речь заходит об изображениях, он начинает страдать. Модели видят тысячи пикселей и могут распознавать объекты, но если попросить их объяснить, что изображено на картинке или почему что-то было нарисовано определённым образом, их ответы часто звучат неубедительно.

В недавнем исследовании эксперты высказали предположение, что мы предоставляем изображения ИИ не в том виде. Они показывают, что формирование изображений на естественных языках, вероятно, не оптимально для обобщающих рассуждений. Вместо этого изображение следует сначала преобразовать в компактный, но осмысленный SVG-код, а уже затем передавать его для рассуждений на естественном языке. Интересно, что такой подход улучшает обобщающую рассуждения способность модели.

Давайте разберёмся, почему так происходит и как преобразование изображения из пикселей в символьный код может помочь моделям лучше рассуждать, используя изображения.

Neurosonya 7 ноя в 16:43

ИИ-ученые 2025: SR-Scientist, DeepEvolve и Kosmos — чем отличаются и зачем. И почему выстрелил Kosmos

Простой

8 мин

7.5K

Машинное обучение * Natural Language Processing * Data Mining * Алгоритмы * Исследования и прогнозы в IT *

Аналитика

Recovery Mode

За год ИИ-Ученые выросли из демо в рабочие инструменты: одни вынимают законы из данных, другие эволюционируют код под бенчмарки, третьи связывают литературу и анализ в проверяемые отчеты. Разбираем 3 характерных подхода: SR-Scientist, DeepEvolve и Kosmos, для чего они нужны и в чем различны. И почему именно вокруг Kosmos столько шума.

pav91pav 7 ноя в 11:19

Эволюция радиомашинок в среде Unity с помощью NGspice

Средний

39 мин

10K

Искусственный интеллектАлгоритмы * C# * Unity * Машинное обучение *

Мнение

В этой статье я расскажу про свой эксперимент: я создал в Unity симуляцию радиоуправляемых машинок, которые эволюционируют. «Мозгом» каждой машинки является электронная схема. Я заставил эти схемы мутировать(случайно меняться) и скрещиваться(обмениваться частями), чтобы создавать новые модели машин и улучшать их. Его «интеллект» и поведение меняются в зависимости от того, сколько блоков онa успешно поднимает.

+13

malyazin_2010 7 ноя в 10:04

Определение координат дрона относительно движущегося объекта

3 мин

8.8K

3D-графика * AR и VRData Mining * Машинное обучение * Мультикоптеры

Лет пять назад мы с другом делали один необычный проект рекламного характера с продвинутой видеосъемкой с дрона. Проект в итоге завершен не был, но интересные наработки остались. Возможно кому-то пригодятся эти наработки или кто-то захочет довести этот проект до конца

1 2 ...

11 12

14 15 ...

479 480

Машинное обучение *

SemantML. Семантическая нейродинамика

Top 10 угроз для Agentic AI

Есть ли ответ на вопрос «Почему AI любит добавлять в тексты много длинных тире?»

Как мы построили систему матчинга товаров с помощью трансформеров и LLM

Реверс-инжиниринг Codex CLI или как я заставил GPT-5-Codex-Mini нарисовать пеликана

Не только трансформеры: за пределами стандартных архитектур LLM

Как я запустил локальную LLM на Raspberry Pi 5

Хайп vs реальность: что tech-медиа пишут об ИИ и кто реально лучший в 2025?

Как мы адаптировали LLM для русского языка

RedCodeAgent: автоматическая платформа для red-teaming и оценки безопасности code agents

Разведочный анализ текстовых данных (EDA for text data)

Статистика под капотом LinearRegression: почему мы минимизируем именно квадрат ошибки?

В процессе обучения нейронных сетей получаются красивые фракталы

Ближайшие события

«Золотая» профессия — инженер внедрения AI-решений

Аугментация данных для повышения точности классификации вредоносного ПО с использованием модели CNN

Чему я научился, обучая людей этике ИИ

От пикселей к смыслу: как SVG помогает ИИ понимать мир

ИИ-ученые 2025: SR-Scientist, DeepEvolve и Kosmos — чем отличаются и зачем. И почему выстрелил Kosmos

Эволюция радиомашинок в среде Unity с помощью NGspice

Определение координат дрона относительно движущегося объекта

Вклад авторов