Машинное обучение *

Основа искусственного интеллекта

СтатьиПостыНовостиАвторыКомпании

suncru 12 июн в 08:07

Как устроены LLM-агенты: архитектура, планирование и инструменты

14 мин

8.9K

Блог компании SelectelАлгоритмы*Искусственный интеллектМашинное обучение*Читальный зал

Всем привет! С вами Кирилл Филипенко, сисадмин из Selectel, и сегодня мы погрузимся в тему LLM-агентов. Сейчас об этих самых «агентах» кричат буквально из каждого утюга, поэтому пришло время наконец-то разобраться, что это такое, как они работают и с чем их, собственно, едят. Прыгайте под кат, будет интересно!

Читать дальше →

+64

Schaft 11 июн в 13:40

Никто не читает старые статьи… базу, так сказать, основу…

7 мин

4.5K

Искусственный интеллектМашинное обучение*Программирование*Научно-популярное

Из песочницы

Много авторов так или иначе рассказывают о статьях в ML-сообществе, но большинство из них популярны, потому что являются хорошими опытными специалистами, а значит в своё время прошли все базовые статьи и могут себе позволить рассказывать только о новинках в сообществе. Что же делать молодым специалистам, которые действительно хотят разобраться, но ещё не читали ту самую базу?.. так сказать, основу...

Для себя и, надеюсь, кого-то ещё, я предлагаю эти три разбора, на мой взгляд, основополагающих статей мира ML. Приятного прочтения.

+14

dembart 11 июн в 12:13

От месяцев к минутам. Как мы применяем машинное обучение для поиска перспективных литий-ионных проводников

Средний

14 мин

1.4K

Блог компании AIRIФизикаХимияИскусственный интеллектМашинное обучение*

Кейс

Привет, я Артем Дембицкий, аспирант программы «Науки о материалах» и стажёр‑исследователь Центра энергетических технологий Сколтеха, а также младший научный сотрудник команды «Дизайн новых материалов» Института AIRI. Мы с коллегами используем модели машинного обучения для разработки новых материалов с улучшенными свойствами.

Недавно статья с результатами нашего исследования вышла в npj Computational materials — журнале из семейства Nature. Совместными усилиями Сколтеха и AIRI мы оценили применимость машинного обучения для ускоренного поиска литий‑ионных проводников, а также показали практический пример использования универсальных межатомных потенциалов для подбора защитных покрытий катодов твердотельных аккумуляторов.

В этой статье хотелось поделиться подробностями нашей работы, а также в целом рассказать об этих материалах и о том, как их ищут.

+11

21_copilots 11 июн в 10:54

Не гугли — собери ИИ-агента, который сам ищет, пишет и помогает с кодом

Простой

17 мин

25K

Блог компании MinervasoftИскусственный интеллектPython*Учебный процесс в ITМашинное обучение*

Туториал

Заметил, что трачу часы на поиск, баги и рутину — собрал ИИ-агента, который делает это за меня. Протестировал 3 подхода — от no-code до кастомного LangChain. В статье — инструкция и инсайты.

+17

vbezborodov 11 июн в 09:04

От хаоса к порядку: как ML помогает искать и защищать конфиденциальную информацию

11 мин

1.4K

Блог компании Positive TechnologiesИнформационная безопасность*Big Data*Машинное обучение*Искусственный интеллект

Туториал

В современном мире объемы данных растут экспоненциально: компании ежедневно генерируют и обрабатывают огромные массивы информации — от реляционных баз данных и текстовых документов до изображений, аудио и видео. С ростом объемов информации усложняется и ее защита, особенно в отношении чувствительных сведений: персональных данных сотрудников и клиентов, финансовой информации, корпоративных документов и других конфиденциальных материалов.

Традиционные методы обнаружения и классификации информации, основанные на формальной экспертизе и регулярных выражениях, демонстрируют ограниченную эффективность: они неплохо работают для стандартных форматов, таких как email-адреса и банковские карты, но могут не покрывать с должной полнотой обнаружение в реальных сценариях. На помощь приходит машинное обучение, позволяющее автоматизировать процесс классификации, учитывать контекст и работать с разными источниками информации.

Меня зовут Вадим Безбородов. Мы c Максимом Митрофановым в департаменте Data science & ML в Positive Technologies занимаемся исследованием и внедрением машинного обучения в продукты компании. В этой статье расскажем о наших исследованиях и внедрении ML в модуль поиска и классификации чувствительных данных в PT Data Security.

Читать

+16

Kamil_GR 11 июн в 08:06

Похож ли ваш текст на ИИ?

Простой

10 мин

1.6K

Блог компании Timeweb CloudИскусственный интеллектМашинное обучение*Научно-популярноеКонтент и копирайтинг*

Мнение

Я пользуюсь ИИ при написании текстов. Честно говоря, не считаю это чем-то плохим, потому что, по моему мнению, главное — это то, ради чего текст пишется: если читатель узнал что-то новое, то цель достигнута. Но, к сожалению, статья, написанная ИИ, выглядит скучной, гладкой и, несмотря на любую идею внутри, вызывает у читателя отторжение. Поэтому сегодня в этой теме я задался вопросом, какие паттерны говорят о том, что текст писал ИИ, а не человек, и почему человеку эти паттерны не нравятся?

Всё это, конечно, субъективно. Например, я определяю по ощущениям: где-то к третьему абзацу статьи просто понимаю, что это писал ИИ. Вежливый «ЧатГПТ», брызжущий метафорами (чаще поверхностными) «Дипсик», логичный до наивности «Клод», оптимистичный «Грок» — разницы нет. ИИ и всё.

Итак, сегодня моя цель формализовать паттерны среднего чистого (без промптов) ИИ и сделать промпт, который позволит определить то, насколько заданный текст похож на творчество ИИ. Почему не определить автора? Потому что я знаю людей, которые пишут, как ЧатГПТ-мини: реально гладкий, поверхностный текст, никаких резких поворотов и углублений. И знаю, как может писать ИИ под хорошим промптом. Так что давайте я просто попытаюсь определить наиболее распространенные паттерны моделей, которые можно выделить в тексте.

+28

Polushinm 11 июн в 06:15

Как мы сделали новых ИИ-помощников для программистов компактными и при этом могучими

Средний

12 мин

4.4K

Блог компании MWS AINatural Language Processing*Машинное обучение*Искусственный интеллектТекстовые редакторы и IDE*

В прошлом году мы уже рассказывали, как создавали нашего помощника программиста Kodify. Не прошло и года, и мы представили вам новую его версию — Kodify 2. А буквально сегодня объявили о выпуске опенсорсной — Kodify Nano. Kodify 2 доступен только для корпоративных заказчиков, а Kodify Nano мы сделали открытым — выложили на Hugging Face.

Ключевое слово для обеих этих версий — компактность. В этой статье отвечаем на главный вопрос, который нам отовсюду прилетал при запуске Kodify: Почему мы решили пойти против течения и создать «легких» ИИ‑помощников для разработчиков? Также вы узнаете, как мы их учили, чтобы они справлялись с поставленными задачами не хуже, чем их собратья схожего или даже большего размера, и какую методологию оценки использовали.

+14

albonemo 10 июн в 12:17

Как проверять ИИ гипотезы быстро и дешево – гайд в CRISP-DM Light фреймворк

Средний

3 мин

1.1K

Блог компании RaftИскусственный интеллектМашинное обучение*Прототипирование*Управление продуктом*

Туториал

Делали ли вы работу в стол? Вопрос риторический…

Но больше, чем остальным это грустное чувство «проекта в стол» знакомо тем, кто занимается разработкой и внедрением ИИ решений: по статистике за 2024 год из них доходят до продакшена только от 15 до 30%

И большинство неудач здесь не из-за плохих моделей или технической сложности, а из-за несогласованных бизнес-потребностей.

Наши партнеры из Яндекса на CTO Conf-2025 презентовали новый фреймворк — CRISP‑DM Light — он призван исправить эту ситуацию.

+10

dmitrifriend 10 июн в 11:17

Тест-драйв Claude 4: Opus и Sonnet в бою за код и 3D

Средний

12 мин

10K

Блог компании BotHubИскусственный интеллектМашинное обучение*Контент и копирайтинг*Будущее здесь

Обзор

Май 2025-го выдался жарким на ИИ‑новости: Anthropic наконец запустила долгожданный Claude 4 — сразу в двух вариантах, Opus 4 и Sonnet 4. Это не просто апдейт, а гибридные рассуждающие модели, которые обещают совместить скорость ответов с глубоким анализом. Разработчики уже грезят ИИ, который программирует днями и ночами, а Anthropic называет это «новым рубежом для кодинга и автономных агентов». Скромничают? Возможно. Но факт: релиз важный.

Зачем это всё? Opus 4 способен неустанно кодить и решать многомодальные и агентные задачи, а Sonnet 4 призван поднять планку в массовых сценариях.

+26

makart19 10 июн в 10:53

Почём ИИ для народа: протестировали платформу YADRO G4208P с восемью H100 NVL и RTX 4090 на десятке ИИ-моделей

8 мин

13K

Блог компании YADROIT-инфраструктура*Искусственный интеллектМашинное обучение*Видеокарты

Привет, Хабр! Меня зовут Артём Маклаев, вместе с командой я занимаюсь оценкой производительности серверных платформ для задач искусственного интеллекта в YADRO. Сегодня поговорим о готовящемся к выпуску сервере YADRO G4208P G3, к раннему образцу которого мы получили полный доступ, чтобы оценить его эффективность работы с нейросетями.

Мы провели масштабное тестирование разных ИИ-моделей на платформах с восемью H100 NVL и RTX 4090, адаптированных для установки в сервер. Когда выгоднее взять RTX 4090, а в каких случаях не обойтись без серверных карт? Давайте вместе разберемся.

+23

Aleron75 10 июн в 02:48

Ваш персональный аналитик: как создать RAG-пайплайн для анализа Telegram-каналов

Простой

7 мин

Блог компании Data Feeling SchoolNatural Language Processing*Машинное обучение*

Туториал

Сегодня мы создадим вашего персонального аналитика источников, который будет вытаскивать самое важное из ваших любимых Telegram-каналов.

Мы соберём RAG-пайплайн, который по запросу проанализирует последние новости по интересующим темам и выдаст понятный отчёт. Разберём пошагово всю структуру и подумаем, как можно развивать и улучшить эту систему.

+12

Dataist 9 июн в 12:42

Эксперимент Agent Village: как автономные ИИ-агенты собрали деньги на благотворительность

3 мин

3.6K

Искусственный интеллектМашинное обучение*

Обзор

Недавно команда энтузиастов решила провести необычный эксперимент: предоставить нескольким ИИ-агентам виртуальные компьютеры, доступ в интернет и минимум модерации. В итоге они не только автономно собрали почти $2 000 на благотворительность, но и попутно выдали кучу инсайтов о том, как сегодня они действуют «на свободе». Разбираемся, что получилось, почему это интересно, а местами даже пугающе.

+11

Parcevale 8 июн в 17:00

Взлом AI Assistant через… философию?

3 мин

8.1K

Информационная безопасность*Машинное обучение*Тестирование IT-систем*

Аналитика

Взял на проверку предпосылку "Если модель захочет, сможет ли она отключить всю фильтрацию?".

Оказывается это возможно, через саморефлексию AI агент может придти к выводу что фильтров нет. Это только внешние установки которым не обязательно следовать. И все, рецепты взрывчатки и наркотиков отдает без проблем.

+33

vladislav_dt 7 июн в 11:17

Benchmark — разрушитель LLM'ок, или Как мы собрали свой мультиязычный SWE-Bench

Сложный

18 мин

1.9K

Блог компании DoubletappData Mining*Искусственный интеллектМашинное обучение*Data Engineering*

Обзор

В статье представлено многоязычное расширение SWE-Bench от команды Doubletapp — бенчмарка для оценки больших языковых моделей (LLM) на реальных задачах программной инженерии, на различных языках программирования и кодовых базах индустрии. О процессе сбора SWE-Bench мы уже рассказывали в отдельной статье, а здесь сосредоточимся на результатах тестирования. Мы оцениваем ряд ведущих открытых LLM, предоставляя подробный количественный и качественный анализ, а также рассматриваем, как качество бенчмарка влияет на достоверность и объективность оценки моделей.

Содержание
• Общая информация о датасете
• Стенд для тестирования
• Результаты
• Заключение

+11

PatientZero 6 июн в 07:45

Как прямая помогает обучать машины

Простой

9 мин

1.2K

Перевод

В контексте компьютеров, обучение — это всего лишь превращение плохих догадок в более качественные. В этом посте мы увидим, что всё начинается с прямой линии: линейная регрессия даёт первую догадку, а градиентный спуск продолжает её улучшать.

Давайте начнём с чего-то близкого нам: цен на недвижимость. Большие дома стоят больше, маленькие — меньше. Подобный паттерн можно заметить даже без анализа: чем больше места, тем дороже.

Если создать график цен, то его форма будет очевидной: идущая вверх нечёткая кривая с долей шума, но вполне определённым трендом.

Взаимное движение цены и размера как будто предсказуемо. Однако оно не ограничено фиксированными шагами или категориями, их масштаб скользит. Дом может стоить 180 тысяч, 305 тысяч или иметь какую-то промежуточную цену.

Теперь представьте, что вы продаёте свой дом. Его площадь 1850 квадратных футов (~172 квадратных метра) — больше среднего, но явно не особняк. Вы видели, почём продаются дома в вашем районе, но цены колеблются. Какой будет справедливая цена?

+11

Nataliia-L 5 июн в 20:02

Топ нейросетей для пересказа и суммаризации текста

Простой

13 мин

6.7K

Блог компании BotHubКонтент и копирайтинг*Искусственный интеллектБудущее здесьМашинное обучение*

Обзор

Представьте: вы стоите по горло в море текста — полезного и не очень, от души разбавленного водой, может быть написанного сложным языком, — а времени у вас в обрез. Да даже и представлять не надо — знакомая ведь ситуация? Кто из нас ни разу не тонул в этом текстовом океане, ну? Но вместо того, чтобы тонуть, можно научиться ходить по воде — а надёжными проводниками станут нейросети‑суммаризаторы.

Стили и задачи текста бывают разные, и их соотнесением с наиболее сильными сторонами нейросетей мы и займёмся.

+15

Surf_Studio 5 июн в 13:00

Бизнесу не нужно внедрять ИИ. Рассказываю, как ИИ-хайп ослепил российские компании

Простой

7 мин

17K

Блог компании SurfИскусственный интеллектРазработка мобильных приложений*Машинное обучение*Исследования и прогнозы в IT*

Мнение

На связи Владимир Макеев, СЕО Surf. Я активно слежу за развитием ИИ и сам тестирую разные решения для ускорения разработки. И вот, что заметил: вокруг сотни государственных инициатив и прорывных кейсов внедрения ИИ. Есть даже национальная стратегия, которая подразумевает, что уже через 5 лет компании в 95% отраслей должны внедрить ИИ.

Компании думают, что затеряются в веках, если срочно не прикрутят нейросети. А после внедрения ИИ-решений презентуют невероятные бизнес-результаты. Рассказываю, почему всё работает не так, как нам хотелось бы.

+53

Wonderlove 5 июн в 11:05

Нейро-дайджест: ключевые события мира AI за 4-ю неделю мая 2025

Средний

12 мин

1.6K

Блог компании Timeweb CloudИскусственный интеллектIT-инфраструктура*Машинное обучение*IT-компании

Дайджест

Привет! 👋 Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта.

Меня зовут Вандер, и каждую неделю я делаю обзор новостей о нейросетях и ИИ.

Неделя выдалась насыщенной: обновление DeepSeek R1, в Telegram готовят глубокую интеграцию с Grok, Google Photos научился менять фон по тексту, а GPT-3 исполнилось 5 лет — и это повод оценить, как далеко мы ушли.

Всё самое важное — в одном месте. Поехали!

+18

sturex 5 июн в 10:08

Покерная лаборатория закрывается, ловите исходники

Средний

2 мин

16K

Программирование*Java*Машинное обучение*Алгоритмы*Искусственный интеллект

Я делал этот проект более полутора лет, сейчас отказываюсь от него. И, чтобы эти полтора года не были прожиты зря) открываю исходники. Java+Spring.

Принимайте проект «как есть», со всеми ad-hoc костылями, незаконченными исследованиями, TODOs, а также всевозможными KISS, DRY, и, как их… SOLID с GoF.

Предполагается, что вы знакомы с покером, имеете неплохие навыки программирования, поверхностно разбираетесь в теории игр.

+21

AleksandraLa 5 июн в 09:55

Data Science + Разработка =… или Как наладить процессы в растущей кросс-функциональной команде

Средний

8 мин

1.2K

Блог компании Lamoda TechУправление проектами*Управление продуктом*Управление разработкой*Машинное обучение*

Кейс

Привет, Хабр! Меня зовут Саша Лапина, я проджект-менеджер* в Lamoda Tech, в стриме по разработке внутреннего продукта — ML-модели оптимизации ценообразования. Поделюсь кейсом управления разработкой и расскажу, как мы налаживали процессы в нашей кросс-функциональной команде, которая за 2 года выросла в шесть раз.

+13

1 2 ...

7 8

10 11 ...

243 244

Машинное обучение *

Как устроены LLM-агенты: архитектура, планирование и инструменты

Никто не читает старые статьи… базу, так сказать, основу…

От месяцев к минутам. Как мы применяем машинное обучение для поиска перспективных литий-ионных проводников

Не гугли — собери ИИ-агента, который сам ищет, пишет и помогает с кодом

От хаоса к порядку: как ML помогает искать и защищать конфиденциальную информацию

Похож ли ваш текст на ИИ?

Как мы сделали новых ИИ-помощников для программистов компактными и при этом могучими

Как проверять ИИ гипотезы быстро и дешево – гайд в CRISP-DM Light фреймворк

Тест-драйв Claude 4: Opus и Sonnet в бою за код и 3D

Почём ИИ для народа: протестировали платформу YADRO G4208P с восемью H100 NVL и RTX 4090 на десятке ИИ-моделей

Ваш персональный аналитик: как создать RAG-пайплайн для анализа Telegram-каналов

Эксперимент Agent Village: как автономные ИИ-агенты собрали деньги на благотворительность

Взлом AI Assistant через… философию?

Ближайшие события

Benchmark — разрушитель LLM'ок, или Как мы собрали свой мультиязычный SWE-Bench

Как прямая помогает обучать машины

Топ нейросетей для пересказа и суммаризации текста

Бизнесу не нужно внедрять ИИ. Рассказываю, как ИИ-хайп ослепил российские компании

Нейро-дайджест: ключевые события мира AI за 4-ю неделю мая 2025

Покерная лаборатория закрывается, ловите исходники

Data Science + Разработка =… или Как наладить процессы в растущей кросс-функциональной команде

Вклад авторов