Все потоки
Поиск
Написать публикацию
Обновить
841.64

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Эмоции на длинной дистанции: как ИИ учится быть эмпатичным

Время на прочтение3 мин
Количество просмотров563

Почти все тесты на «эмоции» у больших языковых моделей — это короткие реплики: вежливый ответ, парочка поддерживающих слов, и всё на этом. Но в жизни всё работает иначе. Когда разговор затягивается, люди уводят тему в сторону, вспоминают старое, возвращаются — и именно тогда важные нюансы легко теряются. Могут ли современные ИИ не сбиться с эмоциональной нити на длинной дистанции, когда речь идёт не о паре фраз, а о десятках страниц и сложных диалогах? Исследователи решили проверить это на практике: собрали стресс‑тест для моделей с объемными, реальными сценариями, в которых приходится дотошно разбирать переживания и поддерживать разговор до конца. И вместе с этим придумали пару довольно интересных трюков, чтобы дать моделям шанс не «утонуть» в потоке эмоций. Как ИИ справился с этим марафоном — и что из этого вышло, читайте далее.

Читать далее

Развитие интеллектуальных помощников в центрах кибербезопасности

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров672

Всем привет! Я работаю инженером-разработчиком в STEP LOGIC. Наша команда создает технологическую платформу для автоматизации анализа данных и расследования инцидентов STEP Security Data Lake (SDL). Мы были первыми на российском рынке, кто смог внедрить AI-ассистента в SIEM/SOAR. Поэтому в этой статье я хотел бы поразмышлять о перспективах развития и особенностях применения интеллектуальных помощников в системах мониторинга кибербезопасности.

В статье я рассмотрю, какие задачи поможет решить внедрение интеллектуального помощника, с какими рисками придётся столкнуться, разберу пример интеграции AI-ассистента и особенности интеллектуальных систем на базе RAG.

Читать далее

Lens Blur Fields: нейросетевая ФРТ на службе улучшения фотографий и идентификации камеры

Уровень сложностиПростой
Время на прочтение15 мин
Количество просмотров891

Оптическое размытие — обобщающий термин для различных факторов деградации изображения, таких как расфокусировка, дифракция и аберрации. Математически оно описывается функцией рассеяния точки. Форма ФРТ, как правило, пространственно-вариантна и зависит от координат в поле изображения, настройки фокуса, расстояния до объекта (глубины резкости), апертуры и длины волны. Поэтому любые попытки точно описать размытие реальной камеры сталкиваются с необходимостью измерять слишком большое количество параметров, что на практике выполнить почти невозможно.

Метод Lens Blur Fields предлагает новое решение: использовать многослойные перцептроны, которые обучаются представлять ФРТ в виде непрерывной функции высокой размерности (arXiv:2310.11535). Такая модель способна обобщать по всем параметрам сразу и восстанавливать плавные изменения ФРТ вместо того, чтобы хранить её в виде разрозненной таблицы замеров.

В теории это значит, что метод Lens Blur Fields позволит не только сделать очередной красивый фильтр с боке, но и различать экземпляры камер по снимкам с них.

Читать далее

Топ-12 бесплатных нейросетей для создания видео и оживления картинок

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров25K

Когда вы в последний раз поднимали взгляд к звёздам и думали: «А вдруг где-то там действительно есть жизнь?»

Космос всегда был для нас не только загадкой, но и сценой для фантазий. Учёные ищут ответы в телескопах и формулах, а мы решили погнаться за модой и спросить у нейросети.

Сегодня достаточно пары слов — и алгоритмы нарисуют целые миры. Теперь режиссёром становится ваше воображение, которое неплохо так заправлено искусственным интеллектом.

Мы протестируем 12 сервисов и посмотрим, смогут ли они превратить безмолвный космос в оживший пейзаж и заселить его инопланетными героями.

Да пребудет с тобой Сила, нейросеть… и пусть твои звёзды не рендерятся сутками!

Приятного чтения!

Читать далее

Как ChatGPT помогает при обучении

Время на прочтение16 мин
Количество просмотров6.1K

Как мы учимся новому:

- Самостоятельно — читаем книги, статьи, смотрим бесплатные материалы в интернете.

- На курсах / с ментором — помимо обучающих видео и статей идет закрепление материала в виде домашних заданий.

Но ведь теперь есть ChatGPT (и его аналоги) — искуственный интеллект (ИИ), очень много знающий. Ему можно задать любой вопрос и получить развернутый ответ. Как он изменит обучение? Заменит ли он тренера на курсах? Или будет ему помогать?

Я считаю, что чат — не замена «обычной» учебе, однако большое подспорье для неё. И в этой статье я покажу плюсы и минусы его использования в обоих вариантах обучения.

Читать далее

Что случается с медицинскими данными без стандартов отчетности: кейс менингита и survival-анализа в R

Время на прочтение8 мин
Количество просмотров290

Без стандартов — ни к журналу, ни к себе не подступишься: в этой статье — история анализа выживаемости пациентов с менингитом и то, как внедрение STROBE и TRIPOD полностью изменило подход к работе с медицинскими данными. На примере кейса и кода на R автор показывает, как стандарты отчетности помогают структурировать исследование, избежать потерь данных, честно построить модель и — главное — самому понять, что ты сделал.

Читать далее

«Большие вызовы»: как школьники за 3 недели собрали модуль для офлайн-распознавания документов на Android

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров946

Привет, Хабр! Меня зовут Олег Милосердов, я руковожу проектами по компьютерному зрению в ВТБ. В июле мы с коллегами приняли участие в научно-технологической программе «Большие вызовы» от образовательного центра «Сириус» в качестве наставников. Мы предложили школьникам спроектировать и внедрить автономный модуль распознавания MRZ-зоны документов, удостоверяющих личность, прямо на мобильном устройстве под Android, которое работает без интернета, серверов и облака. В этой статье расскажу, как талантливые старшеклассники справились с задачей, какой опыт получили и какие выводы мы можем сделать как наставники.

Читать далее

«Скажи мне, кто-то твой друг, и я скажу, кто ты». Разбираемся, стоит ли дружить с чат-ботами

Время на прочтение5 мин
Количество просмотров1K

Современные чат-боты — не просто программы с набором готовых фраз, а комплексные, сложные системы. Они обучаются, адаптируются к пользователю, имитируют эмоции, причем так натурально, что порой кажутся настоящими собеседниками. В этом нет ничего удивительного, ведь их задача — быть полезными, дружелюбными, поддерживающими.

Все бы хорошо. Но в редких случаях чрезмерное увлечение чат-ботами может привести к смещению акцентов в реальном общении и ощущению изоляции. Давайте разбираться, почему виртуальная дружба иногда выходит за рамки привычного и как сохранить здоровый баланс.

Читать далее

Программисты против ИИ и low-code: кто кого заменит

Уровень сложностиПростой
Время на прочтение14 мин
Количество просмотров3.2K

Привет, Хабр!

«Программистов станет больше, но других» — эта фраза из недавней дискуссии в телеграм-канале Dev Q&A заставила меня задуматься о том, насколько быстро меняется наша профессия.

Коллеги из Диасофт — Сергей Ольков и Дмитрий Старов — вместе с экспертами из других компаний устроили жесткий разбор того, что происходит с разработкой в эпоху ИИ. К нимприсоединились Дмитрий Маруськин (TechLead Capture C# Team), Дмитрий Демиркылыч (АО «Нейросети»), Сергей Сергеев (Comindware) и Алексей Граков (Agizo).

Самое ценное в дискуссии — полное отсутствие розовых очков.

Читать далее

Что выяснили про ChatGPT: первые реальные данные несколько удивляют

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров15K

OpenAI впервые раскрыла реальную статистику использования ChatGPT: 73% запросов не связаны с работой

Компания OpenAI опубликовала первое масштабное исследование поведения пользователей ChatGPT, проанализировав 1,5 миллиона реальных диалогов за период с мая 2024 по июнь 2025 года. Результаты оказались неожиданными и развенчали многие мифы об использовании ИИ.

Ключевые выводы:

700 млн пользователей в неделю — каждый десятый взрослый житель планеты

73% запросов личные, только 27% связаны с работой (год назад было 50/50)

Женщины обогнали мужчин — 52% vs 48% пользователей

Программирование — всего 4,2% от всех запросов (а не основное применение, как многие думали)

Три главные категории: практические советы (29%), поиск информации (24%), создание текстов (24%)

Неожиданные факты:
→ В развивающихся странах ChatGPT растет в 4 раза быстрее, чем в богатых
→ 10% всех обращений — это обучение и репетиторство
→ Больше половины "письменных" задач — редактирование существующих текстов, а не создание нового контента

Исследование показало, что ChatGPT превратился из нишевого инструмента для программистов в массовый помощник для повседневных задач — от рецептов до домашних заданий.

Читать далее

Полезные задачи на Kaggle ( LLM, Diffusion Models)

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров2.3K

В мире Data Science и Data Engineering ценится не только теория, но и практический опыт: умение работать с реальными данными, строить модели и доводить решения до результата. Однако получить такой опыт непросто: рабочие проекты часто закрыты NDA, а учебные кейсы не отражают сложность реальных задач.

Именно поэтому платформа Kaggle заняла особое место в индустрии. Это крупнейшее мировое сообщество специалистов по данным:

Читать далее

Рекомендации историй ВКонтакте: от простой эвристики до ML-системы

Уровень сложностиСредний
Время на прочтение15 мин
Количество просмотров937

Привет, Хабр! Я Степан Малькевич, руковожу командой рекомендации ленты ВКонтакте, AI VK. Сегодня расскажу, как мы за последний год прокачали алгоритмы рекомендаций для историй. Это был путь от MVP с простыми эвристиками до ML‑системы с моделированием авторов, поведенческими фичами и прицелом на онлайновые реакции.

Читать далее

ИИ-агенты выходят на рынок: как строится новая агентная экономика

Время на прочтение4 мин
Количество просмотров2.6K

Когда мы слышим про ИИ‑агентов, многие представляют себе умных помощников. Но что если эти агенты уже сегодня учатся не просто помогать, а напрямую участвовать в цифровой экономике? Они торгуются между собой, обмениваются данными, зарабатывают репутацию, заключают сделки, а иногда — принимают решения быстрее, чем человек успеет моргнуть. Становится похоже на новую игру, правила которой ещё только пишутся. Как устроены эти «песочницы», где автономные агенты учатся жить по своим законам, почему рынок будет меняться гораздо быстрее, чем кажется, и какие подводные камни ждут впереди — разбираемся на свежем примере из исследовательской лаборатории Google DeepMind.

Читать далее

Ближайшие события

Как разработать корпоративного кодового ассистента на основе LLM: от идеи до прототипа

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров2.9K

Привет, Хабр! На сегодняшний день активно распространяется вайб-кодинг — практика написания кода с помощью ИИ кодового ассистента. При его правильном использовании можно ускорить процесс разработки, переложить написание рутинного кода на ИИ и покрыть пробелы в использовании инструментов и библиотек.

Меня зовут Никита Кулин, я Senior ML-инженер в команде AI X5 Digital, которая интегрирует ИИ в процессы компании. Я расскажу о том, как создать собственного кодового ассистента. Рассмотрим полный цикл разработки: от постановки задач до прототипирования.

Читать далее

Сам себя не похвалишь… это сделает искусственный разум. Ревью Deepseek о нашем проекте с LLM

Время на прочтение6 мин
Количество просмотров893

Попросили Deepseek проанализировать наш проект о разработке системы автоматизированной проверки цифровых информационных моделей (ЦИМ) в строительстве. Недавно мы рассказывали о пилоте с ее применением. В итоге получили подробное ревью, с примерами похожих проектов из мировой практики и с выводом об уникальности нашей разработки!

«Прямых аналогов с точно такой же глубиной проработки и комплексностью подхода, ориентированного на российский рынок, нет»  утверждает нейросеть.

Что же сказал Deepseek?

Не все котам масленица: о чем надо задуматься разработчикам, чтобы сохранить текущий уровень достатка

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров3.1K

Привет, Хабр! Меня зовут Иван Самсонов, я CPO of AI в MWS, где делаю так, чтобы все эти модные технологии не просто красиво звучали на митапах, а реально работали в операционке. Сейчас уже никого не нужно убеждать, что AI «пришел» и его пора интегрировать в любой подходящий утюг. Фокус сместился: я все меньше убеждаю топов в необходимости ML, и больше — мидл-менеджмент и инженеров. И доказываю им, что нужно изучать работу нейронных сетей и пристально следить за их развитием. Для этого у меня есть очень весомый довод — на горизонте 5–7 лет огромный пласт технических задач уйдет людям, умеющим грамотно формулировать запрос. В этом материале я расскажу, как это может произойти и кому уже надо задуматься о будущем с ИИ.

Читать далее

Что такое эмбеддинги и как с ними работать. Вводная для начинающих

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров11K

В этой статье будет рассказано об эмббедингах и методах работы с ними. Расскажу немного математики и приведу много примеров на Python.

🔥 Начинаем? 🔥

Скаутинг 2.0: как ИИ и xG находят таланты раньше рынка

Время на прочтение5 мин
Количество просмотров370

Футбол больше не сводится лишь к интуиции и традициям. Теперь это соревнование за то, кто сможет эффективнее использовать данные. От продуманной трансферной стратегии «Брайтона» до работы Луиша Кампуша в ПСЖ — клубы всё активнее обращаются к продвинутой аналитике, чтобы опередить соперников. Это означает использование инструментов на базе искусственного интеллекта, машинного обучения и футбольных данных для более раннего поиска талантов, снижения рисков при трансферах и получения конкурентных преимуществ.

Читать далее

Локальные LLM модели: обзор и тестирование

Уровень сложностиСредний
Время на прочтение33 мин
Количество просмотров20K

В ★5УГЛОВ мы часто работаем с языковыми моделями — как облачными, так и локальными. И если про онлайн‑сервисы знают все, то локальные LLM до сих пор остаются недооцененным инструментом. Я решил поделиться личным опытом: какие модели можно запускать прямо на ПК, чем они полезны и зачем их вообще использовать в реальных проектах.

Большие языковые модели (Large Language Model, LLM) уже давно не являются громоздкими программными продуктами, закрытыми от пользовательских доработок и требующими огромных вычислительных мощностей. Многие ИИ можно скачать и запустить на обычном компьютере без интернета. Популярны так называемые «дистиллированные» модели — сжатые версии основных нейросетей, имеющие меньше параметров. Они требуют меньше ресурсов и могут работать даже на не самых мощных настольных ПК или ноутбуках. За последнее время локальные ИИ заметно улучшились: они стали быстрее, стабильнее и качественнее. Если раньше многие из них стремились отвечать по‑китайски (если явно не указать язык), то сегодня выбор значительно шире и работать с ними удобнее. Попробуем оценить самые популярные на разных задачах и выбрать лучшую.

Читать далее

Прокачиваем RAG: тестируем техники и считаем их эффективность. Часть 1

Уровень сложностиПростой
Время на прочтение15 мин
Количество просмотров6.8K

При про­ектировании RAG-системы инженер каждый раз сталкивается со множеством вопросов: какую базу данных использовать, как организовать получение релевантной информации, да даже выбор эмбеддера может занять приличное время, а это лишь вершина айсберга. Что хорошо работает в одной сфере, например в техподдержке, может полностью провалиться в другой — например, при анализе юридических документов. Поэтому задачей инженера является выявление особенностей предметной области и адаптации RAG системы к ним. Однако, чтобы это сделать, необходимо не только понимать, какие приёмы можно использовать, но и знать насколько они эффективны.

В данной статье мы разберём основные RAG техники, посмотрим их сильные и слабые стороны, сферы применения, а также немного поэкспериментируем. В следующей части статьи мы проведём тестирование этих техник на реальных пользовательских запросах из датасета Natural Questions и оценим качество работы с помощью RAGAS и BertScore, посмотрим на графики и разойдёмся, чтобы обдумать всё написанное. Поэтому предлагаю начать!

Читать далее

Вклад авторов