Все потоки
Поиск
Написать публикацию
Обновить
1120.15

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Невидимые ошибки медицины и надежда на ИИ

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров309

Я писал о медицине 2050 года (и тогда видел в её будущем засилье ИИ и роботов, воспринимая это как неизбежность — и скорее со знаком «минус». Однако размышление на эту тему приводит к выводу, что в реальных условиях нашей страны пациенты, напротив, выиграют от трансформации человеческой медицины в медицину машинную.

Читать далее

Новости

Создание умных AI-агентов: полный курс по LangGraph от А до Я. Часть 3. Даём ИИ руки: работа с инструментами и MCP

Время на прочтение36 мин
Количество просмотров438

В третьей части курса по созданию ИИ‑агентов совершаем революционный скачок: превращаем умных болтунов в настоящих цифровых исполнителей с «руками».

Учим агентов самостоятельно работать с файлами, базами данных, API и внешними системами. Больше никаких просьб «пришлите мне файл» — агенты сами найдут данные, проанализируют их и создадут отчёт.

Осваиваем три мощных паттерна: ручные графы с инструментами для максимального контроля, ReAct‑агентов для простоты использования и мультиагентные системы, где каждый агент — эксперт в своей области.

От простых файловых операций до комплексных систем с оркестратором, которые автоматически исследуют темы в интернете, структурируют данные и создают профессиональные отчёты.

Плюс разбираем Model Context Protocol (MCP) — универсальный стандарт для подключения любых инструментов.

Читать далее

Новые алгоритмы ускоряют машинное обучение в децентрализованных сетях

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров140

Международная команда ученых совершила прорыв в области распределенного машинного обучения, разработав новые алгоритмы, значительно повышающие эффективность обучения моделей в федеративных сетях. Исследование, проведенное учеными из Университета имени Короля Абдуллы ( Саудовская Аравия), Московского физико-технического института (МФТИ), Университета Мила и Монреальского университета (Mila, Канада), Университета имени Мухаммеда бен Зайда по искусственному интеллекту (MBZUAI, ОАЭ) и Принстонского университета (США), представляет собой значительный шаг вперед в решении проблемы высокой вычислительной сложности обучения больших моделей в распределенных системах. Результаты опубликованы в материалах конференции NeurIPS 2024.

Читать далее

Circuit Tracing: как заглянуть в галлюцинации модели и найти там смысл

Время на прочтение7 мин
Количество просмотров618

Всем привет! Меня зовут Ирина, я NLP-инженер в red_mad_robot, занимаюсь научными исследованиями интерпретируемости LLM и анализом механизмов внутренних вычислений моделей, чтобы применять полученные результаты на практике. Например, сегодня хочу рассказать, как мы подошли к решению задачи детекции галлюцинаций LLM в RAG системах со стороны исследования графов размышлений модели — с помощью интересного фреймворка от Anthropic.

В статье поговорим, как использовать cross-layer transcoders и атрибуционные графы для детекции галлюцинаций в RAG системах. Рассмотрим пример реализации детектора на графах для анализа модели Qwen2.5-7B и практические примеры использования. Спойлер: на простой реализации получили точность детекции 85% на тестовом датасете.

Читать далее

Умеют ли нейросети создавать игры?

Время на прочтение4 мин
Количество просмотров950

Как вы думаете, может ли нейросеть не просто писать код, а придумать игру с нуля — чтобы герои прыгали, анимации радовали, а всё это реально хотелось попробовать самому? Оказалось, для ИИ с этим не всё так просто. Одно дело — решить алгоритмическую задачку. Совсем другое — создать что-то, что приятно выглядит и не разбивается при первом запуске. Недавно исследователи придумали способ честно сравнивать, какой ИИ справляется с этой задачей лучше: они собрали целый полигон игровых примеров, где важна не только работа кода, но и то, что появляется на экране. Получилось не просто сравнение — а взгляд на настоящее и будущее генерации игр силами нейросетей.

Читать далее

Как «программировать» свои сны: техники осознанности и алгоритмы ночного сознания

Уровень сложностиСложный
Время на прочтение4 мин
Количество просмотров1.1K

Мы привыкли воспринимать сон как что-то пассивное: лёг, заснул, проснулся. Но на самом деле — это среда, в которой можно что-то делать. Более того, есть техники, позволяющие буквально «программировать» свои сны. В этой статье я попробую объяснить, как осознанность во сне можно рассматривать через призму алгоритмов, чем это похоже на инженерные задачи и какие инструменты можно «позаимствовать» из мира IT.

Читать далее

«Пароль? 2FA? Давайте уже честно — этого мало!»

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров1.4K

Привет, Хабр! Разбираемся вместе с Андреем Пименовым, аналитиком данных R&D-лаборатории Центра технологий кибербезопасности ГК «Солар», как происходит ИИ-детекция по звуку и клавиатуре.

Представим ситуацию: злоумышленник втирается в доверие к сотруднику, получает пароль, обходит SMS-верификацию, и — та-дам! — ваши корпоративные сервисы теперь рассылают коллегам фишинговые ссылки. Вероятен сценарий? Конечно!

Так, в 2020-м так взломали Twitter (те самые твиты от верифицированных пользователей со скамом). А в случае с SolarWinds, крупной американской IT-компанией, хакеры месяцами работали в системах, притворяясь легитимными пользователями.

Читать далее

Российские ученые ускорили машинное обучение в распределенных системах без центрального сервера

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров260

Исследователи из России вместе с их американским коллегой предложили новый, полностью децентрализованный алгоритм оптимизации. Этот алгоритм позволяет эффективно решать различные задачи, работая без центрального сервера и автоматически настраиваясь без предварительной настройки параметров. Результаты исследования опубликованы в материалах конференции NeurIPS 2024

Читать далее

Как мы научили нейросеть читать технические схемы и сразу считать их стоимость

Время на прочтение5 мин
Количество просмотров1.6K

Когда думаешь о «цифровой трансформации» в промышленности, в голове обычно всплывают роботы, датчики, большие экраны и дроны, которые сами разносят детали по цеху. В реальности всё часто упирается в куда более прозаичные вещи.

Например — технические схемы. Представьте: целые шкафы с папками, где вперемешку свежие CAD-чертежи и сканы пожелтевших листов А3 с подписями от руки: «Смотри сюда», «замени резистор». Чтобы собрать спецификацию и посчитать стоимость, инженеру приходилось садиться с карандашом и Excel — и часами переписывать резисторы, транзисторы, конденсаторы, их номиналы и количество. Ошибся в одной букве или не заметил мелкий элемент — и вся цепочка снабжения поехала.

В какой-то момент мы, как разработчики, задали себе вопрос: «А почему в 2025 году до сих пор человек должен глазами считать резисторы на сканах, если есть компьютерное зрение и OCR?» Так и стартовал проект: сделать систему, которая за полминуты превратит «кривой скан схемы из прошлого века» в таблицу компонентов с готовой сметой.

Читать далее

Как киберэкономика и ИИ меняют философию науки? Поппер, Кун, Фейерабенд и Лакатош в условиях цифровых технологий

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров248

В последние десятилетия мы переживаем эпоху технологических прорывов, изменяющих привычные границы не только в науке и бизнесе, но и в самой философии. Статья, на которую я опираюсь, поднимает вопросы о достоверности знаний в эпоху информационных технологий и искусственного интеллекта, и призывает к попытке пересмотра эпистемологии, выходящей за рамки классических теорий.

Читать далее

Nano Banana для дизайнеров: как работать, не отходя от Figma

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров2.5K

Привет, Хабр! Меня зовут Алина Сидоренко, я лид-дизайнер в компании Friflex. В этой статье я расскажу, как быстро генерировать и редактировать изображения без фотошопа (и даже не выходя из Figma) с помощью нейросети Nano Banana. Это модель редактирования и генерации изображений внутри ИИ-помощника Gemini от Google, которая позволяет точечно менять отдельные элементы на фото и при этом не разрушать всю сцену.

Читать далее

Сначала Agile, потом — агентный ИИ

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров737

Агентные ИИ-системы обещают ускорить разработку, но ускоряют только там, где уже налажен быстрый поток поставки: автономные продуктовые команды, короткие циклы, непрерывная обратная связь. Реальность же прозаична: по DORA многие организации релизят реже раза в неделю, у четверти change failure rate доходит до 40%, а инциденты чинятся неделями.

В статье разбираемся, почему без «взрослого» Agile и DevOps ИИ-агенты всего лишь делают узкие места заметнее, и как организационная агентность (право и способность команд действовать) становится предпосылкой для реальной выгоды от ИИ.

Agile → ИИ-агенты: что важно

Данные не кончатся: как LLM навсегда изменили сбор и разметку мультимодальных данных и привели нас к SynthOps

Время на прочтение9 мин
Количество просмотров1.3K

Привет! Эта статья посвящена синтетическим данным и тому, как сбор данных и их разметка изменились навсегда. Поговорим про мультимодальную синтетику (аудио и изображения), генераторы, валидаторы, примеры классных генераций, датасеты, роль LLMок в этих процессах и трансформацию привычных пайпланов в концепцию SynthOps, которая требует других подходов по работе с данными.

Я достаточно долгое время разрабатывал софт для разметки всего и вся любой сложности, рассказывал про то как LLMки пришли на замену (или помощь) людям в текстовых и мультимодальных данных, а потом позанимался генерацией разного роды синты.

Обо всем это и хочется рассказать.

Читать далее

Ближайшие события

T-ECD — синтетический кросс-доменный датасет для исследований в области рекомендательных систем

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров644

Всем привет! На связи команда RecSys R&D Т-Банка. В экосистеме Т мы развиваем рекомендации практически во всех сервисах — от инвестиций до доставки продуктов и кэшбэка.

Представляем  открытый синтетический датасет T-ECD — T-Tech E-commerce Cross-Domain Dataset. Он создан на основе реальных данных Т-Банка и предназначен для исследований в области рекомендательных систем. 

Под синтетичностью мы понимаем то, что датасет насемплирован из реального распределения, поэтому обладает очень похожими на реальность статистическими свойствами данных, но при этом полностью анонимный и обезличенный.

Рассказываем, как T-ECD устроен и что внутри. Полный датасет и его уменьшенная версия T-ECD-Small уже доступны на Hugging Face.

Читать далее

Как мы научили ИИ превращать отзывы в деньги

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров775

Привет, Хабр! Меня зовут Артём Гриппа, я руковожу направлением продуктов поддержки клиентских отзывов в Магнит OMNI. Сегодня хочу рассказать о том, как команды моего направления — клиентских отзывов и платформы опросов — вместе с нашими стейкхолдерами создали систему работы с клиентской обратной связью, которая влияет на бизнес-результаты. Не просто собирает красивые метрики для отчётов, а превращает каждый отзыв в конкретные действия и, что немаловажно, в дополнительную выручку. Причём речь идёт не о паре сотен отзывов, которые можно прочитать за чашкой кофе, а о полутора сотнях тысяч ежедневных комментариев, которые физически невозможно обработать без автоматизации.

Читать далее

VoiceReader — читаем вслух

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров893

Делаем на c# репетитора по чтению вслух на 20+ языках.

Идея простая: открываем текст на (почти) любом интересующем языке, и читаем в микрофон. Все распознанные слова в тексте помечаются цветом.

Читать далее

ML Q & AI. Глава 9. Генеративные ИИ модели

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров772

← Предыдущая глава | 

Какие существуют популярные категории глубоких генеративных моделей (также известных как генеративные ИИ) в области глубинного обучения, и какие у них недостатки?

Для создания различных форм информации, таких как изображения, видео, тексты и аудио, было разработано множество глубоких генеративных моделей. Кроме того, эти модели могут быть адаптированы для генерации данных, специфичных для конкретных областей, например, для моделирования органических молекул и белковых структур. В этой главе мы сначала рассмотрим определение генеративного моделирования, а затем подробно опишем каждый тип генеративной модели, оценив их сильные и слабые стороны.

Читать далее

ИИ и образование: как меняется школа и университет под влиянием технологий

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров896

А на дворе сейчас 2025 год, когда часто слышны новости о появления какой‑нибудь новой модели или обновления старой. Нейросети сегодня проникли во многие сферы (точнее пытаются это сделать): от бизнеса до медицины, от развлечений до повседневных бытовых устройств. Не всегда удачно, но какие‑то плюсы от этого все же есть.

Однако давайте сосредоточим внимание именно на образовательных учреждениях: школах, колледжах и вузах. Разберемся, какие перемены происходят там благодаря искусственному интеллекту, какие возможности открываются перед учениками, студентами и даже преподавателями, а также постараемся оценить, насколько эти изменения полезны или, напротив, несут потенциальные риски.

Я, конечно, тоже выскажусь по этому поводу, поделившись своими мыслями относительно плюсов и минусов происходящего процесса.

Принимайте устойчивое сидячее или лежачее положение — как вам удобнее, а я приступаю к своему рассказу.

Читать далее

Как убрать жёлтый оттенок у картинок, сгенерированных в ChatGPT

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров4K

Открытый в конце ноября 2022 года ChatGPT вскоре перестал быть сервисом только для создания текстов. Ещё 19 октября 2023 в платные тарифы добавили DALL·E 3. 8 августа 2024 года OpenAI расщедрилась: отныне можно было создавать до двух картинок в сутки на бесплатном тарифе ChatGPT. Важно, что это был просто союз с большой языковой моделью: БЯМ переводит нестройную человеческую просьбу в детальный бриф промпта для графического бэкэнда — генеративной нейросети на диффузионных декодерах.

25 марта компания OpenAI объявила, что отныне модель GPT-4o может генерировать картинки. БЯМ способна не только создать новое изображение с нуля по текстовому описанию, но и принять на входе другую картинку с текстовым промптом и сгенерировать что-то на этой основе. Теперь картинки рисовала не чистая диффузия, а авторегрессионный трансформер в связке с мощным декодером, качество поднялось, практическая польза резко выросла.

Почти сразу обнаружился огромный недостаток картинок от GPT-4o — лёгкий коричневый оттенок любых результатов, которому в разной степени были подвержены все результаты. Хотя проблема решается тривиально, сегодня существует целая экосистема платного софта для устранения этого эффекта.

Читать далее

Как оплатить ChatGPT из России в 2025 году легально и без лишних сложностей

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров16K

ChatGPT из «бота, который шутит и пишет стихи» превратился в полноценный инструмент. Для одних это замена Google при поиске информации, для других — ассистент по работе с кодом, а кто-то уже использует его как часть рабочей инфраструктуры. В 2025 году говорить «я работаю с ChatGPT» звучит примерно так же естественно, как когда-то «я использую Google Docs».

Но все это работает ровно до того момента, пока речь не заходит о подписке. Бесплатный тариф есть, но он ограничен: скорость падает, в часы нагрузки чат может просто «вылетать», а доступ к GPT-5 и дополнительным функциям остается за пейволлом. Именно поэтому многие рано или поздно задумываются о подписке ChatGPT Plus. Она стоит фиксированные $20 в месяц, но вот как оплатить ее из России — вопрос, который до сих пор вызывает больше всего проблем.

Читать далее
1
23 ...

Вклад авторов