Обновить
1164.85

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Нет, тренировка DeepSeek R1 не стоила $294 тыс. Реальная цифра в десятки раз выше

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров2.1K

В интернете широко обсуждают опубликованный в Nature отчет авторов DeepSeek, в котором якобы заявляется, что обучение модели R1 обошлось компании всего в 294 тысячи долларов. Цифра выглядит сенсационной, ведь конкуренты тратят на создание своих моделей в тысячи раз большие суммы: например, для Claude Sonnet 3.7 давали оценку в несколько десятков миллионов долларов. Если бы взятая из Nature цифра была правдой, то получилось бы так, что у конкурентов нет никаких шансов перед командой DeepSeek. Но это не так.

Читать далее

Nano Banana: редактирование изображений через нейросеть

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров17K

Доброго времени суток, «Хабр»!

Не так давно компания Google представила обновлённую модель для работы с визуальным контентом. Nano Banana уже получила в сети громкий титул убийцы Photoshop, поскольку не только создает картинки с нуля, но и редактирует: меняет стиль одежды, перекрашивает стены, удаляет лишние объекты и не только.

В сегодняшней статье мы подробно рассмотрим Nano Banana, протестируем эту модель, а также я со своей, далеко не авторитетной точки зрения, отвечу на вопрос: фарс или годнота предстала перед нами?

Принимайте устойчивое сидячее или лежачее положение — как вам удобнее, а я приступаю к своему рассказу.

Читать далее

Создание умных AI-агентов: полный курс по LangGraph от А до Я. Часть 2. Диалоговые агенты: память, сообщения и контекст

Время на прочтение48 мин
Количество просмотров20K

Во второй части курса по созданию ИИ-агентов превращаем безжизненные схемы в настоящих цифровых собеседников: подключаем нейросети к LangGraph, учим их запоминать контекст на сотни сообщений и гарантированно получать валидный JSON вместо творческой "болтовни".

Создаем умные системы, которые сами определяют тип сообщения — отзыв это или вопрос — и автоматически направляют в нужную ветку обработки.

Покажу, как объединить несколько нейросетей в одном графе, где каждая модель работает там, где сильнее всего. От простых диалогов до мультимодельных архитектур с интеллектуальной маршрутизацией.

Читать далее

Часть 5. Обзор техник оценки качества систем RAG

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров3.8K

Продолжаю адаптированный перевод статьи китайских исследователей Retrieval-Augmented Generation for Large Language Models: A Survey (ссылка на первую часть — здесь, на вторую часть — здесь, третью часть — здесь, четвёртую часть — здесь). К некоторым терминам, как и в прошлых частях, добавлены переводы и пояснения для удобства начинающих ИТ-переводчиков.

В этой части мы поговорим про техники оценки качества систем RAG и соответствующие им наборы данных. Основная цель — понять и оптимизировать эффективность моделей RAG в различных прикладных сценариях.

Читать далее

Как приручить драконов B2B-рынка и сократить длинные сделки

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров1.4K

Привет, Хабр! Меня зовут Дарья Морозова, я руководитель продуктового маркетинга в R‑Style Softlab. Хочу поделиться опытом, как мы перестроили работу продукта и маркетинга, чтобы справляться с длинными сделками на узком рынке и использовать ИИ не как «магический инструмент», а как практическое ускорение.

В России около 146 миллионов человек, но наша целевая аудитория — всего 308 банков. И это число сокращается: только за первый квартал 2025 года лицензии потеряли девять банков, а к 2030 прогнозируют существенное сокращение. В такой среде любая ошибка может стоить клиента и доли рынка.

Отдельный вызов — специфика сделок в банках. Их цикл длится 18–24 месяца, в процесс вовлечены от пяти до девяти ролей (CIO, CEO, риск, compliance и другие). Приоритеты у клиента меняются быстрее, чем формируется бюджет, а между касаниями может быть месяцы тишины. Главная проблема тут даже не конкуренты, а неопределённость и внутренняя инерция самого банка.

Эти вызовы мы называем «драконами». Чтобы их приручить, мы объединили продуктовый и маркетинговый отделы в один департамент с единым руководством и общими KPI. Теперь команды действуют как единое целое: маркетинг напрямую влияет на дорожную карту продукта, а продуктовые инсайты сразу превращаются во внешние коммуникации.

Результат — количество касаний с клиентами выросло на 30%, а маркетинг перестал восприниматься как «отдел затрат» и стал полноценным драйвером роста.

Читать далее

Проблема моделирования сознания в ИИ: философы или инженеры

Уровень сложностиСредний
Время на прочтение21 мин
Количество просмотров1.1K

Я часто заглядываю в философские паблики и с удовольствием наблюдаю полёт мысли профессиональных философов, обычно последователей континентальной философии. Слов нет — звучит красиво, глубоко, каждый термин ежедневно перекладывается с места на место, в общем все при деле. Особенно много времени уделяется вопросу сознания. Впрочем, результат тот же — гипотезы гипотез, доказываются гипотезами. Замечу, речь не о философии как таковой, а о разрыве между концептуальной ясностью и проверяемостью. Мне интересны как раз те философские конструкции, которые допускают операционализацию и тесты.

В связи с этим у меня возник вопрос: а пробуют ли они тестировать свои идеи? Сразу предвижу возмущение — там волшебные квалиа, ощущения, «Я», эмоции, душа и субъект, мудрецы, медитация и никакой «низменной материи».

Честно скажу, такой подход мне кажется непродуктивным. Текущее развитие ИИ требует не размышлений о тонкостях толкования влияния этернализма на интеракционалистскую свободу воли субъекта, а формирования операционных алгоритмов философии, которые можно будет запускать как симуляции на компьютерах и ИИ.

Если философская концепция не может быть формализована и протестирована — грош цена такой концепции.

Читать далее

Как мы автоматизировали весь процесс поиска работы с командой джунов

Время на прочтение6 мин
Количество просмотров4.4K

Всем привет! Мы команда разработчиков, которые создали первого в РФ ии-ассистента для поиска работы, собрав команду из 7 джунов. 

В этом посте делимся нашим опытом продукт-разработки: расскажем о ключевых ошибках, неочевидных инсайтах и о том, как нам удалось дожить до релиза, несмотря на 3 переноса его даты :) 

Читать далее

Расширяем базовый функционал n8n: от RAG до кастомного агента с MCP

Уровень сложностиСредний
Время на прочтение15 мин
Количество просмотров11K

Компании и энтузиасты стремятся автоматизировать процессы, но не каждый готов писать код с нуля. Поэтому в последние годы особую популярность набрала no-code платформа n8n. С её помощью можно быстро собирать пайплайны различной сложности: от простых чат-ботов до умных ассистентов, которые управляют календарем и напоминают о задачах.  Обычно в статьях про n8n затрагивают только готовые блоки, собирают из них пайплайны автоматизации, но в то же время упоминают об ограниченности использования этой платформы. Действительно, базовых блоков в n8n может не хватать, чтобы закрыть все потребности пользователя, но сегодня я покажу, как можно обойти эти ограничения и расширить базовый функционал n8n.

Привет, Хабр! Меня зовут Музафаров Данил, я Data Scientist в компании Raft. В этом туториале я шаг за шагом покажу: как локально развернуть n8n, как добавить кастомные API и создать полноценного AI-агента с MCP tools с расширенным функционалом. Придется немного писать код, но главное, что это позволит оставить архитектуру решения на n8n, дополнив его кастомными тулами.

Читать далее

Как научить ИИ-агентов работать с инструментами без ручной разметки

Время на прочтение4 мин
Количество просмотров1.1K

Как сделать так, чтобы ИИ-агент уверенно бронировал рейсы, проверял балансы, собирал ответы из нескольких сервисов — и не упирался в кучу искусственных ограничений? Команда исследователей решила взглянуть на этот вопрос иначе: если мир реальных инструментов слишком хаотичен, почему бы не построить для агента полноценную тренировочную среду — с тысячами функций и строгим контролем каждого шага? Оказалось, что такой виртуальный полигон способен научить модели не только формально вызывать API, но и действовать так, будто она действительно понимает происходящее. Что придумали авторы — в подробностях этой статьи.

Читать далее

Селективная генерализация: улучшение возможностей при сохранении alignment

Время на прочтение16 мин
Количество просмотров252

TL;DR: Мы провели бенчмаркинг семи методов, направленных на предотвращение эмерджентного рассогласования и других форм некорректного обобщения с использованием ограниченного объёма alignment-данных. Мы демонстрируем устойчивый трейдофф между способностями модели и согласованием, подчеркивая необходимость более эффективных методов для снижения этого конфликта. Простое включение alignment-данных в микс обучающих данных оказывается недостаточным для предотвращения рассогласования, однако простое наложение KL Divergence penalty на alignment-данные показывает лучшие результаты, чем более сложные подходы.

Читать далее

Как одеть гидру в броню или взлом смарт-контрактов на DeFi-хаке

Уровень сложностиСредний
Время на прочтение16 мин
Количество просмотров449

Философия, мысли и спойлеры

Добрый день, уважаемые хабровчане ;-). Мы продолжаем серию публикаций о нашем участии в «разношерстных» хакатонах, проводящихся под эгидой коммерческих, государственных и иных организаций самого необычного формата, направленности, специфики, толка и рассуждений.

В общем, мы стараемся на зацикливаться на конкретно одной тематике и/или специфике, и постоянно пробуем себя, в различных направлениях. Да, не скрою, порой мы ввязываемся в, откровенно, рискованные истории, там, где совсем не имеем опыта и/или имеем крайне отдаленное представление о том, что от нас требуется;)). Плохо это или хорошо, тут можно мыслить двояко, однако, у нас получается, учитывая, что из 10 хакатонов, которые мы провели 8 оказались, для нас успешными (или почти) и мы весьма преуспели на этом поприще соревновательного Data Science.

При этом, выходя на хак, мы для себя уже составили небольшой роадмап, что нам, в целом, интересно, помимо решения предложенного кейса и на что мы акцентируем внимание в первую очередь:

Примерно, с такими же настроениями, мы пришли и на этот (DeFi-2025, Сбер) очередной хак, посвященный разработке блокчейн‑решений и анализу уязвимостей смарт‑контрактов и web-3.

Забегая вперед скажу, что нам не хватило, каких‑то 0.06% для того, чтобы войти в топ-8 номинируемых команд. В общем, мы получили по сумме баллов за наше решение 13.44, тогда как у лидера было порядка 16. Отрыв небольшой, учитывая сложность задачи и ее первоначальное очень жесткое условие: одним из проходных критериев было создать уникальное решение, до этого нигде не фигурирующее в цифровом поле до 2025 года текущего месяца. С таким мы столкнулись впервые и были немного удивлены. Да. хакатон и подразумевает нечто подобное, но все же надо было понять, что вместе с нами было еще 28 команд, и они тоже умеют гуглить ;-). Наша команда называлась BlockTeam.

И мы предоставили такое решение и детально его показали организаторам. Интересно, тогда приглашаю всех неравнодушных лиц под кат. Хардкор, и только хардкор!!!

Читать далее

Ваш ИИ-ассистент — это новое поколение компиляторов

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров5.5K

Команда AI for Devs подготовила перевод статьи о том, как ИИ меняет саму суть программирования. Автор сравнивает LLM с компиляторами и утверждает, что роль разработчиков постепенно смещается от написания кода к управлению архитектурой и обучению ИИ. Как думаете, это угроза или эволюция профессии?

Читать далее

AI-агент 007. Разбираем, что автоматизировать, а что не стоит

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров2.9K

Всем привет, я Александр Константинов — технический эксперт из Cloud.ru. Всё чаще в жизни и работе мы имеем дело с AI-агентами — стремимся делегировать рутинные задачи или ускорить что-то сложное. И мы, само собой, в команде тоже их используем. В этой статье я подсобрал весь опыт — свой, команды, коллег и клиентов — и разобрал, с автоматизацией чего AI-агенты здорово помогут, а где лучше найти другое решение. А еще в конце показал, как быстро создать собственного помощника.

Читать

Ближайшие события

Внутреннее устройство чат-бота

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров2.1K

Всем привет! Меня зовут Кажекин Денис, я DS в лаборатории машинного обучения Альфа-Банка. В этой статье расскажу о том, как устроен наш чат-бот поддержки и какие модели участвуют в обработке пользовательских запросов.

Читать далее

Писать код просто, а читать сложнее

Время на прочтение4 мин
Количество просмотров4.8K

Написать код легко. Если у вас в голове сложилось решение, и вы уверенно владеете синтаксисом вашего любимого языка программирования, то напишете код с лёгкостью. А может быть у вас есть LLM, которая напишет за вас целые функции? Тогда ещё проще. Но сложнее всего не писать код, а читать. Требуется время, чтобы загрузить себе в голову ментальную модель системы. Вот это по-настоящему трудозатратно.

Ментальная модель складывается у вас в голове, когда вы читаете код. Это ваша внутренняя «карта», по которой понятно, как работает система, где находятся самые хитрые её части, что от чего зависит. Не имея такой карты в голове, вы просто смотрите на текстовые строки.

Когда я выполнял работу по заказу, большинство из моих заданий начинались одинаково. Мне ставили задачу пофиксить баг или добавить новую фичу в приложении, которое я видел впервые. Сначала моя ментальная модель была как чистая доска. Чтобы приступить к её заполнению, я открывал домашнюю страницу и разбирался, на что она похожа. Я открывал исходный код страницы: это React? jQuery? Сторонний плагин? Я просматривал базу кода, чтобы выяснить, используется ли у них где-нибудь ещё такая карусель, которую они просят поставить на первой страницы. Знакомился с их сборочным процессом, конфигурацией для тестирования, с тем, каким инструментарием они пользуются. Каждая мелкая деталь, которую я обнаруживал, встраивалась в ту модель, которая складывалась у меня в голове.

Читать далее

Как искусственный интеллект приносит миллионы: кейс завода минеральных удобрений

Время на прочтение12 мин
Количество просмотров3.4K

Нейросети умеют не только писать водянистые тексты и создавать картинки людей с тремя руками, но и решать реальные промышленные задачи.

Привет, Хабр! Меня зовут Андрей Никитин, я руководитель направления искусственного интеллекта в IBS. В этой статье расскажу, как мы внедрили ИИ на производстве минеральных удобрений крупного химического холдинга. Поделюсь, зачем на производстве нужно машинное обучение и почему нашей команде пришлось погрузиться в изучение технологии производства удобрений.

Читать далее

NVIDIA CMP – микроскопы для забивания гвоздей? Копаем глубже…

Уровень сложностиПростой
Время на прочтение17 мин
Количество просмотров5.6K

Почему видеокарта, имеющая неплохие вычислительные возможности, в Stable Diffusion работает в 20 раз медленнее, чем RTX 3060? Почему в LM Studio она становится фаворитом, а в ComfyUI карета превращается в тыкву? Почему FurMark на CMP 90HX тормозит, а на CMP 50HX «бублик» крутится почти нормально? Разгадки в разных программных ограничениях, которые можно найти с помощью экспериментов. Я купил три майнинговые карты NVIDIA, чтобы понять, можно ли заставить их эффективно работать.

В этот раз мы рассмотрим: статистику производительности в LM Studio, как всё печально в ComfyUI и Stable Diffusion, анатомию программного кода GPU, почему оптимизации производительности дают на CMP обратный эффект, какие режимы вычислений могут раскрыть их потенциал.

Читать далее

Как написать простейшую нейросеть на python, простыми словами о сложном

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров21K

В мире Data Science написание нейронных сетей, кажется чем‑то очень трудоёмким, доступным для понимания лишь математикам с многолетним опытом. Многие руководства, начинаются со сложных объяснений backpropagation, градиентного спуска и т.п, от которых у новичков складывается впечатление, что написание нейросетей — им не по силам. В данной статье, я хочу развеять подобные убеждения и показать пример, написания простейшей нейронной сети на python. Мы не будем углубляться в теоретические основы высшей математики. Вместо этого, мы просто возьмем данные, напишем код, посмотрим на результат и проанализируем его.

Читать далее

Дизайнер-видеомонтажёр — это просто! (Клип за 1000р)

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров1.6K

Идеи не падают с неба — они складываются из того, что нас окружает. Кто работал на фрилансе или шабашил наверняка сталкивался с проблемами продать подороже (купить подешевле).

На своём канале я реализую свои идеи. Порой хочется создать что‑то новое. Так что в какой‑то момент пазл сложился: я собрал в один трек свой опыт общения с «клиентскими хотелками», их требования, и привычку выражать мысли в рифме — получился черновой набросок песни:

Читать далее

Как я за неделю создала корпоративного бота для hh.ru: вайб-кодинг, прокачка промптов и уроки продакт-менеджмента

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров7K

Хабр, привет!

Я Оля Плюта, продуктовый аналитик hh.ru. Хочу поделиться необычным опытом участия во внутреннем хакатоне hh. Не в классическом формате «48 часов без сна», а в режиме «вайб-кодинга» — недельного марафона, где главное не только результат, но и процесс, удовольствие от создания продукта и обмен идеями.

Моим проектом стал Telegram-бот для нетворкинга и организации мероприятий внутри компании. Забегая вперёд, скажу, что итогом стали работающий прототип, ~5000 строк кода на Python и несколько неожиданных инсайтов, которые оказались ценнее самого кода.

Как это было и инсайты

Вклад авторов