Как стать автором
Поиск
Написать публикацию
Обновить
1140.96

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Воспроизводимый рейтинг: можно ли с помощью краудсорсинга предсказать выбор пользователей LLM?

Время на прочтение7 мин
Количество просмотров436

Всем привет! Сегодня хотим поделиться историей нашего эксперимента, который начался с простого вопроса: а можно ли с помощью краудсорсинга воссоздать рейтинг нейросетей, который мы получаем от тысяч реальных пользователей на нашем сайте LLM Arena

Причём не в жёсткой парадигме «оцени по инструкции», а приближаясь к реальному user preference, когда пользователь выбирает то, что ему субъективно больше нравится.

TL/DR: 

* Мы можем за 3 дня воспроизвести пользовательский рейтинг LLM с точностью 90%+;

* У нас есть отобранная команда аннотаторов и автоматический фильтр качества;

* Мы научились фильтровать фрод и мусорные промпты лучше, чем стандартные крауд-платформы;;

* Теперь мы можем быстро тестировать новые модели и выдавать предрейтинг до массового запуска.

Читать далее

Nano Banana от Google: генерация и редактирование изображений на новой архитектуре Gemini 2.5

Уровень сложностиСредний
Время на прочтение2 мин
Количество просмотров15K

26 августа 2025 года Google представила новую preview-модель под кодовым названием Nano Banana — это часть экосистемы Gemini 2.5 Flash Image, ориентированной на генерацию и редактирование изображений с помощью текстовых и мультимодальных запросов. Несмотря на шутливое название, перед нами — серьёзный инструмент с претензией на роль нового стандарта в визуальном ИИ.

Читать далее

NVIDIA RTX 6000 Blackwell Server Edition: тесты, сравнение с Workstation и RTX 5090, особенности охлаждения

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров3.5K

Разбираем RTX 6000 Blackwell Server Edition: чем она отличается от Workstation и Max-Q, как работает пассивное охлаждение в серверах, результаты тестов в инференсе LLM и генерации видео, а также сравнение с RTX 5090, A5000 и H100.

Читать далее

Собираем свою систему оценки общения операторов КЦ и получаем отчёты в Telegram

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров662

Привет, Хабр! Сегодня покажем, как буквально за пару вечеров собрать систему, которая расшифровывает звонки, анализирует речь операторов и присылает руководителю отчёт в Telegram.

Например, в кол-центре с 15 операторами такая сводка поможет руководителю быстро понять, кто перегружен, где чаще звучит негатив, а кто просто слишком много говорит. Не надо слушать записи — отчёт сам всё рассказывает.

📊 Отчёт за 19 июля
🎧 Оператор дня: Иван Иванов (emotionScore: 0.42)
🥵 Больше всего негатива: Юлия Тестова (33%)
🗣️ Средняя скорость речи: 132 слов/мин
🤯 Самый «говорящий»: Андрей Максимов (74% времени)
🚨 Перебиваний в среднем: 2,7 на звонок

Читать далее

Как дообучать LLM на лету с помощью памяти вместо файнтюнинга

Время на прочтение4 мин
Количество просмотров6K

Реальные агентные задачи требуют множества шагов, вызова инструментов и гибкой памяти. Исследователи нашли возможность улучшать агента без файнтюнинга весов языковой модели: предлагается хранить удачные и неудачные кейсы и опираться на них при планировании. В итоге получились шикарные метрики на бенчмарках GAIA, SimpleQA и Human Last Exam. Разбираемся, как это работает.

Читать далее

LLM-агенты против ручного ресерча: кейс Bioptic в биофарме

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров846

При разработке новых лекарств важно вовремя оценить конкурентную среду – какие препараты уже существуют или находятся в разработке для той же болезни. Такой анализ конкурентов обычно входит в due diligence проекта: инвесторы и фармкомпании вручную собирают данные из разных источников о всех потенциальных конкурентах целевого препарата. 

Команда стартапа Bioptic (сооснователь — Андрей Дороничев) предложила автоматизировать эту рутинную работу с помощью агентной AI‑системы на базе больших языковых моделей (LLM).

Всем привет. Меня зовут Кирилл Пшинник, я научный сотрудник Университета Иннополис и CEO онлайн-университета zerocoder.ru. Сегодня узнал о еще одном важном шаге в деле ускорения анализа и сбора информации с помощью ИИ. На этом примере — в медицине.

Читать

ИИ и бессмертие: может ли алгоритм наследовать личность?

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров851

Представьте будущее, где после вашей смерти близкие продолжают общаться с цифровой версией вас — она говорит вашим голосом, использует ваши шутки и хранит ваши воспоминания. Это не фантазия и не мистика, а результат работы искусственного интеллекта, обученного на ваших текстах, записях и сообщениях.

Возникает вопрос: если алгоритм воспроизводит мою манеру речи, мои мысли и воспоминания — это всё ещё я или лишь искусная копия?

Читать далее

Новый релиз публичного детектора голоса Silero VAD v6

Уровень сложностиСредний
Время на прочтение2 мин
Количество просмотров3K

На Хабре уже было аж 3 статьи про развитие нашего публичного детектора голоса Silero VAD (последняя тут). А вот что стало лучше в этот раз:

Хочу узнать!

Зачем детям изучать программирование, если есть ChatGPT?

Время на прочтение4 мин
Количество просмотров7.1K

Каждую неделю нам задают один и тот же вопрос: «Зачем учить ребенка программированию, если нейросети скоро заменят всех программистов?». Честно говоря, три года назад я и сама так думала. Но наблюдая за детьми в эпоху ИИ-революции, поняла кое-что важное.

Читать далее

Обзор существующих ИИ-инструментов для инженера-конструктора

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров13K

Дорогие мои рыцари-джедаи инженеры-конструкторы! Возможно, наблюдая за успехами нейросетей в последнее время, вы тоже задумывались, каким образом можно применить все это великолепие для собственной работы, особенно, если ваша работа связана с передовыми разработками в науке и технике. Меня тоже постоянно терзала мысль, что лодка с самыми классными разработками в сфере машинного обучения проплывает совершенно мимо. Не в силах терпеть такое положение, я решил разобраться в современных способах применения машинного обучения в нашей сфере и подготовить обзор инструментов и технологий, пригодных в нашем нелегком труде. Если вам интересно узнать, как ИИ может помочь в инженерной деятельности, добро пожаловать под кат.

Читать далее

Фрактальная логика и битва нейросетей за семантику

Уровень сложностиСредний
Время на прочтение17 мин
Количество просмотров706

Это история о попытке создать новую логику.

О попытке, рожденной в эпоху, когда фракталы Мандельброта казались ключом ко всей природе. Я, логик по образованию, увидел аналогию: если математические "монстры" оказались фракталами, то, может быть, логические парадоксы — это тоже фракталы?

Я построил концепцию, где смысл — не точка, а процесс, бесконечный и самоподобный. Но концепция осталась без семантики.

И тогда я решил устроить суд Божий: я дал свою книгу двум арбитрам — искусственным интеллектам. Я ожидал диалога, но получил войну.

Qwen, стремясь к формализации, строил сложные системы. DeepSeek, как строгий судья, разрушал их одну за другой, обвиняя в "иллюзии формальности" и "магии".

В этой битве не было победы. Но из обломков моей идеи родилось нечто ценное: понимание того, что истина в сложности не в построении новой системы, а в способности видеть старые проблемы по-новому.

Это — отчет с поля боя за семантику.

Читать далее

Повышаем точность диагностики ДЦП у новорожденных с помощью нейросетей

Время на прочтение12 мин
Количество просмотров3.3K

МРТ головного мозга помогает диагностировать серьёзные патологии, от опухолей до нейродегенеративных заболеваний. Своевременная диагностика в младенческом возрасте позволяет заметить в развитии мозга негативную динамику, приводящую к заболеваниям наподобие ДЦП, и вовремя начать терапию. Но когда дело касается обследования таких пациентов, есть дополнительные риски: эту процедуру проводят под анестезией. Поэтому врачам важны решения, которые позволят сократить время диагностики, снизить риски и принять более информированные решения.

Специалисты Санкт‑Петербургского государственного педиатрического медицинского университета (СПбГПМУ) совместно со Школой анализа данных (ШАД) и Центром технологий для общества Yandex Cloud разработали решение на базе нейросети, которое помогает оценить развитие мозга новорожденных по МРТ‑снимкам. При подозрении на ДЦП и другие болезни ЦНС решение работает как вспомогательный инструмент, который сокращает время расшифровки результатов МРТ до нескольких минут вместо нескольких дней.

Меня зовут Юлия Бусыгина, я руковожу проектом со стороны Yandex Cloud, и в этой статье мы вместе с профессором Александром Поздняковым расскажем подробнее, как проектировали решение, обучали модель, как тестируем и оцениваем его эффективность.

Читать далее

Использование code interpreter от OpenAI в 1С

Время на прочтение2 мин
Количество просмотров1.5K

На одном хорошем примере показываю как можно использовать встроенный инструмент OpenAI Code interpreter в 1С

Читать далее

Ближайшие события

Как айтишная пара ушла из найма и запустила стартап с AI-стилистом

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров2.7K

Надя и Андрей — семейная пара, которая оставила уютный найм и запустила AI-стартап Aesty. Она — экс-тимлид в ML, он — iOS-гуру. Вместе они делают продукт, который меняет шопинг: AI-стилист, создающий твоего цифрового двойника, чтобы миксовать образы и примерять тренды.

У них было всё — стабильная жизнь в Дубае, работа в найме, хороший доход, путешествия. Но на Порш не хватало, поэтому и ушли из найма (шутка!). Но накопилось внутреннее желание влиять на продукт, понимать, как устроен весь бизнес и решать не только инженерные задачи, а также интерес — делать что-то более креативное и визуальное.

Всё началось, когда Надя пыталась уместить гардероб в два чемодана при переезде. Она обратилась за помощью к стилисту, доверилась, вложилась — но в итоге почувствовала себя в чужом гардеробе. Тогда возникла мысль: а что, если AI сможет сделать шопинг по-настоящему персональным? Так и родилась идея Aesty.

У ребят не было резкого прыжка в продукт. Выход из найма начался мягко и продумано: с консалта, фриланса, коротких проектов. Пока в голове — формировалась идея и продукт не обрёл форму.

Сейчас они с Андреем уже прошли акселератор в Сауди, рейзят pre-seed, выпустили MVP и даже видят первую выручку.

Полное интервью

Интеллектуальный экзоскелет? Как ИИ меняет человеческий фактор

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров1K

Мне довелось попасть в это ваше IT в 2007 году. Тогда в Политехе был конкретный недобор, а офисные программисты с научными степенями с радостью писали запросы и формы отчётов за пакет хороших пряников. Причём делали это быстро, правильно и с пояснениями, несмотря на неумелые ТЗ-шки менеджеров и аналитиков. Дело было так: пишешь ТЗ, кидаешь на почту разработчикам, максимум через день (через три — уже скандал!) на внутренний звонит программист и зовёт, чтобы объяснить, как пользоваться отчётом или выгрузкой. Сейчас в большинстве компаний это выглядит так: ставишь задачу в таск-трекере и забываешь о ней; если через 2-3 недели изменится статус, считай, повезло. И попробуй слово скажи: айтишники ребята занятые, им думать надо. 

Читать далее

Как внедрить автоматическое ревью кода с помощью ИИ: опыт Microsoft, Google и ByteDance + практическое руководство

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров5K

TL;DR

Автоматическое ревью кода с помощью ИИ уже работает в продакшене крупнейших компаний. Microsoft обрабатывает 600 000 пулл-реквестов в месяц, экономя сотни тысяч часов. ByteDance достигла 75% точности с 12 000 активных пользователей еженедельно. Google автоматизировал 7,5% всех комментариев ревьюеров. В статье — детальный разбор архитектур, метрики эффективности и пошаговое руководство по внедрению с расчётом окупаемости.

Читать далее

Неожиданный результат: ИИ замедляет опытных разработчиков

Время на прочтение9 мин
Количество просмотров3.1K

Мы провели рандомизированное контролируемое исследование (RCT), чтобы оценить, как инструменты искусственного интеллекта начала 2025 года влияют на продуктивность опытных open-source разработчиков, работающих в своих собственных репозиториях. Неожиданно оказалось, что при использовании ИИ-инструментов разработчики выполняют задачи на 19% дольше, чем без них — то есть ИИ замедляет их работу.

Мы рассматриваем этот результат как срез текущего уровня возможностей ИИ в одном из прикладных сценариев. Поскольку системы продолжают стремительно развиваться, мы планируем использовать аналогичную методологию в будущем, чтобы отслеживать, насколько ИИ способен ускорять работу в сфере автоматизации R&D[1].

Подробности — в полной версии статьи.

Читать далее

Кейс: Как я, саунд-дизайнер без знаний кода, за 7 месяцев запустил SaaS-библиотеку звуков с помощью ИИ

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров1.5K

Привет! Меня зовут Илья Шмяк, я саунд-дизайнер. Моя работа — создавать звук для игр, кино, брендов. Я не программист, но у меня была гипотеза: можно ли в одиночку, используя только ИИ-ассистента, построить с нуля полноценный веб-сервис?

Спойлер: можно. Этот путь занял 7 месяцев и привел к запуску noise pw — библиотеки уникальных звуков. Это не просто история успеха, а разбор факапов, технических решений и текущей экономики проекта.

Этап 1. Гипотеза и MVP: Иллюзия простоты и первые ошибки фронтенда

Все началось с идеи создать платформу для продажи моих звуков и музыки. Моим единственным техническим специалистом стал ChatGPT.

Я начал с анализа референсов, чтобы понять технологический стек. ИИ порекомендовал Jekyll — генератор статических сайтов, как «быстрый, безопасный и простой». На тот момент я не осознавал концепции бэкенда и считал, что сайт — это просто набор HTML-страниц. Весь первый этап был посвящен созданию клиентской части (фронтенда).

Читать далее

Как мы сделали робота-комплектовщика: от идеи до первого прототипа

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров5.4K

Привет! Меня зовут Валерий Ильин, я руководитель сектора разработки мобильных роботов в Яндекс Роботикс. До недавнего времени в нашей линейке роботов отдельно жили мобильные роботы (робот‑инвентаризатор и робот‑тотоносец) и проекты на основе роборук (депалетизатор, пикер). Решения закрывали две основные операции на складе: перемещение товара и его отбор, но по отдельности. Идея объединить их и собрать робота, который закрывает обе операции, зрела в мыслях уже давно. Но прежде чем задумка воплотится в жизнь, ей нужно было созреть, набраться сил, а нам — опыта.

В феврале 2025 года мы начали разработку автономного робота, который сможет делать всё, что делает человек‑комплектовщик, — только не уставая и в предсказуемом темпе.

И сегодня я хочу рассказать о нашем роботе‑комплектовщике. Пока это только прототип, разработанный за 4,5 месяца, но у нас есть техническая концепция, которую мы планомерно реализуем.

Под катом разберём, с какими ограничениями сталкивается классическая роботизация (стационарные роборуки, AMR‑ и FMR‑тележки), почему склады не готовы радикально менять процессы и как это повлияло на архитектуру решения. А ещё я покажу, как мы сделали локальное планирование на роботе, доработали софт мобильной платформы, а также добавили камеры и обработку глубины. В конце поделюсь промежуточными результатами и расскажу о наших планах — от стекинга до тестов на реальных складах.

Читать далее

Искусственный язык имитирует человеческий вкус с помощью графена и искусственного интеллекта

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров618

Нет, это не метафора — учёные создали устройство, которое различает вкусы почти так же точно, как человек.

Оно работает во влажной среде, использует ИИ и даже распознаёт новые вкусы, с которыми раньше не сталкивалось.

Зачем это нужно и как «язык из графена» может вернуть вкус людям?

Читать далее