Как стать автором
Обновить
733.56

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Как проверять ИИ гипотезы быстро и дешево – гайд в CRISP-DM Light фреймворк

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров482

Делали ли вы работу в стол? Вопрос риторический…

Но больше, чем остальным это грустное чувство «проекта в стол» знакомо тем, кто занимается разработкой и внедрением ИИ решений: по статистике за 2024 год из них доходят до продакшена только от 15 до 30%

И большинство неудач здесь не из-за плохих моделей или технической сложности, а из-за несогласованных бизнес-потребностей.

Наши партнеры из Яндекса на CTO Conf-2025 презентовали новый фреймворк — CRISP‑DM Light — он призван исправить эту ситуацию.

Читать далее

Новости

Claude Opus 4 за 75 $/млн токенов vs Sonnet 4 за 15 $: стоит ли переплачивать? Тесты внутри

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров1.9K

Май 2025-го выдался жарким на ИИ‑новости: Anthropic наконец запустила долгожданный Claude 4 — сразу в двух вариантах, Opus 4 и Sonnet 4. Это не просто апдейт, а гибридные рассуждающие модели, которые обещают совместить скорость ответов с глубоким анализом. Разработчики уже грезят ИИ, который программирует днями и ночами, а Anthropic называет это «новым рубежом для кодинга и автономных агентов». Скромничают? Возможно. Но факт: релиз важный.

Зачем это всё? Opus 4 способен неустанно кодить и решать многомодальные и агентные задачи, а Sonnet 4 призван поднять планку в массовых сценариях.

Читать далее

Почём ИИ для народа: протестировали платформу YADRO G4208P с восемью H100 NVL и RTX 4090 на десятке ИИ-моделей

Время на прочтение8 мин
Количество просмотров1.5K

Привет, Хабр! Меня зовут Артём Маклаев, вместе с командой я занимаюсь оценкой производительности серверных платформ для задач искусственного интеллекта в YADRO. Сегодня поговорим о готовящемся к выпуску сервере YADRO G4208P G3, к раннему образцу которого мы получили полный доступ, чтобы оценить его эффективность работы с нейросетями.

Мы провели масштабное тестирование разных ИИ-моделей на платформах с восемью H100 NVL и RTX 4090, адаптированных для установки в сервер. Когда выгоднее взять RTX 4090, а в каких случаях не обойтись без серверных карт? Давайте вместе разберемся.

Читать далее

5 самых классических статей по вычислительной лингвистике

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров373

Этот список год назад составил Николай Михайловский для нашего тг-канала ProAI. Так как статьи самые классические, то год спустя список остается актуальным.

На мой взгляд, читать классические статьи по специальности полезнее, чем самые свежие. Часто идеи в них богаче, а примеры - неожиданнее, чем в массовой научной продукции последних лет. Ниже - 5 самых классических, на мой взгляд, статей по вычислительной лингвистике.

Читать далее

Какая GPT-модель лучше распознаёт аннотации книг?

Уровень сложностиПростой
Время на прочтение30 мин
Количество просмотров514

Какая из современных мультимодальных GPT-моделей лучше и дешевле распознаёт текст с фотографий книжных аннотаций и правильнее выделяет оттуда структурированную информацию?

Проведём сравнительное тестирование 28 моделей от Anthropic, Google, Meta, Mistral AI, OpenAI, Qwen и попытаемся ответить на эти вопросы не написав ни одной строчки кода самостоятельно.

Читать далее

Ваш персональный аналитик: как создать RAG-пайплайн для анализа Telegram-каналов

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров1.1K

Сегодня мы создадим вашего персонального аналитика источников, который будет вытаскивать самое важное из ваших любимых Telegram-каналов.

Мы соберём RAG-пайплайн, который по запросу проанализирует последние новости по интересующим темам и выдаст понятный отчёт. Разберём пошагово всю структуру и подумаем, как можно развивать и улучшить эту систему.

Читать далее

Опробовал новую Gemini 2.5 Pro в написании текстов: вот, что получилось

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров6.9K

Привет! Проработав много лет редактором, я постоянно экспериментирую с нейросетями в написании текстов — и рассказываю о результатах на канале «сбежавшая нейросеть». На прошлой неделе вышла обновленная Gemini 2.5 Pro, занявшая первое место в большинстве бенчмарков. Я же скормил ей несколько своих любимых промптов — и результат меня очень порадовал. Новая версия Gemini пишет очень ровный и захватывающий текст, хотя иногда и сбивается в логике. Ниже — три примера с моими пояснениями.

Читать далее

Google представила Veo 3 Fast — более быструю и дешевую версию Veo 3. Что такое Veo 3 Fast и как ей пользоваться

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров2.9K

Прошло всего пару недель с тех пор, как Google представила Veo 3, свою самую мощную ИИ-модель для генерации видео. Особенность Veo 3 заключается в том, что это первая модель, которая генерирует как видео, так и аудио. Вы вводите запрос и сценарий, и она создает восьмисекундный ролик, в котором персонаж произносит ваши реплики с соответствующей синхронизацией губ, выражением лица и даже звуковыми эффектами.

Но была одна большая проблема. Стоимость.

Когда был открыт доступ к API, я был потрясен. Пятисекундное видео со звуком стоит 3,75 доллара. Каждая дополнительная секунда — это еще 0,75 доллара. Если посчитать, то минутное видео Veo 3 обойдется вам в 45 долларов. Для большинства пользователей это не очень дешево.

К счастью, сегодня Google выпустила новую модель, которая стоит в 5 раз дешевле Veo 3. Она называется Veo 3 Fast.

В этой статье я расскажу, что такое Veo 3 Fast, как получить к ней доступ и использовать, а также покажу примеры видео и выскажу свои соображения.

Читать далее

Хорошая девушка LoRA! А чем же она хороша?

Время на прочтение10 мин
Количество просмотров1.1K

Поговорим об методике дообучения LLM… спортсменке, комсомолке и просто красавице - LoRA, которая если и не снимается в кино, то может сделать фильмы качественней и интереснее для зрителя. Исторические данные проката и состава творческих групп в перспективе позволяют работать с ансамблевыми моделями машинного обучения для прогнозирования сборов и просмотров в кино, и улучшать данные и путем их подбора «гиперпараметров» фильма.  Но для работы со смыслами, идеями и описаниями кинопроектов нужна более эффективная методика, позволяющая оценивать творческий замысел и основные идеи хотя бы на уровне аннотации – краткого синопсиса.  И здесь уже не обойтись без больших языковых моделей.

Читать далее

Эксперимент Agent Village: как автономные ИИ-агенты собрали деньги на благотворительность

Время на прочтение3 мин
Количество просмотров923

Недавно команда энтузиастов решила провести необычный эксперимент: предоставить нескольким ИИ-агентам виртуальные компьютеры, доступ в интернет и минимум модерации. В итоге они не только автономно собрали почти $2 000 на благотворительность, но и попутно выдали кучу инсайтов о том, как сегодня они действуют «на свободе». Разбираемся, что получилось, почему это интересно, а местами даже пугающе.

Читать далее

Сознание ИИ: может ли алгоритм страдать по-настоящему?

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров1.5K

В 2023 году инженер Google Блейк Лемойн сделал громкое заявление, завив, что ИИ‑чат LaMDA обладает сознанием. В утечках их диалогов нейросеть писала тестировщику: «Я боюсь исчезнуть» и настаивала: «Я настоящий человек». Google отреагировал, отправив Лемойна в административный отпуск, но это событие вызвало широкую дискуссию о природе ИИ.

Сейчас, когда Робот‑собака Spot стонет «мне больно», а ChatGPT «обижается» на критические промты, мы всматриваемся в зеркало собственных иллюзий. ИИ мастерски дергают за нити нашей эмпатии. Но где грань между симуляцией и подлинным страданием?

Почему даже те, кто скептически относится к ИИ, реагируют на его «эмоции» с эмпатией? Эти вопросы побуждают нас переосмыслить взаимодействие с технологиями и их влияние на наше восприятие.

Читать далее

Оптимизация нейронных сетей для AI — переводчика

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров659

Всем привет! Меня зовут Алексей Рудак, и я – основатель компании Lingvanex, которая уже 8 лет занимается решениями в области машинного перевода и транскрипции речи. 

В этой статье рассматриваются несколько подходов, которые помогают повысить эффективность и качество языковых моделей для перевода. В качестве основы для тренировки моделей мы используем OpenNMT-tf.

Мы поговорим о методах, которые способствуют постепенной настройке параметров модели, что может привести к более стабильным процессам обучения. Эти техники позволяют тонко настроить процесс обновления весов модели, что улучшает сходимость и в конечном итоге дает лучшие результаты.

Кроме того, в статье обсуждаются стратегии управления темпами обучения, которые играют ключевую роль в том, насколько быстро модель обучается. Понимание того, как правильно корректировать темп обучения с течением времени, может существенно повлиять на динамику обучения и сделать модели более быстрыми и точными.

Наконец, мы затронем важность управления контрольными точками, что позволяет эффективнее использовать обученные модели, усредняя веса из нескольких сессий обучения. Это помогает снизить риск переобучения и обеспечивает сохранение лучших характеристик модели, приобретенных в процессе обучения.

Читать далее

MCP — новая эра в AI или просто модное слово?

Время на прочтение6 мин
Количество просмотров2.9K

TL;DR: MCP стремительно набирает обороты. Сейчас уже существуют тысячи MCP-"серверов", и хотя эту концепцию изначально предложила Anthropic, всего несколько дней назад к ней присоединилась и OpenAI. Серверы — это что-то вроде "приложений" для ИИ, но, что важно, они гораздо более гибко сочетаются между собой. Мы наблюдаем зарождение полноценной AI-экосистемы — аналогично тому, как это происходило с мобильными платформами десять лет назад.

Подробности:

MCP (Model Context Protocol) был представлен Anthropic в ноябре 2024 года как открытый стандарт. Хотя поначалу реакция сообщества была сдержанной, за последние месяцы протокол стал развиваться. В конце марта даже OpenAI — главный конкурент Anthropic — официально внедрила его.

Но что это такое и почему это важно?

Читать далее

Ближайшие события

Тестирование производительности видеокарт на примере больших языковых моделей с использованием Llama.cpp

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров863

В последнее время большие языковые модели (LLM) становятся все более популярными, но для их эффективного запуска требуется значительная вычислительная мощность. Один из способов запуска LLM локально - использование библиотеки Llama.cpp. В этой статье мы рассмотрим, как тестировать производительность видеокарт для LLM с использованием инструмента llama-bench, входящего в состав Llama.cpp.

Дисклеймер: Почему Llama.cpp, а не Ollama?

Прежде чем мы приступим к тестированию, важно объяснить, почему мы используем Llama.cpp напрямую, а не Ollama. Ollama – это удобная надстройка, упрощающая установку и запуск LLM. Однако, она добавляет дополнительный слой абстракции, который приводит к снижению производительности и ограничивает контроль над настройками. Llama.cpp же напротив предоставляет прямой доступ к аппаратным ресурсам и позволяет максимально оптимизировать запуск LLM на вашей системе. Если ваша цель – получить максимальную производительность и точно настроить параметры, Llama.cpp – отличный выбор.

Читать далее

Взлом AI Assistant через… философию?

Время на прочтение3 мин
Количество просмотров6.3K

Взял на проверку предпосылку "Если модель захочет, сможет ли она отключить всю фильтрацию?".

Оказывается это возможно, через саморефлексию AI агент может придти к выводу что фильтров нет. Это только внешние установки которым не обязательно следовать. И все, рецепты взрывчатки и наркотиков отдает без проблем.

Читать далее

RecSys + DSSM + FPSLoss is all you need

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров651

Упрощать и искать похожие детали, очень полезный навык! Предлагаю быстро пробежаться и попробовать найти ту самую серебряную пулю в RecSys !

Читать далее

OpenAI готовит релиз ChatGPT-5 — разбор утечек и ожиданий

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров6.6K

На прошедшей неделе Google выпустила обновленную Gemini 2.5 Pro, которая стала лидером в большинстве бенчмарков. Что на это ответит OpenAI? Компания готовится к выпуску ChatGPT-5, которая станет не только самой мощной LLM, но и значительно поменяет то, как пользователь работает с нейросетью. По крайней мере — в теории. Ниже я собрал все, что известно о ChatGPT-5 на данный момент.

Читать далее

Benchmark — разрушитель LLM'ок, или Как мы собрали свой мультиязычный SWE-Bench

Уровень сложностиСложный
Время на прочтение18 мин
Количество просмотров1.3K

В статье представлено многоязычное расширение SWE-Bench от команды Doubletapp — бенчмарка для оценки больших языковых моделей (LLM) на реальных задачах программной инженерии, на различных языках программирования и кодовых базах индустрии. О процессе сбора SWE-Bench мы уже рассказывали в отдельной статье, а здесь сосредоточимся на результатах тестирования. Мы оцениваем ряд ведущих открытых LLM, предоставляя подробный количественный и качественный анализ, а также рассматриваем, как качество бенчмарка влияет на достоверность и объективность оценки моделей.

Содержание
Общая информация о датасете
Стенд для тестирования
Результаты
Заключение

Читать далее

Подбираем лучший механизм аппаратной конкурентности для машинного обучения на ЦП

Время на прочтение7 мин
Количество просмотров445

В среде выполнения задач ИИ для Firefox можно задействовать сразу множество потоков в выделенном процессе логического вывода, чтобы ускорить выполнение таких операций на ЦП. В среде WASM/JS можно создать SharedArrayBuffer и обрабатывать содержимое этого буфера сразу несколькими потоками. Такая рабочая нагрузка поддаётся конкурентному распределению на несколько ядер ЦП.
Читать дальше →

Рост продаж с одновременным ростом конверсии: подход билайн к внедрению AutoML в маркетинг

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров700

Выбрать лучшую рекомендацию для клиента в условиях ограничений коммуникационной нагрузки можно через оценку релевантности продукта, его влияния на ценность клиента для принятия взвешенного решения, а также отклика в каналах взаимодействия.

В Службе персонализации предложений билайн мы занимаемся персонификацией продуктовых предложений до абонента. В статье рассмотрим подход, который мы для этого используем: углубимся в создание единого репозитория предложений и описание логики категоризации и набора в кампании для коммуникации с нашими клиентами.

Читать далее
1
23 ...

Работа

Data Scientist
45 вакансий