Все потоки
Поиск
Написать публикацию
Обновить
785.91

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Как должен выглядеть машинный перевод в 2025 г

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров1.6K

Давайте признаемся, что мы уже устали от рассказов про то, что вышел новый движок, который делает машинные переводы «almost human-like» или «вообще не требует человеческого ревью». При этом движки действительно становятся все качественнее: дуумвират Google-Deepl разрушен, а новые языковые модели показывают немыслимые результаты на бенчмарках. Но почему мы все еще уверены, что хорошие бенчмарки нам не помогут? Как встроить движок МТ в процесс перевода так, чтобы он действительно помогал, а не мешал?

Читать далее

Как нейросети помогают при создании кино и сериалов, и почему без человека всё ещё никак

Время на прочтение6 мин
Количество просмотров2.5K

Привет, Хабр! Меня зовут Артём Орлов, я директор по инновациям в Wink. В этой статье расскажу, как нейросети влияют на создание контента на всех его стадиях — от проработки идеи и планирования производства до кастинга и постпродакшена.

Под катом:

— интуиция человека VS анализ больших данных ИИ;
 — чувство вкуса VS огромная насмотренность;
 — нерациональные факторы VS шаблонный анализ;
 — спасение сцен на постпродакшене;
 — примеры сервисов, которые помогают киношникам;
 — и другое.

Давайте по порядку.

Читать далее

От нестационарности к прогнозу: пайплайн анализа и моделирования временных рядов

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров1.2K

Привет, Хабр! Я Михаил Зуев — Data Scientist из команды затрат корпоративных
клиентов Сбера. Мы много предсказываем, классифицируем и прогнозируем.
Впервые столкнувшись с последним и проведя исследование по этой теме, я
столкнулся с большим количеством неструктурированной информации. Эта статья —
одновременно описание моего пути и небольшое упорядоченное наставление по
анализу и прогнозированию временных рядов, которое я сам хотел бы получить.

Читать далее

Топ-10 лучших бесплатных нейросетей, которые сильно упростят вашу жизнь

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров25K

2025 год. Нейросети уже не просто часть технологий, а часть повседневности. Они рядом с нами в работе, учебе, творчестве, даже в быту. Помогают написать письмо, подобрать музыку, отредактировать фото или придумать идею для проекта. Иногда кажется, что единственное, чего им не хватает, это способности приготовить завтрак. Хотя, если честно, и это, похоже, лишь вопрос пары десятков апдейтов.

Всего пару лет назад мы с интересом наблюдали, как алгоритмы с трудом оживляют фотографии. Тогда всё это выглядело забавно и очень неуклюже. А теперь ИИ рисует картины, пишет сценарии и создаёт видео, которые сложно отличить от реальных. В какой-то момент мы даже перестали удивляться.

Но вместе с возможностями пришла и новая проблема. Их стало слишком много. Каждый день появляются десятки новых сервисов, которые обещают упростить жизнь и сделать всё за вас.

Чтобы сэкономить вам время, мы собрали подборку из десяти нейросетей, которые подойдут на все случаи жизни. Они просты, удобны и работают без привязки карты.

Приятного чтения!

Читать далее

Как LLM помогают ученым

Время на прочтение7 мин
Количество просмотров1.5K

Всем привет! Меня зовут Николай Никитин, я руковожу лабораторией автоматического машинного обучения в Институте ИИ ИТМО. Сегодня я бы хотел сделать небольшой экскурс в то, как методы и модели ИИ позволяют автоматизировать решение прикладных задачам в разных областях науки.

Нейросети уже достигли впечатляющих результатов ― вспомним хотя бы Нобелевскую премию по химии прошлого года, выданную за методы фолдинга белков, проработанные с участием AlphaFold. И различные полезные для ученых решения, появляются каждый день во многих областях.

Под катом ― о том, как AI4Science выглядит сегодня, почему всю науку нельзя отдать на откуп LLM и в какой форме они наиболее полезны.

Читать далее

Как я автоматизировал анализ логов из Kibana с помощью LLM и AI-агентов

Время на прочтение5 мин
Количество просмотров3.5K

Инструменты вроде OpenSearch, Elastic или Kibana давно стали стандартом для поиска и визуализации логов благодаря удобству и мощной поисковой системе. Однако, когда речь заходит о сложном анализе — агрегациях, парсинге, выявлении сложных закономерностей — их встроенные средства быстро достигают предела возможностей. Особенно сложно становится, если структура логов далека от идеала: например, как у нас — всё содержимое свалено в одно поле Message в формате JSON.

Меня зовут Игорь Щегловитов, я работаю экспертом по тестированию в QC облачной инфраструктуры и веб-порталов. Раньше наша команда решала такие задачи кастомными утилитами на C#, которые выгружали логи из ELK и анализировали их локально. Однако каждое новое требование превращалось в мини-проект: доработать код, написать новые парсеры, скрипты агрегации и фильтрации. Работа замедлялась, техдолг рос.

Я решил использовать связку AI-агентов с кастомными промптами, собственный сервисный слой (MCP) для доступа к логам и LLM-модель, чтобы превращать пользовательские запросы в автоматический алгоритм анализа. Так, кейсы вроде «Посчитай уникальных пользователей за сутки» или «Проанализируй ошибки за период» решаются без ручного кодинга.

Под катом мой кейс: расскажу, как это сделал, поделюсь ссылкой на гитхаб, так что, если хотите упростить себе анализ логов, — эта статья для вас.

Читать далее

Как мы обеспечили +33% к точности на сложных SQL-запросах

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров1.4K

Традиционные подходы к генерации SQL-запросов часто полагаются на инструктированные языковые модели, но они могут быть неэффективными и неточными. Мы рассмотрим новый подход, основанный на использовании Reinforcement Learning для дообучения моделей, который может улучшить точность и эффективность генерации SQL.

Читать далее

7 смертных грехов ML-ценообразования

Время на прочтение19 мин
Количество просмотров939

Оптимизацию цен часто упрощают: учимся прогнозировать спрос, зная его при заданных ценах — оптимизируем цены, фиксируем прибыль.

И, казалось бы, данные о продажах в прошлом найти нетрудно, готовых фреймворков с алгоритмами оптимизации — десятки, осталось только немного «поиграть в kaggle», обучив хорошую модель для предсказания спроса и всё готово!

Но на практике всё намного сложнее. Почему модель, идеально прогнозирующая спрос, может предлагать цены, разоряющие бизнес? Может ли максимизация прибыли привести к потере покупателей в долгосрочной перспективе? Почему оптимизатор может считать, что яблоки должны продаваться по цене iPhone? В этой статье разберём эти и прочие «смертные грехи» ценообразования с помощью ML.

Читать далее

ИИ в трейдинге

Время на прочтение6 мин
Количество просмотров6.7K

В статье рассказывается о вариантах  применения ИИ  для создания торговых систем.

В практической части на примере платформы AmiBroker демонстрируется, как с помощью ИИ (модели DeepSeek) можно написать код простой momentum стратегии для фьючерса на акции Сбербанка. Приводятся результаты бэктестирования стратегии.

Читать далее

Вредные советы: как угробить своего AI-агента

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров1K

Ваш AI-агент ведет себя как капризный стажер и доказывает, что 2+2=5? Или вы уже третью неделю пытаетесь дообучить модель, а она делает вид, что не понимает, чего вы от нее хотите? Кажется, пора признать: классические подходы не работают.

Пока одни AI-инженеры кропотливо готовят данные и тестируют их, другие непослушные инженеры открыли простую истину. Они всё делают наоборот: не тестируют агентов, кормят модель мусором и открывают ей полный доступ к конфиденциальным данным. И знаете что? У них получаются самые незабываемые агенты!

Мы в команде Cloud.ru подумали: зачем бороться с этой гениальной стратегией? Гораздо эффективнее ее систематизировать: таким инженерам нужно давать не полезные, а вредные советы. Они все сделают наоборот, и получится как раз правильно. В статье собрали вредные советы для идеального саботажа. Читайте и внедряйте.

Читать советы

130+ датасетов для машинного обучения: гид, который сэкономит часы поиска нужных данных

Время на прочтение27 мин
Количество просмотров5.5K

Сколько раз вы начинали новый ML-проект и первым делом отправлялись на поиски подходящих данных? Процесс этот знаком каждому: есть задача, выбрана архитектура модели, но без качественного датасета дальше не продвинуться. Тут и начинается квест по бесконечному поиску «того самого» набора по репозиториям, форумам и каталогам. 

Хороших датасетов множество, но найти среди тысяч вариантов нужный — отдельная история. Чтобы облегчить вам эту задачу, мы сделали подборку датасетов, которые активно используются ML-инженерами: от классических наборов данных, известных каждому, до новичков в информационном поле.

Читать далее

Новые вирусы против супербактерий: как ИИ меняет правила игры

Время на прочтение5 мин
Количество просмотров1.1K

Супербактерии — микроорганизмы, не реагирущие на антибиотики. Что это значит? Болезни, которые раньше лечились за несколько дней, теперь становятся опаснее. Каждый год от таких инфекций умирают миллионы людей, и к 2050 году число жертв может вырасти до десяти млн в год. Проблема в том, что новые лекарства создаются медленно и стоят все дороже, а бактерии мутируют быстрее, чем фармацевтика успевает на них реагировать.

В этой ситуации на помощь приходят бактериофаги, или фаги, — вирусы, которые естественным образом уничтожают «суперов», не затрагивая клетки человека. А еще в этом помогают технологии. Так, ИИ позволил создать совершенно новые варианты вирусов, которые могут преодолевать даже искусственно выведенную устойчивость. Сегодня предлагаю разобрать, как работает этот механизм и какие вызовы стоят перед методами, сочетающими биологию с машинным обучением.

Читать далее

Как ИИ научился делать научные видео — от слайдов до говорящей головы

Время на прочтение4 мин
Количество просмотров1K

ИИ уже умеет многое: от сочинения текстов до генерации сложных картинок. Но стоит дать ему реальную задачу — вроде создания научного видео по длинной статье, — и он тут же сталкивается с неожиданными трудностями. Почему же до сих пор самые умные модели часто уступают человеку в таких, казалось бы, рутинных задачах, где важна не только начинка, но и подача?

Новое исследование показало интересный поворот: дело не только в качестве речи или зрелищности слайдов. Ключевая сложность — правильно собрать всё вместе: знания, логику повествования, невербальные детали и даже такие мелочи, как движение курсора по слайду. Именно в этом ИИ часто спотыкается, а не в отдельной “говорящей голове” или красивой анимации.

Разбираемся, как современные ИИ учатся имитировать настоящих докладчиков: что нового придумали исследователи, почему для оценки качества нужен целый набор свежих метрик и как прозрачная модульная архитектура наконец-то позволяет ИИ не просто воспроизводить информацию, а действительно объяснять как настоящий докладчик.

Читать далее

Ближайшие события

Топ-3 ML-модели, которые помогут в продуктовой аналитике

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров3.5K

Как использовать ML-модели, чтобы не просто анализировать пользователей, а управлять их поведением — предсказывать отток, оценивать эффект от акций и подбирать оптимальные воздействия.

В этой статье я собрал три типа моделей: прогнозирование поведения, uplift-модели и выбор оптимального воздействия. Давайте разбираем, как они устроены и где реально приносят пользу.

Читать далее

Книга: «Промт-инжиниринг для LLM. Искусство построения приложений на основе больших языковых моделей»

Время на прочтение2 мин
Количество просмотров12K

Привет, Хаброжители! Большие языковые модели (LLM) кардинально меняют мир, обещая автоматизацию различных задач и решение сложных проблем. Программные приложения последнего поколения используют эти модели в качестве строительных блоков для создания новых возможностей практически во всех областях, но, чтобы пользоваться этими возможностями, нужны навыки. Книга расскажет о науке и искусстве промт-инжиниринга, и эти знания помогут вам раскрыть истинный потенциал LLM.

Опытнейшие эксперты Джон Берриман и Альберт Циглер поделятся приемами эффективного взаимодействия с ИИ и расскажут, как представлять свои идеи в формате, удобном для языковой модели. Освоив философские основы и практические приемы, вы обретете знания и уверенность, необходимые для создания приложений нового поколения на базе LLM.

Читать далее

Почему GPT’s стал отвечать «проще» и как строить Ассистентов с учётом Free-пользователей

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров2.7K

У многих ощущение, что GPT's в ChatGPT стали отвечать хуже. Разбираем, что реально изменилось в моделей и тарифах, чем GPT's отличаются от Projects и «Агентов», и что делать авторам кастомных ассистентов, чтобы сохранить качество для платных и бесплатных пользователей.

Читать далее

LLMO на практике: как попасть в тренировочные данные будущих AI-моделей (и зачем Вам это нужно уже сегодня)

Уровень сложностиСредний
Время на прочтение32 мин
Количество просмотров967

Три месяца назад я начал замечать странную закономерность. Открываю ChatGPT, задаю вопрос по SEO — получаю детальный ответ с цитированием пяти-семи источников. Проверяю Claude с тем же запросом — снова развёрнутый ответ, четыре ссылки на компании и блоги. Perplexity показывает топ-7 ресурсов с описаниями. Gemini выдаёт структурированный список решений.

И вот что интересно. Одни и те же сайты появляются в этих ответах постоянно. HubSpot, Moz, Backlinko, Ahrefs, SEMrush — их цитируют снова и снова. А сотни качественных блогов, которые я читаю годами, в этих ответах отсутствуют. Вообще.

Начал копать глубже. Что у этих постоянно цитируемых ресурсов общего? Почему AI-модели выбирают именно их?

Понимаете, что произошло? Правила игры изменились. И большинство об этом ещё не знает.

Читать далее

От одной видюхи в офисе до AI-хакатона: пошаговая инструкция по организации

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров958

Привет, Хабр! Эта история началась не со стратегической сессии и не с приказа сверху. Она началась с того, что в 2023 году наши разработчики, как и многие в IT-сообществе, подхватили хайп вокруг LLM и начали в свободное время ковырять Llama 2 и другие модели. Все это происходило на личных и рабочих машинах, и довольно быстро стало понятно: для серьезных экспериментов мощностей не хватает.

Шаг 1. Искра: как низовая инициатива разожгла пламя. От любопытства к общему железу

Точкой невозврата стал момент, когда группа энтузиастов пошла к руководству с простой идеей: «Давайте купим в офис одну общую, но мощную видеокарту для всех». К нашему удивлению и радости, руководство идею поддержало и выделило бюджет. Это была не просто покупка GPU, а инвестиция в зарождающееся комьюнити.

Читать далее

Сначала был кремний: Почему архитектура чипов, а не код, определяет будущее AI

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров1.8K

Мы, разработчики, верим, что наш код — движущая сила AI. Но что, если все наши решения предопределены архитектурой чипов? Эта статья — погружение в «кремниевую геологию»: от монополии NVIDIA и CUDA до восстания альтернатив вроде Groq и Cerebras, кастомных чипов Google и Apple и геополитической войны, которая меняет правила игры для каждого из нас.

Читать далее

Итоги DevDay 2025: OpenAI представила Apps SDK, AgentKit и новые модели — полный разбор анонсов

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров914

Вчера вечером в Сан-Франциско прошла конференция DevDay 2025, на которой OpenAI представила масштабное обновление своей экосистемы. Компания заметно сместила фокус с потребительских продуктов на создание надёжной и масштабируемой платформы для разработчиков и корпоративного сегмента. Под руководством CEO Сэма Альтмана и при участии легендарного дизайнера Джони Айва мероприятие продемонстрировало новое видение ChatGPT как центральный хаб для взаимодействия с приложениями, данными и автоматизацией.

Читать далее

Вклад авторов