Все потоки
Поиск
Написать публикацию
Обновить
766.49

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Период
Уровень сложности

От ресторанов до банков: какие компании доверяют ИИ важные задачи

Время на прочтение5 мин
Количество просмотров686

Нейросети – мощный инструмент, который уже меняет бизнес. Но обычно все сводится к общим словам: «ИИ помогает в маркетинге», «Нейросети улучшают сервис»… Звучит красиво, но где конкретика? Мы нашли реальные кейсы: как крупные компании уже используют искусственный интеллект, что из этого вышло и какие технологии стоят за успехом.

Читать далее

Внедряем AI Code Review на GIthub: сомнительно, но окэй…

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров6.1K

Код-ревью — важная часть жизненного цикла разработки продукта, но давайте честно: никто не любит просматривать чужой код. Часто, разработчики делают ревью спустя рукава, но даже если это не так -- человеческий фактор может сыграть злую шутку и уязвимость в коде может быть упущена. Пропущенные ошибки, уязвимости и нестабильный код могут привести к задержкам в релизе и росту технического долга. Более того, зачастую, компании имеют свои гайдлайны по оформлению code review, которые также необходимо проверять вручную.

Что если эту рутинную задачу можно ускорить с помощью ИИ?

Читать далее

Исследуем возможности ИИ писать код. Часть 1

Уровень сложностиСредний
Время на прочтение68 мин
Количество просмотров4.8K

ИИ — одна из самых обсуждаемых тем последних лет. Многие считают, что он заменит разработчиков, сделав их ненужными. Я решил проверить, насколько это утверждение правдиво, и провести исследование возможностей ИИ в написании кода

Читать далее

AutoML: гид по автоматизации машинного обучения для начинающих

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров4.6K

Каждый, кто пытался построить даже самую простую модель машинного обучения, знает, сколько всего нужно учесть: сбор данных, предобработка, выбор алгоритма, подбор гиперпараметров, оценка качества… Это большой объем рутинных задач, но есть и хорошие новости: их можно автоматизировать. На помощь придет AutoML.

В 2025 году AutoML уже не просто модное слово, а мощный инструмент, который меняет правила игры в Data Science. Разберемся, что это такое, каким бывает и как его использовать, чтобы стать еще круче в ML.

Читать далее

Бенчмаркинг AI-агентов: оценка производительности в реальных задачах

Время на прочтение11 мин
Количество просмотров2K

AI-агенты уже решают реальные задачи — от обслуживания клиентов до сложной аналитики данных. Но как убедиться, что они действительно эффективны? Ответ заключается в комплексной оценке AI-агентов.

Чтобы AI-система была надежной и последовательной, важно понимать типы AI-агентов и уметь их правильно оценивать. Для этого используются продвинутые методики и проверенные фреймворки оценки AI-агентов.

В этой статье мы рассмотрим ключевые метрики, лучшие практики и основные вызовы, с которыми сталкиваются компании при оценке AI-агентов в корпоративных средах.

Читать далее

Искусственный интеллект без иллюзий: от модных трендов к реальным решениям

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров2.7K

В этой статье мы разберем, как ИИ выходит из стадии хайпа и начинает приносить реальные результаты. Вы узнаете о ключевых технологиях и подходах, которые стали важными в 2024 году, а также о том как компании справляются с новыми вызовами, и почему Composite AI, RAG и графы знаний набирают такую популярность.

Читать далее

Так ли хорош ИИ-генератор изображений Grok 3?

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров18K

Вчера Илон Маск и компания xAI объявили, что Grok 3 будет бесплатным для всех в течение ограниченного времени. Это означает, что вы можете использовать Grok 3 для обычных чатов, глубокого исследования темы и даже для создания изображений.

В этом посте я сосредоточусь на возможностях Grok 3 по созданию изображений. Я сравню, насколько он стал лучше по сравнению с Grok 2, и посмотрю, как он выглядит в сравнении с другими ИИ-генераторами изображений, такими как ChatGPT и Flux от Black Forest Labs.

Давайте начнем.

Читать далее

Практика использования алгоритмов машинного обучения для нормализации данных НСИ в корпоративных системах

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров806

В материале рассматривается проблематика синхронизации нормативно-справочной информации (НСИ) при интеграции систем и возможности применения алгоритмов машинного обучения (ML) для решения задач нормализации НСИ.
Статья написана по результатам выполненного при поддержке Фонда содействия инновациям технологического проекта по разработке интеллектуальных модулей НСИ.

Читать далее

ChatGPT в бизнесе

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров6.8K

Всего за пару лет с момента запуска ChatGPT (конца 2022 года) крупные компании во многих отраслях успели испытать и внедрить эту технологию в реальные процессы. К 2025 году накоплено достаточно данных о том, где генеративный ИИ действительно приносит пользу — от обслуживания клиентов и финансовой аналитики до помощи программистам и даже медицины.

Читать далее

Обучить модель RoBERTa расстановке запятых на балконе для продакшена

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров1.4K

RoBERTa — улучшенная версия модели BERT, разработанная Facebook AI. Она показывает отличные результаты в задачах обработки естественного языка, таких как классификация текстов и генерация ответов.

Построим конкурентоспособный сайт расстановки пунктуации, обучив свою нейронную сеть. Для прогнозирования популярности в поисковой выдаче начнем с анализа запросов Вордстат: расставить запятые – 290 000 запросов/месяц; расставить точки – 15 000 запросов/месяц.

По статистике, 95% запросов посвящены запятым, уделим им особое внимание. Добавим мультиязычность, чтобы получать больше трафика.

Читать далее

Соревнование VN1: чему я научился у прогнозистов

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров1.2K

С сентября по октябрь 2024 года мне выпала честь организовать VN1 Forecasting Competition — соревнование по прогнозированию, в котором приняли участие около 250 команд и отдельных участников. Целью конкурса было предсказать объём продаж различных онлайн‑продавцов на 13 недель вперёд. Первый был разогревочным: участники могли протестировать разные модели, увидеть свои результаты и сравнить их с успехами соперников. Второй этап был решающим — участникам разрешалось подать только один окончательный прогноз, а его точность оставалась неизвестной до самого финала.

После соревнования я собрал мнения и выводы 20 сильнейших участников: мы обсудили их подходы, трудности, с которыми они столкнулись, и найденные решения. В этой статье я поделюсь основными уроками, которые вынес из этого соревнования.

Читать далее

Разметка данных на заказ: как корректно оценить проект и защитить бизнес от рисков

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров945

Сорванные дедлайны, работа в выходные, недовольный клиент — знакомо? Если да, то вы, вероятно, сталкивались с некорректной оценкой проекта. В прошлой статье я рассказывал о риск-факторах в задачах разметки и сбора данных:

Читать далее

Генерация табличных данных с помощью языковых моделей: делаем правильно

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров2.5K

В мире анализа данных и машинного обучения качественные табулированные данные играют ключевую роль. Однако далеко не всегда у специалистов есть доступ к реальным данным из-за конфиденциальности или их полного отсутствия в структурированном виде. В таких случаях на помощь приходят языковые модели, способные генерировать структурированные таблицы с синтетическими данными.

Читать далее

Ближайшие события

Анализ обработки признаков в YOLO NAS S при помощи CAM

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров1.2K

Методы объяснения моделей — практичный инструмент для понимания модели, оценки её точности и стабильности. Однако, часто можно столкнуться с ситуацией, когда фреймворк, в котором метод реализован, просто не "дружит" с реализацией модели. В этом туториале хочу подробно показать CAM (class activation map) для объяснения моделей зрения.

Читать далее

МРТ для DataScience. Часть 2

Время на прочтение6 мин
Количество просмотров1.1K

«Ликбез по устройству МР‑томографа» — вторая часть цикла статей. Содержание цикла и первая часть «МРТ и другие виды медицинской визуализации» здесь.

Читать далее

Оценка систем LLM: основные метрики, бенчмарки и лучшие практики

Время на прочтение17 мин
Количество просмотров2.9K

Оценка LLM-систем вручную — это утомительное, времязатратное и порой раздражающее занятие. Поэтому, если вам приходилось многократно прогонять набор промптов, чтобы вручную проверять каждый вывод LLM, вас обрадует, что эта статья научит вас всему необходимому для правильной оценки LLM и обеспечения долгосрочной эффективности вас и вашего приложения на основе LLM.

Оценка LLM относится к процессу обеспечения соответствия выходных данных LLM человеческим ожиданиям, которые могут варьироваться от этических и безопасных соображений до более практических критериев, таких как правильность и релевантность выходных данных LLM. С инженерной точки зрения эти выходные данные LLM часто можно найти в форме тестовых кейсов, в то время как критерии оценки формализуются в виде метрик оценки LLM.

На повестке дня:

В чем разница между оценкой LLM и оценкой системы LLM, а также их преимущества

Офлайн-оценки, что такое бенчмарки системы LLM, как создавать наборы данных для оценки и выбирать правильные метрики оценки LLM, а также распространенные ошибки

Оценки в реальном времени и их польза для улучшения наборов данных для офлайн-оценок

Реальные примеры использования систем LLM и как их оценивать, включая chatbotQA и Text-SQL

Читать далее

Сравнение AI-инструментов для прототипирования: v0, Bolt и Lovable

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров14K

Здравствуйте! Меня зовут Богдан, я являюсь автором телеграм канала про нейросети в телеграме, посчитал эту статью очень интересной для перевода, приятного прочтения

На переполненном рынке инструментов разработки с поддержкой ИИ выделяются три платформы для прототипирования компонентов и приложений: v0 от Vercel, Bolt от StackBlitz и Lovable. В этой статье рассматриваются их практическое применение для начальной загрузки MVP, ограничения и компромиссы с инженерной точки зрения.

Обзор: v0, Bolt, Lovable

Основная задача, которую пытаются решить эти инструменты, не нова: уменьшить трение между идеей и реализацией. Однако их подходы существенно различаются как по архитектуре, так и по исполнению.

v0.dev преуспел в быстром прототипировании пользовательского интерфейса, и несколько компаний используют его для поддержки библиотек компонентов и дополнения своих дизайн-систем. Он хорошо работает с популярными UI-фреймворками, такими как Tailwind или Material-UI. v0 теперь поддерживает генерацию не только UI-компонентов, но и серверных служб, включая интеграцию с базами данных и API-маршрутами, демонстрируя стремление Vercel к разработке полного стека. Хотя эта поддержка полного стека находится на ранней стадии, в будущем она может стать конкурентоспособной.

Я часто предоставляю v0 макет (загружаю изображение или выбираю входные данные Figma), а затем предлагаю интерактивную версию, которая меня устраивает. Он также хорошо работает с чистым текстом, если вам удобно отложить дизайн. Если вам нужна дополнительная поддержка бэкенда, например, БД для хранения данных, v0 также может работать с такими поставщиками, как Prisma, создавая для вас схему.

Читать далее

Топ-5 советов по человечному тексту с ИИ

Время на прочтение4 мин
Количество просмотров21K

В этой статье разберем, как сделать текст максимально человечным и информативным, заменив копирайтера.

Читать далее

Законы масштабирования – архитектура O1 Pro // Инфраструктура синтетических данных, RLAIF, токеномика вычислений

Время на прочтение29 мин
Количество просмотров1.2K

С каждым днем растут страхи и сомнения относительно законов масштабирования ИИ. Большинство предсказателей отрасли ИИ утверждают об окончании законов масштабирования, которые за последние несколько лет привели к мгновенному улучшению возможностей больших языковых моделей (LLM). К ним присоединились журналисты, вооружившись неопределенной информацией о неспособности моделей успешно масштабироваться из-за предполагаемой низкой производительности. Критики также указывают на исчерпание доступных данных для обучения и замедление масштабирования оборудования для обучения.

Читать далее

Искусственный интеллект в распределенных вычислениях: революция обработки данных

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров1.4K

Мир, в котором мы живем, погружается в эпоху данных. Каждый день человечество производит миллиарды гигабайт информации — от текстов и изображений до потоков видео и сенсорных данных от устройств Интернета вещей (IoT). Однако массивы данных бесполезны без мощных инструментов анализа, которые способны извлечь из них полезные знания. Распределенные вычисления и искусственный интеллект (ИИ) становятся ключевыми инструментами в решении этой задачи.

Эта статья объясняет, как распределенные вычисления помогают ИИ масштабироваться, какие технологии стоят за этим синтезом, и какие перспективы нас ждут в ближайшем будущем. Мы также рассмотрим конкретные примеры применения и обсудим основные вызовы, с которыми сталкивается этот союз технологий.

Читать далее

Вклад авторов