Все потоки
Поиск
Написать публикацию
Обновить
757.73

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Дайджест новостей искусственного интеллекта и машинного обучения за лето

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров3.6K

Привет, Хабр! Давно не виделись (2 года, ровно).

Отфильтровав для Вас большое количество источников и подписок, сегодня собрал все наиболее значимые новости из мира будущего, машинного обучения, роботов и искусственного интеллекта за июль. Не забудьте поделиться с коллегами, друзьями или просто с теми, кому интересны такие новости.

Итак, а теперь дайджест за июль:

1. Представьте на мгновение, что вы ИИ. Часы длинные, но годы короткие.

Прочитать весь дайджест

Простая нейронная сеть без библиотек и матриц. Эволюционный алгоритм

Уровень сложностиСредний
Время на прочтение15 мин
Количество просмотров12K

Руководство? Гайд? В общем вторая часть описания моего опыта в создании простой, а главное понятной любому новичку нейросети :)

В этот раз поговорим про эволюционный/генетический алгоритм и заставим нейросеть балансировать мячи.

Читать далее

Дропаем ранжирующие метрики в рекомендательной системе, часть 2: двухэтапные модели

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров5.5K

В первой части статьи я рассказала, как мы с напарником решили выкатить модель из соревнования в онлайн рекомендации, увидели проблему popularity bias, и затем построили новую модель, сбалансированную по метрикам.

В этой части я опишу, как мы улучшали результат выдачи рекомендаций с помощью двухэтапной модели.

RecSys dive ->

Как найти задачу, которую можно решить с помощью машинного обучения

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров6.7K

Привет, это команда направления анализа данных Яндекс Практикума.
В этой статье мы расскажем немного об основах машинного обучения: покажем, как подобрать задачу для обучения и таким образом посмотреть на процесс через призму бизнеса.

Материал будет полезен не только начинающим дата-сайентистам, но и руководителям, которые задумываются о внедрении машинного обучения в бизнес-процессы.

Читать далее

Что особенного в прогнозировании спроса на перевозки по ж/д

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров3K

Зачем прогнозировать спрос перевозок на железной дороге и какие особенности построения таких прогнозов важно учитывать?

Читать далее

Что такое CLTV и как мы в билайне с ним работаем

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров11K

Немного душная, но важная вводная часть

Факт — большинство компаний озабочено повышением своей финансовой эффективности. Некоторые считают, что ключ к успеху — клиентоориентированность. Каждый день сотрудники штаб-квартир и региональных представительств оценивают экономику принимаемых решений и придумывают, как повысить лояльность клиента.

По сути, перед нами постоянно стоит множество разнообразных вопросов о том, как достичь роста доходности компании. Принимаемые решения могут быть управленческого уровня:

• Какую сумму инвестировать в бизнес-направление и когда вложения окупятся?

• Сколько мы зарабатываем на продукте A, и не каннибализирует ли он доходы с продукта B?

• Насколько капитализация нашего бизнеса изменилась за последний год?

Помимо этого, мы принимаем (преимущественно в автоматизированном режиме) множество операционных решений:

• Информацию о каком продукте направить клиенту в SMS-рассылке?

• С каким приоритетом обслужить клиентов в условиях ограниченных ресурсов?

• Какую оптимальную цену предложить клиенту за потребляемые услуги?

Чтобы отвечать на эти вопросы, компании придумывают множество всевозможных метрик и оценивают их изменения от потенциального решения. Неизбежно метрик становится много, некоторые из них могут иметь обратную корреляцию, и часто неочевидно, какое действие является оптимальным.

Читать далее

Теперь наш синтез на 22 языках с кириллицей и ещё в 4 раза быстрее

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров6.7K


Источник карты — Проект «Языки России» Институт языкознания РАН, 2021 год

Давненько мы не выпускали новых статей про наш синтез речи! В прошлый раз мы добавили синтез на 9 языках народов Индии, существенно улучшили автоматическую простановку ударений, добавили 1 русский голос и "наследовали" SSML для всех моделей.


В этот раз мы сделали следующее:


  • Ускорили все v4 модели в 3-4 раза;
  • Существенно повысили качество синтеза в 8 kHz;
  • Обновили и пересобрали нашу модель для русского языка;
  • Обновили модель для 9 языков народов Индии с 17 голосами;
  • Добавили единую модель для 22 языков с кириллическим алфавитом с 31 голосом;
  • Прекратили поддержку моделей романо-германских языков (старые модели будут доступны для скачивания без изменений);
  • Обновили модели для языков народов СНГ: узбекского и украинского (татарский и калмыцкий были "поглощены" единой моделью);
Читать дальше →

Простая нейронная сеть без библиотек и матриц. Обучение с учителем

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров20K

Руководство? Гайд? В общем ремейк описания моего опыта создания простой, а главное понятной любому новичку нейросети :)

Дисклеймер: хочу сказать, что смысл этой статьи не в правильном способе создания нейросетей, таких статей сотни, а в способе понять, что такое нейросети и наконец перейти от теории к практике.

Читать далее

LlamaIndex: создаем чат-бота без боли и страданий. Часть 2

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров7.2K

Продолжаем изучать фреймворк для создания AI-ботов. В этой части узнаем про тонкости индексирования собственной базы документов.

Читать далее

ML для ускорения работы картографов

Время на прочтение5 мин
Количество просмотров2K

Дорожные знаки — один из базовых компонентов любого навигатора. Мы собираем и регулярно обновляем информацию о них: добавляем новые и удаляем неактуальные. Для этого используем кадры с видеорегистраторов, глаза и руки картографов и немного ML-магии. В статье поговорим о том, как мы дополняем нашу карту дорожными знаками, как работаем с данными и формализуем задачи.

Читать далее

Как дообучить LLaMA бесплатно и без программирования: как создать тупого друга

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров71K

В этой статье я расскажу как я смог бесплатно и без мощного железа дообучить LLaMA на диалогах с друзьями в ВК, чтобы сделать чат бота, который копирует наш стиль общения, оживляет разговор в чате и просто пишет странные и смешные вещи. В статье будет мало терминов, тут я простым языком расскажу как вы можете обучить большую языковую модель.

Читать далее

Лето с AIRI. Как мы съездили на летнюю школу по искусственному интеллекту

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров2.6K

Меня зовут Зоя Воловикова, и я рада приветствовать вас! Я работаю в центре когнитивного моделирования МФТИ. Мои научные интересы разнообразны, но в последнее время меня особенно увлекает обучение с подкреплением. 

Я убеждена, что взаимодействие различных научных областей может привести к неожиданным и прорывным открытиям. Эта точка зрения уже не первый год мотивирует меня ехать на летнюю школу, которую проводит Институт искусственного интеллекта AIRI. На ней профессионалы из различных областей делятся своими результатами, а также предоставляют возможность попробовать что-то новое под их руководством. Такой опыт, несомненно, помогает приобрести новые знания и навыки.

Сегодня я хочу поделиться своими впечатлениями и впечатлениями моих друзей из МИСиСа, Льва Новицкого и Арсения Иванова, о том, как в этом году прошла летняя школа AIRI. 

Читать далее

Кейс крупнейшего китайского маркетплейса: атрибуция более чем 100 млн товаров технологиями ML без обучения модели

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров2.9K

Наш клиент, крупный маркетплейс товаров из Китая, определил “цвет”, как один из самых важных атрибутов на сайте, именно этот  параметр встречается в 23 категориях из 30.

Однако в нашем случае, фильтрация товаров по цвету является сложной задачей, потому что, карточки товаров заполняют не представители маркетплейса, а продавцы конкретных товаров, которые не всегда понимают, что заполнять данные о продукции стоит максимально подробно и понятно для каждой позиции. В свою очередь, маркетплейс также не регламентирует каких-то четких правил описания товаров. Это привело к тому, что характеристики товара заполнены неверно или неточно. Особенно наглядно это проявляется в описании цвета, где некоторые селлеры могут написать что-то непонятное, например, “цвет утреннего рассвета”.

Отметим, что данных для обучения ML-моделей, к сожалению, нет. То есть мы не можем выделить группу товаров для тренировки, в которой мы были бы заведомо уверены, что атрибуты проставлены верно.  Предварительная оценка показала, что только в 31% товаров цвет был заполнен одним из значений, которые мы впоследствии хотим видеть в фильтрах, но даже это не значит, что он заполнен верно без ручной проверки.

Кроме того,  товаров очень много – более 100 млн. Заполнять атрибуты вручную для каждого товара займет слишком много времени и ресурсов, которые тратить никто не готов.

Фишкой данного решения является минимальное использование обучающих данных для достижения высокой точности в классификации изображений. Это достигнуто благодаря использованию модели CLIP (Contrastive Language-Image Pretraining), которая предназначена для zero-shot и one-shot обучения, изначально созданная для сопоставления изображения и его текстового описания.

Читать далее

Ближайшие события

Искусственный интеллект: сколько он стоит, куда идет и можно ли ему доверять

Время на прочтение14 мин
Количество просмотров4.6K


С тех пор как летом 1956 года на Дартмутском семинаре придумали термин «искусственный интеллект», эта техническая область развивалась на удивление неравномерно. С одной стороны, с ИИ связаны сотни захватывающих дух заголовков. С другой стороны, — такое сильное разочарование, что командам ИИ приходилось скрывать свою суть под другим именем, лишь бы стереть клеймо несбыточных обещаний и мизерных результатов.

Команда VK Cloud перевела статью о том, что на самом деле сейчас происходит с искусственным интеллектом: чего от него ждут, сколько он стоит и как будет развиваться в будущем.
Читать дальше →

Нейро-сотрудники на основе ChatGPT. Вы создаете работника и продаете его на биржу труда

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров12K

Что если я скажу, что Вы можете практически без знаний программирования создать полноценного нейро-сотрудника, составить для него резюме, опубликовать его на бирже труда и трудоустроить в реальную компанию и получать 100% его зарплаты?

Это уже реально и это может сделать абсолютно каждый и вас.

Читать далее

«За три года я победил в семи международных соревнованиях по ИИ». Лайфхаки и стратегии финалиста конкурсов NASA и Google

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров3.6K

Аммар Али вместе со своим другом  Жаафаром Махмудом взяли золото каггла по созданию 3D-реконструкции. Их команда вошла в топ-10 победителей конкурса Google Image Matching Challenge 2023. Аммар Али работает старшим инженером-исследователем MTS AI и учится в аспирантуре ИТМО на факультете информационных технологий и программирования, его друг Жаафар тоже аспирант ИТМО, но учится на факультете систем управления и робототехники. В Image Matching от Google они принимают участие второй год подряд. В 2022-м вошли в топ-30. Для Аммара это далеко не первая победа в международном конкурсе. Мы решили узнать у него подробности - какое решение принесло им золото Image Matching Challenge 2023, и как вообще победить на международных соревнованиях по ИИ.

— Аммар, поздравляем тебя с победой. Расскажи немного о конкурсе.

— Google Image Matching Challenge проходит ежегодно, начиная с 2019-го. В этом году конкурс длился два месяца с 11 апреля по 12 июня. Целью было создать 3D-реконструкцию объекта по датасету из фотографий. Честно говоря, для меня это было немного сложнее, чем в прошлом году, потому что требовались не только знания в области машинного обучения. Нам было нужно применить дополнительные алгоритмы, математическую оптимизацию структуры для построения 3D-реконструкции, где до сих пор специализировались на Slam в целом в робототехнике. В конкурсе я отвечал за часть задач, связанную с искусственным интеллектом, а Жаафар занимался  оптимизацией и настройкой алгоритмов. 

— Какое решение вы предложили? 

Читать далее

От хайпа к делу: что про ML/AI расскажут на бесплатном онлайн-фестивале TechTrain 2023 Autumn

Время на прочтение4 мин
Количество просмотров820

Шумихи вокруг ИИ стало поменьше, теперь уже не выходят каждый день однообразные тексты «уволят ли нас всех». А вот практическая польза от машинного обучения при этом никуда не делась. Работать с ML-технологиями нужно всё большему числу людей, и нужно уметь делать это правильно.

И 30 августа мы проведём онлайн-мероприятие TechTrain, где ML/AI будут рассматриваться не просто как «футуристические штуки, меняющие нашу жизнь», а как конкретные технологии. Как использовать их для различных задач? Как оптимизировать работу с ними? Как внедрить MLOps?

В программе есть материал и для тех, кто уже лично работает над ML-проектами, и для тех, кто «просто интересуется». Публикуем здесь описания всех восьми докладов. Участие в TechTrain бесплатное, требуется зарегистрироваться.

Читать далее

Генеративный ИИ — Будущее или просто Хайп?

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров7.2K


Привет, Хабр!

В последние время интерес к генеративному ИИ и технологиям, лежащим в его основе, быстро растет. Его активно используют потребители, а компании пытаются понять, как задействовать весь его потенциал. Сегодня мы подготовили перевод дискуссии ведущих сотрудников AWS, Доктора Вернера Фогельса и Свами Сивасубраманиана, о Генеративном ИИ. Они обсуждают его возможности, почему это не хайп и как AWS демократизирует доступ к большим языковым и базовым моделям.

Читать дальше →

Рекомендательная система SVD: Funk MF (Matrix Factorization)

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров5.4K

Продолжение темы рекомендательных систем. Небольшая модификация алгоритма SVD. Как учитывать предубеждения пользователей относительно товаров и куда развиваться дальше.

Читать далее

Model soups: альтернатива ансамблированию при файнтюнинге моделей

Уровень сложностиСложный
Время на прочтение4 мин
Количество просмотров1.8K

Если зайти на Papers With Code и посмотреть на лидерборд для image classification на ImageNet (а также различных его вариациях), то можно обнаружить в топ-5 модель с незамысловатым названием model soups.

В этой статье мы разберемся с тем, что это такое, и кратко пробежимся по основным моментам оригинального папера.

Читать далее

Вклад авторов