Машинное обучение *

Основа искусственного интеллекта

Статьи Посты Новости Авторы Компании

YudinS 6 июл 2023 в 10:58

YandexGPT в Браузере: как мы учили модель суммаризировать статьи

7 мин

29K

Блог компании ЯндексБраузерыМашинное обучение*Искусственный интеллектIT-компании

✏️ Технотекст 2023

Неделю назад на сайте 300.ya.ru мы продемонстрировали возможности языковой модели YandexGPT применительно к задаче суммаризации текстов. С тех пор многое изменилось: мы обучили новую, более качественную модель, в пересказах которой в 4 раза меньше ошибок. А сегодня мы внедрили её в Яндекс Браузер. Может показаться, что мы просто взяли ту же модель, о которой уже рассказывали сообществу на примере Алисы, и прикрутили к ней кнопку в Браузере. Но не всё так просто. Да, наша базовая модель уже понимала, что такое суммаризация в общих чертах. Но для нас было важно добиться результата в нужной нам форме и с предсказуемым качеством. И вот тут-то начинаются нюансы.

Сегодня поделюсь с Хабром не столько новостью, сколько нашим опытом и советами из области дообучения моделей и промпт-инжиниринга. Расскажу, через что пришлось пройти нашей команде, чтобы модель начала делать то, что от неё ожидают.

Читать дальше →

+43

AlexTeexone 5 июл 2023 в 18:40

See and Tell: Сервис просмотра сериалов для слабовидящих

Средний

4 мин

976

Python*Машинное обучение*

Из песочницы

Весной 2023 года прошел хакатон MTS True Tech Hack, на котором был представлен кейс улучшения сервиса просмотра видео для людей с ограниченными зрительными способностями. Предоставить решение во время хакатона нам не удалось, но зато за следующие два месяца мы смогли закончить пилотную версию сервиса, помогающего слабовидящим людям лучше понимать происходящее на экране. В этом посте мы решили поделиться результатами и деталями проделанной работы.

+11

seninvs 5 июл 2023 в 11:56

Сложности MVP или как мы смотрели 40000 видео

Простой

4 мин

2.2K

Big Data*Машинное обучение*

Из песочницы

MVP, он же Minimal Viable Product, представляет собой базовую (ванильную) версию продукта и содержит только самый необходимый функционал. По сути это пробник, который служит для оценки рисков и оправданности вложений в полноразмерный продукт. MVP может иметь разный вид: пробный образец, тестовая партия, или уже готовый продукт, но с урезанным функционалом.

MVP - это отдельный вид искусства, где нужно за короткое время доказать, что ты можешь предложить бизнесу решение, которое поможет достичь поставленных продуктовых целей, за оправданную цену. Это своего рода спидран большого проекта. Про такой MVP как раз и пойдет наш разговор.

mmsmirnova 4 июл 2023 в 17:16

Как мы с помощью Kubeflow Pipelines оптимизировали обучение ML-моделей

Средний

10 мин

3.5K

Блог компании VKМашинное обучение*

Расскажу, как мы оптимизировали обучение моделей, внедрив инструмент Kubeflow Pipelines в нашу практику. Я хочу показать, чем Kubeflow Pipelines может быть полезен ML-специалисту и как в нём без потери существующей кодовой базы можно запускать готовые пайплайны.

+21

olegchir 4 июл 2023 в 14:22

LLM API для Java

Простой

6 мин

3.7K

Блог компании Failover BarПрограммирование*Java*Машинное обучение*

Обзор

Прочитав сегодняшнюю статью о том, как в Сан-Франциско массово собираются LLM-щики, коллега сказал — "лучше б там собирались BDSM-щики, это, по крайней мере, понятное развлечение". Для человека не посвященного, "нейросети" — это всё ещё что-то про Python и математическую статистику.

Тем не менее, можно кусать низко висящие фрукты и с помощью Java, дергать API для Chat GPT, и тогда ничего учить не придётся. В этой статье будут ссылки на несколько фреймворков с простым API для жабы и котла, которые можно использовать хоть сейчас.

Волшебно. Читать далее.

kitbit 4 июл 2023 в 11:34

Нейронные сети не могут обобщать периодические зависимости. Как это исправить?

Средний

15 мин

4.1K

Python*Big Data*Математика*Машинное обучение*Искусственный интеллект

Из песочницы

Изучая нейронные сети все глубже, сталкиваешься с тем, что не ко всем задачам применимы полносвязные глубокие нейронные сети с классическими слоями Linear и слоями активации Relu, Sigmoid, Than и их вариации. Почему не используют остальные функции в качестве активации, например, периодические?
В целом, периодические функции являются одними из основных функций, важными для человеческого общества и естествознания: суточные и годовые циклы в мире диктуются периодическими движениями солнечной системы, графики изменения погоды, показателей мировой экономики также включают периодическую компоненту.

+16

agpankova 3 июл 2023 в 20:29

Эволюция метрик качества машинного перевода — Часть 1

Простой

5 мин

Машинное обучение*Natural Language Processing*

Обзор

Как правильнее всего измерять качество машинного перевода? Многие слышали о BLEU, но на самом деле метрик много. В этой статье расскажем, какие существуют метрики, как они эволюционировали и какие сегодня наиболее адекватны. Часть 1: эволюция метрик и обзор традиционных метрик.

itmo 3 июл 2023 в 16:33

Как стать магистром по ML за 2 года

10 мин

3.6K

Блог компании ИТМОПрограммирование*Машинное обучение*Учебный процесс в IT

Год назад в ИТМО открылась новая магистратура по искусственному интеллекту. Мы отказались от академического подхода, посмотрели на примеры лучших инженерных школ и стажировок, да и в целом от мира образования, и пригласили ИТ-компании для участия в подготовке высококвалифицированных кадров.

В этой статье рассказываем о том, как построено обучение и над какими проектами здесь можно работать. В конце вы найдете ссылку на конкурс проектов для поступления на следующий учебный год.

MaxRokatansky 3 июл 2023 в 14:59

Sarsa: алгоритм, основные принципы и применение

Простой

7 мин

2.4K

Блог компании OTUSМашинное обучение*Искусственный интеллект

Обзор

В области искусственного интеллекта и машинного обучения, SARSA (State-Action-Reward-State-Action) является одним из фундаментальных алгоритмов обучения с подкреплением. Он широко применяется в реализации различных задач, включая игровые приставки, роботов и системы автопилотирования. В данной статье мы рассмотрим определение SARSA и обсудим его значимость в области искусственного интеллекта и машинного обучения.

+11

ohio_merchant 3 июл 2023 в 14:11

«Магия вне Хогвартса», или Как разделить аудиосигнал на источники, обогнав существующие решения

8 мин

Блог компании VKМашинное обучение*Звук

Привет, хабровчане! Меня зовут Дмитрий, я студент первого курса Вышки магистерской программы «Системный анализ и математические технологии».

В октябре прошлого года я прошёл отбор в Инженерно-математическую школу (ИМШ). Это совместная образовательная программа VK Education и НИУ ВШЭ. Я стал участником мастерской по прикладному искусственному интеллекту. В одном из проектов мы командой из двух человек (да, нас было мало, но мы были сильны!) решили реальную технологическую задачу под руководством эксперта VK и научных сотрудников университета. Нам нужно было придумать технологию разделения аудиосигнала на источники. В команде я отвечал за подготовку данных, а мой коллега — за проведение экспериментов. Хочу рассказать вам подробно, как мы решали эту задачу – надеюсь, что это будет для вас полезно.

+24

odmin227 3 июл 2023 в 13:12

Как я покорил ИТМО и поступил в магистратуру по ИИ без экзаменов

Простой

5 мин

6.7K

Блог компании AI Talent HubМашинное обучение*Учебный процесс в ITКарьера в IT-индустрииИскусственный интеллект

Мнение

Привет, друзья поступающие! Меня зовут Даня Картушов, и сегодня я хочу поделиться с вами историей, которая может изменить ваше представление о поступлении в университет. Выбор темы для статьи для меня стал важным этапом. Ведь, кажется, за последние 12 недель я прошел через невероятные испытания, досрочно поступил в магистратуру по ИИ от AI Talent Hub, @NapoleonITи ИТМО а также понял, что настоящая сила — в сообществе, которое позволяет тебе стать лучше и в уверенности, что ты на верном пути.

alizar 3 июл 2023 в 12:00

Кодеки новой эпохи: HEVC, AV1, VVC и нейросети

Средний

6 мин

19K

Блог компании RUVDS.comРабота с видео*Алгоритмы*Сжатие данных*Машинное обучение*

Аналитика

Сжатие с учётом контекста, источник: WaveOne (сайт удалён)

Хотя новые стандарты кодеков появляются каждые десять лет, все они основаны на пиксельной математике — манипулировании значениями отдельных пикселей в видеокадре для удаления информации, не важной для восприятия. Другие математические операции уменьшают объём данных после первоначального кодирования.

В новом поколении кодеков алгоритмы машинного обучения используются для анализа и понимания визуального содержания видео, выявления избыточных данных и более эффективного сжатия. Вместо написанных вручную алгоритмов, тут применяют методы Software 2.0, основанные на обучении. Данная область развивается на протяжении десятилетий, но в последние годы получила сильный толчок. Все знают, что в 2017 году произошёл прорыв в разработке ИИ благодаря изобретению трансформеров. В свою очередь, они основаны на концепции внимания, которую придумали в 90-е. Эта техника впервые позволила соотносить друг с другом отдельные части текста или видеокадра.

Читать дальше →

+55

SergeiGozalov 3 июл 2023 в 00:24

Распознаем лючки бензобаков

Средний

12 мин

11K

Обработка изображений*Машинное обучение*Робототехника

Из песочницы

Привет, Хабр! Однажды, я решил создать автоматическую автозаправочную станцию. Один из ее компонентов - роботизированная "рука", для автоматической заправки транспортных средств, независимо от марки/модели. Данная рука последовательно открывает лючок бензобака, отвинчивает крышку горловины бензобака, вставляет заправочный пистолет, осуществляет заправку автомобиля и возвращает все на место. В данной статье я хочу рассказать о том, как осуществлялось распознавание лючка бензобака для корректного позиционирования "руки" в пространстве и определения места присоединения присоски. Давайте посмотрим - как эта задача была решена.

+28

101

Lozkins 2 июл 2023 в 11:32

Прогулка по мостам Кёнигсберга с ORtools

Простой

6 мин

3.4K

Математика*Машинное обучение*

Кейс

На выходных впервые удалось выбраться в Калининград. Я уделил немало внимания исследованию уровня жизни и благополучия области, в основном, ориентируясь на стоимость покупки/аренды жилья, цены в ресторанах и заработок таксистов. Данные достаточно доступные и позволяют сформировать общее представление о положении дел в городе/области.

Помимо экономической составляющей, конечно, старался погрузиться в культурный/исторический аспект жизни города. За короткий промежуток времени достаточно сложно проникнуться всеми особенностями, однако в Калининграде я бы выделил верное следование ограничениям скорости! Благодаря этому, возникает ощущение безопасности, замедления времени и спокойствия.

История города богатая, и в этом мешке событий я нашел кое-что интересное для себя. Речь пойдет о задаче семи пешеходных мостов Кёнигсберга. В свое время Эйлер в процессе размышлений над решением этой задачи положил начало теории графов. В статье рассмотрим задачу с позиции задачи линейного программирования и подтвердим результаты трехсотлетней давности с помощью Python и OR-Tools.

AnatolyBelov 2 июл 2023 в 08:32

RuGPT3. Исследование вариантов циклическим перебором

7 мин

2.7K

Машинное обучение*Искусственный интеллектNatural Language Processing*

RuGPT3 - коллекция моделей от Сбер

Проводим автоматическое тестирование циклическим перебором вариантов.

Работаем в Colab, тестируем Small, Mediub, Large.

Параметры генерации совершенно неоптимизированы - это первый заход, чтобы посмотреть исходную ситуацию и сравнивать по мере улучшения.

Алгоритм тестирования
полный последовательный перебор

10 вопросов
3 модели: Small, Medium, Large
Несколько наборов параметров внутри каждой модели
Реплики сохраняем в гугл-таблице

GolovinDS 30 июн 2023 в 16:00

Прогноз покупки страховки клиентами туроператора

Средний

21 мин

1.6K

Блог компании OTUSМашинное обучение*

Кейс

Всем привет! Данная статья является выпускным проектом выпускницы OTUS. Наталья попыталась сделать прогноз покупки страховки клиентами туроператора методами ML. Что из этого вышло, смотрите под катом.

+17

KKK_56 30 июн 2023 в 12:43

Prompt-инженер как новый тренд. Требования и зарплаты у специалистов

6 мин

41K

Блог компании МТСМашинное обучение*Карьера в IT-индустрииИскусственный интеллектБудущее здесь

Технологические компании со всего мира ищут квалифицированных и эффективных инженеров, которые бы облегчили общение с машиной и составление инструкций. Екатерина Саяпина, Product Owner личного кабинета платформы МТС Exolve, созданной компанией МТТ (входит в экосистему МТС), разбирается, как попасть в эту волну, какие вакансии представлены на рынке и чему стоит научиться, если вы хотите стать prompt-инженером.

+12

cointegrated 30 июн 2023 в 10:12

Фильтруй базар! Как мы параллельный русско-башкирский корпус чистили

Сложный

6 мин

2.9K

Python*Семантика*Data Mining*Машинное обучение*Natural Language Processing*

Чтобы обучать нейросети понимать и генерировать человеческие языки, нужно много качественных текстов на нужных языках. «Много» – не проблема в эпоху интернета, но с качеством бывают сложности. В этом посте я предлагаю использовать BERT-подобные модели для двух задач улучшения качества обучающих текстов: исправление ошибок распознавания текста из сканов и фильтрация параллельного корпуса предложений. Я испробовал их на башкирском, но и для других языков эти рецепты могут оказаться полезны.

+17

sad__sabrina 29 июн 2023 в 17:52

Interpretability versus explainability: Интерпретируемость или объяснимость?

Простой

3 мин

1.4K

Машинное обучение*Научно-популярноеИскусственный интеллект

Обзор

При чтении статей в области explainable AI, нередко можно встретить интерпретируемость (Interpretability) и объяснимость (explainability) как взаимозаменяемые сущности. Между этими понятиями существует путаница, которая вызывает трудности, особенно масштабные при отслеживании и анализе литературы [1].

В этом посте разобрана разница между explainable AI и interpreted AI, приведены примеры и небольшой монолог на тему: "что всё-таки важнее".

Прошу к чтению =)

JetHabr 29 июн 2023 в 15:40

Тестирование ML-моделей. От «пробирки» до мониторинга боевых данных

9 мин

3.3K

Блог компании Инфосистемы ДжетТестирование IT-систем*Машинное обучение*Искусственный интеллект

✏️ Технотекст 2023

Из этой статьи вы узнаете, почему важно проводить «лабораторные испытания» ML-моделей, и зачем в тестировании наработок «ученых по данным» должны участвовать эксперты из предметной области, а также — как выглядят тесты после того, как модель покинула датасайнтистскую лабораторию (и это не только мониторинг качества данных).

На первый взгляд кажется, что тестирование ML-моделей должно проходить по классическим ИТ-сценариям. Моделируем процесс, присылаем сценарии тестерам, и начинается магия — невозможные значения входных данных, попытки сломать логику системы и т. д. В некотором смысле все работает именно так: процесс разработки ML-сервисов включает и этот этап. Но только в некотором смысле — ведь у науки о данных есть масса особенностей.

Узнать магические секреты

1 2 ...

47 48

50 51 ...

324 325

Машинное обучение *

YandexGPT в Браузере: как мы учили модель суммаризировать статьи

See and Tell: Сервис просмотра сериалов для слабовидящих

Сложности MVP или как мы смотрели 40000 видео

Как мы с помощью Kubeflow Pipelines оптимизировали обучение ML-моделей

Истории

LLM API для Java

Нейронные сети не могут обобщать периодические зависимости. Как это исправить?

Эволюция метрик качества машинного перевода — Часть 1

Как стать магистром по ML за 2 года

Sarsa: алгоритм, основные принципы и применение

«Магия вне Хогвартса», или Как разделить аудиосигнал на источники, обогнав существующие решения

Как я покорил ИТМО и поступил в магистратуру по ИИ без экзаменов

Кодеки новой эпохи: HEVC, AV1, VVC и нейросети

Распознаем лючки бензобаков

Ближайшие события

Прогулка по мостам Кёнигсберга с ORtools

RuGPT3. Исследование вариантов циклическим перебором

Прогноз покупки страховки клиентами туроператора

Prompt-инженер как новый тренд. Требования и зарплаты у специалистов

Фильтруй базар! Как мы параллельный русско-башкирский корпус чистили

Interpretability versus explainability: Интерпретируемость или объяснимость?

Тестирование ML-моделей. От «пробирки» до мониторинга боевых данных

Вклад авторов

Работа