Search results for «[deeplearning]» / Habr

How to become an author

Publications Hubs Companies Users Comments

MaksimSidorov Aug 30 2022 at 14:16

Вебинар «Встраиваем процесс разработки компонентов с ИИ в модельно-ориентированную инженерию»

1 min

181

ЦИТМ Экспонента corporate blogMachine learning*Artificial IntelligenceSystems engineering*

15 сентября, 10:00, Онлайн

Регистрируйтесь на бесплатный вебинар, и узнайте, как облегчить проектирование сложных систем с ИИ, разрабатываемых в модельно-ориентированном процессе, как протестировать систему в модельном окружении через симуляцию, как сгенерировать код для прототипов на промежуточных аппаратных платформах (CPU/GPU).

Читать далее

0

MTorn Dec 12 2023 at 12:59

Риски, присущие работе искусственного интеллекта

Easy

10 min

1.9K

Development Management*Research and forecasts in IT*Reading roomArtificial IntelligenceFinance in IT

Opinion

Когда я задался вопросом, а что есть почитать на тему управления рисками ИИ, я удивился тому, насколько мало информации по этому поводу опубликовано. В основном, найденные тексты касались морально-этических норм и будущего человечества. Я решил чуть более детально изучить вопрос, а результатом с радостью делюсь в данном материале.

Сейчас, в декабре 2023 года, тема искусственного интеллекта продолжает набирать популярность, так как человечество осознало потенциал использования искусственного интеллекта в различных областях своей жизнедеятельности.

Данная статья не затрагивает социальные и этические проблемы ИИ и не претендует на полноту охвата области рисков присущих искусственному интеллекту, а служит в первую очередь отправной точкой для последующих исследований, является попыткой автора затронуть данную тему и понять возможные риски, присущие всему тому, что называют искусственным интеллектом (ИИ aka AI).

Для этого в первую очередь давайте разберемся, а что такое ИИ и какой ИИ существует, какие цели перед ним стоят.

Читать далее

+2

ternaus Feb 20 at 07:06

Albumentations: XYMasking

Easy

7 min

881

Python*Image processing*Machine learning*

Tutorial

Короткая версия

После длинного вступления, будет туториал по применению аугментации XYMasking к спектрограммам от ЭЭГ. Кто экономит время - код с примерами можно найти по ссылке в документации библиотеки.

Длинная версия

Albumentations - это Open Source библиотека для аугментации изображений.

Аугментация - это умное слово, которое в переводе с русского на русский означает "преобразование".

Q: Зачем это надо?

A: Основное применение - тренировка нейронных сетей на картиночных данных, например ImageNet.

Чем больше разнообразных данных сеть видит при тренировке, тем выше шансы, что она выучит закономерности, а не просто запомнит их.

На практике, пока прошлый батч картинок обрабатывается сетью на GPU, CPU занимается подготовкой нового батча, причем к каждому изображению применяются различные аугментации. Это позволяет достигнуть большего разнообразия данных, которые видит сеть.

Благодаря такому подходу нейронная сеть никогда не видит один и тот же набор пикселей, что способствует более высокой точности и обобщающей способности.

Читать далее

+6

voneskinho Dec 31 2023 at 15:58

Foundational models: приведет ли масштабирование к AGI

Medium

2 min

3.2K

Machine learning*Artificial Intelligence

В deep learning за последние 10 лет произошла революция. В этом посте расскажем, почему это важно знать всем, на визуальных примерах, и рассмотрим перспективы на ресерч и внедрение моделей искусственного интеллекта, учитывающие социальный импакт моделей.

В области стратегических игр значимый результат был получен в 2016-2017 году, когда модель меньше чем за 3 дня обучения смогла дойти до уровня чемпиона мира в игре go.

Читать далее

-6

hivaze Mar 11 at 16:15

Контекст больше не предел: Линейка русскоязычных энкодеров ruRoPEBert и как она создавалась

Medium

9 min

5K

Точка corporate blogMachine learning*Artificial IntelligenceNatural Language Processing*

Привет, Хабр! Если вы интересуетесь NLP или просто современными DL моделями, то приглашаю вас узнать, как можно, имея всего лишь одну A100, около 30 гигабайтов текста и несколько дней обучения, решить проблему ограниченного окна контекста для русскоязычных трансформеров. А ещё сделаем несколько оптимизаций и добьёмся почти лучших метрик в бенчмарке encodechka.

Погрузиться в контекст

+14

Vasyutka Jun 3 2018 at 22:05

Человек машине помощник

9 min

6.2K

Recognitor corporate blogData Mining*Machine learning*

Этот блог обычно посвящен распознаванию автомобильных номеров. Но, работая над этой задачей, мы пришли к интересному решению, которое можно с легкостью применять для очень широкого круга задач компьютерного зрения. Об этом сейчас и расскажем: как делать систему распознавания, которая вас не подведет. А если подведет, то ей можно подсказать, где ошибка, переобучить и иметь уже чуть более надежное решение, чем прежде. Добро пожаловать под кат!

Читать дальше →

+26

visualcomments Feb 17 2021 at 10:20

Время, деньги и фасттекст (и при чем здесь бытие)

2 min

1.3K

Machine learning*

Пятиминутка философии на Хабре.

Все знают изречение «время — деньги». Но если обратиться к корпусу философских текстов, то такое сочетание для философии не самое привычное. Гораздо чаще время у философов ассоциируется, например, с бытием. Есть даже такая книга, «Бытие и время». Но вдруг нас заинтересует, как же всё-таки время и деньги связаны в философии? Самое время обратиться к глубокому обучению.

У нас есть модель фасттекста, которую обучили на корпусе из 346 философских книг на русском языке. Самые любопытные читатели прямо сейчас могут поработать с ней в колабе.

Попробуем задать ей вопрос о сходстве денег и времени в философии. Но заодно захватим и связку «бытие - время».

Читать далее

+3

veseluha Apr 13 at 15:00

Lightning Studio: Альтернатива Google Colab от создателей PyTorch Lighting

2 min

4K

BotHub corporate blogMachine learning*Artificial Intelligence

Lightning Studio представляет собой передовую облачную платформу для проектирования и тестирования моделей машинного обучения, разработанную создателями PyTorch Lightning. Эта платформа обеспечивает пользовательский опыт, сравнимый с "iPhone" в сфере инструментов ML, благодаря своей интуитивной простоте и одновременно впечатляющей мощности. Она объединяет инструменты машинного обучения в единый интерфейс, избавляя от необходимости переключения между разными приложениями. Это значительно упрощает процесс создания масштабируемых приложений и конечных точек AI.

Одна из множества функций Lightning Studio способствует повышению производительности разработки на 60%, так как она позволяет легко переходить с работы на CPU на GPU, сокращая таким образом до 80% времени, обычно тратимого на разработку.

Рассказываем, в чем суть далее(:

Читать далее

+5

ivankudryavtsev Feb 14 at 16:38

Вышел Savant 0.2.7: фреймворк компьютерного зрения, оптимизированный для NVIDIA

4 min

3.1K

Programming*Algorithms*Machine learning*Robotics development*Artificial Intelligence

7 февраля 2024 года наша команда выпустила очередную версию фреймворка Savant - 0.2.7. Релиз содержит несколько исправлений ошибок, четыре новых демонстрационных пайплайна и ряд улучшений, о которых будет написано далее.

Читать далее

+1

yullycake Sep 23 2023 at 10:00

Обслуживание моделей PyTorch с помощью TorchServe

Easy

8 min

3.1K

IT Infrastructure*Machine learning*

Это подробное руководство о том, как создавать и развертывать собственные модели PyTorch в производстве с помощью TorchServe.

Читать далее

+3

ivankudryavtsev Jul 17 2023 at 12:10

Вышел Savant 0.2.4: компьютерное зрение на базе глубокого обучения для Nvidia Jetson и dGPU

Easy

3 min

1.7K

Python*Data Mining*Algorithms*Image processing*Machine learning*

Review

После месяца напряженной работы мы выпустили новую версию Savant (0.2.4), с новыми функциями и примерами использования.

Savant — это фреймворк компьютерного зрения с открытым исходным кодом для создания приложений компьютерного зрения на базе нейронных сетей, работающий на стеке Nvidia. Он упрощает разработку динамических, отказоустойчивых конвейеров видео‑аналитики, использующих рекомендованные Nvidia инструменты для центров обработки данных и граничных ускорителей.

Savant построен на базе DeepStream и предоставляет высокоуровневый уровень абстракции для быстрой разработки конвейеров компьютерного зрения на базе Nvidia DeepStream.

Читать далее

+2

alex_golubev13 Dec 4 2023 at 09:51

Кто такие LLM-агенты и что они умеют?

Medium

24 min

25K

Open Data Science corporate blogMachine learning*Artificial Intelligence

Review

В последнее время большие языковые модели (Large Language Models, LLM) стали невероятно популярными — кажется, их обсуждают везде, от школьных коридоров до Сената США. Сфера LLM растёт бурными темпами, привлекая внимание не только специалистов в области машинного обучения, но и обычных пользователей. Кто-то высказывает массу опасений насчет их дальнейшего развития, а кто-то и вовсе предлагает бомбить дата-центры — и даже в Белом Доме обсуждают будущее моделей. Но неужели текстом можно кому-то навредить? А что если такая модель приобрела бы агентность, смогла создать себе физическую оболочку и полностью ей управлять? Ну, это какая-то фантастика из (не)далёкого будущего, а про агентов нашего времени я расскажу в этой статье. И не переживайте — знание машинного обучения вам не понадобится!

Читать далее

+23

IvaYan Dec 4 2023 at 12:53

Архитектура современных приложений на основе LLM

Medium

11 min

6.5K

Machine learning*

Review

Translation

В этом посте мы рассмотрим пять наиболее важных этапов, который нужно пройти при разработке собственного приложения на основе LLM, формирующиеся общепринятые подходе к разработке таких приложений и предметные области, на которые стоит обратить внимание.

Читать далее

+4

elebedevwork Feb 2 2019 at 13:35

Как мы создали рекомендательный сервис по подбору одежды на нейронных сетях

10 min

14K

Image processing*Machine learning*

В этой статье я хочу рассказать о том, как мы создали систему поиска похожей одежды (точнее одежды, обуви и сумок) по фотографии. То есть, выражаясь бизнес-терминами, рекомендательный сервис на основе нейронных сетей.

Как и большинство современных IT-решений, можно сравнить разработку нашей системы со сборкой конструктора Lego, когда мы берем много маленьких деталек, инструкцию и создаем из этого готовую модель. Вот такую инструкцию: какие детали взять и как их применить для того, чтобы ваша GPU смогла подбирать похожие товары по фотографии, — вы и найдете в этой статье.

Из каких деталей построена наша система:

детектор и классификатор одежды, обуви и сумок на изображениях;
краулер, индексатор или модуль работы с электронными каталогами магазинов;
модуль поиска похожих изображений;
JSON-API для удобного взаимодействия с любым устройством и сервисом;
веб-интерфейс или мобильное приложение для просмотра результатов.

В конце статьи будут описаны все “грабли”, на которые мы наступили во время разработки и рекомендации, как их нейтрализовать.

Постановка задачи и создание рубрикатора

Задача и основной use-case системы звучит довольно просто и понятно:

пользователь подает на вход (например, посредством мобильного приложения) фотографию, на которой присутствуют предметы одежды и/или сумки и/или обувь;
система определяет (детектирует) все эти предметы;
находит к каждому из них максимально похожие (релевантные) товары в реальных интернет-магазинах;
выдает пользователю товары с возможностью перейти на конкретную страницу товара для покупки.

Говоря проще, цель нашей системы — ответить на знаменитый вопрос: “А у вас нет такого же, только с перламутровыми пуговицами?”

Читать дальше →

+30

smirnovevgeny Nov 30 2021 at 13:00

Как улучшить ключевые метрики банка за счет кассовых чеков ОФД?

8 min

4.1K

Альфа-Банк corporate blogBig Data*Machine learning*Artificial IntelligenceFinance in IT

Плох тот дата сайентист, который не представляет, как будут использоваться его модели в конечных продуктах, как они помогут бизнесу увеличить чистую прибыль, улучшить клиентский опыт или любой другой ключевой показатель в компании. Часто задачи приходят от продуктовых подразделений, но в случае, когда главным компонентом продукта является модель машинного обучения, без экспертного взгляда специалиста не обойтись. В этой статье рассмотрим, как можно принести пользу компании за счет данных кассовых чеков ОФД.

Читать далее

+5

honyaki Aug 11 2021 at 17:06

Знакомство с Panda Gym

7 min

3.3K

Skillfactory corporate blogPython*Programming*Machine learning*Artificial Intelligence

Tutorial

Translation

К старту курса о машинном и глубоком обучении знакомим читателей с panda-gym — это библиотека с открытым исходным кодом, предоставляющая среду обучения с подкреплением интегрированному с Gym роботу Franka Emika Panda. Поддерживаются среды игр Atari, настольных игр, физические симуляции в 2D и 3D и многое другое. Это позволяет обучать несколько агентов, сравнивать их или разрабатывать новые алгоритмы машинного обучения для задач обучения с подкреплением. Подробности, как всегда, под катом, а в конце вы найдёте ссылку на блокнот Google Colab.

Читать далее

+6

smirnovevgeny Nov 1 2021 at 11:15

Классификация кассовых чеков

6 min

8.6K

Альфа-Банк corporate blogBig Data*HackathonMachine learning*Artificial Intelligence

Банки получают содержание кассовых чеков клиентов по транзакциям, совершенных по собственным картам через Операторов Фискальных Данных с согласия клиента. Данные приходят в сыром текстовом формате, аналогичном тому, что вы получаете в магазине на бумажном носителе информации после каждой вашей покупки. Каждый магазин заносит товары в кассовое ПО в произвольном, полюбившемся ему формате. Чеки некоторых магазинов содержат полное название каждой из товарных позиций, большинство же, видимо, сильно экономят на бумаге и сокращают все названия.

В кассовых чеках не содержатся штрих-коды и другие идентификаторов товаров. К сожалению, исходя из вышеописанных причин, не может существовать единого каталога с категоризацией всех названий товаров из чеков. А ведь наличие такого каталога помогло бы более качественно отображать детализацию покупок клиенту. Дополнительно категоризация товарных позиций может быть использована в качестве дополнительных признаков в моделях, использующих транзакционные переменные.

Весной 2021-го года ВТБ организовывал соревнование на платформе Boosters с целью решения этой задачи.

Читать далее

+16

palette_knife25 Dec 27 2022 at 13:32

Автоматическое исправление ошибок ASR с помощью sequence-to-sequence моделей

11 min

2.7K

MTS AI corporate blogMachine learning*Reading roomArtificial IntelligenceNatural Language Processing*

Review

Всем привет, я Алсу Вахитова — NLP-разработчица в MTS AI. Вместе с коллегами мы создаем различные алгоритмы обработки текста и извлечения информации из него. Большое количество проектов включает в себя взаимодействие с командами из “соседних” доменов, например, automatic speech recognition (ASR). Одна из таких задач - исправление ошибок в результате работы ASR методов (ASR error correction). В этой статье я приведу теоретический обзор некоторых статей, решающих данную проблему.

Читать далее

+3

Roosh Feb 10 2023 at 16:04

Что под капотом «ответов на вопросы» Маруси?

16 min

3.9K

VK corporate blogMachine learning*Voice user interfaces*

Привет, это команда ответов на вопросы Маруси.

Этот материал состоит из двух частей. Это вторая часть (первая часть). В ней мы чуть глубже копнём технический аспект того, как устроены ответы на вопросы Маруси.

В первой части мы поверхностно рассмотрели механизм, позволяющий нашему голосовому помощнику понимать вопросы и реагировать на них. Теперь поговорим о том, как мы некоторое время назад создавали систему ответов на вопросы, и с помощью каких решений достигался результат, соответствующий как требованиям пользователей, так и техническим ограничениям.

Материал может быть интересен тем, кто только начинает свой путь в NLP или разрабатывает аналогичные решения, но не обладает несколькими стойками c DGX.

Читать далее

+33

VTB Feb 20 2023 at 13:25

Введение в Adversarial attacks: как защититься от атак в модели глубокого обучения на транзакционных данных

7 min

3.7K

ВТБ corporate blogBig Data*

Машинное обучение широко применяется в различных отраслях. Последние несколько лет все большее распространение получают модели глубокого обучения, включая финансовую и банковскую сферы. В тоже время существуют риски, связанные с манипуляциями ограничений данного рода решений. В частности, риск подвергнуться намеренной атаки на такие модели. В этой статье представим общую таксономию таких атак и способов защиты от них. А также частный случай возможных атак на модели глубокого обучения на транзакционных данных и защиты от таких атак.

Adversarial attacks — это злонамеренное манипулирование входными данными модели машинного обучения с целью заставить ее выдать неправильные предсказания.

Эти атаки проектируются, чтобы использовать уязвимости алгоритмов машинного обучения и часто могут быть выполнены незаметно для системы или пользователя.

Цели таких атак могут варьироваться от причинения финансовых убытков, кражи конфиденциальной информации до нарушения работы системы в целом.

Виды атак

Существует несколько типов Adversarial attacks, каждый из которых имеет свои уникальные характеристики и методологию.

Читать далее

+1

1