Машинное обучение *

Основа искусственного интеллекта

СтатьиПостыНовостиАвторыКомпании

karinakvanchiani 13 июл 2023 в 07:56

Мнение большинства для разметки данных в задачах компьютерного зрения

Средний

8 мин

3.5K

Блог компании SberDevicesКраудсорсингМашинное обучение*Обработка изображений*Data Mining*

Туториал

Многие прикладные задачи из области компьютерного зрения требуют от разработчиков создания собственных наборов данных, которые можно своевременно обновлять и адаптировать: увеличивать количество классов и сэмплов или делать сэмплы более разнородными по тем или иным признакам. Кроме того, для некоторых задач необходимы доменные и достаточно специфичные данные. Например в SberDevices, для реализации управления умными устройствами с помощью жестов, необходим датасет, на изображениях которого люди показывают жесты перед камерой; для бьютификации в Jazz — фотографии людей на веб-камеру или селфи. Необходимость постоянно создавать и поддерживать собственные наборы данных требует автоматизации их сбора и разметки.

+10

NewTechAudit 13 июл 2023 в 06:41

Контроль за дрейфами предсказательных моделей и Popmon

Простой

8 мин

8.6K

Python*Машинное обучение*

Туториал

✏️ Технотекст 2023

Привет, Хабр!

На связи участник профессионального сообщества NTA Иван Попов.

В сфере бизнеса зачастую используются модели машинного обучения для прогнозирования различных показателей, однако их предсказательная сила может снижаться с течением времени. В данном посте расскажу, что такое дрейф моделей, почему важно следить за ними, и как это можно сделать с помощью библиотеки Popmon.

Как держать дрейф модели под контролем?

KobakAnton 12 июл 2023 в 17:28

Разработка видеоаналитики для контроля в общественных бассейнах

Средний

10 мин

3.8K

Машинное обучение*

Кейс

В статье расскажу об опыте реализации видеаоаналитики в сложной среде, а именно - в воде, на примере подготовки программно-аппаратного комплекса для общественных басссейнов.

Читать кейс (15 минут)

ddimitrov 12 июл 2023 в 12:14

Kandinsky 2.2 — новый шаг в направлении фотореализма

Средний

7 мин

56K

Блог компании СберБлог компании SberDevicesМашинное обучение*Обработка изображений*Natural Language Processing*

Обзор

2023 год можно смело называть годом бурного развития генеративного искусственного интеллекта. Это касается не только привычной нам модальности изображений (Kandinsky 2.1, Stable Diffusion XL, IF, Шедеврум и др.), но и текстовой (ChatGPT, LLaMA, Falcon и др.), и даже модальности видео (GEN-2, CogVideo и др.). При этом ни в одном из направлений выделить объективного лидера почти невозможно — все команды стараются равномерно двигаться вперёд и повышать качество синтеза. Текстовые чат‑боты научились взаимодействовать с внешними системами посредством плагинов, синтез изображений вышел на уровень фотореалистичных генераций, длина генерируемых видео постепенно увеличивается с сохранением сюжетной связности между кадрами. И такой прогресс обусловлен уже не только наращиванием вычислительных мощностей, но и большим числом неординарных архитектурных решений, которые позволяют добиваться лучшего качества.

С момента выхода Kandinsky 2.1 (4 апреля 2023 года) прошло чуть больше трёх месяцев, и вот сегодня мы анонсируем новую версию модели в линейке 2.X. И если архитектурно модель не претерпела кардинальных изменений, то в части расширения функционала получила существенное развитие. В первую очередь, мы сделали упор на повышение качества генераций и их разрешении, а также новых возможностях синтеза изображений.

+65

166

freQuensy23 12 июл 2023 в 12:00

Кто же такая это ваша LoRA

Средний

5 мин

71K

Математика*Машинное обучение*

Обзор

В сети в последнее время регулярно мелькают статьи типа - как обучить Stable Diffusion генерировать ваши фотографии/фотографии в определенном стиле/фотографии определенного лора/такие фотографии итп.

Однако к сожалению, даже на хабре, об этой технологии рассказывают супер-поверхностно - как скачать какую-то GUI программу, и куда тыкать кнопочки. Поэтому я решил исправить это недоразумение, и выпустить первую статьи на русском, где полностью рассказывается что по настоящему стоит за этими 4-мя буквами.

+36

shpringer 12 июл 2023 в 09:26

Пугающее противостояние: утечка данных в машинном обучении

13 мин

5.3K

Блог компании VKBig Data*Машинное обучение*

Перевод

В общем контексте под утечкой данных часто имеют в виду ситуацию, когда без разрешения или без соблюдения должных мер безопасности кому-то постороннему передают конфиденциальную информацию. В результате нарушается безопасность и конфиденциальность данных. В машинном обучении речь идёт о другой проблеме, когда информация из тестового датасета ошибочно попадает в обучающий.

Читать дальше →

+24

JetHabr 12 июл 2023 в 08:00

Инструменты Дата-сайнтиста. Универсальная база

4 мин

11K

Блог компании Инфосистемы ДжетИскусственный интеллектУчебный процесс в ITМашинное обучение*Python*

Обзор

✏️ Технотекст 2023

Специалисты по анализу данных используют много разных инструментов, причем новые технологии (фреймворки, библиотеки и т.д.) появляются так часто, что у начинающих свой путь в отрасли постоянно возникает вопрос, что им нужно изучать в первую очередь. Здесь вы найдете обзор базовых инструментов. В следующих постах мы продолжим тему и расскажем об инструментах, не вошедших в этот обзор.

Какие инструменты нужны для анализа данных

+10

dbalutin 12 июл 2023 в 06:30

Откуда берутся истории

Простой

9 мин

Блог компании СберМашинное обучение*Контекстная реклама*

Кейс

Я работаю в Сбере, в команде, которая развивает продажи в СберБизнес, интернет-банке для предпринимателей. Наша лента историй (stories) — главный способ помочь клиентам освоиться с продуктами и услугами банка и его партнёров: пользователь читает ленту, находит что-то интересное для себя, нажимает кнопку и подключает услугу. Помимо продуктовых внушительную часть нашей ленты занимают «познавательные» истории (interaction stories). Они дают советы по предпринимательской деятельности, посвящают клиентов Сбера в нюансы изменений законодательства, делятся выводами, рассказывают про интересные случаи. Подготовкой такого контента для ленты занимается сразу несколько команд. Это трудозатратно и занимает немало времени на разных этапах согласования. Хотелось этот процесс ускорить, но как? У нас появилась идея: пусть ИИ сам производит контент за нас. У него нет понятия «не могу или не умею», он сделает всё, что захочешь. Конечно, в разумных пределах.

pandovv 11 июл 2023 в 14:03

Декларирование ML-пайплайнов: организация экспериментов

Средний

4 мин

1.8K

Блог компании АвтомаконМашинное обучение*Искусственный интеллект

Обзор

Приветствуем читателей Хабра! Мы, дата-сайентисты и дата-аналитики компании «ДатаЛаб»* (ГК «Автомакон»), делимся своим опытом решения актуальных проблем, с которыми сталкиваются ML-команды.

dasafyev 11 июл 2023 в 08:58

Топ-10 видеокарт для машинного обучения

Простой

10 мин

74K

Блог компании HOSTKEYData Mining*Машинное обучение*Искусственный интеллектВидеокарты

Обзор

Как правильно выбрать видеокарту и максимально эффективно обрабатывать большие объемы данных и выполнять параллельные вычисления.

-6

Artezio_team 11 июл 2023 в 07:01

ChatGPT и сингулярность. Как искусственный интеллект переписывает будущее

8 мин

11K

Блог компании ГК ЛАНИТМашинное обучение*Искусственный интеллектБудущее здесь

Искусственный интеллект (ИИ) проникает во все сферы нашей жизни, и одним из ярких примеров такого прогресса является ChatGPT, разработанный OpenAI. Сегодня более 100 000 000 пользователей уже вовлечены в использование этого интеллектуального чат-бота, а число его возможных применений продолжает расти. Благодаря своим навыкам в обработке естественного языка и пониманию контекста, ChatGPT успешно зарекомендовал себя в образовательных проектах, бизнесе, научных исследованиях и многих других областях. На дискуссии Artezio мы собрали экспертов, чтобы обсудить, как ChatGPT меняет наш подход к общению, его преимущества и некоторые опасения, возникающие в связи с использованием ИИ в повседневной жизни. Представляем краткий обзор дискуссии в блоге ЛАНИТ.

+72

aibrain 10 июл 2023 в 12:18

Генерируй, дискриминируй. Как мы ускорили доменную адаптацию GAN для генерации лиц в пять тысяч раз

Сложный

5 мин

2.7K

Блог компании AIRIАлгоритмы*Обработка изображений*Машинное обучение*Искусственный интеллект

Кейс

Всем привет! Меня зовут Айбек Аланов. Я — аспирант факультета компьютерных наук ВШЭ, а также научный сотрудник группы «Вероятностные методы машинного обучения» AIRI. Сегодня мне хотелось бы поделиться с вами успехами, которые добилась наша научная группа в вопросе адаптации генеративно-состязательных сетей на новые домены.

+13

aarmaageedoon 10 июл 2023 в 10:49

Как использовать метод Дэвида-Скина для агрегации разметки. Разбираем по шагам

Средний

9 мин

3.1K

Блог компании MWS AIБлог компании МТСМашинное обучение*Natural Language Processing*

Обзор

Всем привет. Открываю серию статей, посвященную агрегации разметки. Этим вопросом я активно занимался, пока работал в нашем центре компетенций по работе с данными: нам нужен был механизм агрегации разметки из разных задач. По пути накопил материалов и, причесав, делюсь с вами.

В этой части я расскажу про модель Дэвида-Скина, которая заложила основы для многих методов агрегации разметки и является второй по значимости после голосования большинством. Многие создатели проектов следуют этому методу для повышения качества данных. Изначально он был разработан в 1970-х для вероятностного моделирования медицинских обследований. Именно поэтому разберем этот метод на примере с докторами.

perevalov_a 9 июл 2023 в 12:53

Почему ChatGPT нас (полностью) не заменит

Простой

5 мин

Машинное обучение*Исследования и прогнозы в IT*Карьера в IT-индустрииИскусственный интеллектБудущее здесь

Мнение

Примечание: этот текст не был написан ChatGPT.

В последнее время технологии искусственного интеллекта (ИИ), включая генеративные нейронные сети, стали все более распространенными среди широких масс. Одним из самых продвинутых и широко известных примеров является ChatGPT, созданный на базе GPT-3.5 архитектуры, которая позволяет ему обрабатывать и анализировать естественный язык и давать точные и часто неожиданные ответы на разнообразные вопросы. ChatGPT может быть использован во многих областях, включая образование, здравоохранение, банковское дело и многие другие.

Несмотря на все его возможности, и вопреки многочисленным репликам в интернете, ChatGPT, как и любая другая «умная программа», не может полностью заменить человека на его рабочем месте. В этой статье мы порассуждаем на тему того, почему труд человека останется актуальным.

-1

118

Mazepov 9 июл 2023 в 08:59

Семантическая сегментация на основе архитектуры U-Net и определение расстояния между объектами

Средний

7 мин

20K

Data Engineering*Умный домИскусственный интеллектМашинное обучение*Python*

Лучший Техноавтор 2023

Всем привет!

Возвращаясь к бытовому применению нейронных сетей, изначально была идея усовершенствовать модель детекции свободного парковочного места из предыдущей моей статьи (Определение свободного парковочного места с помощью Computer Vision), сделать возможность сегментации дороги, тротуара и исключать из парковочных мест, автомобили, которые стоят на газоне (было несколько гневных комментариев на этот счёт).

Однако в процессе размышлений, я решил сделать отдельную модель сематической сегментации, причем написать вручную нейросеть и обучить на своих данных. Суть модели заключается в следующем:

Модель на базе U-Net архитектуры сегментирует различные объекты (кот, стул, стол, тарелка с котлетами итд) и при сближении двух объектов сегментации (кот - тарелка) модель сигнализирует об этом с помощью телеграмм бота.

Отлично, задача поставлена, теперь реализация!

+28

PS21 8 июл 2023 в 12:08

Первые шаги в импульсных нейронных сетях

Средний

21 мин

18K

Python*Искусственный интеллектМатематика*Машинное обучение*Программирование*

Из песочницы

Перевод

Давайте попробуем немного разобраться в теме импульсных нейронных сетей (spiking neural network, SNN). Напишем простую импульсную нейронную сеть, используя только NumPy и Pandas, для классической задачи машинного обучения с использованием кодирования рецептивными полями.

+24

mr_mishen 8 июл 2023 в 09:00

Kaggle — практическое изучение Big Data. Что это за платформа, и как она работает

5 мин

24K

Блог компании МТССпортивное программирование*Машинное обучение*Карьера в IT-индустрии

Привет, Хабр!

Время от времени здесь публикуются статьи с упоминанием Kaggle. Это крупнейшая международная платформа соревнований по Data Science. В организации соревнований участвуют крупные и не очень компании, а многие задачи решают реальные проблемы медицины, ИИ, разработки и т. п.

Если вы слышали что-то о Kaggle, но ещё не пробовали платформу в работе, то эта статья для вас. В ней относительно коротко рассказывается о том, как всё это работает, в каких соревнованиях можно участвовать и какие вообще возможности предоставляет платформа участникам.

+17

mathalex 7 июл 2023 в 11:57

Применение метода взаимной информации в медицинских задачах классификации многомерных временных рядов

Средний

9 мин

3.4K

Машинное обучение*Искусственный интеллект

Из песочницы

Привет, хабр! Меня зовут Алексей Бойков. Я студент третьего курса факультета компьютерных наук НИУ ВШЭ. В начале весны 2023 года мне удалось попасть на стажировку в Лабораторию искусственного интеллекта Сбера. В ней несколько основных групп, я работал в командах фундаментальных исследований и искусственного интеллекта в медицине. Моим руководителем был Качан Олег, который предложил мне заняться исследованием применимости гиперграфов полной взаимной информации для анализа временных рядов. В данной статье я попробую рассказать про часть этой задачи, касающуюся непосредственно применения полной взаимной информации, как меры ассоциации между несколькими случайными величинами.

+10

Turbo 7 июл 2023 в 10:38

VOT Challenge: как мы поучаствовали в соревнованиях по компьютерному зрению

8 мин

990

Машинное обучение*Обработка изображений*

Обзор

Привет, хабристы. В этой короткой заметке мы хотим рассказать о нашем опыте участия в конкурсе по компьютерному зрению - VOT Challenge 2023, посвященном трекингу объектов на видео. Порефлексируем об ошибках, которые мы допустили и зачем вообще участвовать в этих конкурсах. Это вольный перевод нашей заметки на ACM, если Вам понравится, сходите и на оригинал. Нам будет приятно.

shpringer 7 июл 2023 в 09:21

Фигуры Matplotlib и стиль Cyberpunk: несколько строк кода — и готова красивая фигура

8 мин

8.3K

Блог компании VKBig Data*Машинное обучение*

Перевод

Когда мы создаем инфографику или постеры с данными, мы хотим привлечь внимание читателя: для этого изображение должно быть эстетически привлекательным и при этом убедительно доносить нашу мысль. Есть множество графических библиотек для создания графиков с помощью Python. Одна из них — это хорошо известная Matplotlib. Но графики, построенные ее стандартными средствами, часто выглядят скучными, и, чтобы оживить их, нужно потратить много времени.

Читать дальше →

+27

1 2 ...

147 148

149

150 151 ...

423 424

Машинное обучение *

Мнение большинства для разметки данных в задачах компьютерного зрения

Контроль за дрейфами предсказательных моделей и Popmon

Разработка видеоаналитики для контроля в общественных бассейнах

Kandinsky 2.2 — новый шаг в направлении фотореализма

Кто же такая это ваша LoRA

Пугающее противостояние: утечка данных в машинном обучении

Инструменты Дата-сайнтиста. Универсальная база

Откуда берутся истории

Декларирование ML-пайплайнов: организация экспериментов

Топ-10 видеокарт для машинного обучения

ChatGPT и сингулярность. Как искусственный интеллект переписывает будущее

Генерируй, дискриминируй. Как мы ускорили доменную адаптацию GAN для генерации лиц в пять тысяч раз

Как использовать метод Дэвида-Скина для агрегации разметки. Разбираем по шагам

Ближайшие события

Почему ChatGPT нас (полностью) не заменит

Семантическая сегментация на основе архитектуры U-Net и определение расстояния между объектами

Первые шаги в импульсных нейронных сетях

Kaggle — практическое изучение Big Data. Что это за платформа, и как она работает

Применение метода взаимной информации в медицинских задачах классификации многомерных временных рядов

VOT Challenge: как мы поучаствовали в соревнованиях по компьютерному зрению

Фигуры Matplotlib и стиль Cyberpunk: несколько строк кода — и готова красивая фигура

Вклад авторов