Машинное обучение *

Основа искусственного интеллекта

Статьи Посты Новости Авторы Компании

MariaGafurova 14 часов назад

Размер имеет значение. Как Ozon автоматизировал измерение товаров на складах

16 мин

Блог компании Ozon TechРазработка под e-commerce*Машинное обучение*Компьютерное железоВидеотехника

Кейс

Сотрудники каждого склада, которые хотят выстроить логистические процессы оптимальным образом, должны знать фактические габариты и вес товаров, которые хранятся на его площадях. Совокупность габаритов и веса товара в Ozon называют объёмно-весовыми характеристиками (ОВХ).

Мы разработали, собрали и интегрировали в операционные процессы складов Ozon устройства для измерения габаритов и веса товаров. Об этом мы писали ранее. Но к идее создания своего решения пришли не сразу.

+26

badcasedaily1 18 часов назад

Разбираемся в ROC и AUC

Простой

6 мин

676

Блог компании OTUSPython*Программирование*Машинное обучение*

Обзор

Привет, Хабр!

В машинном обучение очень важны метрики оценки эффективности моделей. Среди таких метрик есть: кривые ROC и показатель AUC. Они позволяют оценивать бинарные классификаторы.

В этой статье мы как раз и разберем их.

AmigoRRR 20 часов назад

Не можешь остановить восстание роботов — возглавь его. Где учиться робототехнике в России узнали на ROS Meetup 2024

Средний

4 мин

702

Машинное обучение*Разработка робототехники*Программирование микроконтроллеров*РобототехникаИскусственный интеллект

Репортаж

Буквально вчера в чате робототехников разгорелся спор в какой вуз идти учиться робототехнике, да так чтобы можно было заниматься с роботами на практике. Давайте совместно разберемся в этом вопросе.

The-Founder-1 22 апр в 20:42

ML-технологии, которые уже сейчас оказывают мощное влияние на бизнес

Простой

11 мин

1.5K

Машинное обучение*

Обзор

Технологии очаровывают, отталкивают, вызывают приступы скептицизма… Люди по-разному относятся к любым новинкам, и это нормально. Но, как мы знаем, истинная ценность любой инновации проявляется в ее способности решать реальные проблемы и удовлетворять потребности клиентов. Поэтому лишь применяя новые технологии на практике для решения конкретных бизнес-потребностей, мы можем легко отличить действительно полезные вещи от тех, которые еще нуждаются в разработке и пока не могут принести ощутимых результатов.

Вот и сейчас в машинном обучении (ML) наблюдаются стремительные изменения и постоянное развитие. В этой статье мы рассмотрим последние тенденции в ML и объясним, как они уже сейчас выдвигают бизнес на новый уровень без затрат на новых сотрудников.

veseluha 22 апр в 18:00

На какие AI Coding Assistants стоит обратить внимание в 2024?

8 мин

4.6K

Блог компании BotHubПрограммирование*Машинное обучение*Искусственный интеллект

Обзор

Не является секретом, что LLM в настоящее время являются неотъемлемой частью нашего рабочего процесса. Особое внимание заслуживает AI Coding Assistant — искусственный интеллект, или просто программный помощник, который поддерживает разработчиков, помогая писать более качественный и точный код, тем самым экономя время и ресурсы.

Давайте рассмотрим различные программные помощники, доступные на рынке для разработчиков с разными уровнями навыков, включая как бесплатные, так и платные варианты.

Но прежде чем мы погрузимся в детали этих инструментов, давайте ответим на вопрос: "Что такое эти помощники?".

Приятного прочтения(:

+19

Hanamime 22 апр в 14:32

Кто держит руку на нашем пульсе: о настоящем и перспективах здравоохранения

Простой

9 мин

682

Блог компании СберМашинное обучение*Искусственный интеллектМедгаджеты

Мнение

В сфере медицины скорая помощь ИИ рассматривается как жизненно необходимая. Слишком большим оказался разрыв между новейшими технологическими достижениями и реальной врачебной практикой, которая далека от идеала не где–то в отдельно взятой стране, а по всему миру. В интервью The New York Times Бхавик Патель, доктор медицинских наук, MBA, клиника Мэйо, Аризона, высказал мнение:

В современном здравоохранении есть много пробелов, и я думаю, мы можем разумно использовать искусственный интеллект, чтобы устранить их или, по крайней мере, свести к минимуму.

Давайте разберёмся, как ИИ может помочь в медицине и какие шаги предпринимаются в разных странах.

+11

s_valuev 22 апр в 13:38

Языковой процессор LPU, GenAI в FinOps и инструменты для анализа данных

Средний

6 мин

Блог компании SelectelBig Data*Машинное обучение*Искусственный интеллектIT-компании

Дайджест

Привет, Хабр! Возвращаюсь с новым выпуском полезных материалов, который поможет разобраться в ML, AI и дата-аналитике. Сегодня в программе — состояние MLOps в 2024 году, возможности дата-контрактов, оценка качества данных DQ Score и Python-библиотека для работы с SQL. Подробнее — под катом. Еще больше полезных материалов — в Telegram-сообществе «MLечный путь».

Читать дальше →

+26

Odin_Himself 22 апр в 00:27

«Строка бога» и «лакмусовая бумажка» для ИИ-генераторов изображений

Простой

6 мин

Интерфейсы*Обработка изображений*Машинное обучение*Научно-популярноеИскусственный интеллект

Мнение

Здравствуйте, уважаемые читатели!

В этой статье я хотел бы привести простой пример методологии, которую использую лично я для оценки возможностей нейросетей-художников, а также для работы с ними.

Кроме того, хотелось бы ввести в обиход промт-инженеров два новых термина.

heinrich_wirth 21 апр в 01:40

KPConv на русском: Свертки для point cloud

Средний

7 мин

312

Python*Работа с 3D-графикой*Математика*Машинное обучение*Искусственный интеллект

FAQ

Приветствую всех!

В этой публикации я попробую максимально просто и наглядно рассказать о сверточном слое для point cloud. Перед вами статья, объясняющая KPConv — метода работы с облаками точек без их преобразования в промежуточные форматы, такие как воксели. Моя недавняя задача, связанная с совмещением облаков точек, заставила обратиться к нейронным сетям из за разной плотности точек в местах пересечений. И вот, исследуя возможные подходы, я обнаружил решение в котором использовали KPConv, который позволил извлекать признаки из точек по аналогии извлечений признаков из пикселей.

Информации на русском языке о данной структуре очень мало, поэтому я постарался сделать материал доступным и содержательным.

Lithium_vn 20 апр в 18:00

Использование нейросетей в SEO: большой обзор инструментов

17 мин

Блог компании BotHubМашинное обучение*Поисковая оптимизация*Искусственный интеллект

Обзор

Нейронные сети стремительно меняют ландшафт цифрового маркетинга, и SEO не является исключением. Все больше специалистов по поисковой оптимизации обращаются к возможностям искусственного интеллекта, чтобы улучшить свои стратегии, автоматизировать рутинные задачи и добиться более высоких результатов в органической выдаче.

Но как именно нейросети могут помочь в SEO? Какие задачи они способны решать уже сегодня, а какие перспективы открывают на будущее? Как выбрать и внедрить подходящие инструменты в свой рабочий процесс? Эти вопросы волнуют многих оптимизаторов - как начинающих, так и опытных профессионалов.

В этой статье мы постараемся дать развернутые ответы на эти вопросы и предоставить максимум полезной информации по теме. Мы подготовили большой обзор инструментов, которые используют как минимум алгоритмы машинного обучения. Наша цель - не просто познакомить вас с трендами на стыке SEO и ИИ, но и вооружить практическими знаниями, которые вы сможете применить в своей работе.

Ну что ж, поехали! Приятного чтения:)

+14

freQuensy23 20 апр в 14:53

Выбираем правильный инференс: Как мы сэкономили 70к $ на ЛЛМках

4 мин

3.2K

Машинное обучение*DevOps*Data Engineering*

Недавно ко мне обратились знакомые, которые активно впиливали LLM в своей продукт, однако их смущала стоимость такого решения - они платили около 8$/час за Huggingface inference Endpoint 24/7, на что уходили просто невиданные ~100 тысяч долларов в год. Мне нужно было заресерчить какие есть способы развертывания больших текстовых моделей, понять какие где есть проблемы и выбрать оптимальных из них. Результатами этого ресерча и делюсь в этой статье)

-5

Golangcoder 20 апр в 12:10

Дайджест полезных находок, инструментов, статей и видео из мира машинного обучения за неделю

3 мин

1.6K

Машинное обучение*Искусственный интеллект

Дайджест

Каждую неделю мир машинного обучения наполняется новыми открытиями, проектами и статьями, которые не только вдохновляют дата саентистов, но и расширяют горизонты знаний.

В этой статье мы собрали для вас подборку самых интересных и актуальных материалов недели, которые помогут вам быть в курсе последних тенденций и достижений.

🚀 Полезные инструменты недели

• LLaMa 3 - это главный релиз недели. Новая SOTA в open-source! LLM с открытым исходным кодом, которая превосходит Claude 3 Opus... и дышит в спину GPT-4.Скорость работы составляет почти 300 токенов в секунду. LLAMA-3 - самая загружаемая модельна HF.

• Torchtune - новая PyTorch-библиотека для файнтюнинга LLM. Библиотека сделана на базе PyTorch и и поддерживает LLama2 7B/13B, Mistral 7B и Gemma 2B.

• LLM Reka Core - новая передовая нейросеть способна обрабатывать текст, изображения, аудио и видео, чем выделяется среди других технологий в своем классе.

• VASA-1 - ананас нового ИИ генератора от Microsoft Research видео, который выглядит очень реалистично.

• AutoCodeRover - это полностью автоматизированный инструмент для исправления ошибок на GitHub (исправление ошибок в разделе issues и генерации новых функций в проект).

• Tkinter Designer — инструмент, который автоматически конвертирует дизайны Figma в код Tkinter GUI.

• OmniFusion 1.1. - гибридная LLM для работы с картинками

• VoiceCraft: Zero-Shot - мощный редактор речи и преобразователь Text2Speech

📚 Бесплатные книги недели:

▪Учебник, где собрана коллекция задачек о нейросетях, параллельно даётся необходимая теория с объяснением

Читать

The-Founder-1 20 апр в 06:35

NumPy для самых маленьких

Простой

7 мин

13K

Python*Машинное обучение*Искусственный интеллект

Обзор

Математика везде в нашей жизни, но в программировании, а особенно ML ее два раза больше. Обычно Питон берут в пример самого "научного" языка программирования из-за математических фреймворков. Как не Питон может помочь оперировать математическими абстракциями, некоторые из сферы ресерча пользуются исключительно питоном для всяких научных изысканий — сегодня мы поговорим про библиотеку NumPy и работу с массивами.

Самая новичковая "библиотека" с примочками в виде SciPy и Matplotlib предназначена для работы с многомерными массивами. NumPy – основа для многих других библиотек для машинного обучения, таких как SciPy, Pandas, Scikit-learn и TensorFlow.

Pandas, например, строится поверх NumPy и позволяет работать со структурами данных высокого уровня по типу DataFrame и Series. При помощи NumPy можно проводить преобразование категориальных данных в числовой формат, например, с использованием кодирования one-hot.

+15

badcasedaily1 19 апр в 21:05

Пять лучших NLP инструментов для работы с русским языком на Python

Простой

5 мин

5.5K

Блог компании OTUSПрограммирование*Машинное обучение*Natural Language Processing*

Обзор

В этой статье рассмотрим пять лучших библиотек Python, предназначенных специально для работы с русским языком в контексте NLP. От базовых задач, таких как токенизация и морфологический анализ, до сложных задач обработки и понимания естественного языка.

murat_apishev 19 апр в 16:57

Как учить большие языковые модели (теоретический туториал)

Средний

1 мин

4.5K

Машинное обучение*Искусственный интеллектNatural Language Processing*

Туториал

Обзорное видео с доклада об особенностях обучения LLM для тех, кто в теме ML/DL, но хочет расширить кругозор в области работы с большими языковыми моделями. На основе личного опыта и обзора множества научных статей и инструментов. Ссылка на презентацию прилагается.

Смотреть

Extremesarova 19 апр в 16:41

Материалы для подготовки к собеседованию на позицию Data Scientist. Часть 3: Специализированное машинное обучение

Средний

22 мин

Блог компании МегаФонBig Data*Машинное обучение*Учебный процесс в ITКарьера в IT-индустрии

Роадмэп

Привет! Меня зовут Артем. Я работаю Data Scientist'ом в компании МегаФон (платформа для безопасной монетизации данных OneFactor).

В предыдущей статье я поделился материалами для подготовки к этапу по классическому машинному обучению.

В этой статье рассмотрим материалы, которые можно использовать для подготовки к секции по специализированному машинному обучению.

dt_sicutglacies 19 апр в 12:21

Как общаться с базой знаний на естественном языке с помощью LLM и объективно оценить работу полученной системы

Простой

11 мин

3.1K

Блог компании DoubletappМашинное обучение*Искусственный интеллектNatural Language Processing*

Туториал

Привет, Хабр! Меня зовут Даниил, работаю в ML-отделе Doubletapp. В статье расскажу про особенности применения больших языковых моделей для оптимизации бизнес-процессов.

Большая языковая модель (LLM) — это тип языковой модели, который способен распознавать и генерировать осмысленные тексты, а также другие сложные типы данных (например, код). Такого рода модели обучаются на огромных массивах данных, чаще всего собранных из открытых источников.

Тем не менее LLM все еще имеют ряд проблем, одной из которых является галлюцинирование (придумывание фактов). Сложно винить модель за то, что она не знает, как устроен тот или иной процесс/продукт в вашей компании, и пытается придумать вразумительный ответ. Поэтому нужно подсказать LLM фактическую информацию, а она уже даст нам понятную человеку персонализированную реплику.

Такая система ответов на вопросы с использованием фактической информации называется RAG (Retrieval Augmented Generation).

Данная статья состоит из двух частей:

• мы рассмотрим построение RAG-системы на основе библиотеки langchain;

• объективно оценим работоспособность созданной системы, используя синтетические данные на русском языке с помощью фреймворка RAGAs.

ipasechnik 19 апр в 12:08

Генеративные 3D-модели

Средний

15 мин

7.6K

Блог компании SberDevicesРабота с 3D-графикой*Машинное обучение*Искусственный интеллект

Обзор

Салют, Хабр! На связи Игорь Пасечник — технический лид направления XR RnD SberDevices. Сегодня я хочу рассказать про одно из наших направлений исследований — разработку генеративных моделей для 3D-контента.

Современные методы генерации 2D-контента, такие, как 2D-диффузионные модели (Kandinsky 3.0, SDXL), уже достигли впечатляющих результатов и несколько лет являются неотъемлемой частью современности, генеративные видео модели также активно развиваются. Кульминацией развития таких подходов, вероятно, станет представленная не так давно модель Sora. Тем не менее большинство из этих моделей до сих пор испытывают проблемы при генерации консистентных 3D-сцен и объектов.

С другой стороны стороны, существует конвенциональная 3D-графика, а также огромная индустрия и множество прикладных областей, включая игры, XR, дизайн, архитектуру, маркетинг, 3D-проектирование, где используются пайплайны на основе 3D-графики и производится контент на их основе. Методы создания 3D-моделей, такие, как ручное моделирование, 3D-сканирование и фотограмметрия, могут быть трудоёмкими, дорогостоящими и требующими специальных навыков. 3D-продакшн в общем виде использует множество инструментов для создания и рендеринга тяжелой фотореалистичной графики, адаптация генеративных 3D-пайплайнов под такие подходы достаточно тяжела из-за множества инструментов, которые такие пайплайны должны поддерживать. Также адаптация больших латентных генеративных 2D-моделей вроде SORA для прикладных задач фотореалистичной графики может стать альтернативой классическми пайплайнам на основе физического моделирования. Тем не менее, на текущий момент пайплайны работы с графикой, использующие базовый набор примитивов, включая меши, PBR-текстуры, простые модели освещения, закрывают множество прикладных задач и также могут быть востребованы у массового пользователя в случае их демократизации.

+42

aldrchist 19 апр в 11:01

Как мы тестируем беспилотные автомобили с помощью симуляций

Простой

12 мин

2.4K

Блог компании ЯндексБлог компании Конференции Олега Бунина (Онтико)Машинное обучение*Искусственный интеллектТранспорт

Всем привет! Это Александр Чистяков из команды беспилотных автомобилей Яндекса. Мой доклад посвящён симуляторам: что это, зачем, как это устроено изнутри и какие в симуляции есть подводные камни, неожиданные парадоксы. Также расскажу, с помощью каких алгоритмических или архитектурных решений мы со всеми этими парадоксами боремся.

+22

Sentient85 19 апр в 11:01

Фича стор, CLTV и как построить много моделей в короткий срок

Средний

10 мин

917

Блог компании Альфа-БанкМашинное обучение*Финансы в ITData Engineering*

Кейс

Условия задачи: дано число клиентов банка N, число банковских продуктов М, горизонт времени прогноза Т. Нужно посчитать ( Pij ).

Привет, меня зовут Игорь Дойников, в Альфе я CDS — Chief Data Scientist в Розничном Бизнесе. Моя команда строит модели машинного обучения для розничного бизнеса Альфа-Банка. В статье я расскажу как, собственно, эту задачу решать и зачем. Сначала пройдёмся по CLTV, как бизнес постановки задачи мы перешли к задаче машинного обучения, какие при этом возникали проблемы и как мы их решали. А главное — что такое Feature Store и как этот инструмент помогает нам решать задачи СLTV.

+10

2 3 ...

324 325

Машинное обучение *

Размер имеет значение. Как Ozon автоматизировал измерение товаров на складах

Новости

Разбираемся в ROC и AUC

Не можешь остановить восстание роботов — возглавь его. Где учиться робототехнике в России узнали на ROS Meetup 2024

ML-технологии, которые уже сейчас оказывают мощное влияние на бизнес

На какие AI Coding Assistants стоит обратить внимание в 2024?

Кто держит руку на нашем пульсе: о настоящем и перспективах здравоохранения

Языковой процессор LPU, GenAI в FinOps и инструменты для анализа данных

«Строка бога» и «лакмусовая бумажка» для ИИ-генераторов изображений

KPConv на русском: Свертки для point cloud

Использование нейросетей в SEO: большой обзор инструментов

Выбираем правильный инференс: Как мы сэкономили 70к $ на ЛЛМках

Дайджест полезных находок, инструментов, статей и видео из мира машинного обучения за неделю

NumPy для самых маленьких

Ближайшие события

Пять лучших NLP инструментов для работы с русским языком на Python

Как учить большие языковые модели (теоретический туториал)

Материалы для подготовки к собеседованию на позицию Data Scientist. Часть 3: Специализированное машинное обучение

Как общаться с базой знаний на естественном языке с помощью LLM и объективно оценить работу полученной системы

Генеративные 3D-модели

Как мы тестируем беспилотные автомобили с помощью симуляций

Фича стор, CLTV и как построить много моделей в короткий срок

Вклад авторов

Работа