Как стать автором
Обновить

Как мы подружили ML и биореакторы

Время на прочтение 12 мин
Количество просмотров 2.2K
Блог компании BIOCAD Машинное обучение *
🤖 Сезон machine learning

Привет, Хабр! Мы Data Science команда биотехнологической компании BIOCAD. Хотим рассказать вам о том, как мы применяем машинное обучение при производстве лекарственных средств и с какими задачами сталкиваемся для оптимизации технологического процесса культивирования белка.

Читать далее
Всего голосов 16: ↑16 и ↓0 +16
Комментарии 3

NORUAS — домашний Саурон, но это не точно…

Время на прочтение 11 мин
Количество просмотров 2.9K
Python *Машинное обучение *Программирование микроконтроллеров *Умный дом DIY или Сделай сам
Туториал
🤖 Сезон machine learning

Являясь постоянным посетителем Хабра довольно долгий период времени, стал свидетелем того, как многие сегодня уже обыденные технологии были предметом острого внимания на ресурсе в период их появления.

Еще совсем недавно 3D-печать будоражила умы читателей, завораживала своей перспективностью, открывала широкие возможности для творчества, но была недоступна для простого обывателя. Сейчас 3D-принтер можно легко приобрести на китайском рынке по приемлемой цене. Технология 3D-печати не прекратила своего развития. Меняются способы печати, появляются более скоростные модели принтеров. Но сама технология стала привычным для нас явлением.

Немного позднее грянула эпоха IoT и ресурс запестрел статьями про интернет вещей. Автоматизация быта человека привела к появлению множества умных устройств, а их интеграция в единую систему приблизила нас к будущему еще на один шаг, породив концепцию умного дома. Своевременное появление линейки микроконтроллеров от фирмы Espressif Systems с поддержкой Wi-Fi также способствовало бурному развитию IoT. Сегодня любой желающий может купить умное устройство в магазине или собрать его самостоятельно, ознакомившись с инструкциями из интернета.

В последнее время очень популярна тема машинного обучения. Темпы её развития настолько стремительны, что мы не успеваем отследить этапы её развития. Ещё вчера мы умилялись общению с голосовым помощником, а сегодня ставим задачи генерации изображений высокого качества или просим сгенерировать программный код на основе краткого технического задания. Мы уже привыкли что бытовая техника понимает голосовые команды, камеры и телефоны автоматически распознают лица и накладывают нужные нам фильтры, социальные сети или информационные порталы выдают точные и нужные нам рекомендации. И за все этим стоит работа армии незаменимых помощников - моделей машинного обучения, на обучение которых было потрачено и ещё будет потрачено огромное количество человеко-часов, аппаратных ресурсов и терабайт данных. И все эти технологические достижения в совокупности дают нам отличную возможность не только быть их потребителями, а созидать и творить, реализовывать свои самые смелые идеи.

Читать далее
Всего голосов 8: ↑8 и ↓0 +8
Комментарии 9

Как я учился сочинять музыку с помощью программы ScoreCloud SongWriter

Уровень сложности Средний
Время на прочтение 8 мин
Количество просмотров 1.6K
Data Mining *Машинное обучение *Облачные сервисы *Искусственный интеллект DIY или Сделай сам
Обзор

Приложение ScoreCloud Songwriter компании DoReMir Misic Reserch AB (Швеция) предназначено как для профессиональных, так и для начинающих музыкантов, создающих и реализующих музыкальные партии или отдельные песни внутри этого продукта.

Компания DoReMir выбрала модель облачного распознавания нот и применение искусственного интеллекта для создания нескольких распознанных потоков. Распределенное музыкальное хранилище находится внутри облака AWS.

Это означает, что любая ваша музыкальная партия будет сначала локально сохранена в формате ogg или mp3, потом загружена на AWS.

После загрузки в облако к вашему музыкальному файлу будут применены следующие алгоритмы: разбиение его на отдельные музыкальные токены, применение к отдельным музыкальным токенам методики по определению тональности, определению музыкального размера и определению ведущих мелодию голосов и аккомпанирующих инструментов.

Обзор, распознавание, анализ - поехали!
Всего голосов 5: ↑4 и ↓1 +3
Комментарии 2

Все, что вы хотели знать о задаче определения остаточного ресурса оборудования

Уровень сложности Средний
Время на прочтение 10 мин
Количество просмотров 3.8K
Python *Анализ и проектирование систем *Машинное обучение *Искусственный интеллект
Обзор
🤖 Сезон machine learning

Применение искусственного интеллекта и машинного обучения в задачах промышленности не настолько распространено, как в других сферах и отраслях экономики вроде банкинга, ритейла, телекома. При этом современные промышленные объекты часто генерируют и собирают большое количество данных, а методы машинного обучения обеспечивают эффективное использование этих данных для решения различных устоявшихся типовых задач: выявления неисправностей и отказов, прогноз качества продукции, определения остаточного срока службы оборудования и многих других.

Как раз про решение одной из типовых задач - задачи определения остаточного ресурса я и рассказывал на конференции https://datastart.ru в ноябре 2022 года, а также на митапе ИИшницы “ИИ в индустрии”, откуда даже сохранилось видео. В этом посте я соберу, структурирую и немного дополню информацию из докладов.

Читать далее
Всего голосов 11: ↑11 и ↓0 +11
Комментарии 17

Отгадай слово: как мы создали игру с элементами машинного обучения и вышли в ноль за 2 месяца

Уровень сложности Средний
Время на прочтение 12 мин
Количество просмотров 7.1K
Блог компании AI Talent Hub Python *Разработка игр *Машинное обучение *Искусственный интеллект
Кейс
🤖 Сезон machine learning

Как думает искусственный интеллект? Попробовать разобраться в его логике можно в игре от менторов AI Talent Hub, онлайн-магистратуры Napoleon IT и ИТМО, и студентов ИТМО «Отгадай слово». За два месяца в нее сыграли уже более 107 тысяч уникальных пользователей, а количество подписчиков одноименного телеграм-канала увеличилось до 5 000.
Что делает игру такой популярной, как проект окупился без затрат на продвижение и рекламы на сайте, а также почему при работе с ИИ не избежать ошибок? Рассказываем в статье. 

Читать далее
Всего голосов 33: ↑33 и ↓0 +33
Комментарии 23

Обработка естественного языка (NLP). Личный опыт — мой первый запуск BERT

Время на прочтение 4 мин
Количество просмотров 2.5K
Python *Программирование *Машинное обучение *Искусственный интеллект Natural Language Processing *
🤖 Сезон machine learning

BERT — Bidirectional Encoder Representations from Transformers

Здесь не будет рассказываться о том, что такое BERT, как это работает и для чего применяется — в сети об этом достаточно информации.

Это статья про личный опыт — как конкретно у меня получилось запустить BERT с чистого Colab по конкретным описаниям.

Читать далее
Всего голосов 5: ↑4 и ↓1 +3
Комментарии 5

10 первых ошибок в карьере ML-инженера

Уровень сложности Простой
Время на прочтение 13 мин
Количество просмотров 17K
Python *Машинное обучение *Учебный процесс в IT Карьера в IT-индустрии
🤖 Сезон machine learning

Работа ML-инженера заключается не только в обучении моделей — хороший специалист погружается в бизнес-контекст, умеет доносить мысли до коллег без ML-бэкграунда, а также не забывает про тесты, дизайн-документы и документацию. 

Богдан Печёнкин, автор Симулятора ML, собрал 10 ошибок специалистов, которые зачастую встречаются в первые годы карьеры.

Узнать больше
Всего голосов 39: ↑39 и ↓0 +39
Комментарии 23

В этой одежде системы распознавания будут считать вас животным

Время на прочтение 4 мин
Количество просмотров 44K
Алгоритмы *Машинное обучение *Дизайн Искусственный интеллект
Кейс
У Рэйчел Дидеро интересный набор навыков: несколько степеней в области дизайна одежды (полученные в школах трех разных стран) и докторская степень в области машинного обучения Миланского политехнического университета.

Эти знания позволили ей выпустить коллекцию — довольно уродливой — одежды Manifesto. Она страшная и безвкусная, зато в ней вы становитесь нераспознаваемые для ML-алгоритма детектирования Yolo, активно используемого для работы с уличными камерами.



Поскольку, в виде одного из хобби, я занимаюсь проблемами распознавания объектов, мне было интересно не только описать сам подход к алгоритму и его возможному обману, так и то, что наше будущее, очевидно, будет не таким, как мы представляем. И это интересно исследовать.

Читать дальше →
Всего голосов 78: ↑76 и ↓2 +74
Комментарии 254

Ищем ответ на главный вопрос Вселенной, жизни и всего такого в новом сезоне ML на Хабре

Время на прочтение 17 мин
Количество просмотров 21K
Блог компании ВТБ Habr Машинное обучение *
🤖 Сезон machine learning
Спецпроект

Меня зовут Андрей Аврамчук, я старший продюсер спецпроектов в Хабре, принёс не ответ на главный вопрос, а пока только новый сезон на Хабре — «Машинное обучение», который мы проводим совместно с ВТБ с 1 по 31 марта. Будем искать вместе, и да поможет нам магия ML.

UPD. Сезон закончился, итоги можно посмотреть в этой статье.

Артур Филип Дент?
Всего голосов 32: ↑31 и ↓1 +30
Комментарии 11

Разработка кросплатформенного приложения на Qt с использованием нейросетей, обученных на tensorflow

Уровень сложности Сложный
Время на прочтение 13 мин
Количество просмотров 6.7K
C++ *Qt *Машинное обучение *Искусственный интеллект TensorFlow *
Туториал
Из песочницы
🤖 Сезон machine learning

Разработка кросплатформенного приложения на Qt с использованием нейросетей обученных на tensorflow.

Читать далее
Всего голосов 20: ↑17 и ↓3 +14
Комментарии 15

Как решать реальные задачи при помощи ChatGPT

Уровень сложности Средний
Время на прочтение 5 мин
Количество просмотров 12K
Блог компании Friflex Машинное обучение *
Туториал
🤖 Сезон machine learning

Всем привет! На связи Андрей Нестеров, я занимаюсь компьютерным зрением в  применении к мобильным приложениям в компании Friflex
Мы создаем мобильные приложения по оцифровке спорта, которые позволяют распознавать спортивные события и анализировать их. 
В этой статье я приведу простейший пример использования ChatGPT в машинном обучении, предложу несколько способов, которые помогут обращаться к ChatGPT для решения реальных задач, а также подчеркну моменты, в которых она совершенно неприменима.

Читать далее
Всего голосов 16: ↑11 и ↓5 +6
Комментарии 5

Как спрогнозировать спрос на самокаты и не захламить город, версия Whoosh

Уровень сложности Простой
Время на прочтение 11 мин
Количество просмотров 4.2K
Блог компании Whoosh Big Data *Машинное обучение *
Кейс
🤖 Сезон machine learning

Нельзя просто так взять и расставить электросамокаты в городе. Надо, чтобы они находились в нужное время, в нужном месте и в нужном количестве, чтобы выполнять свою транспортную задачу. Спрос на поездки в разных локациях неодинаковый, поэтому если поставить самокаты ровным слоем на улицах города — будет неэффективно. Нельзя также расставить их только в местах сильного пользовательского притяжения, забыв при этом про периферию.

Нужен хоббит алгоритм, который бы рассчитал, какое количество поездок можно ожидать на определенной парковке в определенный временной промежуток.

Меня зовут Никита Зеленский, я руковожу отделом по работе с данными в Whoosh, разработчике технологических решений и операторе микромобильности. Эту статью мы написали вместе с Иваном Маричевым, дата‑сайнтистом Whoosh. Он же и автор алгоритма, о котором пойдет речь.

Здесь мы расскажем, как мы реализовывали модель прогнозирования спроса на самокаты, с чем сталкивались при прототипировании, какие модели были протестированы, чем наш случай отличается от прогнозирования спроса в каршеринге, спроса для пополнения запасов в дарксторе и т. п. (Самокат, самокаты Whoosh передают привет!)

История получилась про наши подходы и грабли, которые мы в итоге собрали. Чуть‑чуть про технику, чуть‑чуть про бизнес — нескучно и с ветерком (как на самокате).

Whoosh!

Читать далее
Всего голосов 12: ↑12 и ↓0 +12
Комментарии 10

ChatGPT: новый инструмент в борьбе с багами. Как можно использовать AI для повышения качества тестирования

Уровень сложности Простой
Время на прочтение 4 мин
Количество просмотров 25K
Поисковые технологии *Тестирование веб-сервисов *Тестирование мобильных приложений *Машинное обучение *Искусственный интеллект
Из песочницы
🤖 Сезон machine learning

Всем привет! Я QA Engineer и недавно открыл для себя ChatGPT и хочу открыть этот мир другим тестировщикам. Эта статья не руководство к применению и каких-то суперлайфхаков здесь не будет. Цель этой статьи в том, чтобы показать огромные возможности нейросетей в помощи нам, тестировщикам, в работе. Надеюсь что кто-то, прочитав это, хоть немного сможет облегчить себе составление тест-кейсов, написание документации или написание автотестов. Примеров с написанием кода здесь по минимуму, так как таких материалов уже много.

Читать далее
Всего голосов 22: ↑20 и ↓2 +18
Комментарии 23

Снова о распознавании рукописного текста, на этот раз с помощью CRNN

Время на прочтение 5 мин
Количество просмотров 2.2K
Машинное обучение *
🤖 Сезон machine learning

Нейронные сети в частности и машинное обучение в целом демонстрируют потрясающие результаты в тех областях науки и техники, в которых от них никто не ожидал этого еще лет 10 назад. Уже на текущий момент модели машинного обучения превзошли человека в задачах классификации, распознавания, предсказания и даже в некоторых играх человек не способен конкурировать c ними…

Задача классификации изображений на датасете ImageNet – ярчайший пример того, что нейросети превзошли человека (внимание: еще в 2016 году).

Давайте посмотрим
Всего голосов 5: ↑5 и ↓0 +5
Комментарии 7

Прости нас, Джон Коннор, или Как мы научили нейросеть точечно распознавать звуки выстрелов

Уровень сложности Средний
Время на прочтение 8 мин
Количество просмотров 2.8K
Блог компании Doubletapp Python *Машинное обучение *Искусственный интеллект Звук
Кейс
🤖 Сезон machine learning

Привет, Хабр! Меня зовут Антон Рябых, работаю в Doubletapp и в этой статье расскажу про технические детали применения машинного обучения в проекте HitFactor. 

Что такое hit factor? На соревнованиях по практической стрельбе спортсмены быстро перемещаются, меняют магазин и стреляют по разным, в том числе и подвижным мишеням. Hit factor — это результат соревнования, то есть количество набранных очков, деленное на время прохождения. 

Нам рассказали об этом чемпионы мира по практической стрельбе Алена Карелина и Роман Халитов, которым нужно было мобильное приложение для помощи в тренировках. Двигаться экономнее, стрелять быстрее — анализ записи тренировки поможет понять, как сократить время на прохождение упражнения и повысить эффективность.

В проекте требовалось очень точно определять время начала выстрела и время стартового сигнала. Каких-то готовых решений на момент разработки продукта (2019 год) не было. В статье расскажу:

как решали задачу без машинного обучения
какие были подходы с машинным обучением;
как размечали данные
как использовали промежуточную модель для помощи с разметкой;
как деплоили конечную модель на iOS-девайсы.

Читать далее
Всего голосов 9: ↑9 и ↓0 +9
Комментарии 12

True RND или что делать с обученной моделью (опыт чайника)

Уровень сложности Средний
Время на прочтение 4 мин
Количество просмотров 3.6K
C# *Машинное обучение *DIY или Сделай сам
Из песочницы
🤖 Сезон machine learning

Когда то давно на просторах интернета читал статью о генерации по настоящему случайного пароля. Суть сводилась к тому что для реализации рандома нужно натурально бросать игральные кости. Отличная идея, для небольшого pet проекта и для того чтобы проникнуть в основы ML.

Попробуем научить компьютер бросать настоящие кости, находить их на изображении с веб камеры и понимать что на них выпало.

Читать далее
Всего голосов 19: ↑19 и ↓0 +19
Комментарии 15

Как мы улучшаем выделение интентов в наших продуктах

Уровень сложности Средний
Время на прочтение 13 мин
Количество просмотров 1.1K
Блог компании Just AI Машинное обучение *Искусственный интеллект Natural Language Processing *
🤖 Сезон machine learning

Привет, Хабр! На связи Мурат Апишев, руководитель направления NLP R&D в Just AI. Одним из ключевых направлений компании является разработка инструментов для создания голосовых и чат-ботов. Задача создания классификатора интентов в таких проектах является краеугольным камнем, и в этой статье я бы хотел поделиться некоторыми апдейтами наших продуктов в этом направлении. Речь пойдет о внедрении моделей классификации и парафраза на основе трансформеров. Приятного чтения!

Читать далее
Всего голосов 7: ↑7 и ↓0 +7
Комментарии 0

HalvingSearch: ускорение поиска по сетке (grid search). Библиотека sklearn

Уровень сложности Средний
Время на прочтение 5 мин
Количество просмотров 2.3K
Машинное обучение *
Из песочницы
🤖 Сезон machine learning

Подбор гиперпараметров модели – одна из самых распространенных задач в data science. Если заранее неизвестно, какими могут быть оптимальные значения, приходится искать по сетке значений. Если у нас есть m гиперпараметров и для каждого задано n возможных значений, то число вариантов равно mn и для каждого нужно обучить модель и определить ее точность. Если мы используем перекрестную проверку (cross-validation), то это число надо умножить на число частей, на которые мы разбиваем набор данных.

Есть ряд алгоритмов оптимизации поиска, например байесовский – «осмысленный» поиск, при котором рассматриваются не все возможные сочетания гиперпараметров.

Относительно недавно sklearn был реализован еще один метод – halving search.

Читать далее
Всего голосов 9: ↑8 и ↓1 +7
Комментарии 4

Первая бесплатная модель перевода с русского на китайский язык и обратно

Время на прочтение 6 мин
Количество просмотров 4.4K
Data Mining *Машинное обучение *Искусственный интеллект Natural Language Processing *Data Engineering *
Кейс
🤖 Сезон machine learning

Представляю вашему вниманию, первую бесплатную offline модель по переводу с русского языка на китайский и обратно.

Ранее, я писал, как можно достаточно легко обучить свою модель по машинному переводу на примере перевода с английского на русский.

В этот раз я решил, реализовать, модель перевода с китайского языка, так как давно хотел и о чем заявлял в комментариях к предыдущей своей статье.

Читать далее
Всего голосов 17: ↑16 и ↓1 +15
Комментарии 2

Учим нейросеть принимать решения на основе уже известного опыта (на примере Шахмат и загруженного датасета)

Время на прочтение 15 мин
Количество просмотров 3.5K
Python *Программирование *Машинное обучение *Искусственный интеллект
🤖 Сезон machine learning

Учим нейросеть играть в Шахматы, загрузив в нее датасеты уже сыгранных партий с известным результатом.

То есть никакого минимакса, деревьев и расчетов на несколько ходов вперед.
Идея в том, что если в нейросеть загрузить много партий, уже сыгранныx другими игроками, то нейросеть будет знать, как поступали другие игроки в соответствующих случаях и к какому результату это приводило. Нейросеть обобщит имеющийся опыт и будет делать ход на основе уже известного опыта и выявленных закономерностей, причем делать ход «мгновенно».

Читать далее
Всего голосов 12: ↑11 и ↓1 +10
Комментарии 13
1