skillfactory_school 9 янв 2023 в 19:41

Как включить в модель знания предметной области

6 мин

6.3K

Блог компании SkillfactoryPython * Искусственный интеллектМашинное обучение * Программирование *

Туториал

Перевод

Комментарии 9

OBIEESupport 9 янв 2023 в 21:38

А не проще ли узнать номер офисного помещения и просто позвонить по телефону? Аукнуть под дверью? Постучаться? Или посмотреть по внутренним камерам? 7 лет назад материал статьи написан - неужели у вас материалы с тех пор не поменялись?

stranger777 9 янв 2023 в 22:22

Статья написана 1 января 2023 года. В оригинале указано, что время чтения — 7 минут, возможно, вы перепутали эту 7 со сроком написания статьи. Когда речь идёт об уже прошедших годах, Medium указывает год рядом с месяцем и днём.

Возможно, прогнозирование такого рода используется для целей статистики. Когда обзванивать или смотреть камерами каждый офис просто неудобно, проще прикинуть цифру моделью.

И ещё нашлось отслеживание занятости переговорных комнат для оптимизации использования помещений: https://support.google.com/a/answer/9025587?hl=ru. Представьте, что вы разрабатываете информационную панель для задачи такого рода. Конечно, теоретически, можно поставить фотоэлементы во всех помещениях, считать открытие и закрытие двери, но это может подойти не всегда. Здесь пойдут в ход самые разнообразные данные, только бы они были доступны.

OBIEESupport 9 янв 2023 в 22:51

Извините, я еще и автор medium.com немного. Туда попала выдержка из исследования сделанного 7 лет назад. Ранее мне это исследование было известно на английском языке, года 4 я его рассказывал в средней школе как пример простого применения ИИ.

В реальности - наличие такого количества датчиков уже давным-давно компенсировано встроенным в потолки видеонаблюдением. Мой товарищ заказывал такую систему, проще поставить камеру в каждую комнату с CV на движение, чем калибровать режимы камер раз в месяц, учитывать режим отопления по году, или неправильно сработавшие сигнализации. Это - условия России.

Я - практик, преподаватель, но с большим сдвигом к постоянному применению знаний. За перевод с medium.com - спасибо, но оригинал исследования на английском заметно более информативен.

stranger777 10 янв 2023 в 10:25

Статья ведь не совсем о полезности набора данных или модели. Она пример того, как включать в модель знания предметной области.

AnonimYYYs 15 янв 2023 в 05:48

Но, ведь суть данной модели - предсказывать. Если, например, у нас есть способы узнать температуру, влажность и прочее в будущем (тоже какие-то модели), то камерами с сивишкой тут ничего не сделать, а вот модель - в самый раз.

Однако, у меня другой вопрос (к автору). А какой вообще смысл делать "человеческие правила". Ведь модель машинного обучения и нужна, чтобы строить гипотезу самостоятельно, причем с поиском закономерностей таких, о которых человек никогда не подумает. А с вводом таким правил мы сразу ограничиваем модель, и таким образом суть машинного обучения, что модель сама ищет зависимости - пропадает. Вот никак не пойму смысла этого.

Kotovoz 9 янв 2023 в 22:22

Где данные модели на основе правил могут пригодиться, для каких реальных задач? Есть ли у вас примеры из практики?!

stranger777 9 янв 2023 в 22:24

Хороший вопрос. При возможности обязательно уточню.

KirovDoc 10 янв 2023 в 17:13

Спасибо за статью, есть над чем подумать, в частности над методологией. По сути это разновидность бэгинга. Вопрос: можно ли представленный вами способ поиска порога заменить на поиск через ROC-анализ? Комментарий: независимо от метода, порог не будет являться стабильной величиной. Можно высчитать порог, который идеально будет делить данные, но в реальности он будет иметь интервал неопределенности (это можно показать через бутстрэп), что приведет к невозможности его использования. Если порог зафиксировать, метрики модели (чувствительность, специфичность..) будут тоже меняться от выборки к выборке. Возможно порог, как правило для принятия решения следует находить не через статистику (потому что ML делает практически тоже самое), а через эмпирический подход и знания предметной области, если это возможно.

deadmoroz14 14 янв 2023 в 16:25

Честно говоря, я совсем не понял зачем тут попытались переизобрести деревья решений.

Ладно если бы действительно привнести знания из предметной области, введя несколько правил вручную. Но вот подбор пороговых значений по признакам с помощью GridSearch, чтобы максимизировать метрики... Это и есть то, как работают деревья решений (в сильно приближенном виде)!

Качество предсказания довольно хорошее. Однако неизвестно, как модель делает эти прогнозы. [речь про RandomForestClassifier]

RandomForest не более чем ансамбль деревьев решений, которые и были созданы, чтобы быть интерпретируемыми. Т.е. решения ансамбля можно попытаться объяснить, если сильно захочется, немного поколдовав.

Я уж молчу про SHAP, LIME и др. Если сильно хочется, можно и black-box модель проинтерпретировать.

В итоге, что мы имеем: автор не имеет достаточного кругозора, чтобы подобрать правильный инструмент решения проблемы и изобретает велосипеды. Браво!

Оригинальному видео влепил дизлайк.

SkillFactory, как вы вообще отбираете статьи для перевода?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий