Комментарии 9
А не проще ли узнать номер офисного помещения и просто позвонить по телефону? Аукнуть под дверью? Постучаться? Или посмотреть по внутренним камерам? 7 лет назад материал статьи написан - неужели у вас материалы с тех пор не поменялись?
Статья написана 1 января 2023 года. В оригинале указано, что время чтения — 7 минут, возможно, вы перепутали эту 7 со сроком написания статьи. Когда речь идёт об уже прошедших годах, Medium указывает год рядом с месяцем и днём.
Возможно, прогнозирование такого рода используется для целей статистики. Когда обзванивать или смотреть камерами каждый офис просто неудобно, проще прикинуть цифру моделью.
И ещё нашлось отслеживание занятости переговорных комнат для оптимизации использования помещений: https://support.google.com/a/answer/9025587?hl=ru. Представьте, что вы разрабатываете информационную панель для задачи такого рода. Конечно, теоретически, можно поставить фотоэлементы во всех помещениях, считать открытие и закрытие двери, но это может подойти не всегда. Здесь пойдут в ход самые разнообразные данные, только бы они были доступны.
Извините, я еще и автор medium.com немного. Туда попала выдержка из исследования сделанного 7 лет назад. Ранее мне это исследование было известно на английском языке, года 4 я его рассказывал в средней школе как пример простого применения ИИ.
В реальности - наличие такого количества датчиков уже давным-давно компенсировано встроенным в потолки видеонаблюдением. Мой товарищ заказывал такую систему, проще поставить камеру в каждую комнату с CV на движение, чем калибровать режимы камер раз в месяц, учитывать режим отопления по году, или неправильно сработавшие сигнализации. Это - условия России.
Я - практик, преподаватель, но с большим сдвигом к постоянному применению знаний. За перевод с medium.com - спасибо, но оригинал исследования на английском заметно более информативен.
Статья ведь не совсем о полезности набора данных или модели. Она пример того, как включать в модель знания предметной области.
Но, ведь суть данной модели - предсказывать. Если, например, у нас есть способы узнать температуру, влажность и прочее в будущем (тоже какие-то модели), то камерами с сивишкой тут ничего не сделать, а вот модель - в самый раз.
Однако, у меня другой вопрос (к автору). А какой вообще смысл делать "человеческие правила". Ведь модель машинного обучения и нужна, чтобы строить гипотезу самостоятельно, причем с поиском закономерностей таких, о которых человек никогда не подумает. А с вводом таким правил мы сразу ограничиваем модель, и таким образом суть машинного обучения, что модель сама ищет зависимости - пропадает. Вот никак не пойму смысла этого.
Где данные модели на основе правил могут пригодиться, для каких реальных задач? Есть ли у вас примеры из практики?!
Спасибо за статью, есть над чем подумать, в частности над методологией. По сути это разновидность бэгинга. Вопрос: можно ли представленный вами способ поиска порога заменить на поиск через ROC-анализ? Комментарий: независимо от метода, порог не будет являться стабильной величиной. Можно высчитать порог, который идеально будет делить данные, но в реальности он будет иметь интервал неопределенности (это можно показать через бутстрэп), что приведет к невозможности его использования. Если порог зафиксировать, метрики модели (чувствительность, специфичность..) будут тоже меняться от выборки к выборке. Возможно порог, как правило для принятия решения следует находить не через статистику (потому что ML делает практически тоже самое), а через эмпирический подход и знания предметной области, если это возможно.
Честно говоря, я совсем не понял зачем тут попытались переизобрести деревья решений.
Ладно если бы действительно привнести знания из предметной области, введя несколько правил вручную. Но вот подбор пороговых значений по признакам с помощью GridSearch, чтобы максимизировать метрики... Это и есть то, как работают деревья решений (в сильно приближенном виде)!
Качество предсказания довольно хорошее. Однако неизвестно, как модель делает эти прогнозы. [речь про RandomForestClassifier]
RandomForest не более чем ансамбль деревьев решений, которые и были созданы, чтобы быть интерпретируемыми. Т.е. решения ансамбля можно попытаться объяснить, если сильно захочется, немного поколдовав.
Я уж молчу про SHAP, LIME и др. Если сильно хочется, можно и black-box модель проинтерпретировать.
В итоге, что мы имеем: автор не имеет достаточного кругозора, чтобы подобрать правильный инструмент решения проблемы и изобретает велосипеды. Браво!
Оригинальному видео влепил дизлайк.
SkillFactory, как вы вообще отбираете статьи для перевода?
Как включить в модель знания предметной области