Вы скажите конкретно, о чем мы спорим. А то я что-то нить потерял. Речь о том, что вы не видите применения спутникам Даурии? О пожарах ничего не повторял вроде как… просто написал, что думаю. Ход мыслей был таков. Разрешение — 22m. Средний пожар гораздо больше этих размеров. Зеленого, красного, инфракрасного должно хватить. По крайней мере, если я могу различить пожар «визуально» на картинке, то с большой вероятностью я смогу натренировать детектор.
На счет алгоритмов и ваших ссылок. Я читал довольно много литературы по алгоритмам, основанных на данных LANDSAT 7-8. Ощущение такое, что авторы, возможно неплохие физики, ничего не понимают ни в статистике, ни в более современном машинном обучении. Могу привести конкретный пример. Мне дали задачку детектить облака и тени от облаков. Все что я прочел сводилось к тому, чтоб взять один продукт, вычесть другой, нормализовать и отфильтровать по какому-то магическому значению. Я не нашел ни одного документа, который бы использовал что-то вроде классификаторов или алгоритмов кластеризации. Я сделал неплохой классификатор, который работает лучше чем описанные алгоритмы. У меня нет корпуса для сравнения, по этому конкретными цифрами похвастаться не могу. Но могу скинуть картинки и маски. Я это к тому, что ваши ссылки не являются для меня большим авторитетом.
Что собственно до темы спора (как я его понял) — у меня два коллеги, кстати бывшие насовцы, работают над мониторингом определенных культур, в основном используют NDVI. Говорят, что частота LANDSAT недостаточная для их задачи прогнозирования. Тем более когда на фотках густая облачность (ждать еще 16 дней, или переключаться на 7-й). Видимо, я скоро к ним подключусь, тогда сможем поговорить более детально.
Ага, у них дорогие. Мы у них напрямую берем, босс договорился.
Вообще у меня получилось работать на всех трех. Но из skybox'a очень тяжело вытягивать небольшие объекты, качество заметно ниже.
А никто не пробовал делать через машинное обучение? Я когда-то заставил нейросеть хорошо выравнивать последовательности по типу алгоритма Дамерау-Левеншейна. Правда, использовал для спелчекера. Но здесь нечто похожее.
Татьяна, а без статичных грамматик пробовали? По себе знаю, что составление таких правил — то еще удовольствие. Сейчас ведь появились уже всякие вкусные вещи типа рекуррентных сверточных сетей, с которыми можно автоматически строить грамматики (т.е. деревья разбора).
Да не пытаюсь я представить реальный бесконечный отель. Я просто пытаюсь понять, зачем нужно приводить эту аналогию. Когда-то давно мне ее уже приводили. Ничего не понял, начал спрашивать. Не ответили внятно… Так зачем эта аналогия? Просто потому что ее привел Гильберт? Или я туплю… не знаю.
Ладно, если это кому-то помогает, вопросы снимаю. На счет принципа дирихле — странная формулировка. Обычно говорится что невозможно построить инъекцию во множество меньшей мощности. Ну да ладно, аргумент я понял.
Серьезно, для кого-то это может показаться логичным объяснением. Для меня не работает. Ну совсем неинтуитивно. Может, честнее ввести аксиомы и дать несколько примеров, чтобы показать что это действительно удобно и работает?
В чем разница между параллельной рассылкой и последовательным вытеснением? Почему в одном случае работает, в другом нет, ведь по сути тож самое. Далее могу спросить, что такое бесконечность, как мы ее определяем. Можем ли мы послать сообщение одновременно всем жильцам и т.п.
Другими словами, я могу вас попросить обосновать — почему такой сдвиг возможен?
В по моим «интуитивным» аксиомам, он не возможен, так как если бы мы захотели сдвинуть — мы уперлись бы в занятый номер. Продолжая дальше, мы бы так и не смогли отыскать свободный — двигаясь бесконечно в сторону увеличения номера комнаты.
Я не к тому, что Гильберт был неправ :), а к тому, что такие интуитивные примеры опасны. Интуиция у всех по разному работает.
В машинном обучении другая терминология. Имеется ввиду mean accuracy — т.е. общее правильно распознанных элементов, деленное на общее количество тестовых примеров. Вы правы — для несбалансированных классов это плохая метрика. Но в статье указывается AUC score — стандартный способ оценки классификаторов, и он довольно высок.
Да, тусовка там хорошая. Фаундеры на слуху, но у них и правда ничего серъезного в публикациях нет. Но за кадром много интересного. Возможно, гугл их купил посто чтоб их не купил фейсбук. На тот же nips Цукерберг приезжал, объявил что создает ML департамент у себя, и главным по науке будет LeCun.
На счет алгоритмов и ваших ссылок. Я читал довольно много литературы по алгоритмам, основанных на данных LANDSAT 7-8. Ощущение такое, что авторы, возможно неплохие физики, ничего не понимают ни в статистике, ни в более современном машинном обучении. Могу привести конкретный пример. Мне дали задачку детектить облака и тени от облаков. Все что я прочел сводилось к тому, чтоб взять один продукт, вычесть другой, нормализовать и отфильтровать по какому-то магическому значению. Я не нашел ни одного документа, который бы использовал что-то вроде классификаторов или алгоритмов кластеризации. Я сделал неплохой классификатор, который работает лучше чем описанные алгоритмы. У меня нет корпуса для сравнения, по этому конкретными цифрами похвастаться не могу. Но могу скинуть картинки и маски. Я это к тому, что ваши ссылки не являются для меня большим авторитетом.
Что собственно до темы спора (как я его понял) — у меня два коллеги, кстати бывшие насовцы, работают над мониторингом определенных культур, в основном используют NDVI. Говорят, что частота LANDSAT недостаточная для их задачи прогнозирования. Тем более когда на фотках густая облачность (ждать еще 16 дней, или переключаться на 7-й). Видимо, я скоро к ним подключусь, тогда сможем поговорить более детально.
Для моих задач и LANDSAT не подходит.
Вообще у меня получилось работать на всех трех. Но из skybox'a очень тяжело вытягивать небольшие объекты, качество заметно ниже.
Когда вы ожидаете получить первые снимки?
— skybox
— digitalglobe
— astrium
Но у всех есть свои недостатки. Мне нужно для подсчета небольших объектов на снимке. К примеру, машин.
Вы это расскажите тем, кто болезни диагностирует :).
Ладно, если это кому-то помогает, вопросы снимаю. На счет принципа дирихле — странная формулировка. Обычно говорится что невозможно построить инъекцию во множество меньшей мощности. Ну да ладно, аргумент я понял.
зы ушел читать ZFC
Серьезно, для кого-то это может показаться логичным объяснением. Для меня не работает. Ну совсем неинтуитивно. Может, честнее ввести аксиомы и дать несколько примеров, чтобы показать что это действительно удобно и работает?
В чем разница между параллельной рассылкой и последовательным вытеснением? Почему в одном случае работает, в другом нет, ведь по сути тож самое. Далее могу спросить, что такое бесконечность, как мы ее определяем. Можем ли мы послать сообщение одновременно всем жильцам и т.п.
В по моим «интуитивным» аксиомам, он не возможен, так как если бы мы захотели сдвинуть — мы уперлись бы в занятый номер. Продолжая дальше, мы бы так и не смогли отыскать свободный — двигаясь бесконечно в сторону увеличения номера комнаты.
Я не к тому, что Гильберт был неправ :), а к тому, что такие интуитивные примеры опасны. Интуиция у всех по разному работает.
Такое ощущение, что вы пытаетесь дать правильное определение через неуместные примеры, какой-то читинг.