Тоже показалось странным, что хоть статья и выражает опасения по поводу слепого применения центральной предельной теоремы, в ней упускается из виду критический недостаток подхода - попытка подогнать нормальное распределение к любым наборам данных с неотрицательными значениями.
Такое допущение может привести к ошибочным выводам, поскольку реальные данные часто имеют асимметричные и ненормальные распределения.
Очень важно выбирать соответствующие распределения, которые отвечают характеру данных.
Ожидал увидеть хотя бы попытку свести логнормальное распределение к нормальному, или использование сопряженных распределений типа бета-распределения, но увы.
Какая доля парсинга (в % от числа сайтов и % от числа страниц) идет через chromium, а какая - средствами попроще?
Как работаете с сайтами типа ВИ, которые обфусцируют имена классов?
Какой средний сервер у вас и сколько он вывозит потоков chromium?
Понятно, что статья обзорная, но хотелось бы больше технических деталей! На раскрытие фирменных секретов претензии нет, интересны общие цифры и подходы.
По сути, вы сейчас предлагаете следующее: попросить толокеров определять по фото травы - работает ли рядом устройство для полива. Думаю, вы понимаете, почему классификатор, обученный на таких данных, не будет учитывать дождь и «собачку».
Интересный подход с усреднением эмбеддингов токенов «внутри слова».
Насколько часто он оправдан и встречается ли в реальных задачах, могли бы рассказать? Насколько лучше это работает при двупроходном усреднении, сначала по вложениям токенов внутри слова, а потом по вложениям самих слов?
В качестве метрики расстояния между предложениями не смотрели в сторону word movers distance?
Однако смешивая глобальное и локальное значения, мы можем получить лучшее из обоих миров
В корне не согласен с автором оригинальной статьи, так как это, по сути, наложение всё того же, «плохого» эффекта, но с определенной прозрачностью, что не отменяет того, что он имеет ореолы и не перестает быть в основе своей тем самым extreme “HDR photo” style.
Ореолы воспринимаются неестественно по той причине, что человеческая зрительная система и мозг понимают, что какой-то отдельный объект, освещен «как-то не так», неравномерно, то есть задействованы некоторые иерархические свойства сцены, которые в «живом» фото еще необходимо извлечь из картинки, а вот в игровых движках они, как правило, идут «из коробки».
Критикуешь — предлагай!
Чем ближе в «иерархическом дереве» игровой сцены (не знаю, как правильно это называется, могу быть неточен в терминах, за что прошу меня простить) находятся объекты, тем меньше должна быть разница в уровне экспокоррекции между ними, а внутри объектов она должна отсутствовать, т.е. коррекция должна применяться ко всему объекту целиком.
На примере последней фотографии можно выделить три части: небо, здание и трава с деревьями. Каждой части должен быть присвоен свой уровень экспокоррекции и, возможно, коррекции контраста, это избавит ситуацию как от проблемы ореолов, так и от других артефактов.
Недавно решал похожую задачу, а точнее — следование между двумя линиями. Спешу предупредить, с дорожной разметкой она никак не была связана.
Проблемы, аналогичные указанным в статье, решал немного иначе:
Для каждого угла поворота я держал 2 массива, в которых отмечал, есть ли линия слева и, соответственно справа, в допустимой окрестности.
С помощью Байесовского вывода оценивались вероятности направлений взгляда с учетом ошибок первого и второго рода.
Для нового кадра в качестве априорного распределения использовал т.н. намотанное нормальное распределение, причем если в кадре не обнаружилось никаких линий, сигма увеличивалась на собственное базовое значение, это здорово помогало «расширять область поиска» после нескольких кадров, на которых алгоритм ничего не видел.
Как итог, пошаманив с гиперпараметрами, получил очень устойчивое к помехам определение направления движения, которое отказывалось работать только в случае долговременной «слепоты» OpenCV к линиям, чего на практике не встречалось.
Всё-таки облака — чаще всего необходимое, но отнюдь не достаточное условие выпадения осадков, есть много других факторов, таких как температура, в т.ч. на разных высотах, смешение холодных и тёплых воздушных масс, а также много других характеристик, используемых в профессиональной метеорологии, которые используются как в краткосрочных, так и в долгосрочных прогнозах.
Было бы интересно узнать, что из этого набора реально используется / готовится к использованию.
Обещания кандидатами светлого будущего перед выборами нашли второе логическое обоснование.
Под первым я имел ввиду наивность тех людей, которые верят всем предвыборным программам на 100%.
Мобильное устройство — это не обязательно телефон.
Имхо, я бы не отказался от карты памяти для зеркалки, способной при размере RAW-файла современной камеры около 30 МБ принимать до 30 файлов в секунду.
Это полностью покроет не столько потребности, сколько возможности современных камер.
Да и размер для такой задачи более чем хорош.
Не будем забывать, что человеку 61 год, и снимать раз в 5 лет по одной части для него непозволительная роскошь.
Да и актерам, которые тоже стареют, им проще войти в роль при съемке нескольких частей.
Скажите пожалуйста, а какое отношение имеет внешний вид к праву (если уж допустить, что такое право у кого-то может быть) регулировать свободу Интернета?
Какое отношение к этому имеет возраст? С какого возраста можно официально становиться «экспертом»? А когда пора заканчивать (чтобы не попасть под определение «старпера»)?
Ну и последний вопрос — какие стихи в данном случае соответствовали бы?
На самом деле это риторические вопросы, не имеющие никакого отношения к делу 28 летнего «безусого отрока». Хочу обратить внимание на комичность ситуации, состоящую в том, что спор идет не по существу вопроса, а обсуждаются совсем уж субъективные критерии.
По самым оптимистичным оценкам, численность боевиков в Сирии, принадлежащих одной самой известной ныне террористической организации составляет до 200 тыс. чел.
По самым пессимистичным оценкам, население Сирии составляет около 18.5 миллиона человек, т. е. имеем 1/92.5 в худшем случае, что в пересчете на население России составит 1.5 миллиона террористов.
$ 200 миллиардов (по оценке из статьи) / 1.5 миллиона = 126000$ на то, чтобы остановить одного (!) психа при их чудовищной плотности на душу населения.
Это, естественно, при 100% доле поимки и обезвреживания.
Тоже показалось странным, что хоть статья и выражает опасения по поводу слепого применения центральной предельной теоремы, в ней упускается из виду критический недостаток подхода - попытка подогнать нормальное распределение к любым наборам данных с неотрицательными значениями.
Такое допущение может привести к ошибочным выводам, поскольку реальные данные часто имеют асимметричные и ненормальные распределения.
Очень важно выбирать соответствующие распределения, которые отвечают характеру данных.
Ожидал увидеть хотя бы попытку свести логнормальное распределение к нормальному, или использование сопряженных распределений типа бета-распределения, но увы.
А где, собственно, статья про "экшн-трансформер"?
Про "не только" нашел, а про экшн-трансформер, извините, 6 натянутых абзацев воды.
Какая доля парсинга (в % от числа сайтов и % от числа страниц) идет через chromium, а какая - средствами попроще?
Как работаете с сайтами типа ВИ, которые обфусцируют имена классов?
Какой средний сервер у вас и сколько он вывозит потоков chromium?
Понятно, что статья обзорная, но хотелось бы больше технических деталей! На раскрытие фирменных секретов претензии нет, интересны общие цифры и подходы.
По сути, вы сейчас предлагаете следующее: попросить толокеров определять по фото травы - работает ли рядом устройство для полива. Думаю, вы понимаете, почему классификатор, обученный на таких данных, не будет учитывать дождь и «собачку».
Можете посоветовать какой либо дефолтный набор ключей для chromedriver?
В сети много «советчиков», данные от которых или безнадежно устарели, или не имеют отношения к боевому использованию.
Вспомнился, скорее, нанокостюм из Crysis.
Интересный подход с усреднением эмбеддингов токенов «внутри слова».
Насколько часто он оправдан и встречается ли в реальных задачах, могли бы рассказать? Насколько лучше это работает при двупроходном усреднении, сначала по вложениям токенов внутри слова, а потом по вложениям самих слов?
В качестве метрики расстояния между предложениями не смотрели в сторону word movers distance?
Ореолы воспринимаются неестественно по той причине, что человеческая зрительная система и мозг понимают, что какой-то отдельный объект, освещен «как-то не так», неравномерно, то есть задействованы некоторые иерархические свойства сцены, которые в «живом» фото еще необходимо извлечь из картинки, а вот в игровых движках они, как правило, идут «из коробки».
На примере последней фотографии можно выделить три части: небо, здание и трава с деревьями. Каждой части должен быть присвоен свой уровень экспокоррекции и, возможно, коррекции контраста, это избавит ситуацию как от проблемы ореолов, так и от других артефактов.
Проблемы, аналогичные указанным в статье, решал немного иначе:
Как итог, пошаманив с гиперпараметрами, получил очень устойчивое к помехам определение направления движения, которое отказывалось работать только в случае долговременной «слепоты» OpenCV к линиям, чего на практике не встречалось.
Всё-таки облака — чаще всего необходимое, но отнюдь не достаточное условие выпадения осадков, есть много других факторов, таких как температура, в т.ч. на разных высотах, смешение холодных и тёплых воздушных масс, а также много других характеристик, используемых в профессиональной метеорологии, которые используются как в краткосрочных, так и в долгосрочных прогнозах.
Было бы интересно узнать, что из этого набора реально используется / готовится к использованию.
Под первым я имел ввиду наивность тех людей, которые верят всем предвыборным программам на 100%.
Имхо, я бы не отказался от карты памяти для зеркалки, способной при размере RAW-файла современной камеры около 30 МБ принимать до 30 файлов в секунду.
Это полностью покроет не столько потребности, сколько возможности современных камер.
Да и размер для такой задачи более чем хорош.
Да и актерам, которые тоже стареют, им проще войти в роль при съемке нескольких частей.
Какое отношение к этому имеет возраст? С какого возраста можно официально становиться «экспертом»? А когда пора заканчивать (чтобы не попасть под определение «старпера»)?
Ну и последний вопрос — какие стихи в данном случае соответствовали бы?
На самом деле это риторические вопросы, не имеющие никакого отношения к делу 28 летнего «безусого отрока». Хочу обратить внимание на комичность ситуации, состоящую в том, что спор идет не по существу вопроса, а обсуждаются совсем уж субъективные критерии.
По самым пессимистичным оценкам, население Сирии составляет около 18.5 миллиона человек, т. е. имеем 1/92.5 в худшем случае, что в пересчете на население России составит 1.5 миллиона террористов.
$ 200 миллиардов (по оценке из статьи) / 1.5 миллиона = 126000$ на то, чтобы остановить одного (!) психа при их чудовищной плотности на душу населения.
Это, естественно, при 100% доле поимки и обезвреживания.