Search
Write a publication
Pull to refresh
2
0
Send message

А насколько метрики Marigold-DC на бенчмарках сопоставимы с актуальными SOTA?

Получается, что в таком варианте расчет на то, что монокулярная карта глубины (предсказанная без учета данных с лидара) с точностью до линейного отображения равна истинному. Наверняка же иногда это не так, и случаются "относительные" ошибки в глубине, которые не исправить y=ax+b

Кажется, в ControlNet показывались какие-то примеры обратной задачи - генерации изображения по карте глубины.

Ну ведь неправда же в заголовке, аж дважды. Даже картинка-первоисточник приложена сразу. "Almost every respondent has used AI coding tools", т.е. "Почти все участники опроса пользовались AI инструментами для программирования" (хотя бы один раз). Это не "почти все программисты", и не "используют" (регулярно).

Вся статья - полтора абзаца перевода с картинки, и перевод с фактическими ошибками. Уж лучше вывод гугл-переводчика сразу публиковать.

Про решение проблемы вычисления градиентов: есть вот такая статья, где к распределению вероятностей, зашумленному Гумбелем, применяют SoftArgmax, т.е. Softmax + вычисление мат-ожидания.

Кажется довольно простым способом организовать честное(?) дифференцируемое сэмплирование.

Обычно прежде чем применять алгоритм, стоит взглянуть на оценку его сложности. Интересно было бы узнать - до какого уровня вы добрались по этому алгоритму, сколько ушло сил и времени? Ну и как кажется - что там получится дальше.

Читал мнение, что учить китайский самостоятельно - дело очень тяжкое и довольно бесперспективное.

Комплексовать из-за того, что кто-то понимает что-то лучше вас - действительно плохая идея.

Про субъективность опыта тут уже писали выше - он у всех разный. Когда я учился на физтехе - на нашем факультете было почти ровно 50% девушек (физхим - на других не так). Многие девушки отлично понимали и урматы, и теорфиз (лучше меня), а некоторые нет - также как и парни. Заметить это несложно: кто-то уже к концу семинара по теме щелкает задачки, кто-то после того как повтыкает дома, а кто-то к концу семестра.

Вероятно, распределения по способностям к точным наукам действительно разные у разных полов, но кажется что социального тут больше, чем биологического.

Нет, имел в виду поиск всех объектов на изображении из какого-то закрытого (или даже открытого) множества классов. Как обычно подразумевается в задаче Object Detection https://paperswithcode.com/sota/object-detection-on-coco

В большинстве опубликованных за последние года 3 нейронок для детекции объектов время работы не зависит от количества объектов в кадре. Чаще всего предсказывается вероятность объекта клаcса Х в каждой локации. Может быть ограничение по максимальному количеству найденных объектов в кадре (например, 100) и обычно есть сильная зависимость от разрешения изображения (больше изображение - дольше инференс, но зато можно найти мельче объекты).

Кажется, что на КДПВ - Crazyflie от bitcraze.

По сравнению с другими дронами статьи, crayzflie интересен тем, что дрон является модульным с кучей дополнительных свистелок, и все составляющие (код и электроника) - open source

Было бы интересно больше почитать про практическое применение полученного решения. В кабине же сидит оператор, и видит примерно то же, что и камера. Что именно дают бизнесу детекции траков и собственного ковша?

Спасибо за статью! Поздравляю с первым местом.

Интересно, запускалось ли ваше решение на настоящем роботе, а не симуляторе? Кажется на каком-то соревновании CVPR по Visual Navigation решения победителей обещали потестить в реальных условиях.

С точки зрения ML и обучения работа прикольная - применение Text-To-Image к необычному домену, пусть даже результаты пока не очень.

Но с точки зрения исследования материалов непонятен смысл: допустим, вы преодолеете все проблемы и научитесь генерировать правдоподобные изображения наночастиц в СЭМ - зачем они? Кажется, что область применения генеративных сетей и точных измерительных приборов не пересекается.

Разве что deep-fake в научных журнала публиковать.

На чем основаны эти утверждения?

Пока что только страны с ручной сортировкой конечным потребителем сумели более-менее обустроить переработку своих отходов - остальные складируют либо у себя, либо в других странах.

Автоматическая сортировка на сортировочных станциях и оборудование для этого есть, но в промышленных масштабах так можно выделять грубо только крупные фракции (металл, стекло). Сортировать пластики все равно только вручную на линии - без маркировки, например, PET и PS может быть довольно сложно различить.

При этом в основной массе вторсырье не дешевле, а с учетом затрат на сортировку - дороже первичного сырья. Если вы не хотите сами сортировать мусор, то в промышленном масштабе этим будут заниматься только за счет государственных субсидий, т.е. - ваших же налогов.

Спасибо за статью. Интересно, а вы не пробовали еще тестировать идентификацию на новых данных? Раз есть апи и бот, значит это видимо предполагалось.

Несколько лет назад на CVPR был конкурс по детекции и ре-идентификации амурских тигров: https://cvwc2019.github.io/leaderboard.html

Судя по лидерборду и статьям, с идентификацией все было супер (top-1 точность 95%+). Но в данных была одна интересная деталь: в датасете в Train и Test были кадры с одних и тех же камер, и даже одних и тех же видео с небольшим интервалом, что приводило общем-то к data-leak между Train и Test и оверфиту, который было сложно увидеть по Test. В публичных решениях фото тигра Х с одной камеры зоопарка, никогда не ре-идентифицировалось по фото того же тигра Х с другой камеры в том же зоопарке - всегда только с той же камеры.

Например, если вдруг фото "Принцессы" все зимние и со снегом, а у других тигров в основном летние и без снега, то тут можно словить похожий эффект.

А Google Cloud же в России доступен только для юр. лиц?
Спасибо за статью и ссылки, особенно про пирамиды.
Спасибо за статью. Правильно ли я понимаю, что в основном выигрыш при смене «провода» с USB на RS-232 объясняется уменьшением частоты сигнала и ослаблением потерь от эффектов длинных линий?
Если да, то можно ли просто согласовать USB линию? Вроде есть метод согласования при фиксированной частоте, что-то вроде шунта на четверть длины волны.
Еще вопрос по передаче по USB: при частоте 12МГц мы передаем только 115200 бит/c. Отсюда вроде бы следует, что даже при коротких пакетах большую долю времени ничего не передается. Может тогда можно переключиться как-то на LowSpeed режим, это вроде тоже должно уменьшить волновое сопротивление?
Чтоб решить проблему со стабильностью можно модифицировать потенциал Леннарда-Джонса так, чтобы он был конечен в 0. Например, добавить к радиусу константу, т.е. вычислять не U( r) а U(r+c). Вообще разные варианты гуглить можно по «lennard jones soft-core».
В итоге можно увеличивать шаг(ценой точности) и использовать больше частиц, хотя некоторые soft-core потенциалы могут быть сами по себе сложнее для вычислений, что скажется на FPS.
Тема сама по себе интересная, но что именно являлось целью работы?
Если именно исследование микротрубочек, то почему настолько маленькое количество частиц? Может я ошибаюсь, но судя по вики, микротрубочки подлиннее вообще должны быть. Понятно, что как кусочек посмотреть — можно и столько, но может больше — лучше будет?

Если показать использование FPGA для молекулярной динамики, то как я понял, перенести этот подход на другие задачи также эффективно слету не выйдет — используется фиксированое число соседей, ну и опять-таки обычно частиц на порядки больше.

А можно уточнить, что имеется в виду под полноценным ООП?
Инкапсуляции в python нет в принципе — но есть соглашение, как следует называть методы и атрибуты, которые разаработчик считает приватными, соответственно, нарушение приватности будет намеренным и на совести нарушающего
Python поддерживает множественное наследование, используя стандартную библиотеку, можно создавать абстрактные классы.
Полиморфизм можно реализовать внутри одного и того же метода в зависимости от типа аргумента.
Отсутствие содержания по заголовку действительно обескураживает, а тема ведь сама по себе интересная.
1

Information

Rating
Does not participate
Registered
Activity