Как стать автором
Обновить
2
0

Пользователь

Отправить сообщение

DETR: Бесконечная история

Уровень сложностиСложный
Время на прочтение13 мин
Количество просмотров1.8K

Всем привет, с вами команда Layer!
Мы рады сообщить, что совсем скоро выйдет наша новая исследовательская работа, посвященная поиску моментов в видео, релевантных пользовательскому запросу. Мы хотим сделать эту работу как можно более доступной для каждого, кто хочет глубже разобраться в теме. Поэтому мы решили написать этот небольшой туториал, посвященный семейству моделей DETR, так как они используются не только для детекции котиков на картинках, но и в таких необычных доменах, как детекция моментов в видео. Мы уверены, что среди читателей многие знакомы с основами DETR, однако подозреваем, что не все могли следить за её развитием. Всё‑таки по сравнению с YOLO, DETRу пиара явно не достает. В этой статье мы предлагаем краткий обзор эволюции модели, чтобы помочь вам лучше ориентироваться в новых исследованиях. Если же вы впервые слышите о DETR или хотите освежить свои знания, то бегом читать — тык, если после прочтения остались вопросы, то можно ознакомиться с этими видео — тык, тык.

Давайте детальнее разберёмся, что ждёт вас в этом туториале. Сначала мы рассмотрим недостатки оригинальной версии DETR, а затем перейдём к архитектурным улучшениям, которые либо устранили эти проблемы, либо заметно их сгладили. Начнём с Deformable DETR — модели, которая оптимизировала вычисления. Затем обратим внимание на Conditional DETR и DAB DETR — архитектуры, которые существенно переосмыслили роль queries в модели. Далее мы погрузимся в особенности DN‑DETR, который стабилизирует one‑to‑one matching. После этого детально разберём DINO DETR — модель, которая объединяет и улучшает идеи DN‑DETR и DAB‑DETR, а также переизобретает RPN для детекционных трансформеров. И в завершение нашего путешествия мы познакомимся с CO‑DETR, который объединил классические детекторы, такие как ATSS, Faster RCNN, и модели типа DETR, установив новые SOTA метрики на COCO.

Читать далее
Всего голосов 23: ↑19 и ↓4+21
Комментарии0

Что почитать по машинному обучению: подборка из 6 книг

Время на прочтение4 мин
Количество просмотров12K

Привет, Хабр! Это Миша Степнов, руководитель центра R&D Big Data в МТС Диджитал. Машинное обучение и технологии искусственного интеллекта постоянно развиваются — так что специалистам этой сферы приходится за ними поспевать. Держать руку на пульсе помогают в том числе книги. Сегодня поделюсь подборкой из шести книг по машинному обучению, которые будут интересны начинающим (и не только) специалистам.

Читать далее
Всего голосов 18: ↑17 и ↓1+27
Комментарии2

Пара тупых ответов про эволюцию

Время на прочтение9 мин
Количество просмотров50K


В школе я очень любил биологию, но у неё была очевидная проблема. Эволюция — суть жадный алгоритм, который мгновенно вознаграждает за небольшие улучшения. Тысячи лет постепенных улучшений, и вот перед вами утконос.

Проблема в том, что у него есть глаз. И другие сложные органы. А у тех же птиц есть крылья. И никакой жадный алгоритм не даёт понять, как можно тысячелетиями отращивать половинку крыла. Эта штука не просто не помогает, а откровенно мешает.

Крыло работает только тогда, когда целое. Половина крыла не даёт оторваться от земли.

Примерно такой же вопрос к сложным мутациям. Как так можно поменять пару букв в коде, чтобы он вдруг стал отлаженной библиотекой с чем-то полезным?

Ну или вот хвост павлина. Как можно развить такую длинную бесполезную штуку, которая люто нравится хищникам? Разве не должны были выжившие павлины стать ловкими и короткохвостыми?

Свои ответы я получил уже довольно поздно, но помню, как был рад их услышать. И наблюдая за идущим сейчас холиваром про теорию Дарвина, вижу много людей, которые задают те же самые вопросы.
Читать дальше →
Всего голосов 272: ↑269 и ↓3+329
Комментарии597

Как мы перенесли web-сервис в Телеграм Mini Apps

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров8.5K

До лета 2023 года перед разработчиками Точка.Нетворк стояла проблема: CJM становился сложным, и это затрудняло работу над продуктом. В итоге мы придумали решение — полностью отказались от веба и сосредоточили развитие платформы только в Mini Apps от Телеграма. Без этого было бы невозможно развивать продукт дальше.

В статье расскажу, как и почему мы отказались от веб-версии Точка.Нетворк — локального сообщества предпринимателей — и переместились в Телеграм.

Читать далее
Всего голосов 27: ↑27 и ↓0+38
Комментарии4

Как мы заработали 100 000 рублей за 3 месяца, запустив простой конвертер картинок в США

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров58K

Что мы поняли, запустив простой конвертер картинок за 1 месяц в США. И как заработали 100 000 рублей за первые 3 месяца, хотя вокруг куча бесплатных аналогов.

Читать далее
Всего голосов 117: ↑106 и ↓11+113
Комментарии219

Как сделать так, чтобы ваши открытые данные были никому не интересны

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров16K

Публикация открытых данных — благородное занятие, которое стимулирует исследования, инновации и прозрачность. В то же время заниматься этим бывает утомительно, а пользователи могут делать с вашими данными все, что им угодно. Такая утеря контроля над данными может быть нежелательной, но в некоторых случаях закон обязывает публиковать их именно под открытой лицензией. 

Лучший выход из подобной ситуации — опубликовать формально открытые данные, но сделать так, чтобы они никому не были интересны. Специально для таких сценариев я составил перечень стратегий, которые помогут избежать нежеланного внимания пользователей, заинтересованных в работе с вашими данными. 

Читать далее
Всего голосов 35: ↑31 и ↓4+34
Комментарии9

Физика сверхъестественного: тонкие энергии, астральные тела, торсионные поля и высшие планы бытия

Уровень сложностиСредний
Время на прочтение40 мин
Количество просмотров7.6K

На современном рынке эзотерических услуг есть предложения на любой вкус и кошелёк, и они пользуются устойчивым спросом. Экстрасенсы занимаются телепатией и телекинезом, контактёры совершают астральные путешествия и общаются с потусторонними сущностями, энергопрактики работают с тонкими телами, аурами и жизненными энергиями, а целители‑ньюэйджеры совмещают в своей деятельности парапсихологию, астрологию, гомеопатию, акупунктуру и биорезонанс. Несмотря на внешние различия, все эти эзотерические учения и практики так или иначе основаны на идее скрытого от обычных людей «тонкого» мира, информационно‑энергетического поля или таинственной силы — посредника между духом и материей. В данной статье мы разберёмся, совместимо ли существование такой силы с фундаментальными физическими теориями, и чем упомянутые сущности отличаются от невидимых сущностей, известных науке: квантовых полей, пространства‑времени или параллельных миров.

Читать далее
Всего голосов 48: ↑41 и ↓7+45
Комментарии130

Как нам удалось в 100 раз ускорить решение оптимизационной задачи NBO в Альфа-Банке

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров2.1K

В данной статье мы расскажем, как нам удалось найти решение задачи NBO на open-source солвере CBC примерно в 100 раз и добиться повышения оптимального значения целевой функции на 0.5%.

Читать далее
Всего голосов 14: ↑12 и ↓2+12
Комментарии6

Дышать, а не задыхаться

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров21K

Привет, Хабр! Меня зовут Влада и я обожаю работать с людьми. Попав волею судеб IT сферу, я поняла, что хоть в IT очень много зависит от командного взаимодействия, большая часть тусовки нацеливается на хард, а не софт. Поэтому статьи тут я хочу посвящать софтам.

Конкретно эта тема вдохновлена и моим опытом, и тем, что из‑за большой нагрузки и событий последних лет, мне часто приходилось искать методы вытаскивания сотрудников (за любые места и в любых позах) из депрессивных состояний.

В ход обычно шло всё, от снижения количества тасков на конкретного сотрудника или изменения уровня сложности до тимбилдингов и особого режима работы. Что‑то помогало лучше, что‑то хуже, скорее, конкретный инструмент нужно было искать индивидуально.

Этот метод — свежая находка последних 6 месяцев, и, как мне кажется, он — квинтэссенция смысла — почему вообще происходит выгорание. Опять же, наверное, общий подход знают всё, я просто его преподнесу в более структурной форме.

То, что напишу ниже, ненаучно (хотя и достаточно сильно перекликается с теорией Павлова, да‑да, тем самым, который про собак и условные рефлексы писал), но обкатываю на окружающих людях и себе — очень помогает исправить ситуацию. Теория не моя, но автор дал добро на то, чтобы пустить её в мир. Для тех, кто любит кратко — переходите к блоку «Итог», а всех остальных приглашаю погрузиться в мою историю и подробное объяснение мат.части.

Читать далее
Всего голосов 46: ↑37 и ↓9+37
Комментарии36

Obsidian+Github вместо Notion: синхронизация, бекап и версионность (3-в-1)

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров41K

О том, как сделать прозрачную синхронизацию заметок Obsidian между устройствами (Desktop, Android, iOS) через GitHub:

1. Без сторонних приложений (вроде iCloud, SyncThing, Termux и пр)
2. Бесплатно
3. Бонусом — резервная копия: как самих заметок, так и истории изменений.

В результате получается полноценная замена Notion: структурированные заметки с автоматической синхронизацией между устройствами.

Инструкция:
Всего голосов 135: ↑135 и ↓0+156
Комментарии126

Как SpaceX нарушила Договор о космосе первым выходом частного астронавта в космос — и почему это хорошо для компании

Время на прочтение8 мин
Количество просмотров104K

Привет, Хабр! На связи Саша Баулин, специалист МТС Диджитал и фанат космоса.

Сегодня, 12 сентября 2024 года, в 13:12 по Москве Джаред Айзекман, командир космического корабля Crew Dragon, принадлежащего SpaceX, впервые в истории частной космонавтики вышел в скафандре в открытый космос. Те, кто видел трансляцию этих событий, могут пожать плечами: «Ну и что? Постоял, подвигал плечами, даже от корабля, считай, не отрывался. Что в этом такого, если космонавты и астронавты государственных агентств делают так уже 59 лет?»

Совсем другое отношение к этой истории у специалистов по космосу, особенно у конструкторов скафандров. Для них случившееся — событие огромного значения (все потому, что они понимают огромную сложность сделанного). А также у юристов, связанных с космическим правом: те вообще заявили, что SpaceX в частности и США в целом нарушили договор о космосе.

Отчего то, что не кажется чем-то особенным человеку с улицы, так серьезно взволновало специалистов по космосу и его законам?

Читать далее
Всего голосов 161: ↑145 и ↓16+159
Комментарии431

BDUI: удовольствие или боль

Уровень сложностиСредний
Время на прочтение16 мин
Количество просмотров4.4K

Backend Driven UI (BDUI) — это подход, при котором сервер управляет не только данными приложения, но и формирует интерфейсы, включая экраны, верстку, реакции на действия пользователя и переходы между экранами. Клиентская часть сводится к рендерингу интерфейсов на основе полученных с сервера данных.

На первый взгляд, это даёт несколько преимуществ. Во-первых, сокращается время от идеи до реализации фичи. Во-вторых, можно создать интерфейсы сразу для нескольких платформ. В-третьих, появляется возможность обновлять функциональность без необходимости обновления приложения, даже на старых версиях у пользователей.

На бумаге такие идеи кажутся идеальными, иногда даже «серебряной пулей». Однако на практике всё не так однозначно, и многое зависит от конкретного кейса. В этой статье я поделюсь опытом нашей компании, расскажу о нюансах, которые позволили нам извлечь пользу из BDUI, и представлю рабочий инструмент. Мы использовали нестандартные подходы, которые, надеюсь, вдохновят вас. Похоже, что для нас BDUI — это скорее удовольствие, чем боль. Давайте разберёмся, как нам это удалось!

Читать далее
Всего голосов 22: ↑20 и ↓2+22
Комментарии24

Квантовые эксперименты на дому. Строим квантовый компьютер из лазера и полимеров

Уровень сложностиСредний
Время на прочтение21 мин
Количество просмотров21K

У меня хорошая новость для тех, кому надоело читать мои нудные лонгриды по квантовой теории и философии физики. В этой статье будет одна практика – квантовые эксперименты в домашних условиях, с минимальным бюджетом и без специального оборудования. Я решил снять и наглядно продемонстрировать, как построить квантовый компьютер своими руками и выполнить на нём квантовое вычисление - алгоритм Дойча. Всё, что я буду делать, вы сможете при желании воспроизвести у себя дома и убедиться, что это работает. Если у вас есть знакомые, которые сомневаются в квантовой механике и отрицают факт квантового превосходства, поделитесь с ними ссылкой на эту статью или видео, пусть посмотрят.

Читать далее
Всего голосов 97: ↑93 и ↓4+116
Комментарии67

JPEG XL лучше всех, но Google против

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров25K

JPEG XL превосходит все форматы по уровню сжатия и визуальному восприятию (DSSIM), источник

Оригинальный формат JPEG разработан в далёком 1992 году и уже устарел. Вопрос в том, кто придёт ему на смену. Идеальной заменой казался JPEG XL, в сравнительных тестах он показывает превосходство над AVIF, WebP и другими форматами. Можно было бы сказать, что будущее за JPEG XL, если бы не один нюанс: в 2022 году корпорация Google почему-то удалила его поддержку из браузера Chrome. И не хочет возвращать обратно.
Читать дальше →
Всего голосов 91: ↑88 и ↓3+126
Комментарии70

WebP — формат сжатия веб-страниц

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров11K

Я хочу, чтобы посетители моего сайта наслаждались им, так что я забочусь об accessibility и проверяю, что даже без JavaScript тут есть, на что смотреть. Я забочусь о том, насколько быстро грузятся страницы, ведь на некоторых из них есть большие иллюстрации, поэтому я минифицирую HTML.

Вот только есть один нюанс, который ставит мне палки в колёса и не даёт сделать блог лёгким как пёрышко.

Читать далее
Всего голосов 54: ↑52 и ↓2+64
Комментарии53

Зачем в iPhone чип, который убивает FaceID

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров51K

Разбирался я в низкоуровневой работе камер iPhone, и дошёл до FaceID — системы распознавания лиц, используемой Apple для разблокировки смартфона. И наткнулся внутри на интересную вещь: чип, единственное предназначение которого в том, чтобы вывести из строя FaceID. Навсегда.

О том, как в iPhone вообще работает FaceID, где там этот чип стоит, что именно он делает, зачем его сделали таким злым, и как в ремонте справляются с этой напастью — под катом!

Читать далее
Всего голосов 630: ↑629 и ↓1+747
Комментарии177

Сколько, реально, lossless треков в Яндекс Музыке

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров92K

Хабр, привет!

Я Беслан, IT-шник по любви, искренне увлеченный этим всем.

Люблю ковыряться в коде, писать код, прошивать всё что можно, поднимать инфру на линуксах, собирать роботов, datascience, нейронки, LLM-ки, и много ещё всего такого, вы поняли.

Помимо всего этого, я очень люблю хороший звук.
Не могу назвать себя прям аудиофилом, ибо провода никогда не прогревал, и усилок на пирамидки не ставил.
Но всё равно люблю хороший звук:

Читать далее
Всего голосов 174: ↑165 и ↓9+184
Комментарии250

Sapiens: фундаментальная CV-модель для задач с людьми

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров3.1K

Почти две недели назад из недр одной из самых прорывных AI лабораторий мира вышла новая классная модель (а точнее — семейство моделей) компьютерного зрения, но данная новость в русскоязычном интернете прошла будто бы без энтузиазма. А зря — штука довольно хороша.

Итак, у нас есть семейство моделей, которое из коробки поможет решить «четыре фундаментальные задачи человека в CV» (цитата авторов) и давайте посмотрим, что же там есть есть и как это работает.

Скажу сразу, что мне хотелось написать скорее напоминательно-обзорный пост о том, что такая модель вообще вышла и чего ожидать от нее в дальнейшем. В живых проектах мы пока это не использовали (но однозначно будем) и свой большой обзор писать рановато, но я поигрался с демками и да — результаты повторяемы. Технических деталей будет минимум — пейпер хорош и не стоит лишать удовольствия его прочитать самому целиком, особенно, если вы занимаетесь похожими задачами.

Читать далее
Всего голосов 12: ↑12 и ↓0+15
Комментарии1

Пару ласковых о GMail

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров66K

Если многобукв - переходите к разделу TLDR ниже

Навеяно этой статьёй. У меня схожая ситуация, только меня не взламывали. Я просто в один момент полностью утратил возможность зайти в свою электронную почту. Надеюсь данная информация поможет кому-то избежать подобной участи.

Я пользуюсь GMail уже лет 20, с момента его появления, с тех пор как появились и предложили невиданный по тем временам гигабайт бесплатного места. А ещё отличный веб-клиент и антиспам. С тех данный продукт Корпорации если не Добра, то по крайней мере Нейтралитета стал №1 для меня и даже не мыслил о чём-либо другом. Нужно создать ящик под какую-то задачу? В первую очередь всегда шёл на Google Mail. Пока недавно Gmail не сказал мне "да не пошёл бы ты в известном направлении", после чего я впервые в жизни всерьёз задумался об альтернативах.

Дело вот в чём. Пару лет назад я создал аккаунт в одной видеоигре, к нему зарегистрировал ящик в Gmail, он использовался только для принятия писем с кодом при входе в игру, больше ни для чего. В эту игру я захожу раз в год, в ящик соответственно тоже, он для меня третьестепенной важности, поэтому мне даже в голову не приходило подключать какие-то дополнительные средства входа вроде 2FA или одноразовых ключей. Я бережно придерживаюсь сетевой гигиены, меня не взламывают и аккаунты не угоняют. И даже если это вдруг произойдёт - большой трагедией не станет, ну потрачу лишние 5 минут своего времени и воспользуюсь функцией восстановления доступа к аккаунту, ведь у мега-корпорации Google с более чем двадцатилетним опытом на рынке наверняка есть развитые средства восстановления доступа, не так ли?

Читать далее
Всего голосов 77: ↑69 и ↓8+81
Комментарии206

Забытая история китайских клавиатур

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров18K

В китайском языке насчитываются десятки тысяч иероглифов. Кто-нибудь задумывался, как вообще можно набирать их все на клавиатуре, имеющей сопоставимые со стандартной размеры? Не такой, как на фото выше.🙂

Забегая вперед скажем, что сейчас это делается при помощи программного интерфейса Input Manager Editor (IME). Но еще 50-60 лет IME не было, а компьютеры в КНР, как и потребность в наборе текста, была. Как же выходили из ситуации? Тут на сцену выходит студент электротехнического факультета Вирджинского военного института Чан-хуэй Йе. Но обо всем по порядку. 

Читать далее
Всего голосов 34: ↑34 и ↓0+45
Комментарии22
1
23 ...

Информация

В рейтинге
4 630-й
Откуда
Москва, Москва и Московская обл., Россия
Зарегистрирован
Активность