Все потоки
Поиск
Написать публикацию
Обновить

Все потоки

Сначала показывать
Порог рейтинга
Уровень сложности

T-ECD — синтетический кросс-доменный датасет для исследований в области рекомендательных систем

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров795

Всем привет! На связи команда RecSys R&D Т-Банка. В экосистеме Т мы развиваем рекомендации практически во всех сервисах — от инвестиций до доставки продуктов и кэшбэка.

Представляем  открытый синтетический датасет T-ECD — T-Tech E-commerce Cross-Domain Dataset. Он создан на основе реальных данных Т-Банка и предназначен для исследований в области рекомендательных систем. 

Под синтетичностью мы понимаем то, что датасет насемплирован из реального распределения, поэтому обладает очень похожими на реальность статистическими свойствами данных, но при этом полностью анонимный и обезличенный.

Рассказываем, как T-ECD устроен и что внутри. Полный датасет и его уменьшенная версия T-ECD-Small уже доступны на Hugging Face.

Читать далее

Анализ модуля RF125 (125 кГц): дальность >5 м и мкА потребление

Уровень сложностиПростой
Время на прочтение29 мин
Количество просмотров1.7K

Серия RF125 представляет собой систему беспроводной связи, работающую в низкочастотном (НЧ) диапазоне 125 кГц. Ее основной функцией является обеспечение дальнего «пробуждения по воздуху» (Over-the-Air Wake-up) и двунаправленной передачи данных. Система состоит из передающего модуля (RF125-TX/TX2) и приемного модуля (RF125-RX/RA), специально разработанных для приложений, где приемное устройство должно находиться в режиме ожидания в течение длительных периодов времени при сверхнизком энергопотреблении и может быть активировано при получении определенного беспроводного сигнала.

Выбор диапазона 125 кГц является краеугольным камнем технических характеристик системы. Как низкочастотный диапазон, он обладает отличными физическими проникающими способностями, что позволяет ему эффективно проходить через неметаллические препятствия. Между тем, его свойства связи в ближнем поле концентрируют энергию сигнала в меньшей области, способствуя безопасной связи с ограничением по зоне. Серия RF125 в полной мере использует эти функции для достижения дальности связи более 5 метров, что является значительным преимуществом среди аналогичных продуктов на 125 кГц. Ключевая ценность системы заключается в способности ее приемного модуля поддерживать чрезвычайно низкое энергопотребление на уровне микроампер при отсутствии сигнала, тем самым значительно продлевая срок службы батареи устройств с питанием и решая проблему высокого энергопотребления в традиционных беспроводных устройствах, находящихся в состоянии непрерывного прослушивания.

Читать далее

Как мы научили ИИ превращать отзывы в деньги

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров1.2K

Привет, Хабр! Меня зовут Артём Гриппа, я руковожу направлением продуктов поддержки клиентских отзывов в Магнит OMNI. Сегодня хочу рассказать о том, как команды моего направления — клиентских отзывов и платформы опросов — вместе с нашими стейкхолдерами создали систему работы с клиентской обратной связью, которая влияет на бизнес-результаты. Не просто собирает красивые метрики для отчётов, а превращает каждый отзыв в конкретные действия и, что немаловажно, в дополнительную выручку. Причём речь идёт не о паре сотен отзывов, которые можно прочитать за чашкой кофе, а о полутора сотнях тысяч ежедневных комментариев, которые физически невозможно обработать без автоматизации.

Читать далее

Удваивая эффективность: термоэлектрическое охлаждение

Время на прочтение15 мин
Количество просмотров2.1K

Одним из важнейших аспектов нормальной работы многих устройств является охлаждение, не говоря уже о его бытовом значении. Развитие технологий, а также их более широкое распространение требует поиска альтернативы классическим громоздким и плохо масштабируемым компрессионным системам охлаждения. Ученые из лаборатории прикладной физики университета Джонса Хопкинса (Балтимор, США) разработали новую систему на основе наноматериалов, которая в два раза эффективнее. Из чего именно состоит новая система охлаждения, каковы принципы ее работы, и что показали практические испытания? Ответы на эти вопросы мы найдем в докладе ученых.

Читать далее

Бобина, VHS и стример. История одной из опорных технологий XX века. Часть 3

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров5K

В этой части отвлечемся от привычного нам использования магнитной пленки в музыке и видео. Посмотрим, на что еще она способна. Спойлер: она способна на многое.

Читать далее

Быстрый старт в CI на примере Flutter (под банальный Android и интересную «Аврору»)

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров2.8K

Flutter продолжает набирать популярность. Фреймворк предлагает низкий порог входа и возможность собрать приложение практически под любую платформу. Если вы хотите выпускать приложения стабильнее, чаще, быстрее, да еще и под несколько платформ и одним коммитом, то эта статья для вас.

Читать далее

Динамическое планирование задач в NiFi

Время на прочтение9 мин
Количество просмотров256

Статья о том, какие бывают ограничения самописных планировщиков задач и как мы перевели весь процесс планирования в NiFi, сделав его более прозрачным.

Читать далее

VoiceReader — читаем вслух

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров1.5K

Делаем на c# репетитора по чтению вслух на 20+ языках.

Идея простая: открываем текст на (почти) любом интересующем языке, и читаем в микрофон. Все распознанные слова в тексте помечаются цветом.

Читать далее

Релизы без DevOps: Как сделать самому, на 1 сервере, за 1 день

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров1.9K

(Анонс: Привет. Собираю статистику по инженерным процессам — от enterprise до инди‑команд (форма в конце статьи). Результаты агрегирую и опубликую на хабре в ближайшее время. Анонимно, 5–10 минут. Важен каждый.)

В сети очень много информации о том, как работать в большой и многорукой команде, с кучей выделенных ролей и настроенными процессами. Да я и сам отправляю к девопсам, когда на конференции подходят и спрашивают «а как правильно сделать репликацию базы данных?», потому что они (девопсы) сделают это быстрее и правильнее почти любого бэкендера. Но кроме компаний, в которых работают тысячи инженеров и есть отдел «на любой чих», — есть компании, в которых работают три джуна и один мидл (кстати, они-то и задают этот вопрос). Я и сам когда‑то с такой компании начинал… И эта статья для них.

Авто деплой с ролбэком за пару часов

Трудовые отношения в России

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров6.3K

Российское трудовое право, унаследованное от советской системы, рассматривает труд не просто как экономическую деятельность, но и как социальную гарантию. В отличие от многих западных стран, где преобладает гражданско-правовое регулирование, в России сохраняется жёсткая структура Трудового кодекса, создающая два принципиально разных режима взаимодействия между работодателем и работником.

Читать далее

Запускаем WebAssembly модули с Python хоста

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров1.2K

WebAssembly - молодая, но довольно перспективная технология. WASM позволяет упаковать программу в бинарный формат, который можно запускать на любой системе, в изолированной среде.

В статье посмотрим как WASM-модули взаимодействуют с Python хостом. (Спойлер - не все так просто как хотелось, поддержка WASM в Python экосистеме пока слабая)

Читать далее

njs в stream: многоарендность по SNI и динамический upstream из Redis/etcd

Время на прочтение10 мин
Количество просмотров226

Привет, Хабр!

Сегодня я хочу разобрать одну конкретную, но до безобразия полезную задачу, с которой мы столкнулись, когда наш сервис стал обрастать клиентами. Задача простая на словах, но с изюминкой: маршрутизировать входящие TLS-соединения в stream-модуле Nginx на разные бэкенд-пулы в зависимости от имени сервера SNI, которое клиент указывает в самом начале рукопожатия. Причем арендаторов могут добавлять каждую пятницу, а перезагружать Nginx каждый раз — это не наш метод. Конфиги должны быть статичными, а вот список арендаторов — динамическим, живущим где-то в Redis или etcd.

Перейти к статье

Автоматизируем синхронизацию тест-кейсов в ТестОпс: больше никаких ручных обновлений

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров1.3K

Привет, Хабр! Меня зовут Вадим, я уже много лет в тестировании и сейчас работаю Head of QA в Альфа-Банке (Беларусь). За эти годы я успел поработать с десятками инструментов, написать сотни тест-кейсов и... потратить неприлично много времени на рутину, которую можно было автоматизировать ещё вчера.

Знаете, есть такая особенность нашей профессии - мы автоматизируем всё вокруг, но часто забываем автоматизировать собственную боль. Сегодня хочу поделиться решением одной из таких "болей", с которой сталкивается каждый QA-инженер, работающий с ТестОпс: необходимость вручную синхронизировать тест-кейсы после каждого прогона автотестов.

Читать далее

Ближайшие события

NE-Executable | Разбор деталей часть 1

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров1.2K

Формат "Новых исполняемых" файлов называют сегментным. Даже в официальной документации Microsoft её заголовок это "Сегментный Новый Исполняемый формат" (ориг. "Segmented NEW Executable Format").

Этот сегментный формат программ поддерживал

Сегментную модель памяти;

Защищенный режим Intel 286+

Динамичкую компановку (Dynamic Linking);

Управление ресурсами;

Возможность экспорта и импорта определенных процедур.

Читать далее

NE-Executable | Разбор деталей часть 1

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров693

Формат "Новых исполняемых" файлов называют сегментным. Даже в официальной документации Microsoft её заголовок это "Сегментный Новый Исполняемый формат" (ориг. "Segmented NEW Executable Format").

Этот сегментный формат программ поддерживал

Сегментную модель памяти;

Защищенный режим Intel 286+

Динамичкую компановку (Dynamic Linking);

Управление ресурсами;

Возможность экспорта и импорта определенных процедур.

Читать далее

ML Q & AI. Глава 9. Генеративные ИИ модели

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров1.1K

← Предыдущая глава | 

Какие существуют популярные категории глубоких генеративных моделей (также известных как генеративные ИИ) в области глубинного обучения, и какие у них недостатки?

Для создания различных форм информации, таких как изображения, видео, тексты и аудио, было разработано множество глубоких генеративных моделей. Кроме того, эти модели могут быть адаптированы для генерации данных, специфичных для конкретных областей, например, для моделирования органических молекул и белковых структур. В этой главе мы сначала рассмотрим определение генеративного моделирования, а затем подробно опишем каждый тип генеративной модели, оценив их сильные и слабые стороны.

Читать далее

Как 40 ведущих стартапов нашли своих соучредителей

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров480

Поиск подходящего соучредителя — один из самых важных и сложных этапов в построении компании. По словам Ноама Вассермана, автора книги "Дилемма основателя", "по оценкам, 65% стартапов терпят неудачу из-за конфликтов между соучредителями, поэтому поиск подходящего соучредителя крайне важен".

Читать далее...

ИИ и образование: как меняется школа и университет под влиянием технологий

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1.5K

А на дворе сейчас 2025 год, когда часто слышны новости о появления какой‑нибудь новой модели или обновления старой. Нейросети сегодня проникли во многие сферы (точнее пытаются это сделать): от бизнеса до медицины, от развлечений до повседневных бытовых устройств. Не всегда удачно, но какие‑то плюсы от этого все же есть.

Однако давайте сосредоточим внимание именно на образовательных учреждениях: школах, колледжах и вузах. Разберемся, какие перемены происходят там благодаря искусственному интеллекту, какие возможности открываются перед учениками, студентами и даже преподавателями, а также постараемся оценить, насколько эти изменения полезны или, напротив, несут потенциальные риски.

Я, конечно, тоже выскажусь по этому поводу, поделившись своими мыслями относительно плюсов и минусов происходящего процесса.

Принимайте устойчивое сидячее или лежачее положение — как вам удобнее, а я приступаю к своему рассказу.

Читать далее

NGC 6503 — Межгалактический страж Млечного пути

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров7.3K

NGC 6503 — карликовая спиральная галактика, едва ли заметная даже в довольно зоркие телескопы (её интегральный блеск равен 10,2m — не слишком ярко для любительского инструмента), расположена в созвездии Дракона. И это самая яркая галактика в огромном Драконе. Некоторым созвездиям повезло больше, но Дракону досталась карликовая галактика, которая по ряду причин получила неофициальные названия «Изолированная галактика», «Одинокая галактика» или даже «Галактика, затерянная в космосе». А остальные галактики в Драконе еще тусклее — совсем за пределами любительской оптики.

Пока астрономы располагали лишь наземными средствами изучения галактик, даже на самых лучших астрофотоснимках NGC 6503 являла собой продолговатое туманное пятнышко без детализации. Поэтому большого интереса «Одинокая галактика» долгое время не вызывала (а чего интересоваться-то, если всё равно ничего о ней не узнаешь...), хотя открыта она была более полутора веков назад — в 1854 году немецким астрономом Артуром фон Ауверсом.

Читать далее

Как убрать жёлтый оттенок у картинок, сгенерированных в ChatGPT

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров5.2K

Открытый в конце ноября 2022 года ChatGPT вскоре перестал быть сервисом только для создания текстов. Ещё 19 октября 2023 в платные тарифы добавили DALL·E 3. 8 августа 2024 года OpenAI расщедрилась: отныне можно было создавать до двух картинок в сутки на бесплатном тарифе ChatGPT. Важно, что это был просто союз с большой языковой моделью: БЯМ переводит нестройную человеческую просьбу в детальный бриф промпта для графического бэкэнда — генеративной нейросети на диффузионных декодерах.

25 марта компания OpenAI объявила, что отныне модель GPT-4o может генерировать картинки. БЯМ способна не только создать новое изображение с нуля по текстовому описанию, но и принять на входе другую картинку с текстовым промптом и сгенерировать что-то на этой основе. Теперь картинки рисовала не чистая диффузия, а авторегрессионный трансформер в связке с мощным декодером, качество поднялось, практическая польза резко выросла.

Почти сразу обнаружился огромный недостаток картинок от GPT-4o — лёгкий коричневый оттенок любых результатов, которому в разной степени были подвержены все результаты. Хотя проблема решается тривиально, сегодня существует целая экосистема платного софта для устранения этого эффекта.

Читать далее