Все потоки
Поиск
Написать публикацию
Обновить

Разработка

Сначала показывать
Порог рейтинга
Уровень сложности

Декодирование IR сигнала с TV (или исследование пультовых лучей)

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров65

В этом тексте я написал про то как подключить к микроконтроллеру инфракрасный приёмник.

Как просто и легко распознавать сигнал с TV пульта.

Читать далее

Новости

Что будет, если заставить ИИ-агента работать с тысячами API

Время на прочтение4 мин
Количество просмотров20

Вы когда-нибудь задумывались, как ИИ-агента научить сразу работать с тысячами разных API? В обычной жизни всё просто — приложение вызывает одну-две привычные функции, а тут задача куда масштабнее: собрать из разрозненных инструментов настоящий швейцарский нож, который не теряется в сложных цепочках вызовов и правильно управляет аргументами, даже если сценарии усложняются. Команда ByteDance решила попробовать — «а что если научить ИИ действовать в среде, где инструментов не просто много, а очень много, и всё это в единой логике?» Получился AgentScaler: агент, который тренируется сразу в тысячах мини-миров, учится планировать, исправлять ошибки на ходу и удивительно бодро справляется даже с нестандартными задачами. 

О том, как устроена эта вселенная для ИИ, как там моделируют работу инструментов и почему такой подход кардинально меняет обучение агентов — в новом разборе.

Читать далее

Как вероятность 1 к 73 000 000 стала приговором для матери двух младенцев: дело Салли Кларк

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров1.1K

Ноябрьским вечером 1999 года присяжные собрались произнести вердикт в зале Честерского суда. На скамье подсудимых – 35-летняя адвокат из Чешира по имени Салли Кларк, мать двоих умерших младенцев. За окном холодно, а внутри – мёртвая тишина. Только что эксперт-педиатр сэр Рой Мидоу спокойно сообщил ошеломляющую цифру: вероятность того, что две здоровые дети из одной благополучной семьи скончались естественной смертью, равна «примерно одному шансу из 73 миллионов». Присяжные переглянулись: такое случается реже, чем раз в столетие. Казалось, сама статистика шепчет обвинение. Через несколько часов Салли услышит слово «виновна» – и звук захлопывающейся тюремной двери на долгие годы.

Два трагических случая легли в основу процесса. В декабре 1996 года первый сын Салли, 11-недельный Кристофер, внезапно перестал дышать в своей колыбели. Врачи назвали причиной «синдром внезапной детской смерти» (СВДС), то есть непредсказуемая гибель младенца без видимых причин. Горе молодых родителей не укладывалось в голове, но они старались жить дальше. Спустя год, в январе 1998-го, случилось немыслимое: умер второй сын, 8-недельный Гарри, тоже внезапно, во сне. Два случая СВДС в одной семье – статистическая редкость. Полиция, получив сигнал от патологоанатома, заподозрила худшее. Салли и её мужа арестовали по обвинению в убийстве младенцев, хотя ни прямых улик, ни мотива, ни признаков насилия не находили. Отца вскоре отпустили, а вот мать предали суду: против неё играла сама невероятность двух несчастий подряд.

Читать далее

AI-компаньон для профориентации на хакатоне

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров85

Кейс «AI-компаньон для профориентации» — как команда на AI Product Hack 2025 создавала персонализированного бот-ассистента для выбора будущей профессии. Рассказываем, как прошёл хакатон: какой стек использовали разработчики, как архитектура Telegram-бота помогает школьникам, студентам и взрослым найти подходящую специальность и образовательный маршрут, какие трудности ребята прошли на пути к MVP. Интеграция ML-ядра, векторные базы и гибкие диалоги — всё, чтобы сделать выбор профессии проще и прозрачнее.

Читать далее

Собираем персональные данные правильно: рекомендации DPO

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров196

Законодательство в области персональных данных активно меняется, а институт согласий на обработку ПДн серьезно трансформируется. Согласия теперь должны оформляться отдельно от других документов, а управлять ими скоро в полной мере будет возможно через Госуслуги.

Меня зовут Никита Козин. Я – Data Protection Officer в БФТ-Холдинге, отвечаю за организацию обработки ПДн более 3000 сотрудников. В статье я делюсь разбором основных нюансов, возникающих при взятии согласий на обработку ПДн.

Дать согласие на чтение статьи

Состояние HTTP-клиентов в Spring

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров426

В новом переводе от команды Spring АйО команда Spring делает важное объявление — RestTemplate уходит в прошлое. С выходом Spring Framework 7.0 разработчики официально заявляют о плане поэтапного прекращения поддержки одного из самых популярных HTTP-клиентов в экосистеме. Его место занимает RestClient, современный fluent-клиент с расширенными возможностями: API-версионирование, гибкая конфигурация конвертеров, группы HTTP-интерфейсов и новый тестовый клиент RestTestClient.

Кроме того, в Spring Boot 4.0 появятся отдельные стартеры для каждого типа клиента, а RestClient теперь можно удобно переиспользовать с уже существующей инфраструктурой RestTemplate.

Читать далее

Ускоряем CLI-утилиты с помощью io_uring

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров433

Привет, Хабр! Уже давненько вокруг ходит тема про io_uring — новую высокопроизводительную модель асинхронного I/O в Linux. В теории это обещает минимальные системные вызовы и очереди отправки/завершения, но как это в деле работает с привычными утилитами? Я решил разобраться на примере типичной задачи – копирования файлов (и немного упомянем хеширование) – переписав её под liburing и сравнив с традиционной синхронной версией.

Узнать все детали эксперимента

Пять ошибок при тестировании времени распознавания документов, которые отравляют жизнь нашим QA-инженерам

Время на прочтение5 мин
Количество просмотров127

Продукты класса ContentCapture работают с большими объемами документов, и для бизнеса критична скорость их обработки. Но как убедиться, что система не замедлится после выхода очередного релиза? Здесь на помощь приходит тестирование: QA-инженеры регулярно проводят замеры скорости распознавания — например, при обновлении технологии или запуском нового проекта.

Казалось бы, все просто: автоматизируешь тесты, замеряешь время — и получаешь объективные метрики для оптимизации. Но на практике даже идеальная автоматизация не спасает от неожиданных сценариев.

В этой статье — пять коварных ошибок, которые чаще всего искажают результаты тестов. Некоторые настолько распространены, что мы научились распознавать их еще до того, как клиент закончит жаловаться.

Читать далее

Изучаем Python: модуль random для начинающих с практическим домашним заданием

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров578

Разбираем модуль random в Python. Начнем с основ: почему его случайность на самом деле предсказуема и как random.seed() дает нам полный контроль над хаосом. Затем пройдемся по главным инструментам: от randint и shuffle до choices с весами.
А в конце — самое интересное. Вас ждет практикум на GitHub. Пять задач на закрепление материала, от генератора паролей до симулятора лутбокса, с полностью автоматической проверкой вашего кода через GitHub Actions. Заходите, чтобы проверить свои силы!

Читать далее

Оптимизация декодера изображений для 6502 с 70 минут до одной

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров520

Когда я решил написать программу для простой цифровой фотосъёмки на Apple II, то думал использовать камеры Quicktake. Выбор казался очевидным, потому что это были камеры Apple, способный подключаться к компьютеру через последовательный порт.

Объём задачи немного расширился, когда мне удалось декодировать фотографии Quicktake 100: захотелось научиться декодировать фотографии Quicktake 150 и Quicktake 200. Из-за этого пришлось погрузиться в тему обработки изображений глубже, чем мне хотелось изначально. В этой статье я расскажу о том, как мне удалось заставить работать декодер Quicktake 150 с достаточно приемлемой скоростью на процессоре 6502 с частотой 1 МГц.

Формат Quicktake 150 проприетарный и не имеет документации, однако в проекте dcraw существуют свободные программные декодеры. Они стали моим фундаментом для создания первого декодера на Apple II. К сожалению, они написаны на C, крайне плохо задокументированы и чрезвычайно непонятны (для меня). Сжатие выполняется при помощи кода Хаффмана с переменной длиной (то есть используется битовый сдвиг), а для воссоздания изображения требуется большой объём 16-битных вычислений. Со всем этим 6502 справляется плохо.

Но для начала мне нужно было переписать исходный алгоритм так, чтобы он работал с полосами по 20 пикселей (из-за ограничений памяти). Я написал функциональный декодер, и он работал идеально, но... для декодирования одной фотографии требовалось семьдесят минут.

Читать далее

Нейросеть на службе бизнеса: от отзыва до инсайтов

Время на прочтение6 мин
Количество просмотров148

эпоху цифровизации каждый клиентский отзыв — это больше, чем просто слова. Это ценный актив, содержащий информацию о настроениях, скрытых проблемах и возможностях для роста. Однако, как бизнесу эффективно обрабатывать тысячи таких сообщений? Решение лежит в области искусственного интеллекта. Сегодня мы разберёмся, как нейросеть трансформирует эмоциональный комментарий в структурированные данные, которые можно интегрировать в бизнес-процессы для принятия решений.


От текста к числам: язык, понятный машине


Прежде чем нейросеть сможет «понять» отзыв, его нужно перевести на её язык. Этот процесс называется токенизацией и векторизацией. Люди читают слова, а машины работают с числами.


Наш первый шаг — это предобработка данных. Представьте, что вы очищаете сырой алмаз от лишней породы, чтобы увидеть его истинный блеск. В мире NLP (обработки естественного языка) это означает:


Приведение к нижнему регистру: «Очень» и «очень» — это одно и то же слово для нашей модели.

Удаление «шума»: Местоимения, предлоги, союзы (и, в, на) — так называемые стоп-слова — часто не несут эмоциональной окраски. Их удаление помогает модели сфокусироваться на действительно значимых словах-маркерах.

Удаление пунктуации и спецсимволов: Запятые, восклицательные знаки и смайлики важны для человека, но для базового анализа могут быть избыточными.


После очистки мы преобразуем слова в числовой формат. Один из самых популярных методов — TF-IDF (Term Frequency–Inverse Document Frequency). Этот алгоритм не просто подсчитывает, сколько раз слово встречается в отзыве (TF), но и оценивает его важность (IDF). Слово, которое часто встречается в одном отзыве, но редко в тысячах других (например, «медленная» в негативном комментарии о доставке), получает высокий вес. Это позволяет выделить уникальные и значимые характеристики каждого отзыва.

Читать далее

Динамические телефонные номера для отслеживания рекламных креативов: как построить систему на Yii2 и МТС Exolve

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров181

Привет, Хабр! Одна из ключевых задач performance-маркетинга — понять, какая реклама реально приводит клиентов. Для кликов есть Яндекс.Метрика, но когда одно из целевых действий — звонок, анализировать источники сложнее, а значит и понять какой креатив работает лучше.

Использование динамических виртуальных номеров позволяет сопоставить звонки с конкретным рекламным источником. Для каждого визита система подставляет уникальный номер телефона и фиксирует обращение. Когда клиент звонит, мы связываем его звонок с конкретной рекламой.

Читать далее

Оптимизация ремонта грузовых вагонов: от мирового опыта к российской практике

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров618

Привет, Хабр! Я Максим Катрушенко, главный специалист по анализу данных и машинному обучению в ПГК Диджитал. В своей статье расскажу, как мы разработали систему оптимизации распределения вагонов на ремонт для одного из крупнейших железнодорожных операторов России Первой грузовой компании (ПГК). Внедрили методологию оценки экономического эффекта через сравнение с "идеальным сценарием". За два с половиной года работы система обработала рекомендации для более чем 50,000 вагонов.

Читать далее

Ближайшие события

Категории типов. Часть 3. Естественные преобразования

Уровень сложностиСложный
Время на прочтение10 мин
Количество просмотров308

Это третья часть обзора и она всё также вводная)). В первой было рассказано о категориях типов, а во второй — о категории подкатегорий типов с её морфизмами-функторами. В этот же раз нам предстоит разобраться, как эти самые функторы взаимодействуют между собой.

Читать далее

2000 лет без ответа: математики создали универсальный метод перечислительной геометрии

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров955

В III веке до н. э. Аполлоний из Перги задался задачей: сколько окружностей можно построить так, чтобы каждая из них касалась трёх данных окружностей ровно в одной точке. Оказалось, что таких окружностей восемь, но доказать это удалось лишь спустя почти 1800 лет.

Читать далее

GitOps в Linux: бесперебойное управление инфраструктурой на основе Git

Время на прочтение4 мин
Количество просмотров816

Представь мир, где каждый сервер, приложение и сетевая конфигурация тщательно оркестрируются через Git, где обновления, аудиты и восстановления происходят с помощью одного коммита. Эти и другие возможности открывает GitOps. Особенно мощно он проявляет себя в сочетании с универсальностью Linux-систем. Как же преобразить управление инфраструктурой Linux? И каким образом с помощью Git добиться ясности, контроля и уверенности в каждом изменении?

Читать далее

Кейс: разработать квест-мастера на нейронке

Уровень сложностиСредний
Время на прочтение47 мин
Количество просмотров207

Инженерия подсказок, как и все, что связано с нейросетями, для непогруженного человека может показаться чем-то раздутым и незначительным. Нет, ну серьезно. Что трудного попросить ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ сочинить стишок или рассказать популярно что такое "Эпистемологический анархизм". Но на деле все действительно оказывается слишком, слишком, слишком нетривиально. Расскажу на примере пустяковой задачки: "Разработать ИИ-агента квест-мастера, который генерит загадки и отслеживает ее угадываемость".

Доп.цель:
добиться исполнения логики именно на стороне нейросети, используя только ее базовые параметры, используя только бесплатные или самые дешевые модели, с задействованием минимально необходимого бекенда.

Оглавление:
X1. Прототипирование. Достижение задуманного 65%. Отсутствие стабильности.
X2. Теория. Основные принципы предсказуемости.
X3. Прототип 2.0. Применение теории использования примеров и структурирования промта на практике и влияение на результат.
X4. Применение и теории, и практики для стабильного результата.

Читать далее

Что такое DevOps и почему он автоматизировал не всё

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров1.9K

Вы сделали заказ в интернет-магазине, а он внезапно завис в самый разгар скидок. За кулисами этого сервиса работают сотни строк кода и ещё больше человеческой поддержки. DevOps — это  способ организовать эту работу так, чтобы новые функции доходили до вас быстрее и без сбоев. Он объединяет разработчиков, тестировщиков и операторов, автоматизируя рутинные шаги и следя за сервисом в режиме реального времени. Звучит хорошо, но на практике автоматизация закрывает далеко не всё.

В статье рассмотрим, что за зверь такой DevOps. Когда работает, а когда спотыкается и где автоматизация работает, а где нужна платформа и процессы. Даже если вы не айтишник — переходите под кат.

Читать далее

Наследие цифрового детства: как код, написанный студентом 5 лет назад, живёт в инфраструктуре сегодня

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров993

Мы все сталкивались с этим: открываешь репозиторий, а там код, который вроде бы работает, но при ближайшем рассмотрении вызывает лёгкую дрожь в руках. В этой статье я хочу поговорить о том, как «студенческий» код, написанный в спешке или ради эксперимента, неожиданно становится частью продакшн-систем. Разберём примеры, посмотрим, как такие артефакты выживают, какие последствия это несёт, и что с этим можно сделать, чтобы не жить на пороховой бочке.

Читать далее

Как Google оценивает контент: скрытые метрики поискового доверия

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров158

Всем привет! Меня зовут Андрей Попов, я SEO-специалист в AGIMA. В 2025 году работа с поисковыми системами кардинально изменилась: Google и ИИ-ассистенты вроде Алисы, Gemini или Chat GPT всё чаще не просто ищут страницы по ключам, а сами «понимают» смысл контента и выдают пользователю готовый ответ.

И вот что самое интересное: решения о том, какой контент попадает в эту выдачу, принимаются не только по релевантности или ссылкам. Всё чаще Google опирается на скрытые метрики доверия — внутренние сигналы, которые оценивают не просто текст, а репутацию источника, авторитет автора, надежность бренда и даже «пограничность» самой темы.

Для SEO-специалиста это меняет правила игры. Недостаточно просто писать статьи и оптимизировать метатеги — нужно работать с невидимым слоем: формировать доверие, закреплять сущности и регулярно подтверждать экспертность.

Читать далее
1
23 ...