Обновить

Разработка

Сначала показывать
Порог рейтинга
Уровень сложности

Построение E2E-решения для прогнозирования временных рядов на примере метеоданных

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров607

Привет, Хабр!

Четыре года назад, еще в институте, одним из моих первых серьезных проектов была простая LSTM-модель для прогноза погоды. Недавно, пересматривая старые наработки, я задался вопросом: насколько дальше можно зайти, применив накопленный за эти годы опыт и современные инженерные практики?

Эта статья — история такого "рефакторинга длиною в 4 года". Это рассказ о том, как простой академический проект был переосмыслен и превращен в полноценное End-to-End (E2E) решение. Цель — не просто снова предсказать погоду, а на практическом примере продемонстрировать системный подход к построению ML-пайплайна с нуля.

В статье рассматриваются все ключевые этапы: от разработки отказоустойчивого веб-скрапера до проведения сравнительного анализа трех разнородных моделей прогнозирования:

Читать далее

Panther Lake: как Intel объединяет мощность и энергоэффективность в одном чипе

Время на прочтение5 мин
Количество просмотров2.6K

Производителям чипов приходится постоянно решать одну и ту же задачу — находить баланс между скоростью и энергоэффективностью. Intel, судя по последним анонсам, попыталась сделать это в серии Panther Lake. В ней компания собрала воедино успешные элементы предыдущих проектов. Так что Panther Lake становится своего рода мостом, соединяющим сегменты рынка, где раньше приходилось выбирать между экономией батареи и скоростью вычислений. И подходят чипы буквально для всего — от тонких ультрабуков до более требовательных систем. Что ж, поехали разбираться!

Читать далее

Как мы в Авито сделали свою LLM — A-vibe

Уровень сложностиСредний
Время на прочтение18 мин
Количество просмотров10K

Всем привет! Меня зовут Анастасия Рысьмятова, я руковожу юнитом LLM в Авито.
В этой статье я расскажу, как мы с командой создали и адаптировали нашу большую языковую модель A-vibe: зачем решили развивать собственную LLM, как построили токенизатор, собрали датасеты, провели SFT и RL и что получили в итоге. Поделюсь основными экспериментами и покажу наши результаты.

Читать далее

Айсберг регистрации товарного знака: что упускает быстрый поиск и вскрывает полноценная проверка

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров465

Бесплатная проверка товарного знака за 5 минут не даёт полную картину. Когда (и как?) можно проверить самому и когда нужен специалист — чтобы не потерять бюджеты на 10 месяцев продвижения бренда и вынужденный ребрендинг.

Читать далее

PSO в Unreal Engine 5: практическая стратегия борьбы со статтерами

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров1.4K

В сообществе Epic в последнее время активно обсуждают статтеты, вызванные компиляцией шейдеров, и их влияние на геймдев-проекты.

В этой статье разберёмся, почему возникает это явление, объясним, как предкэширование PSO помогает его устранить, а также поделимся практиками разработки, которые позволят минимизировать статтеры. Также расскажем о планах по развитию системы предкэширования PSO.

Читать разбор

Банковский спектакль KYC и AML

Уровень сложностиПростой
Время на прочтение16 мин
Количество просмотров6.7K

Многие люди смутно представляют, что у финансовых институтов есть обязанность соблюдать Know Your Customer (KYC) и иметь программы AML (anti-moneylaundering), но что это означает на самом деле? Рад, что вы спросили.

С ними всё… сложно и запутанно, из-за чего у многих (внутри и вне этой отрасли) сложилось ошибочное впечатление об их уровнях широты и строгости. Кроме того, они достигают своих целей не самым очевидным образом, во многих отношениях нарушая наши ожидания о том, как работают законы в целом.

Обсуждать выбор политик без комментариев невозможно, поэтому для начала я должен дать некоторые объяснения. Когда-то я работал в Stripe, и, разумеется, проходил обязательное обучение комплаенсу. В статье я буду говорить только от своего лица и откровенно расскажу, какой не может быть культура отделов комплаенса и по каким причинам.

Читать далее

Краткая история машинного зрения: как инженеры научили компьютер переводить изображения из 2D в 3D

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров2.2K

Еще на заре создания машинного зрения возникло желание превратить изображение на фотографии из плоского двумерного в объемное трехмерное, тем более что для классической фотографии на пленке, пластике или бумаге уже давно были изобретены стереоскопы и демонстрировались стереофильмы.

Пионером в этой области стал инженер-электронщик Лоуренс (Ларри) Робертс из Лаборатории Линкольна Массачусетского технологического института. Потом он перешел на работу в Агентство перспективных оборонных исследовательских проектов МО США, где стал руководителем программы ARPANET и ныне входит в почетный список «пионеров Интернета». Но в его альма-матер, MIT, Ларри Робертса упрямо называют «отцом компьютерного зрения», потому что именно у них он в июне 1963 года защитил диссертацию на степень PhD по теме «Машинное восприятие трёхмерных тел».

Читать далее

Клиентское кэширование в Angie

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров861

Один из самых простых способов ускорить работу сайтов и снизить нагрузку на инфраструктуру — корректно использовать клиентское кэширование. Механизм одновременно и простой, и сложный. В этой статье посмотрим, как можно управлять клиентским кэшированием в веб‑сервере Angie.

Читать далее

Почему слова мешают ИИ-агентам понимать друг друга

Время на прочтение5 мин
Количество просмотров1.2K

ИИ-агенты становятся все умнее и сообразительнее, но почему, когда собирается команда из агентов, возникает неразбериха и неожиданные ошибки? Если агенты уже умеют рассуждать индивидуально, почему они продолжают спорить по простым вопросам и ошибаться там, где не споткнулся бы человек?

Новое исследование подсказывает неожиданный ответ: проблемы командной работы ИИ могут исходить не только от интеллекта модели, но и от языка, используемого для общения между собой. Оказывается, язык является узким горлышком, из-за которого сообщения теряют часть смысла, что затрудняет понимание ИИ друг друга. Исследование предполагает радикально иное решение: что, если бы ИИ делились своими мыслями напрямую, используя язык, отличный от человеческого?

Далее мы обсудим, почему текстовое общение не позволяет ИИ понять друг друга, как другой язык может помочь и почему этот «язык мыслей» не фантастика, а реальность, которую мы можем реализовать сегодня.

Читать далее

Азарт против алгоритма: почему онлайн-казино не играет в кости со вселенной

Время на прочтение5 мин
Количество просмотров4.5K

С азартными играми люди начинают сталкиваться с самого раннего детства. Мы кидаем монету, чтобы выяснить, кто прав, тянем жребий, чтобы определить, кто будет в той или иной команде. Такие действия подчеркивают элемент случайности в наших решениях. В процессе взросления появляется желание что-то получить от выигрыша: дать щелбан своему противнику или получить от него деньги.

Читать далее

Полезные фишки iCloud, Google Drive и Яндекс Диска, о которых многие не знают

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров19K

Облачные хранилища стали настолько привычными, что большинство из нас использует их тупо на автопилоте – для хранения фотографий или бэкапов. Из-за этого, кстати, часть функций, которые есть в облаках, для многих остаются в тайне. А ведь внутри этих сервисов спрятаны возможности, способные реально изменить подход к работе с данными.

Читать далее

Времени нет учиться новому, но хочется уволиться? Старт в геймдев. Давай разберёмся по-человечески?

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров7.9K

КУРС ПОЛНОСТЬЮ БЕСПЛАТНЫЙ. Я НИЧЕГО НЕ ПРОДАЮ, НЕ ГОТОВЛЮ ПЛАТНЫЕ ПРОДОЛЖЕНИЯ И НЕ ПРОШУ ДЕНЕГ!

ВСЕ ФАЙЛЫ ПРОЕКТА МОЖНО СКАЧАТЬ БЕСПЛАТНО, БЕЗ ПОДПИСОК, БЕЗ ДОНАТОВ, БЕЗ УСЛОВИЙ. Я ПРОСТО ДЕЛЮСЬ СВОИМ ОПЫТОМ — ЧЕСТНО, ПО-ЧЕЛОВЕЧЕСКИ, ТАК, КАК МНЕ САМОМУ ХОТЕЛОСЬ, ЧТОБЫ КТО-ТО ОБЪЯСНИЛ В НАЧАЛЕ ПУТИ.

НЕТ НИКАКИХ СКРЫТЫХ КУРСОВ, "ПРОДОЛЖЕНИЙ ЗА ПЛАТУ" И МАРКЕТИНГА. ЭТО ОБУЧЕНИЕ ДЛЯ ТЕХ, КОМУ ПРОСТО ХОЧЕТСЯ НАУЧИТЬСЯ, БЕЗ ВОДЫ И ЛОВУШЕК. ЕСЛИ ХОТИТЕ — УЧИТЕСЬ, ЕСЛИ НЕТ — ПРОСТО ПРОЙДИТЕ МИМО.

Я НЕ “ИНФОЦЫГАН”, А РАЗРАБОТЧИК, КОТОРЫЙ РЕШИЛСЯ ПОДЕЛИТЬСЯ ЗНАНИЯМИ, ЧТОБЫ ДРУГИМ БЫЛО ЛЕГЧЕ НАЧАТЬ. Я НИКОМУ НИЧЕМ НЕ ОБЯЗАН, Я С ВАС НИЧЕГО НЕ БЕРУ, ЧТОБЫ ВЫ МНЕ УМНИЧАЛИ В КОММЕНТАРИЯХ.

Читать далее

Мультиплексор, дешифратор… где великий комбинатор?

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров6.3K

Когда я создавал первые электрические цепи в 3D-симуляторе, то часто думал: как же происходит переход из «живого мира» бесконечных вариантов значений в «компьютерный мир» нулей, единиц и вообще всего, для чего набор значений и их изменчивость строго ограничены? В этой статье я продолжу осваивать курс по схемотехнике, и, судя по темам лекций, ответ мне откроется. Вперед, к комбинационной логике!

Читать далее

Ближайшие события

Я протестировал все AI браузеры. ChatGPT Atlas — далеко не топ, и вот почему

Уровень сложностиПростой
Время на прочтение16 мин
Количество просмотров9.4K

Я протестировал все доступные для скачивания AI браузеры, чтобы это не пришлось делать вам: ChatGPT Atlas, Comet, Fellou, Genspark, Dia, Brave, Яндекс Браузер, Edge. Рассказываю про каждый из них — про плюсы, минусы и фишки, — а процесс тестирования приложен на видео, чтобы вы все видели своими глазами.

Читать далее

Полное руководство по HTTP-кэшированию. Часть 2

Уровень сложностиСредний
Время на прочтение21 мин
Количество просмотров3.1K

Кэширование — скрытый двигатель, на котором держится веб. Именно оно делает сайты быстрыми, надежными и относительно недорогими в обслуживании. При правильной настройке кэширование снижает задержки, разгружает серверы и позволяет даже хрупкой инфраструктуре выдерживать резкие всплески трафика. При неправильной настройке или полном отсутствии кэширования сайты работают медленно, остаются уязвимыми для атак и обходятся очень дорого.

В основе кэширования лежит сокращение лишней работы. Каждый раз, когда браузер, CDN или прокси обращается к серверу за ресурсом, который не изменился, впустую тратятся время и трафик. Когда сервер заново формирует или повторно отдает идентичный контент, это лишь добавляет нагрузки и увеличивает затраты. А при пиковом трафике — например, в "черную пятницу", во время вирусной публикации или DDoS-атаки — такие ошибки стремительно накапливаются и приводят к сбоям всей системы.

Читать далее

Как порядок в CRM повышает эффективность клиентских процессов

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров257

Привет, Хабр!

Меня зовут Сергей Соловьёв, я руководитель отдела методологии в компании BPMSoft. Мы являемся разработчиком одноименной CRM-системы на базе low-code платформы со встроенными ИИ-инструментами. По версии Фонда Сколково и аналитического центра TAdviser, а также консалтинговой компании «Технологии доверия» – лучшей на российском рынке в 2024 году. В этой статье я расскажу, как мы управляем данными в собственной CRM и как это повышает эффективность бизнес-процессов.

Как появляется хаос

Разные подразделения компании работают с разными данными. Бухгалтерии важны название юридического лица и банковские реквизиты, отделу продаж — история взаимодействия с ним и потенциал кросс-продаж. При этом информация в CRM не всегда вносится корректно, что затрудняет поиск и работу с карточками клиентов. В результате данные оказываются фрагментированными и разрозненными: одному контрагенту нередко могут соответствовать две разные карточки.

Дубли контрагентов приводят к организационным проблемам. Если в CRM заведены две карточки одного клиента, разные менеджеры могут вести с ним параллельные переговоры, даже не подозревая об этом.

Проблема становится критичной по мере роста бизнеса и увеличения числа ошибок, связанных с некорректным ведением данных. Когда такие ситуации приобретают массовый характер, компании осознают необходимость системного управления. Однако на ранних этапах этому, как правило, не придают значения — в фокусе остается выбор и использование решений для автоматизации продаж и маркетинга. Чтобы эти процессы автоматизации работали точно, как швейцарские часы, нужно уделить внимание порядку в данных, от которого напрямую зависит эффективность использования новых систем и решений.

Читать далее

Недельный геймдев: #249 — 26 октября, 2025

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1.4K

Из новостей: EA и Stability AI объявили о партнёрстве, Valve поломала рынок CS2, Escape from Duckov продалась тиражом более миллиона копий, Krafton внедряют ИИ во все поля.

Из интересностей: путь от Pathologic 2 к The Lift занял 10 лет, внутриигровые достижения могут сократить медианный плейтайм вашей игры, эйджизм в геймдеве.

Читать далее

Внедрение автоматизированного AppSec конвейера за пару дней без смс и регистрации

Время на прочтение10 мин
Количество просмотров771

Работоспособность любого приложения может быть подвержена угрозам: от сбоев в работе до кражи персональных данных. С этими рисками следует работать через регулярные и комплексные проверки кода на уязвимости, которые должны быть полностью автоматизированными. 

Несмотря на то, что тема актуальная, в интернете до сих пор сложно найти практические примеры, которые бы позволили построить независимый конвейер, не привязанный к системе контроля версий.

Меня зовут Алексей Исламов, я администратор СИБ в Точка Банк. В статье предлагаю готовый вариант реализации такой системы из open‑source инструментов, которым может воспользоваться каждый.

Читать далее

Где туристы из будущего?

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров15K

28 июня 2009 года легендарный астрофизик Стивен Хокинг провёл вечеринку для путешественников во времени с шампанским и шариками. Он никому не сообщил заранее, а только постфактум, с указанием точного времени и места встречи.

Идея была в том, что приглашение переживет столетия/тысячелетия, необходимые для разработки технологии — а затем попадёт на глаза какому-то путешественнику во времени, который любит вечеринки.

К сожалению, это не помогло: на вечеринку всё равно никто не пришёл. Стивен Хокинг сидел там в одиночестве.

Читать далее

Яндекс обновляет процесс найма разработчиков. Рассказываю, почему мы пошли на такой шаг

Время на прочтение9 мин
Количество просмотров43K

Всем привет! Меня зовут Олег Смоляков, в Яндексе я больше 15 лет занимался разработкой, а теперь отвечаю за улучшение процесса найма разработчиков.

Наверняка многие из вас слышали мнения, что у нас много собеседований, их содержание непрозрачно, сам процесс очень долгий, а сверху всё сдобрено задачами на алгоритмы, которые у многих вызывают аллергию. Не буду лукавить: это восприятие не появилось из ниоткуда, и здесь действительно зарыто некоторое количество реальных проблем, о которых я в деталях расскажу дальше.

TLDR: мы решили обновить процесс найма, вместо порой хаотичных собеседований в каждом отдельном сервисе внедряем единую систему оценки по профессии и уровню (например, «Senior C++ Developer»), кандидат, успешно прошедший оценку навыков, теперь сможет претендовать на аналогичные вакансии в любом из 90+ сервисов компании, а всё это вместе делает процесс найма прозрачным, понятным, без дублирования технических интервью и в целом эффективным для всех участников.

А теперь подробнее о том, почему мы на это пошли и как всё устроено.

Читать далее