Как стать автором
Обновить
124
47.4

Редактор

Отправить сообщение

Model Serving в 9 раз быстрее! И никакой замены оборудования

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров619

Обучение ML-модели — это только первый шаг к решению бизнес-задачи. Далее необходимо создать эффективный механизм для развертывания модели в производственной среде и разработать serving-стратегию, которая сможет масштабироваться в соответствии с текущим спросом.

В этой статье мы рассмотрим различные model serving стратегии и узнаем о технологиях, способных значительно повысить их эффективность. Мы рассмотрим три варианта организации model serving системы и сравним их производительность. Наша реализация будет ориентирована на инференс с помощью ЦП, но те же самые концепции могут быть применены и к ГП, поскольку предлагаемые здесь технологии (ONNX Runtime) поддерживают различные аппаратные платформы, включая графические и нейропроцессоры.

Читать далее

Хорошая девушка LoRA! А чем же она хороша?

Время на прочтение10 мин
Количество просмотров1.3K

Поговорим об методике дообучения LLM… спортсменке, комсомолке и просто красавице - LoRA, которая если и не снимается в кино, то может сделать фильмы качественней и интереснее для зрителя. Исторические данные проката и состава творческих групп в перспективе позволяют работать с ансамблевыми моделями машинного обучения для прогнозирования сборов и просмотров в кино, и улучшать данные и путем их подбора «гиперпараметров» фильма.  Но для работы со смыслами, идеями и описаниями кинопроектов нужна более эффективная методика, позволяющая оценивать творческий замысел и основные идеи хотя бы на уровне аннотации – краткого синопсиса.  И здесь уже не обойтись без больших языковых моделей.

Читать далее

Создаём свой Telegram-клон с помощью Next.js и TailwindCSS — Часть 1

Уровень сложностиПростой
Время на прочтение51 мин
Количество просмотров4.5K

Разработка чат-приложения с нуля может показаться довольно сложной задачей. Но при наличии правильных инструментов все становится намного проще, чем вы думаете.

В этой серии из трех частей мы подробно рассмотрим процесс создания клона веб-версии Telegram с использованием Next.js, TailwindCSS и Stream SDK. В первой части мы настроим все необходимые инструменты для нашего проекта, добавим аутентификацию и создадим макет приложения с помощью TailwindCSS.

Читать далее

ZLinq — Zero-Allocation LINQ-библиотека для.NET

Уровень сложностиСложный
Время на прочтение20 мин
Количество просмотров4.9K

В прошлом месяце я зарелизил ZLinq v1 — революционную LINQ-библиотеку, которая достигает zero allocation на структурах и дженериках. Она может похвастаться такими расширениями, как LINQ to Span, LINQ to SIMD, LINQ to Tree (FileSystem, JSON, GameObject и т.д.), drop-in replacement Source Generator для произвольных типов, поддержкой нескольких платформ, включая .NET Standard 2.0, Unity и Godot и на данный момент ZLinq имеет более 2000 звезд на GitHub.

Читать далее

Оценка ценовой эластичности спроса продуктов с помощью байесовского иерархического моделирования

Уровень сложностиСложный
Время на прочтение33 мин
Количество просмотров798

В этой статье я хочу познакомить вас с байесовским иерархическим моделированием — гибким подходом, который автоматически объединяет результаты нескольких подмоделей. Этот метод позволяет оценивать эффекты на индивидуальном уровне путем оптимального объединения информации из различных групп данных с помощью байесовского вывода. Это особенно полезно, когда данные наблюдений для некоторых объектов ограничены, но эти объекты имеют общие характеристики или поведение с другими объектами.

Читать далее

Какую архитектуру данных мне выбрать? — Подход Data-инженера. Часть 2

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров2.3K

Какую архитектуру данных выбрать, когда на горизонте — Data Warehouse, Data Lake, Lakehouse и Mesh, а проект требует гибкости, отчетности и масштабируемости? В этой статье — практический разбор подходов с позиций data-инженера. Рассматриваем плюсы и ограничения каждого варианта, углубляемся в архитектуры Инмона, Кимбалла, Data Vault и медальонную модель, а также разбираемся, где граница между аналитическими целями и технической реализацией.

Читать далее

54 открытых урока июня: от ML до микросервисов

Время на прочтение3 мин
Количество просмотров2.9K

Все уроки бесплатны и проводятся онлайн — участие доступно каждому. Выбирайте интересную вам тему и записывайтесь по ссылкам ниже.

Читать далее

Руководство для Unity-разработчика: Модульное тестирование

Уровень сложностиПростой
Время на прочтение17 мин
Количество просмотров1.4K

Давайте будем честны: как Unity-разработчики, мы все пишем код, который может содержать ошибки. Это касается и меня, и вас, и даже искусственного интеллекта.

Многие разработчики программного обеспечения считают модульное (или unit) тестирование важнейшим инструментом для раннего выявления и предотвращения регрессий. Но действительно ли оно эффективно в контексте разработки Unity-проектов?

В этой статье я поделюсь с вами нашим опытом внедрения тестов в Virtual Maker. Мы рассмотрим разницу между модульными, интеграционными и сквозными тестами, а также обсудим, почему вам не следует (по моему мнению) прибегать к последним в ваших проектах.

Читать далее

RAG‑агент для автоматизации инцидент‑менеджмента

Время на прочтение20 мин
Количество просмотров4.1K

Современные крупные организации сталкиваются с большим числом ИТ‑инцидентов — счет может идти на тысячи в месяц. Инциденты нередко повторяются со временем, однако найти похожий случай в базе знаний или в системе регистрации инцидентов непросто: стандартный поиск по ключевым словам часто неэффективен, а «держать в голове» детали всех инцидентов невозможно.

Читать далее

Какую архитектуру данных мне выбрать? — Подход Data-инженера. Часть 1

Уровень сложностиПростой
Время на прочтение16 мин
Количество просмотров4.7K

Выбор архитектуры данных — это не просто техническое решение, а стратегический шаг, от которого зависит эффективность работы с данными во всей компании. Data Warehouse, Data Lake, Lakehouse или Data Mesh — у каждого подхода есть свои сильные и слабые стороны, и не существует универсального ответа. В этой статье — прагматичный разбор современных архитектур с точки зрения дата-инженера с акцентом на реальные кейсы. Если вы стоите перед выбором или хотите убедиться, что двигаетесь в правильном направлении — разложим всё по полочкам.

Читать далее

Хотите писать без ошибок? Узнайте, как Java обрабатывает кодировки

Время на прочтение5 мин
Количество просмотров1.2K

Многие наверняка сталкивались с ситуацией, когда при открытии файла в текстовом редакторе (например, Word) вместо ожидаемого текста появляется хаотичный набор символов: или «кракозябры». Такое происходит, когда программа неправильно определяет кодировку файла — набор правил, по которым символы преобразуются в двоичный код.

Каждый формат файла (TXT, DOCX, PDF и другие) имеет свою структуру и использует определённую кодировку для хранения данных. Если приложение неверно интерпретирует эти правила, текст становится нечитаемым.

Читать далее

Аналитика во Flutter-приложениях: Какие события отслеживать, примеры архитектур и настройка Firebase

Уровень сложностиСредний
Время на прочтение18 мин
Количество просмотров844

Вы выпускаете Flutter-приложение и уверены в его качестве — но знаете ли вы, как им действительно пользуются люди? Где они отваливаются, какие функции игнорируют, а какие вызывают восторг? Без правильно выстроенной аналитики всё это остаётся догадками. В этой статье — не просто про Firebase и Mixpanel, а о том, как построить гибкую, масштабируемую архитектуру аналитики, которая не развалится с ростом проекта. Включая типобезопасность, поддержку нескольких вендоров и раздельные режимы для продакшна и разработки.

Читать далее

JSON vs бинарные форматы: почему Kafka выбирает скорость?

Время на прочтение7 мин
Количество просмотров7.2K

В современных распределенных системах, где компоненты могут быть реализованы на разных языках программирования, возникает необходимость в эффективной коммуникации между ними. Брокеры сообщений играют ключевую роль в этом процессе, обеспечивая асинхронную передачу данных и снижая зависимость между модулями. Однако для бесперебойного взаимодействия критически важно выбрать наиболее универсальный формат обмена информацией. Ведь важно понять, что и как мы будем передавать, и тут есть несколько вариантов.

Читать далее

Всё, что вам нужно знать о Feign-клиентах в Spring Boot: Что под капотом, настройка, использование, функции

Уровень сложностиСредний
Время на прочтение25 мин
Количество просмотров4.8K

Чтобы сделать вызовы REST API проще и декларативнее, Spring Boot предлагает встроенную интеграцию с Feign‑клиентами. Feign представляет собой HTTP‑клиент, который позволяет разработчикам определять REST‑эндпоинты с помощью интерфейсов Java. Вместо того чтобы писать дублирующийся код для обработки HTTP‑запросов, мы можем определять эндпоинты и их поведение в наглядной и лаконичной форме.

В этой статье мы подробно рассмотрим технические аспекты работы Feign‑клиентов в Spring Boot. Вы узнаете, как их настраивать, как под капотом обрабатываются запросы, ответы и ошибки.

Читать далее

Управление качеством данных в 1С: Как бизнес-аналитику обеспечить доверие к аналитике

Время на прочтение7 мин
Количество просмотров1.1K

Качество данных становится одним из ключевых факторов успеха в любой автоматизации, особенно когда речь идет о таких системах, как 1С. Ошибки в данных могут привести к серьезным проблемам, включая финансовые потери и замедление роста бизнеса. В этой статье мы рассмотрим подходы и инструменты, которые бизнес-аналитики могут использовать для обеспечения доверия к данным, а также роль, которую они играют в процессе управления качеством данных в системе 1С.

Читать далее

Kotlin Multiplatform: как писать код один раз и покорить все платформы

Время на прочтение5 мин
Количество просмотров3.3K

Kotlin Multiplatform — это подход, который позволяет делить до 80% кода между Android, iOS, backend и вебом, не жертвуя нативностью. В статье — без лишнего пафоса о том, как устроена архитектура KMP, чем она отличается от Flutter и React Native, как работает сборка, где границы общего и платформенного кода и почему это решение подходит командам, стремящимся к эффективности без компромиссов.

Читать далее

Разбираемся с MEV и Priority Fee в Solana: влияние на экономику и перспективы на будущее

Уровень сложностиСредний
Время на прочтение17 мин
Количество просмотров924

Solana — одна из самых производительных блокчейн-сетей, но по мере роста её экосистемы экономическая модель сталкивается с новыми вызовами. В статье разбираем, как работают Priority Fee и MEV в Solana, зачем они нужны, как влияют на валидаторов, пользователей и устойчивость сети в целом. Показываем реальные цифры, архитектурные особенности и ключевые риски, включая централизацию, перегрузку и манипуляции с транзакциями.

Читать далее

40 открытых уроков мая: куда движется мир IT в 2025 году

Время на прочтение3 мин
Количество просмотров6.5K

Весна — хорошее время обновить взгляд на технологии и практики, которые действительно работают. Мы собрали для вас подборку открытых уроков мая: без воды, с фокусом на развитие практических навыков в ИИ, разработке и архитектуре, инфраструктуре и DevOps, а также управлении IT-продуктами.

Все уроки бесплатны и проводятся онлайн — участие доступно каждому. Выбирайте интересную вам тему и записывайтесь по ссылкам ниже.

Читать далее

Трёхмерное моделирование в КОМПАС 3D в разных сферах деятельности

Время на прочтение2 мин
Количество просмотров3.8K

Сегодня я расскажу вам о том, что такое трехмерное моделирование, его применение. Данная статья в первую очередь будет полезна тем, кто только краем уха слышал, что такое трехмерное моделирование или только пробует свои возможности в этом. Поэтому попытаюсь объяснить максимально просто.

Сам я инженер-конструктор и уже более 6 лет работаю с трехмерным пространством, поработал во многих различных программах различного класса, а также во многих отраслях. Благодаря работе во многих сферах накопился определенный опыт, которым я хотел бы с вами поделиться.

Читать далее

Дайджест апреля: 30 лучших статей месяца

Время на прочтение6 мин
Количество просмотров802

Привет, Хабр. В этом дайджесте — лучшие статьи в нашем блоге за уходящий месяц. Это материалы, которые заинтересовали хабровчан больше всего: от эффективного управления техническим долгом и безопасности контейнеров до DIY-проектов и полезных советов для разработчиков. Читайте, внедряйте лучшие практики и совершенствуйте свои навыки с актуальными и востребованными темами!

Читать далее
1
23 ...

Информация

В рейтинге
154-й
Откуда
Россия
Работает в
Зарегистрирован
Активность