Статьи / Закладки / Профиль lightstorm / Хабр

Pankrashkin Vladimir @lightstorm^{read⁠-⁠only}

Software Engineer, Solution Architect

MLOps без мам, пап и GPT: как поднять сервер для AI за вечер

12 мин

4.1K

Блог компании SelectelИскусственный интеллектИнформационная безопасность * Серверное администрирование * IT-инфраструктура *

Туториал

Self-hosted в работе с ML — это база. Для работы с данными, особенно если они чувствительные, нужно собственное хранилище, а также ресурсы, на которых можно быстро и без очереди развернуть пайплайн. Часто в «джентльменский набор» ML-инженера входит: Jupyter Notebook, фреймворки Tensorflow и Keras, а также ускорители вроде XGBoost и LightGBM.

Самостоятельная установка компонентов и настройка рабочего окружения — нетривиальная задача. Нужно разбираться в Docker и принципах контейнеризации, а также следить за конфликтами версий и разбирать dependency hell. И, конечно, нужно настроить хранилище и соединение с сервером, а это задача не одного дня.

В этой инструкции делимся способом, как за несколько кликов поднять рабочее пространство на базе готового образа для ML и Data. Подробности под катом!

+35

tertiumnon 20 мар в 14:30

Минимум книг, которые нужно прочитать начинающему или продолжающему свою кривую обучения программисту

Простой

3 мин

75K

Программирование *

Обзор

Ниже небольшой список книг, которые лично я могу рекомендовать для чтения всем программистам, в том числе начинающим. Как это обычно бывает, что купил, то и продаю.

+56

chlorine 24 янв в 04:00

Горизонтальное масштабирование базы данных. Репликация. Партицирование. Шардирование

Простой

11 мин

22K

Программирование * Алгоритмы * Системное программирование * Анализ и проектирование систем * Базы данных *

Туториал

В современном мире данных нагрузка на базы данных стремительно растёт. Когда один сервер перестаёт справляться с объёмом запросов, встаёт вопрос о масштабировании: как эффективно распределить нагрузку, сохранив высокую производительность и доступность?

Существует множество стратегий решения указанной проблемы. Сегодня мы разберем самые популярные из них — репликацию, партициривание и шардирование. Рассмотрим их принципы, плюсы и минусы, а также лучшие практики применения. Понимание этих техник поможет разработчикам и архитекторам строить отказоустойчивые, масштабируемые и высокопроизводительные системы хранения данных.

+17

By_kosha 15 дек 2024 в 12:05

Сложное — просто: архитектуры ПО на жизненных примерах

Простой

7 мин

21K

Программирование * Микросервисы * DevOps * Управление разработкой * Проектирование и рефакторинг *

Обзор

Я недавно решила углубленно разобраться, какие архитектуры бывают в разработке ПО, и написать об этом простую статью. Это моя первая попытка поделиться своими мыслями и объяснить сложные вещи на понятном языке, поэтому буду рада вашей обратной связи

Здесь я рассказываю про монолиты, микросервисы и микрофронтенды без сложных терминов и технических деталей, чтобы те, кто только начинает разбираться в теме, могли понять, что к чему. Надеюсь, вам будет полезно и интересно. Поехали! 🚀

+19

Barseadar 9 окт 2024 в 14:00

RISC-V — звезда родилась: x86 не у дел, ARM сломала обе ноги

Средний

11 мин

66K

Блог компании СЕРВЕР МОЛЛПроизводство и разработка электроники * ПроцессорыКомпьютерное железо

Привет, постоянные и не очень читатели :)

Это снова я — с четвёртой статьей из цикла про архитектуры, процессоры и всё такое. Напомню, как всё было:

Part I: Скандальное разоблачение x86: ARM врывается с двух ног

Part II: Этой индустрии нужен новый герой: ARM врывается с двух ног

Part III: Китайский киднеппинг: похищение дочки

Part IV: RISC-V — звезда родилась: x86 не у дел, ARM сломала две ноги← ВЫ ЗДЕСЬ

Как по мне, сейчас идеальное время для четвёртой статьи из цикла — в процессорах и архитектурах всё скучно (со времён M1 ничего удивительного не было) + вашему покорному слуге нужно было убедиться, что сабж не помрёт, а расцветёт, как стронгилодон крупнокистевой.

Дропдаун

+67

207

digitalsibur 26 сен 2024 в 16:08

Основы Docker: контейнеризация, Dockerfile и Docker Compose. Часть 2

Средний

8 мин

14K

Блог компании Цифровой СИБУРJava * Kubernetes *

Туториал

Привет, Хабр! Меня зовут Толя, я лидер компетенции Java в Цифровом СИБУРе. Наш прошлый материал о Docker собрал классный фидбэк, поэтому мы решили развить тему и подготовить ещё несколько статей, двигаясь от простого к сложному.

В этом материале речь пойдёт о том, что помогает избежать конфликтов зависимостей и проблем с изоляцией, возникающих при запуске нескольких приложений на одном сервере. Для решения этих задач используются технологии контейнеризации, которые позволяют создавать изолированные окружения для приложений, устраняя проблемы совместимости и упрощая процесс развёртывания. Рассмотрим, как работает контейнеризация и какие инструменты помогают сделать её максимально эффективной.

+16

alechik 29 сен 2024 в 18:32

Бесплатная open-source альтернатива Google Photos и iCloud Photos

Простой

3 мин

59K

Open source * Управление медиа * Облачные сервисы * Лайфхаки для гиковХранение данных *

Из песочницы

Как-то мы лежали в кровати с нашим малышом и жена сказала, что фотографий и видео с ним стало больше и она не хочет использовать платное приложение. Примерно так начинается рассказ создателя Immich – бесплатного open-source решения для хранения фотографий и видео.

Надо сказать, в последние годы я тоже регулярно пытался найти бесплатную self-hosted альтернативу Google Photos и iCloud, однако до сегодняшнего дня функциональных и вместе с тем простых в настройке решений я не встречал. Тот же Nextcloud всегда казался чересчур громоздким. Immich же, напротив, сразу завоевал моё сердце, и вот, после нескольких недель его использования, с радостью делюсь своим рабочим примером.

+46

140

aibardash 26 сен 2024 в 07:00

Книги, которые стоит почитать ИТ-архитекторам. Часть 2

4 мин

20K

Блог компании МТСУчебный процесс в ITКарьера в IT-индустрииЧитальный зал

Привет, Хабр! Это Саша Бардаш, главный архитектор интеграционных платформ в МТС Диджитал. В прошлый раз я рассказывал о пяти книгах, которые стоит почитать начинающему ИТ-архитектору. Большое спасибо всем, кто читал. Были интересные комментарии на тему, какие еще книги почитать — кое-что из этого я добавил в свою новую подборку. Итак, под катом пять книг, которые будут интересны уже более опытным ИТ-архитекторам. Что ж, поехали!

+15

Sber 15 авг 2024 в 08:00

Правда ли, что Dubbo — это как gRPC, но из Китая?

Простой

8 мин

3.7K

Блог компании СберJava * Программирование *

Обзор

Всем привет! На связи Максим Чудновский и Александр Козлов, мы занимаемся развитием интеграционной платформы Synapse. Это сloud-native децентрализованная платформа для интеграции и оркестрации микросервисов, которая разрабатывается в СберТехе.

Сегодня есть множество протоколов, обеспечивающих эффективную коммуникацию между различными компонентами приложений и систем. Два ярких представителя таких технологий — Dubbo и gRPC, которые, по мнению некоторых экспертов, имеют поразительное сходство. Но действительно ли они так уж похожи?

Мы подготовили два материала на тему интеграционных фреймворков. В этой статье познакомим вас с Dubbo, вспомним про базовое устройство Service Mesh и покажем, как мы на Java обычно решаем вопросы интеграции в наших системах. Во второй статье соберём демоприложение на базе фреймворка Dubbo.

+28

lgorSL 4 авг 2024 в 14:12

Подборка игр с низкоуровневым программированием

Простой

5 мин

39K

Ненормальное программирование * Assembler * Программирование микроконтроллеров * Игры и игровые консоли

Обзор

TL;DR

Игры от Zachtronics:

TIS-100, EXAPUNKS, SHENZHEN I/O

Про создание процессора от логических элементов и до написания кода на ассемблере: браузерная бесплатная nandgame.com, более продвинутая Turing complete.

Если Вам нравится какая-то игра из перечисленных - наверно, и остальные тоже подойдут. В каждую из них я наиграл по 30+ часов, получил кучу удовольствия и научился чему-то новому.

Подробности

+79

smysol 7 авг 2024 в 06:15

Создание аналога Google Photos на собственном сервере

Простой

4 мин

42K

Big Data * Базы данных * Облачные сервисы * Серверное администрирование * Управление медиа *

Из песочницы

Создание собственного облачного хранилища с автоматическим менеджером фотографий.

Изучение опенсорс софта, нацеленного на автоматический менеджинг фотографий, сравнение софта между собой, установка на тестовый сервер, просмотр с разных устройств.

+27

crackidocky 21 июл 2024 в 10:42

Быстрый поиск по разной документации

Простой

2 мин

3.7K

macOS * Linux * Windows *

Туториал

Недавно я задался вопросом, могу ли я оптимизировать процесс поиска чего-либо в документации любого языка/библиотеки/фреймворка. Прыгать с сайта на сайт – не самая лучшая идея, ибо интерфейсы документацией отличаются, а я хотел унификации.

Сначала мне пришла мысль взглянуть на уже существующие решения, среди которых есть мною любимый Zeal, однако, он доступен только для Windows и Linux, я же крепко сижу в заложниках на MacOS из-за специфики работы и удобства.

На сайте Zeal предлагают перейти на сайт Dash, который по сути является прародителем Zeal, однако, он платный и за него невозможно заплатить в пределах РФ, поэтому я продолжил дальше искать аналоги.

Среди альтернатив также есть DevDocs, который может работать оффлайн в браузере (благодаря PWA), однако, я заметил, что все время держать открытой лишнюю вкладку для поиска в доках было не лучшей идеей (ибо вкладку все равно нужно было бы искать, среди тонны вкладок со StackOverflow и прочим).

Решение с быстрым поиском

В Firefox и Google Chrome есть возможность добавить собственную поисковую систему (или же поиск по сайту), чем собственно я и воспользовался. При поиске в devdocs все GET-запросы уходят по урлу:

vmityuklyaev 9 июл 2021 в 08:27

Масштабируем команду мобильной разработки: как мы в Ozon справились с ростом до 44 iOS, Android и QA на одном приложении

5 мин

5.3K

Блог компании Ozon TechРазработка мобильных приложений * Управление разработкой * Управление проектами * Управление персоналом *

Из песочницы

У нас в компании 8 мобильных приложений и почти столько же мобильных команд. Конкретно наша работает с приложением для покупателей. Когда нас было немного, по 6-10 человек в iOS, Android и QA–командах, мы отлично справлялись с задачами. С ростом столкнулись с проблемой: чем больше у тимлида людей в подчинении, тем меньше он может уделить времени каждому, меньше времени имеет на погружение в задачи. В итоге качество управления команд начинало ухудшаться и с этим нужно было что-то делать

Решение мы нашли в распределении команд по стримам.

В этой статье расскажу как у нас организована работа для 30+ мобильных разработчиков и 14 QA: как мы планируем, делимся знаниями и что нам даёт этот подход.

Как мы справились?

+10

andrey_stepanov1 31 мая 2024 в 09:19

Проектный менеджмент в бигтехе: как там все устроено, и почему во всем этом отсутствует Scrum

Средний

19 мин

11K

Блог компании fuse8Управление персоналом * Управление проектами * Управление разработкой *

Аналитика

Перевод

Если вам интересно, какие инструменты не любят инженеры в бигтехе, почему проджекты там скорее не нужны, для чего на самом деле Scrum, и как стоит подходить к ведению проектов, если есть цель вырастить хорошую инженерную культуру и регулярно добиваться необходимых компании результатов, залетайте под кат и давайте разбираться вместе!

TraPhro 29 мая 2024 в 08:16

Как изобрели современный искусственный интеллект. История изнутри

14 мин

12K

Венчурные инвестицииЧитальный залИскусственный интеллект

Из песочницы

Перевод

Они встретились, увлеклись одной идеей и написали статью, давшую старт, возможно, самому значительному технологическому прорыву в новейшей истории.

Как и многие научные открытия это произошло по счастливой случайности...

mrerberg 28 мая 2024 в 22:18

Что не так с техническими собеседованиями в IT?

Средний

15 мин

48K

Блог компании Альфа-БанкУправление персоналом * Карьера в IT-индустрииIT-компании

Из песочницы

Регулярно имею дело с собеседованиями: как прохожу, так и провожу их. Накопив опыт, решил поделиться мнением, что с техническими собеседованиями не так. Разберу частые ошибки собеседующих и расскажу как, а главное зачем можно улучшать процесс технических интервью.

+100

253

NatalieVT 24 мая 2024 в 07:18

Как устроен рекомендательный сервис, который выдерживает 700 тысяч запросов в секунду. Доклад Яндекса

11 мин

19K

Блог компании ЯндексВысоконагруженные системы * Анализ и проектирование систем * Машинное обучение *

«Баннерная крутилка» — один из самых высоконагруженных сервисов в Яндексе. Он умеет переживать 700 тысяч RPS, а иногда и больше. Каждый раз, когда приходит запрос, крутилка должна просмотреть базу из миллиарда документов и выбрать из них самые релевантные для пользователя. При этом выдерживаются весьма жесткие временные рамки: 99% всех запросов обрабатываются менее чем за 200 миллисекунд.

Какими принципами стоит руководствоваться при построении подобных высоконагруженных систем? Как устроены стадии отбора документов? Какое участие в ранжировании принимает ML? Обо всём этом на недавнем мероприятии для разработчиков в Ереване рассказал Артём Ваншулин, руководитель разработки ранжирования в команде баннерной системы. Сегодня мы делимся с сообществом текстовой версией его доклада. Передаём ему слово.

+36

Ullaes 23 мая 2024 в 09:00

Быстрее, выше, сильнее: оптимизируем Spring-контекст для тестов

Средний

22 мин

11K

Блог компании Т-БанкJava *

Всем привет! Я Юнес, SDET в Тинькофф. Помогаю автоматизаторам создавать более эффективные и надежные тесты, готовить тестовые данные и настраивать CI/CD-пайплайны.

Расскажу о доступных способах оптимизации Spring-контекста для тестов. Будет здорово, если у вас есть знания о Spring Framework и опыт написания тестов: тогда мы будем на одной волне. Давайте разберемся в хитросплетениях аннотаций и конфигураций вместе под катом!

bstan 17 мая 2024 в 11:19

Личное планирование. Именно «личное»

Средний

12 мин

21K

Блог компании Яндекс ПрактикумУправление проектами * Agile * Управление продуктом * Карьера в IT-индустрии

Туториал

Я нашел свою систему «Личного планирования», о чем я поделился в этой статье и передаю этот опыт студентам курсов по менеджменту в Практикуме.

В этой статье расскажу:

— Зачем начинать планирование в начале дня,
— Почему нужно ограничивать количество задач и блокировать время для их выполнения,
— Какие приложения помогают отслеживать продуктивность,
— Зачем подводить итоги дня и анализировать свою эффективность.

Какие практики можно использовать?

+21

PatientZero 26 апр 2024 в 08:15

Как Figma удалось открыть себе путь к почти бесконечному масштабированию баз данных

Средний

17 мин

12K

Веб-разработка * Базы данных * Хранение данных *

Обзор

Перевод

О нашем девятимесячном пути к горизонтальному шардингу Postgres-стека Figma и о возможности обеспечения (почти) бесконечной масштабируемости.

Вертикальное разбиение было относительно простым и важным инструментом масштабирования, позволившим нам быстро добиться существенных улучшений. Кроме того, оно стало важным этапом на пути к горизонтальному шардингу.

С 2020 года стек баз данных Figma вырос почти в сотню раз. Это хорошая проблема, ведь она означает, что наш бизнес расширяется. Но в то же время она стала причиной технических сложностей. В течение последних четырёх лет мы усиленно старались не отставать от прогресса и избегать потенциальных проблем, связанных с ростом. В 2020 году у нас работала единственная база данных Postgres, которая хостилась на самом большом физическом инстансе AWS, но к концу 2022 года мы уже создали распределённую архитектуру с кэшированием, репликами для чтения и десятком вертикально разделённых баз данных. Мы разбили группы связанных таблиц (например, «Figma files» или «Organizations») на отдельные вертикальные разделы, что позволило нам обеспечить удобство инкрементального масштабирования и оставить достаточно пространства для дальнейшего роста.

+22

2 3 4