Как стать автором
Обновить

Все потоки

Сначала показывать
Период
Уровень сложности

Как мы под Новый Год загрузили в PostgreSQL петабайт данных и что из этого вышло

Уровень сложностиСредний
Время на прочтение19 мин
Количество просмотров4.3K

Эта история началась с шутки на офисной кухне 10 декабря, но, как водится, у каждой приличной шутки, она вдруг стала интересной для воплощения, а в конце переросла в не самую технически простую реализацию с хождением по многочисленным граблям. 

А началось всё просто: пока все вокруг спорят как настраивать железо и тюнить операционные системы дабы выжать лишних TPS, мы решили проверить как отреагирует движок PostgreSQL если загрузить в него действительно большой объём данных. Например, давайте сделаем базу размером один петабайт и посмотрим как он это переживёт.

На дворе было 10 декабря, руководство поставило задачу сдать отчёт 20 января, до нового года оставалось меньше месяца, а в руках появился знакомый всем инженерам зуд.

Читать далее

Новости

Веб-разработка на ванильном HTML, CSS и JavaScript

Уровень сложностиСредний
Время на прочтение19 мин
Количество просмотров4.4K

В этой серии статей мы расскажем, как выполнять веб-разработку исключительно на ванильных технологиях. Ни инструментов, ни фреймворков, лишь HTML, CSS и JavaScript.

Современные фреймворки веб-разработки обладают мощными возможностями для быстрой разработки хорошо структурированных веб-приложений, поэтому они стоят изучения. Однако за эту богатую функциональность приходится расплачиваться сложностью фреймворков и инструментария, а для обеспечения безопасности и актуальности проектов часто требуется регулярная поддержка.

Выбрав ванильный стиль веб-разработки, мы обмениваем кратковременное удобство на такие долговременные преимущества, как простота и практически нулевая поддержка. Такой подход возможен благодаря современному уровню развития браузеров, обеспечивающих превосходную поддержку веб-стандартов.
Читать дальше →

MLечный путь 2025 — знания, опыт, коммьюнити. Как это было?

Время на прочтение12 мин
Количество просмотров2.7K

Привет, Хабр! 23 апреля мы провели в Петербурге митап для ML-специалистов. Спикеры обсудили запуск LLM в продакшен, оптимизацию GPU-инференса, а также Edge-решения для медицины и агросектора. Минимум теории — больше кейсов от Selectel, Cloud.ru, Celsus и Русагро.

Как подобрать инфраструктуру под LLM? Как контейнеризировать GPU в многоарендных средах? Как запускать ML на комбайне или медицинском поезде без интернета? На эти вопросы ответили в четырех докладах на MLлечном пути.

А еще мы организовали питч-сессию для стартапов. Пять проектов на стадии pre-MVP боролись за призовой фонд в 100 000 бонусов. Победителей выбирали сами зрители. В тексте рассказываем, как все было.
Читать дальше →

Любителям x86-64 assembler посвящается: DIY волокна в C++

Уровень сложностиСложный
Время на прочтение26 мин
Количество просмотров2.2K

Нас ждёт мозговыносящая смесь 64/32-битного ассемблера и старого-доброго C++. Мы сделаем собственную реализацию... Волокон (fibers) без вызова Win API и звонков в службу спасения.

Читать далее

За полчаса установил DeepSeek 1.5B, пока вы искали GPT подешевле

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров18K

DeepSeek 1.5B — маленький, но шустрый собрат больших языковых моделей. Работает локально, не требует железа на киловатт.

Внутри — инструкция по установке, настройке и запуску DeepSeek 1.5B на Ubuntu 24.04 с Ollama и Open WebUI.

Читать далее

Как отстроить гитару — акустическую или электро

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров3.2K


Привет, Хабр! Тем, кто играет на гитарах, часто встречаются «плохие» инструменты — неудобные для игры, некрасиво звучащие, труднонастраиваемые, не строящие и не держащие строй, создающие посторонние призвуки.

Причина значительной доли таких случаев состоит не в качестве изготовления, фурнитуры или древесины, а в том, что инструмент не отстроен подобающим образом, причём многие параметры не являются азбучными эталонами, а должны соответствовать предпочтениям и стилю игры конкретного музыканта.

Параметры отстройки гитары взаимозависимы: настраивая одно, можно расстроить другое. Сегодня я расскажу и покажу оптимальную последовательность действий, которая поможет не испортить свой инструмент и не потратить слишком много времени.
Дешевизна инструмента - не приговор

Сделали copilot-сервис для техподдержки и делимся секретами RAG c глубоким пониманием контекста

Время на прочтение21 мин
Количество просмотров3.1K

Сегодня мы запускаем Yandex Neurosupport — сервис, который генерирует умные подсказки для операторов контакт‑центра. Он выполняет функции второго пилота: нейросеть анализирует текстовые вопросы клиентов и предлагает оператору вариант ответа. В основе лежат облегчённые модели семейства YandexGPT, дообученные на инструкциях для операторов более чем 50 сервисов Яндекса. Cервис можно внедрить в свой интерфейс через Yandex Cloud по API или же развернуть в on‑premise‑окружении.

Технологическим ядром выступает RAG — звучит просто, но здесь не обошлось без добавления особой яндексовой магии. В этой статье вместе с ребятами из нашей команды ML B2B‑проектов, а также коллегами из команды базовой технологии, Yandex Cloud, «Маркета» и «Еды» расскажем подробнее, как вместе делали этот сервис и каких результатов достигли.

Читать далее

Альтернативы свинцовому аккумулятору ИБП

Время на прочтение6 мин
Количество просмотров7.8K

Как показывает практика, жизнь – лучший учитель. Бэкапы я начал делать после заражения вирусом KillFiles, удалившего мою курсовую за день до сдачи. Источник бесперебойного питания купил после того, как сосед с перфоратором внезапно попал на силовой кабель, в результате чего выбило автомат у всего подъезда, а я потерял полдня работы.

Но ничто не вечно под луной, и недавно у моего ИБП батарея устала навсегда. Превосходный повод попробовать заменить свинцовый аккумулятор на более современный литиевый или суперконденсатор. Заодно и сравним эти способы между собой.

Читать далее

Разбираем древо ArangoDB «по веточкам». Подробный гайд по графовой БД

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров933

Давайте честно: совместный доступ к документам — одна из главных «болей» для всех, кто хоть как-то связан с базами данных. Вроде бы оба пользователя могут работать с файлом, но есть один нюанс: например, количество предоставленных доступов может быть больше, чем их есть на самом деле. Или у документа и вовсе появляется несколько владельцев. Для всего этого требуется решение – и мы его нашли!

Меня зовут Владимир Ревякин, я старший инженер-программист компании «МойОфис», и вместе с QA-инженером Анной Рукавицыной мы подготовили этот материал, чтобы поделиться опытом реализации функции шаринга данных через графовую базу ArangoDB в рамках разработки платформы «Документы Онлайн». Если коротко — это продукт для совместной работы и хранения документов в рамках единой мультипродуктовой экосистемы.

В российских источниках не так много полезной информации по ArangoDB, и наша задача — исправить это недоразумение. Разберем главные нюансы работы с этой системой БД в разработке и тестировании, вспомним ее плюсы, минусы и потенциальные баги. Текст будет полезен как инженерам любых грейдов, которые связаны с работой над базами данных (сил вам...), так и классическим разработчикам продуктов.

Поехали!

Jellyfin Web на своём сервере. Фронтенд для медиастриминга

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров1.9K


Многие из нас первым медиасервером устанавливали Plex. Но это коммерческое решение. Некоторые считают, что в последних версиях он изменился к худшему: например, заставляет регистрировать аккаунт, логиниться через центральный веб-портал, передвигает пользовательский контент в подменю, рекламирует собственные продукты и сервисы, выкатывает ненужные функции.

Поэтому для медиасервера лучше выбрать опенсорсную программу, как Jellyfin.
Читать дальше →

Этот крошечный винт отвечает за будущее гуманоидных роботов

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров6.1K

Революция в области гуманоидной робототехники уже на пороге. Экспериментальные модели работают плечом к плечу с людьми на разных фабриках по всему миру, а разработчики ИИ создают новые фундаментальные архитектуры, чтобы роботы могли ориентироваться в пространстве так же, как человек.

Но каким бы ни был умным «мозг» такого робота, без «скелета» ему никуда. А этот скелет состоит из множества механических компонентов. Кроме подшипников, моторов и шестерёнок, в каждом гуманоиде должны стоять десятки (лучше — сотни) специальных винтов, которые превращают вращательное движение мотора в поступательное, позволяя пальцам двигаться, а ногам ходить.

Планетарные роликовые винты становятся ключевым (и очень дорогим) элементом следующего поколения роботов. Tesla хвастается новыми дизайнами, Китай спешит взять их производство под контроль, а большинство людей даже не знает, из-за чего весь сыр-бор. Борьба за выпуск улучшенных версий таких винтов может стать новой «гонкой чипов» текущего века. Кто создаст лучший винт — тот и будет контролировать следующих «терминаторов».

Читать далее

Автоматизация трехуровневой квартиры: хочу лучше, чем в Дубае

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров4.7K

Вдохновившись умным отелем в Дубае, молодая пара решила сделать себе квартиру не хуже. Выкупили два верхних этажа в новостройке, а затем террасу на крыше.

Из всего этого получился трехуровневый пентхаус — с двумя террасами, вторым светом, потолками под семь метров и желанием хозяев сделать «умным» все, что можно.

Проект занял полтора года, но результат стоил того. Умный дом управляет светом, климатом, шторами и даже маркизами на террасе. В статье расскажем о трехуровневой квартире и ее автоматизации.

Читать далее

Распределённый инференс и шардирование LLM. Часть 2: скрипт vLLM, Ray Serve для вывода API и настройка KubeRay Cluster

Уровень сложностиСложный
Время на прочтение14 мин
Количество просмотров953

Продолжаем пошагово разбираться с ответом на вопрос о том, как эффективно работать с передовыми LLM, используя доступное оборудование и распределённые вычисления. 

В первой части статьи мы подготовили всё необходимое для развёртывания распределённого инференса с Ray Serve и vLLM. Сегодня этим и займёмся. Мы напишем скрипт vLLM, используем Ray Serve, чтобы предоставить внешний HTTP API, а также настроим KubeRay Cluster и развернём в нём Gemma 3.

Вперёд!

Ближайшие события

Add-on pack из 90-х: Microsoft 95 Plus! для Windows

Время на прочтение6 мин
Количество просмотров2.3K

24 августа 1995 года вышла Windows 95 — операционная система, которая должна была стать одним из лидеров в домашнем и SOHO-сегменте. Она предлагала пользователям удобный графический интерфейс, поддержку многозадачности и функцию Plug&Play. Правда, работало это далеко не идеально: в народе технология получила ироничное прозвище Plug&Pray («подключи и молись»). Зато с архитектурной точки зрения это был серьезный шаг вперед — переход от 16-битных к 32-битным приложениям.

Как это часто бывает, к моменту релиза далеко не все запланированные функции были готовы. Разработчики стояли перед выбором: внедрить недоработанные фичи и рисковать стабильностью или отложить их на потом. В итоге дополнительные возможности решили выделить в отдельный коммерческий продукт. Так появилась первая версия Windows 95 Plus! — своеобразное дополнение к основной системе. О нем сегодня и расскажу.

Читать далее

Terraform уже не тот? Как Pulumi меняет правила игры в Infrastructure as Code

Время на прочтение6 мин
Количество просмотров2.3K

Привет, Хабр! Сегодня поговорим про инфраструктуру как код. Почему Terraform уже не единственный игрок в мире IaC, а Pulumi становится всё более актуальным. Я расскажу, как эти инструменты работают, чем отличаются, и почему стоит присмотреться к Pulumi, особенно, если вы хотите гибкости и мощи в управлении облаками.

Читать далее

IQ — во многом псевдонаучный обман

Уровень сложностиСредний
Время на прочтение16 мин
Количество просмотров3.7K

СПОР ЗАКРЫТ (2025) Спор теперь можно считать закрытым благодаря статье Брауна, Вая и Чабриса, которые пытались опровергнуть текст ниже, но вместо этого подтвердили все его выводы. Их статья — самая свежая на тему IQ, основанная на исследованиях нескольких групп людей, — невольно показала, что IQ почти ничего не объясняет: ни успехи в образовании, ни достижения в профессии, ни… доход! И это несмотря на всю круговую логику. Я не замечал эту статью до 2024 года.

Читать далее

Ортодоксальный косплеер решает задачу Перельмана про демографию, проезжая мимо Вудстока

Уровень сложностиСложный
Время на прочтение8 мин
Количество просмотров1.6K

В мире существует множество фундаментальных дискуссионных вопросов с двумя непримиримыми группами сторонников. Кто лучше: коты или собаки, Windows или Linux, физики или лирики?

Одним из таких вопросов является спор консерваторов и прогрессистов.
У консерваторов к прогрессистам есть стереотипная и связанная со временем претензия: «Ваше ”прекрасное” всегда далёко. А если и когда оно всё‑таки становится актуальной реальностью, то оказывается не таким уж прекрасным». Далее может идти заход с козырей в виде Чернобыля. Или наоборот, что‑нибудь для утончённых ценителей, вроде талидомидовой катастрофы.

Однако и к основному консервативному тезису — «раньше было лучше» — можно также сформулировать универсальную претензию, связанную со временем.
Очевидно, что «раньше» Земля была раскалённым шаром. На ней определённо не было «лучше». Всё то, что консерваторами считается «лучшим» появилось сравнительно недавно. Но в консервативной парадигме история делится на её бо́льшую часть, когда некой защищаемой консерваторами сущности ещё не было, и меньшую часть, когда эта сущность уже начала разлагаться и деградировать. А между этими временными отрезками есть бесконечно малый интервал времени, взятый исключительно по вкусу конкретного консерватора, который как раз и «был лучше».

В теории, очевидное замечание. Однако на практике даже те, кто себя считает скорее прогрессистами, зачастую склонны не видеть данной конструкции, когда беседа с консерватором заходит о чём‑либо конкретном.

«Сделать как было раньше»

Объяснение графических процессоров для тех, кто привык работать с ЦП

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров3.1K

За годы работы я подробно изучил, как центральные процессоры (CPU) выполняют код и как они устроены внутри. Дело в том, что я участвовал в разработке ядра Linux и ScyllaDB, а этот код очень близок к металлу. Я даже немного баловался с Verilog, безрезультатно попытавшись собрать моё собственное ядро RISC-V.

Графические процессоры (GPU) в отличие от обычных в основном оставались для меня чёрным ящиком, несмотря на то, что поработать с ними всё-таки довелось. Помню, что экспериментировал с NVIDIA RIVA 128 или чем-то подобным, проверяя, как там работает DirectX. Тогда такие процессоры ещё не выделялись на фоне ускорителей 3D-графики. Я также пытался идти в ногу со временем и немного упражнялся в программировании элементарных шейдеров на современных GPU. Но я никогда глубоко не вдавался в работу с GPU, и мои взгляды можно назвать CPU-центричными.

Однако, поскольку сегодня наблюдается всплеск рабочих нагрузок, связанных с ИИ, и, в частности, приходится работать с большими языковыми моделями (БЯМ), графические процессоры становятся незаменимыми для современных вычислений. К задачам, решаемым с применением ИИ, относятся масштабные прикладные тензорные операции, в том числе — сложение и перемножение матриц. А это уже работа для GPU. Но как современный GPU выполняет их, и насколько при этом возрастает эффективность по сравнению с выполнением таких же рабочих нагрузок на CPU?

Читать далее

Как декомпозиция повышает точность распознавания текста: опыт с фотографиями СТС

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров2.2K

Привет! Меня зовут Наталия Вареник, я DS-инженер в Авито, занимаюсь моделями распознавания изображений. Расскажу про один из наших проектов — пайплайн для распознавания номеров с фотографии свидетельства транспортного средства (СТС). В статье описала особенности задачи и рассказала, как мы решали её с помощью декомпозиции. 

Материал будет полезен начинающим и мидл-DS-инженерам, которые хотят узнать больше про декомпозицию задачи на этапах разметки и построения моделей. 

А еще материал стоит прочитать тем, кто работает с доменами, где нужно иметь дело с задачами распознавания информации с документов — наш подход прекрасно переносится на другие категории. В целом рекомендую статью всем, кто интересуется компьютерным зрением и его применимостью в разных сферах.

Читать далее

Как сделать улётную ИТ-конференцию: опыт программного директора CodeFest

Время на прочтение9 мин
Количество просмотров465

Всем привет! Меня зовут Денис Яковлев, я Technical Project Manager в Яндексе и программный директор ИТ-конференции CodeFest. В статье расскажу о том, что происходит под капотом подготовки ежегодной конфы на 2,5 тысячи айтишников.

Отвечу на вопросы: зачем я и вся команда в этом участвует, как попасть в программный комитет, как мы собираем программу, сколько заявок на доклад мы получили в этом году, какой был конкурс на один слот. А еще поделюсь тем, как увеличить шанс стать спикером конференции и почему вам отказали в этот раз. 

Читать далее