Open source *

Открытое программное обеспечение

Microsoft Edit: легкий текстовый редактор с открытым кодом для Windows

4 мин

Microsoft удивила ИТ-сообщество, возродив текстовый редактор Edit — впервые он появился в MS-DOS 5.0 в 1991 году. Edit предлагает простоту, открытый исходный код и возможности, сравнимые с Linux-редакторами вроде vim. Давайте разбираться, что такое Edit, зачем Microsoft его вернула и почему он может стать находкой для разработчиков.

+53

dimoffon 28 мая в 10:28

Резервирование кластера Greengage DB (на базе Greenplum OSS)

Средний

14 мин

1.4K

Блог компании GreengageOpen source * Высоконагруженные системы * Распределённые системы * PostgreSQL *

Туториал

Greengage DB — это массивно-параллельная реляционная СУБД на базе Greenplum OSS, которая подходит для хранения и обработки данных. Позволяет выполнять сложные аналитические запросы над большими объёмами данных, предоставляя к ним гетерогенный доступ за счёт различного рода коннекторов и средств интеграции.

Но помимо функциональных возможностей, есть и ряд других необходимых вещей, таких как мониторинг, аудит, резервирование и пр. Они требуются для обеспечения полноценной и надёжной работы системы, особенно если речь идёт о промышленной эксплуатации. В рамках данной статьи как раз хочется обсудить подход к резервированию кластера Greengage: какие тут есть возможности, каковы подводные камни и многое другое.

+18

ploshkin 28 мая в 09:00

Исследователи Яндекса выложили Yambda — один из крупнейших в мире датасетов для развития рекомендательных систем

7 мин

17K

Блог компании ЯндексМашинное обучение * Искусственный интеллектИсследования и прогнозы в IT * Open source *

Привет! Меня зовут Александр Плошкин, я руковожу группой развития качества персонализации в Яндексе. Сегодня мы открываем доступ к одному из крупнейших рекомендательных датасетов — Yambda. Он содержит 4,79 миллиардов обезличенных пользовательских действий, собранных за 10 месяцев использования сервиса Яндекс Музыка.

Мы выбрали Яндекс Музыку, потому что это крупнейший подписной стриминговый сервис в России, которым в среднем в месяц пользуются 28 миллионов людей. Существенная часть датасета — агрегированные прослушивания, лайки, дизлайки, а также некоторые характеристики треков, полученные из системы персональных рекомендаций «Моя волна». Все данные о пользователях и треках анонимизированы: датасет содержит исключительно числовые идентификаторы, что обеспечивает конфиденциальность.

Рекомендательные алгоритмы помогают людям находить нужные товары, фильмы, музыку и многое другое — именно они лежат в основе сервисов: от интернет‑магазинов до онлайн‑кинотеатров. Развитие этих алгоритмов напрямую зависит от научных исследований, для которых нужны качественные и объёмные датасеты. При этом опенсорс‑датасеты чаще всего невелики по размеру или уже устарели, так как коммерческие компании, которые накапливают терабайты данных, редко их публикуют.

Публикация больших открытых датасетов наподобие Yambda помогает решить эту проблему. Доступ к качественным большим данным открывает новые возможности для научных исследований и привлекает к области внимание молодых учёных, заинтересованных в применении машинного обучения для решения актуальных задач.

В этой статье я расскажу, из чего состоит датасет, как мы его собирали и как вы можете использовать его для оценки новых рекомендательных алгоритмов.

+46

yadowit 28 мая в 02:38

У Линукс нет перспектив в качестве операционной системы для десктопа

Простой

7 мин

68K

Open source * СофтОперационные системы

Мнение

Судя по результатам которых достиг GNU/Linux за более чем 30 лет своего существования, перспективы на на домашних компьютерах и ноутбуках (десктопе) у него отсутствуют, и вызвано это сразу несколькими причинами.

+10

1164

DanilTreshchev 27 мая в 12:45

Как работать с CAPY

Средний

16 мин

Блог компании Т-БанкOpen source * Виртуализация * DevOps * Kubernetes *

Туториал

Привет, Хабр! Я Данил Трещев, работаю в T-Банке в команде Spirit Compute, которая отвечает за runtime-инфраструктуру. Сегодня я хочу рассказать, как работать с Cluster API Provider Yandex (CAPY). Мы разработали собственное решение, которое позволяет разворачивать k8s-кластеры в инфраструктуре Yandex Cloud.

Разберем, как развернуть Management Cluster и Workload Cluster с помощью инструментов управления кластерами. Материал подходит для обучения и тестирования. Итоговое окружение не будет готово к продакшену — для этого понадобятся дополнительные настройки безопасности и отказоустойчивости.

Добро пожаловать под кат все, кому интересно познакомиться с темой!

+15

krakenkaken 27 мая в 12:26

Повышаем качество документации с помощью LLM

Простой

9 мин

5.2K

Блог компании GramaxПодготовка технической документации * Контент и копирайтинг * Искусственный интеллектOpen source *

Обзор

Привет, Хабр! Меня зовут Катя, я лидирую Gramax, open source-платформу для управления технической документацией.

О Gramax мы писали ранее тут. В этой статье расскажу о Gramax Check — сервисе для автоматических проверок текста на базе LLM. По сути — нашей версии «Главреда», но с настраиваемыми правилами.

Интересно, давай!

+11

randall 26 мая в 13:28

Почта в терминале: олдскульные и необычные email-клиенты

Простой

4 мин

Блог компании MWSБлог компании МТССерверное администрирование * Open source * Облачные сервисы *

Обзор

Облачная корпоративная почта предлагает сразу несколько сервисов в одном решении. В то же время традиционные почтовые клиенты редко удивляют функциональностью, если только вы не собираетесь работать с почтой в формате plain text.

Сегодня мы расскажем об инструментах для работы с электронной почтой в текстовом интерфейсе, а также о других полезных функциях — для ценителей Vim и любителей маркировать свои письма.

+10

21_copilots 26 мая в 12:21

Я устал править за нейросетью — теперь пишу промпты по-другому

Простой

9 мин

36K

Блог компании MinervasoftOpen source * Искусственный интеллектМашинное обучение * Ненормальное программирование *

Аналитика

Устал от багов нейросети. Решил разобраться в алгоритмах ИИ-галлюцинаций, как они влияют на работу, и в конце оставил гайд с рекомендациями по написанию промптов для генерации кода, текста и изображений.

+10

Bright_Translate 25 мая в 09:01

Собираем умные часы: выбор микросхемы

Средний

6 мин

8.5K

Блог компании RUVDS.comDIY или Сделай самOpen source * Программирование микроконтроллеров * Производство и разработка электроники *

Кейс

Перевод

Полный видеоролик по этой статье есть на моём YouTube-канале.

Это первая статья в серии, описывающей все этапы создания умных часов. Здесь я хочу показать, что в 2025 году не так уж сложно самому собрать достаточно неплохую модель. Хочется, чтобы наш проект по созданию обновлённых часов помог создавать их и другим желающим.

Читать дальше →

+59

ZergsLaw 23 мая в 20:59

Это не баг — это фича: как мы начали писать свою open-source альтернативу Buf, потому что нас заблокировали

4 мин

7.2K

Open source *

Сезон Open source

Решил я ворваться тоже в “Сезон Open Source”, но как обычно в стиле «🐢» а не вот эти вот ваши молнии.

+27

AmneziaAdept 23 мая в 17:41

Атака клонов или темная сторона Open Source

6 мин

10K

Блог компании Amnezia VPNOpen source * Сетевые технологии * Информационная безопасность *

Сезон Open source

В далёкой-далёкой стране под названием «Open Source»...

Когда-то мы просто хотели сделать VPN, который можно будет легко развернуть на своем сервере, без сбора логов, централизации и слежки. В 2020 году, на хакатоне Demhack, организованном цифровыми правозащитниками из Роскомсвободы, родилась идея создать VPN-сервис, который станет независимым и неуязвимым к блокировкам. Так появился Amnezia VPN – бесплатное open-source решение, позволяющее каждому настроить VPN на собственном сервере с использованием различных протоколов, например, OpenVPN, WireGuard, Shadowsocks, IKEv2 или OpenVPN over Cloak, как надежда на свободный и неуязвимый интернет. Чуть позже мы сделали еще клиент AmneziaWG, о нем расскажем ниже. И как любой хороший повстанческий корабль, он был построен не корпорацией, а маленькой командой инженеров и активистов – с использованием открытого кода, под свободной лицензией.

Тогда мы еще не предполагали, что спустя пару лет в галактике появится дюжина клонов, выдающих себя за нас.

+62

dimonomid 23 мая в 09:08

Nerdlog: быстрый TUI-просмотрщик логов с удаленных хостов, с таймлайном, без сервера

Простой

17 мин

2.7K

Open source *

Кейс

(Или как я написал радикально простую альтернативу Graylog)

В 2022 году я и моя команда работали над сервисом, который выводил довольно большой объём логов с распределённого кластера из 20+ хостов — всего около 2–3 миллионов сообщений в час. Мы тогда использовали Graylog, и запрос логов за последний час выполнялся за 1–3 секунды — довольно быстро. Однако, инженеры по инфраструктуре хотели избавиться от Graylog — он требовал от них утомительного обслуживания, и в итоге было принято решение перейти на Splunk. Когда Splunk наконец внедрили, мне пришлось с удивлением обнаружить, что он работает невероятно, возмутительно медленно. Тот же запрос выполнялся не за секунды, а за минуты. В чем там было дело, и можно ли это улучшить - никто разбираться не хотел.

Мне это показалось абсурдным. 2–3 миллиона логов в час — это не так уж и много, и мне казалось, что с помощью старых добрых GNU утилит и обычных лог-файлов, без какого-либо централизованного сервера для логов, можно добиться примерно такой же скорости, как у Graylog (и по крайней мере, гораздо быстрее, чем Splunk), и этого было бы достаточно для большинства наших задач.

Так и начался проект: я не мог перестать об этом думать, взял отпуск на неделю и устроил себе личный хакатон, чтобы написать прототип: просмотрщик логов с простым но удобным TUI интерфейсом, включающим таймлайн-гистограмму. Он подключался к хостам по SSH и анализировал обычные лог-файлы с помощью GNU-утилит bash + tail + head + awk.

+24

kubk 22 мая в 19:10

Почему я исправляю баги бесплатно и как это изменило мою карьеру

Простой

6 мин

15K

GitHub * JavaScript * TypeScript * Open source * Программирование *

Ретроспектива

Сезон Open source

8 лет назад я исправил опечатку в чужом репозитории, а сейчас регулярно делаю коммиты в проекты, которые использую, и даже вошел в core team библиотеки с 27000 звёзд на GitHub

В этой статье покажу, что участие в Open Source проще, чем кажется. Расскажу, как регулярная работа с чужим кодом помогает быстрее разбираться в незнакомых кодовых базах, писать тесты и лучше документировать решения. А также объясню, почему публичная активность на GitHub выгодно отличает вас от других разработчиков, особенно в эпоху повсеместного использования ИИ.

+88

iSergeyAlekseev 22 мая в 09:30

Выкрутили автоматизацию на максимум: с чем кроме инвентаризации помог переход на NetBox

11 мин

15K

Блог компании К2ТехOpen source * Информационная безопасность * Облачные сервисы * Сетевые технологии *

Привет, Хабр! На связи команда K2 Cloud — ведущий сетевой инженер Сергей Алексеев и инженер-разработчик Александр Гнатюк.

Мы расскажем о нашем пути к инвентаризации и автоматизации огромной сети ЦОД, каких результатов достигли усилиями сетевых инженеров службы эксплуатации и разработки. Надеемся, что этот опыт будет полезен тем, кто хочет автоматизировать свою работу и сделать инфраструктуру прозрачнее.

+36

PatientZero 21 мая в 09:08

Как делать видеоигры в 2025 году (без движка)

9 мин

22K

Open source * Программирование * C# * Игры и игровые консолиРазработка игр *

Обзор

Перевод

На дворе 2025 год, а я всё ещё продолжаю делать видеоигры. Если верить archive.org, я начал заниматься этим двадцать лет назад! Достаточно долгий срок для одного увлечения...

Когда я рассказываю о том, над чем работаю, люди часто спрашивают меня, как я делаю игры, и их часто удивляет (а иногда и тревожит?), когда я говорю, что не пользуюсь коммерческими игровыми движками. Существует какой-то стереотип, что если ты делаешь игры не в популярном инструменте наподобие Unity или Unreal, это значит, что ты чуть ли не вручную пишешь ассемблерный код.

Я искренне считаю, что создание игр без огромного «многофункционального» движка может быть проще и интереснее, а часто и позволяет оптимальнее тратить вычислительные ресурсы. Я не делаю игру, в которой «есть всё», поэтому мне не нужны 90% фич, предоставляемых движками. Все мои игры обладают конкретным стилем и у меня есть конкретные способы работы с моими инструментами. Часто оказывается так, что используемым по умолчанию реализациям фич в крупных движках наподобие Unity не хватает столь многого, что мне всё равно приходится писать их самостоятельно. В конечном итоге, мои проекты по большей мере оказываются моими собственными инструментами и системами, а движок становится необходим лишь для создания удобного UI и части рендеринга...

Тут можно задаться вопросом, а зачем вообще использовать движок? Что он даёт? Зачем я позволяю инструменту потенциально препятствовать моей работе, когда его владельцы внезапно принимают неэтичные и ужасные бизнес-решения? Или выпускают обновление, которое требуется для запуска моей игры на консолях, но ломает всю систему в игре, заставляя переписывать её? Зачем я ежедневно борюсь с этим для работы с движком, пока я постепенно заменяю все его стандартные системы и он постепенно становится только загрузчиком ресурсов и фреймворком UI редактора?

+70

rsbooster 21 мая в 08:00

Большое обновление DivKit: визуальный редактор, поддержка форм, аниматоры

8 мин

3.7K

Блог компании ЯндексGitHub * Open source * Интерфейсы * Разработка мобильных приложений *

Почти три года назад мы выложили в опенсорс DivKit — наш BDUI‑фреймворк для отрисовки интерфейса приложения из ответа сервера. С его помощью вы можете описать элементы, состояния и анимации на бэкенде. Приложение получит это JSON‑описание и отобразит его.

Мы не перестаём развивать DivKit и за последние месяцы добавили несколько важных функций. О них расскажем в статье.

+23

Drakorgaur 21 мая в 05:58

Миграция с legacy: как werf упростил переезд на Kubernetes и ускорил CI/CD

Простой

4 мин

2.5K

Блог компании ФлантDevOps * Kubernetes * Open source * Системное администрирование *

Кейс

Статья о том, как werf помог упростить переход на Kubernetes, ускорить CI/CD и решить проблемы с кэшированием. Автор поделился опытом внедрения, первыми шагами и преимуществами, которые получила его команда.

+19

cupraer 20 мая в 15:11

Гарантийное обслуживание конечных автоматов

Простой

5 мин

2.2K

Elixir/Phoenix * Erlang/OTP * Open source *

Кейс

Я много и часто говорю о том, что есть принципиальное различие между конечным автоматом и полем «state» в базе данных. Я даже уже отчасти писал про это, но акценты в том тексте были на другом, поэтому я решил посвятить целые полчаса собственной жизни кристаллизации тезисов о правильных конечных автоматах и их реализации в CS.

Так повелось, что математики ограничились применением конечных автоматов к алфавитам, а прикладники тем временем увидели знакомое слово «состояние» и со свойственным всем нам верхоглядством решили, что набор «состояний» и «переходов» — это и есть конечный автомат. Всем, наверное, доводилось видеть такой код:

Подписаться, чтобы посмотреть код

+10

nin-jin 20 мая в 13:23

$mol: 10 лет спустя

Простой

19 мин

14K

Исследования и прогнозы в IT * Веб-разработка * Управление сообществом * $mol * Open source *

Ретроспектива

Сезон Open source

Recovery Mode

Здравствуйте, меня зовут Дмитрий Карловский и я... всю жизнь занимаюсь открытием исходников. Позвольте немного рассказать о ней. Кого-то эта история вдохновит, кого-то наоборот, но надеюсь никого не оставит равнодушным. Рид будет лонгим. Уж простите, но из реквиема по мечте нот не выкинешь.

Сесть и прочитать

+110

155

tyZie 20 мая в 08:15

Как новичок пытался написать свой «терминал»

Средний

4 мин

3.3K

Python * Open source * GitHub * Git *

Из песочницы

Встроенная командная строка в Windows не устраивает многих разработчиков. У нее скудный функционал, нет «запоминания» и многих других функций, который были бы полезны её пользователям. Поэтому я решил попробовать сделать свою «консоль», с возможностью создания своих модулей для расширения функционала.

Для этого, на языке программирования Python я начал писать своё CLI‑приложение, которое упрощает работу с консолью. И что из этого вышло?

Узнать продолжение

+12

1 2 ...

8 9

11 12 ...

252 253

Open source *

Microsoft Edit: легкий текстовый редактор с открытым кодом для Windows

Резервирование кластера Greengage DB (на базе Greenplum OSS)

Исследователи Яндекса выложили Yambda — один из крупнейших в мире датасетов для развития рекомендательных систем

У Линукс нет перспектив в качестве операционной системы для десктопа

Как работать с CAPY

Повышаем качество документации с помощью LLM

Почта в терминале: олдскульные и необычные email-клиенты

Я устал править за нейросетью — теперь пишу промпты по-другому

Собираем умные часы: выбор микросхемы

Это не баг — это фича: как мы начали писать свою open-source альтернативу Buf, потому что нас заблокировали

Атака клонов или темная сторона Open Source

Nerdlog: быстрый TUI-просмотрщик логов с удаленных хостов, с таймлайном, без сервера

Почему я исправляю баги бесплатно и как это изменило мою карьеру

Ближайшие события

Выкрутили автоматизацию на максимум: с чем кроме инвентаризации помог переход на NetBox

Как делать видеоигры в 2025 году (без движка)

Большое обновление DivKit: визуальный редактор, поддержка форм, аниматоры

Миграция с legacy: как werf упростил переезд на Kubernetes и ускорил CI/CD

Гарантийное обслуживание конечных автоматов

$mol: 10 лет спустя

Как новичок пытался написать свой «терминал»

Вклад авторов