Open source *

Открытое программное обеспечение

СтатьиПостыНовостиАвторыКомпании

21_copilots 12 часов назад

Как я собрал телеграм-бота через RAG-подход и сэкономил полжизни на переписках

Простой

15 мин

2.5K

Блог компании MinervasoftМашинное обучение*Open source*Тестирование IT-систем*Python*

Туториал

Устал объяснять всем одно и тоже: как настроить, где найти, что выбрать.

Психанул и собрал личного чат-бота в Telegram, который понимает контекст с опечатками, отвечает быстро и без пассивной агрессии (как я). Бонусом добавил шифрование логов, whitelist для доступа, историю чатов для персонализации и RAG с автообновлением базы знаний через Git.

В статье — пошаговая инструкция, как запустить ИИ-бота на базе Gemma 3, подключить Ollama и Telegram.

DmitryZlobec 19 часов назад

Ставим шину AHB-Lite на ядро YRV

Сложный

5 мин

621

Блог компании YADROПроцессорыПрограммирование микроконтроллеров*Open source*Производство и разработка электроники*

Туториал

При разработке SoC много говорят про RISC-V, а вот информации про шину AHB-Lite сравнительно мало. Все, что есть на русском языке, касается старого проекта MIPSFpga. Почему бы не взять открытые наработки из MIPSFpga Plus и не использовать совместно с ядром RISС-V?

+13

ph_piter 31 июл в 10:52

Книга: «Изучаем Kali Linux»

6 мин

5.5K

Блог компании Издательский дом «Питер»Профессиональная литература*Linux*Информационная безопасность*Open source*

Привет, Хаброжители! Дистрибутив Kali Linux, включающий сотни встроенных
утилит, позволяет быстро приступить к тестированию безопасности. Однако наличие такого количества инструментов в арсенале Kali Linux может ошеломить. Во втором издании описываются обновленные возможности утилит и подробно рассматриваются цифровая криминалистика и реверс-инжиниринг.

Автор не ограничивается рамками тестирования безопасности и дополнительно рассказывает о криминалистическом анализе, в том числе анализе дисков и памяти, а также базовом анализе вредоносных программ.

+10

Prog-Time 31 июл в 06:23

Обновления Telegram-бота для технической поддержки: API для внешних источников и новые возможности

Простой

4 мин

1.1K

Open source*PHP*Laravel*

Обзор

Recovery Mode

Всем привет! Вы просили - я сделал! Я выпустил релиз №3 для бота технической поддержки на GitHub.

Прошло уже несколько месяцев с последнего обновления, и бот за это время получил вдвое больше звёзд на GitHub, что очень мотивирует продолжать развитие и поддержку проекта.

За последний месяц ко мне поступило несколько запросов расширить функционал бота за счёт подключения новых источников трафика. Изначально я думал добавить интеграции с популярными мессенджерами, такими как WhatsApp или Viber. Но в итоге решил, что в первую очередь стоит реализовать API, чтобы вы сами могли подключать любые свои источники.

В этой статье расскажу о новом API для подключения внешних источников — живых чатов, CRM и других систем, а также о других важных обновлениях и планах на будущее.

Alex679 29 июл в 23:15

AsmX G3: Архитектура кодировщика ZGEN. Как hwm генерирует машинный код amd64

Сложный

20 мин

1.1K

Open source*Компиляторы*Assembler*

Recovery Mode

Большинство компиляторов — это монолитные черные ящики, унаследованные из прошлого. Мы отвергли этот путь. Мы разбираем архитектуру x86_64 до "первых принципов", чтобы понять, как на самом деле работает кремний. В этой статье мы вскрываем капот нашего компилятора ZGEN и его "фабрики машинного кода" — hwm. Никакой магии. Только чистая, детерминированная инженерия, которая превращает ассемблер в исполняемые биты.

Перейти к полному техническому разбору

-3

SofiyaP 29 июл в 17:16

Как не увидеть то, что не хотелось бы видеть, чтобы потом не нужно было развидеть

Простой

8 мин

1.5K

Open source*Python*

Из песочницы

Приветствую! Хочу рассказать про свой мини pet‑проект «Just Skip It!», который я разработала (и надеюсь буду развивать), чтобы автоматически пропускать нежелательные сцены в видео.

Поводом для создания проекта, послужило желание избавиться от «неинтересных» эпизодов, которые, по моему мнению, «не улучшают» семейную коллекцию кинофильмов. Сначала использовались варианты редактирования файлов, от комбайнов — видеоредакторов до батников + ffmpeg, довольно быстро я поняла, что этот метод «не очень», так как неисправимо портит оригинальный файл. Хотелось более гибкого решения, которое позволит быстро и неинвазивно вносить изменения в процесс цензурирования.

Так и родился проект «Just Skip It!». В предлагаемой мной реализации, я использовала медиаплеер VLC, и утилиту на Python, которая управляет плеером через его RC‑интерфейс.

reskin 29 июл в 13:45

Оценка подхода lock-free списков

Средний

12 мин

1.8K

Блог компании GreengagePostgreSQL*Распределённые системы*Высоконагруженные системы*Open source*

Обзор

Привет, Хабр. Меня зовут Роман Ескин, я один из C разработчиков проекта Greengage DB. В этой статье я расскажу, как мы реализовали и протестировали lock-free подход в рамках масштабной работы по внедрению функции удаления брошенных файлов. Приглашаю вас заглянуть во внутреннюю кухню работы нашей команды при оценке этой функциональности.

Введение

Позвольте начать с краткой исторической справки: Greengage DB был запущен в 2024 году как open-source форк Greenplum — Massively Parallel Processing (MPP) аналитической системы управления базами данных, основанной на PostgreSQL. Мы начали этот проект, чтобы поддержать open-source сообщество Greenplum, который неожиданно стал проприетарным продуктом в мае 2024 года. Мы гарантируем дальнейшее развитие Greengage DB, следуя принципам открытости и прозрачности.

Так как Greengage DB основан на PostgreSQL, он унаследовал некоторые его известные особенности и проблемы. Одна из таких проблем, особенно актуальная в распределенных средах — это проблема "брошенных файлов" (orphaned files).

Эта проблема возникает, когда таблица создается и данные загружаются в рамках активной транзакции. Если происходит критический сбой до того, как транзакция будет закоммичена или отменена (например, внезапное отключение питания или неожиданное завершение работы узла базы данных), система проходит процесс восстановления после падения (crash recovery). При этом логическая таблица откатится, но физические файлы данных, связанные с этой незакоммиченной таблицей, могут остаться в файловой системе. Со временем такие брошенные файлы могут накапливаться, занимая место и приводя к ненужному расходу ресурсов. В настоящее время их удаление происходит вручную.

Недавно мы представили новый функционал, который позволяет автоматически удалять такие брошенные файлы. Полная информация об этой возможности доступна в статье Удаление брошенных файлов в Greengage DB.

+22

janvarev 29 июл в 12:40

Вышла 12 версия русского опенсорс голосового помощника Ирина (900+ звезд Гитхаб)

8 мин

17K

Open source*Python*Умный домГолосовые интерфейсы*

Всем привет! Я уже писал про своего голосового помощника Ирину статьи на Хабре: раз, два и три; первый раз был аж 3.5 года назад.

Самое главное — опенсорс проект жив. А если опенсорс жив в течение 3.5 лет — значит, он дошел до какой‑то точки зрелости. А если у него 900 звезд на Гитхабе — значит, им кто‑то пользуется, и даже успешно :)

TL;DR> Python с простой архитектурой. Работает оффлайн, полностью локально и приватно. Можно дописывать свои скиллы через плагины. Плагинов много, есть от комьюнити. Поддержка Home Assistant. Поддержка кучи TTS. Поддержка LLM по OpenAI‑совместимому API, можно сделать онлайн или оффлайн. Есть клиент‑сервер.

+78

VBart 29 июл в 11:44

Angie 1.10: разбор фич, планы на 1.11

Простой

17 мин

1.7K

Nginx*Серверное администрирование*Системное администрирование*DevOps*Open source*

Обзор

Следуя устоявшемуся квартальному ритму выпуска значимых релизов, мы выпустили стабильные версии Angie и Angie PRO 1.10 — форка nginx, развиваемого в основном бывшими ключевыми разработчиками оригинального проекта.

Как и в прошлый раз, расскажем подробнее о нововведениях, приводя примеры. Вы узнаете, в чём ключевая фишка нового релиза (картинка под заголовком намекает); также слегка приоткроем завесу тайны над тем, что у нас припасено на будущее.

А пока — краткий список нововведений, которые будут разобраны ниже:

— автоматическое проксирование и балансировка веб-сервисов в Docker-контейнерах (или Podman);
— автоматическое получение TLS-сертификатов для потокового модуля (stream);
— прием соединений Multipath TCP (MPTCP);
— контроль перегрузки CUBIC в QUIC-соединениях;
— привязка сессий с внешним хранилищем в модуле stream;
— новые режимы привязки сессий при проксировании HTTP-запросов;
— режим постоянного перехода на резервную группу в модуле stream.

+24

ngis 29 июл в 07:51

CyberCalc@CyberOffice.pro

Простой

3 мин

234

Open source*Apache*Софт

Зачем офисному пакету, где вычисления по формуле присутствуют и в электронной таблице, и в текстовом процессоре, дополнение-калькулятор?

Риторический вопрос.

Хобби оправдывает любые действия вопреки здравому смыслу.

Далее обзор офисного приложения, работающего в среде Apache OpenOffice 4 и производных сборках, далее AOO.

empenoso 29 июл в 00:26

Экологичное расставание с Алисой: строим полностью локальный и приватный голосовой ассистент

Простой

8 мин

48K

Умный домГаджетыНастройка Linux*Open source*

Мнение

🛸 Космотекст

Идея отказаться от использования Яндекс Алисы в системе умного дома возникла у меня после новости о принятии Госдумой законопроекта, касающегося штрафов за поиск и доступ к экстремистским материалам в интернете. Казалось бы, при чём тут голосовой помощник? Однако Яндекс входит в реестр организаторов распространения информации, что означает определённые юридические и технические обязательства по хранению и передаче данных.

Хотя я не ищу ничего, выходящего за рамки интересов автоматизации, желание иметь полностью автономный, локально работающий умный дом — без зависимости от интернета и облачных сервисов — стало для меня ещё актуальнее.

Тем более что сейчас единственным слабым звеном в моём умном доме остается Яндекс Алиса — которая требует постоянного интернет‑соединения даже для выполнения простейших команд управления локальными устройствами.

В этой статье я расскажу, как и на что планирую заменить Алису, чтобы сохранить привычный голосовой контроль, но без сторонних подключений и рисков для приватности.

Алиса, извини

+130

bolshiyanov 28 июл в 14:08

Как я улучшил свой промпт для генерации кода в OpenAI 4.1 — простой трюк, который РАБОТАЕТ

Простой

3 мин

17K

NestJS*Open source*Веб-разработка*Веб-дизайн*Искусственный интеллект

Кейс

Несмотря на обилие моделей (а я время от времени использую четыре топовые), всё-таки на стыке моих технологий GPT-4.1 даёт лучший результат по сравнению с другими.

... я каждый раз сохраняю эти компоненты в файл Google Документы. И каждый раз при генерации новой функции или целого компонента я "вскармливаю" текст из этого документа именно в формате текста. В общем, эта штука работает хорошо.

Пожалуйста, объясни как ты понял мою проблему, почему я считаю что это важно, как ты собираешься это решать и что будет правильным решением.

+12

interpres 28 июл в 13:01

Самохостинг и технологическая независимость

Простой

8 мин

14K

Блог компании RUVDS.comХостингOpen source*Серверное администрирование*Linux*

Обзор

Перевод

Посмотрев два видео PewDiePie, в которых он узнал об установке Arch (задача эта считается довольно сложной даже для любителей Linux) и о создании трёх проектов (камеры для собаки, устройства для получения информации о погоде/напоминания о питьевом режиме/медитаций и кто знает, что будет ещё) из опенсорсных напечатанных на 3D-принтере деталей, я стал размышлять о самостоятельном проектировании, своём хостинге и технологической независимости. Эти темы уже давно очень близки мне.

Когда меня спрашивают, как начать писать блог или как получить работу, я всегда говорю, что сначала нужно купить домен. Во-вторых, нужно хостить собственный веб-сайт блога, если вы обладаете техническими навыками (впрочем, сегодня это уже несложно). Я говорю так потому, что всё накапливается со временем. Разумеется, вы можете начать с готового блога и не принадлежащего вам URL, но если вы хотите заниматься этим на долгосрочной основе, то что будет дальше? Я видел, как многие люди скачут с WordPress на Medium, потом на Substack, потом на Ghost. Иногда они не выполняют миграцию своих постов, на написание которых было потрачено много времени, а просто создают новые.

Каждый раз они переходят на новый домен. Меня это очень печалит. Да, можно сказать, что они многому научились и что иногда лучше начинать с нуля, но представьте, что всё это происходило в течение десяти лет. Сравните это с десятилетним блогом, имевшим один и тот же домен, хранящим все накопленные трудами обратные ссылки, демонстрирующим долговременные вложения автора благодаря наличию старых постов, пусть и не столь хороших, чем современные. Мне кажется, разница может быть поразительной.

Я уже долгое время занимаюсь хостингом собственных трудов и каждый год добавляю что-то новое, поэтому решил, что стоит написать об этом краткую статью.

+40

x86chk 28 июл в 08:04

Окно в терминальной стадии

Средний

10 мин

3.9K

Блог компании PVS-StudioC++*C#*Windows*Open source*

Что нужно для взаимодействия с операционной системой исключительно через клавиатуру? Это вопрос, на который каждый разработчик даст свой ответ, и как на него ответили Microsoft, выпустив Windows Terminal?

+20

TourmalineCore 28 июл в 06:30

Docs as Code: наш опыт документирования с LaTeX и Dev container

Простой

8 мин

2.9K

Подготовка технической документации*LaTeX*Open source*PDFIT-стандарты*

В мире разработки мы постоянно сталкиваемся с технической документацией — она повсюду, от спецификаций API до архитектурных решений. И мы хотим, чтобы документация была структурированной, актуальной и удобной… но в реальности чаще имеем дело с хаотичным набором разрозненных материалов, которые теряются между Confluence, почтой и Google Docs, стремительно устаревают и выглядят небрежно, с «плывущими» таблицами и запутанной структурой. Представили этот беспорядок?

Хорошая новость: есть способ автоматизировать и стандартизировать документацию, сделав её такой же управляемой, как код — через модель docs as code.

В статье вместе вспомним базовые принципы этого подхода, расскажем про наш опыт документирования и поделимся репозиторием с готовым шаблоном LaTeX для максимально быстрого старта без установки зависимостей!

+13

pensecfort 27 июл в 18:49

Настройка кастомного декодера для PostgreSQL и редактирование декодера auditd в Wazuh

Простой

7 мин

1.4K

Информационная безопасность*Open source*

Туториал

Wazuh — мощная платформа для мониторинга безопасности, которая позволяет анализировать логи систем и приложений. В этой статье мы разберём, как создать кастомный декодер для логов PostgreSQL, чтобы отслеживать подключения, запросы и ошибки базы данных, а также как улучшить дефолтный декодер auditd для более точной обработки системных логов.

Alex679 26 июл в 15:00

AsmX G3: От высокоуровневого ассемблера к нативному коду. Разбираем компилятор ZGEN

Сложный

14 мин

2.5K

Open source*Assembler*Компиляторы*

Мы не просто пишем код. Мы строим компиляторы, которые строят код. AsmX G3 — это не обновление, это переосмысление с первых принципов. Приготовьтесь к глубокому техническому погружению в архитектуру нашего нового компилятора ZGEN, где мы вскроем каждый компонент, от ядра до сборщика ELF, и покажем инженерные решения, которые определяют будущее системного программирования.

Читать полный технический разбор

-6

TrexSelectel 26 июл в 11:42

Intel прикрыла Clear Linux: конец эпохи «самого быстрого» дистрибутива

4 мин

12K

Блог компании SelectelLinux*Операционные системыOpen source*История IT

Ретроспектива

Intel внезапно поставила точку в истории Clear Linux — дистрибутива, который больше десяти лет считался одним из самых шустрых в мире Linux. Разработка остановлена, поддержка прекращена, а пользователям настоятельно советуют паковать чемоданы и мигрировать на другие системы. Что привело к такому решению, какие уникальные фичи Clear Linux уже не увидят свет? А главное — что это значит для Linux-сообщества? Разбираемся в подробностях.

Press F

+27

ngotova 26 июл в 10:16

Создаем 3D карту помещения лидаром Unitree L2 на Windows без ROS

Простой

10 мин

3.3K

3D-графика*Промышленное программирование*Python*DIY или Сделай самOpen source*

Из песочницы

При обследовании зданий и сооружений практически всегда необходимо создать точную 3D модель помещения для формирования паспорта объекта или для разметки дефектов на уже существующей BIM-модели. То есть, лидар и 3D-сканер входят в необходимый джентльменский набор инженера, при этом стоит такой кит весьма недешево, в среднем 150к-1,5 млн рублей. Мы попробовали изучить возможность использования лазерных лидаров более бюджетного класса, к примеру, Unitree 4D LiDAR-L2 (далее Unitree L2), который стоит в пределах 28-40К рублей. Можно ли с помощью лидара, используемого не в промышленном сканировании, а в робототехнике (конкретно эта модель используется как навигатор для робособак) составлять из облаков точек 3D-модели зданий и сооружений? Дополнительно еще решили задачку, а можно ли это делать на Windows, так как у инженеров в поле чаще всего на ноутбуках стоит именно эта ОС, тогда как официально ПО Unitree L2 написано под Ubuntu? Наш вывод – оба ответа – да, можно!

+11

averkij 25 июл в 09:18

DRAGON: динамический бенчмарк для оценки RAG-систем на русском языке

Средний

12 мин

Блог компании СберБлог компании Open Data ScienceМашинное обучение*Open source*Natural Language Processing*

Обзор

С появлением больших языковых моделей (LLM) стало казаться, что они умеют всё: от генерации кода до написания статей в научные журналы. Но, как только дело доходит до фактов, особенно актуальных и узкоспециализированных, начинаются проблемы. LLM — это не поисковики и не базы данных, знания у них статичны: что было в обучающей выборке, то модель и «знает» (да и то не всегда твёрдо). Постоянно дообучать её на актуальных данных — уже вызов. Тут на сцену выходят RAG-системы (Retrieval-Augmented Generation).

Если коротко, RAG — это способ «подкормить» LLM свежими данными: перед генерацией ответа модель получает не только сам вопрос, но и релевантные тексты, найденные внешней поисковой системе или во внутренней базе знаний. Идея звучит просто, но как понять, насколько хорошо это работает? Какие документы действительно помогли модели, а какие запутали её ещё больше? А главное — как сравнить разные RAG-системы между собой по-честному?

Оценка таких систем — нетривиальная задача. С одной стороны, нужно учитывать и качество извлечённых документов, и финальный ответ модели. С другой — важно избегать контаминации: когда модель «угадывает» правильный ответ просто потому, что уже видела его в процессе обучения. Это особенно актуально при использовании статических наборов данных вроде Natural Questions или HotpotQA: они давно «протекли» в открытые датасеты, в том числе для обучения популярных LLM.

+18

2 3 ...

353 354

Open source *

Как я собрал телеграм-бота через RAG-подход и сэкономил полжизни на переписках

Новости

Ставим шину AHB-Lite на ядро YRV

Книга: «Изучаем Kali Linux»

Обновления Telegram-бота для технической поддержки: API для внешних источников и новые возможности

AsmX G3: Архитектура кодировщика ZGEN. Как hwm генерирует машинный код amd64

Как не увидеть то, что не хотелось бы видеть, чтобы потом не нужно было развидеть

Оценка подхода lock-free списков

Вышла 12 версия русского опенсорс голосового помощника Ирина (900+ звезд Гитхаб)

Angie 1.10: разбор фич, планы на 1.11

CyberCalc@CyberOffice.pro

Экологичное расставание с Алисой: строим полностью локальный и приватный голосовой ассистент

Как я улучшил свой промпт для генерации кода в OpenAI 4.1 — простой трюк, который РАБОТАЕТ

Самохостинг и технологическая независимость

Ближайшие события

Окно в терминальной стадии

Docs as Code: наш опыт документирования с LaTeX и Dev container

Настройка кастомного декодера для PostgreSQL и редактирование декодера auditd в Wazuh

AsmX G3: От высокоуровневого ассемблера к нативному коду. Разбираем компилятор ZGEN

Intel прикрыла Clear Linux: конец эпохи «самого быстрого» дистрибутива

Создаем 3D карту помещения лидаром Unitree L2 на Windows без ROS

DRAGON: динамический бенчмарк для оценки RAG-систем на русском языке

Вклад авторов