Как стать автором
Обновить
318.95

Open source *

Открытое программное обеспечение

Сначала показывать
Порог рейтинга
Уровень сложности

Брокер сообщений на Rust

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров1.5K

Всем привет.

Написал бессерверный брокер сообщений, кому интересно прошу под кат.

Читать далее

Новости

Программисты 21 века. Линус Торвальдс

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров5.8K


Линус Торвальдс — финн шведского происхождения, в детстве говорил по-шведски и ходил в шведскую школу. Родился 28 декабря 1969 года в семье журналистов и деда-математика.
Читать дальше →

Есть ли open source в университетах — рассказывает Михаил Гущин, лидер сообщества «Открытый код ФКН ВШЭ»

Уровень сложностиПростой
Время на прочтение14 мин
Количество просмотров1.3K

Кандидат физ.-мат. наук Михаил Гущин работает старшим научным сотрудником на факультете компьютерных наук НИУ ВШЭ. Одно из заметных профессиональных начинаний Михаила — open source-сообщество факультета. Мы обсудили его развитие, ключевые разработки Михаила и коллег, а также российский open source.

Читать далее

Цифровой архив с полнотекстовым поиском, в том числе по PDF и картинкам

Время на прочтение3 мин
Количество просмотров3.9K


У каждого человека с годами скапливается множество бумажных документов, в которых непросто разобраться или что-то найти. Эта проблема ещё более актуальна для организаций.

Опенсорсная программа Paperless-ngx позиционируется как оптимальное решение для создания цифрового архива. Со встроенной системой распознавание символов (OCR) и обучением на основе ранее отсканированных документов она создаёт хранилище с поиском, где можно быстро найти любой документ. Всем документам присваиваются теги, так что они могут присутствовать в разных тематических категориях, это удобнее распределения по папкам.

Paperless-ngx можно установить на домашний сервер и загружать документы через браузер с любого устройства.
Читать дальше →

Истории

Taigram: Архитектура приложения

Время на прочтение13 мин
Количество просмотров2.2K

Всем привет!

Мы продолжаем работу над нашим Open Source проектом Taigram!

Прошлая статья «Taigram: Начало работы», можно сказать, была посвящена организационным моментам:

Читать далее

Тесты как граждане первого сорта

Время на прочтение5 мин
Количество просмотров816

Уже более двадцати лет в индустрии принято тестировать написанный код до выкатывания его в продакшн. Люди придумали unit-тесты, acceptance-тесты, интеграционные тесты, property-based тесты. Люди даже придумали TDD, чтобы удостовериться в том, что тесты на самом деле работают. Люди придумали моки и контракты, наконец (настоятельно рекомендую прочитать эту заметку Валима, она буквально открыла мне глаза на то, что не так с моками в большинстве случаев).

Ниже я покажу, как можно сделать свой библиотечный код гораздо более пригодным не только для использования в чужих проектах, но и для тестирования.

Генераторы вложенных структур

Лучшие статьи Хабра в феврале 2025 года

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров2.2K

В прошлом месяце я уже анализировал самые популярные статьи Хабра за январь, чтобы узнать что вообще происходит в мире. Теперь пришло время посмотреть, изменилась ли картина в феврале. Какие темы остались актуальными, а какие ушли в тень? Давайте разберёмся, чем жил Хабр в феврале 2025 года.

Парсим и анализируем 🤖

Смотрим на GigaIDE Cloud для Jupyter

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров886

В GitVerse неделю назад выкатили новую версию GigaIDE Cloud - рабочую станцию разработчика по запросу, сделанную на базе Visual Studio Code. В мире (например, Microsoft) уже давно пробуют подходы к этой истории, например, чтобы что-то сделать быстро сделать или протестировать, либо вообще дать временный доступ, скажем, разработчику в подрядчике.

GigaIDE Cloud — разработка СберТеха на основе Visual Studio Code. Есть еще GigaIDE Desktop, она на основе JetBrains Idea, но не является темой для изучения в этой заметке. Когда-то мне нужно было пороазбираться быстро с ноутбуком, попробовать его, и сделать все это быстро. GigaIDE Cloud выложили пример как раз с Jupyter, работу которого мне показалось интересным попробовать и, что важно, посмотреть, насколько оперативно получится это сделать.

Читать далее

Почему мы выбрали OpenSDN и как контрибьютим в этот проект

Уровень сложностиСредний
Время на прочтение24 мин
Количество просмотров1.3K

Удивительно, но о проекте OpenSDN (прямом наследнике Tungsten Fabric) на Хабре написано не так много. Однако в последнее время этот проект набрал популярность. Например, за год сообщество активных пользователей платформы OpenSDN организовало инфраструктуру для сборки и рецензирования исходного кода, наладило обмен информацией (в группе в Telegram, на сайте проекта, в разделе на GitHub и пр.), выпуск новых версий программы и дальнейшее использование для решения бизнес‑задач.

В этой статье вы найдёте подробный рассказ об OpenSDN: что это такое и как работает, почему всё больше компаний выбирает этот проект для управления сетью, а также как ИТ‑холдинг Т1 и Т1 Облако участвуют в развитии сообщества и технологии.

Читать далее

Сканирование периметра компании VK с помощью open-source решений

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров4.1K

Всем привет! Зовут меня Владимир, я работаю специалистом информационной безопасности в бизнес‑юните Mail.ru компании VK. Запустить сканер внешнего периметра было одной из моих важных задач. Сделать это можно было двумя способами разобрать и использовать то, что было сделано раньше или создать что‑то новое. Я пошел по второму пути и... мы развернули инструмент на всю компанию.

Читать далее

FRRouting. Без кликбейтного названия

Уровень сложностиСредний
Время на прочтение19 мин
Количество просмотров5.3K

Вот есть у нас, например, два хоста-клиента и есть один Linux. Хосты из одной сети. Надо чтобы пообщаться смогли они друг с дружкой...

Читать далее

Как автоматически отслеживать новости компаний по своему портфелю?

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров2.3K

Как частный инвестор, я всегда ищу способы упростить управление своим портфелем. Особенно меня интересуют высокодоходные облигации. Да, они немного "мусорные", но я не стремлюсь быть финансовым аналитиком в этом или детально изучать каждого эмитента.

Моя цель проста: купить бумаги и получать купоны, то есть стабильный доход. Однако, чтобы избежать неприятных сюрпризов, важно вовремя узнавать новости о компаниях-эмитентах.

Если бы у меня было всего 3–5 облигаций, я могу просто периодически пробивать названия эмитентов в поисковике и смотреть, что о них пишут. Но когда в портфеле 10 и более бумаг, такой подход превращается в рутину, на которую жалко тратить время. Автоматизация здесь может существенно упростить задачу.

Сам скрипт доступен в open-source и уже готов к использованию. Код - на GitHub!

Заранее изучаем чтобы не вляпаться

«Ванильный» Kubernetes больше не нужен? Нужен только «Штурвал»?

Время на прочтение4 мин
Количество просмотров11K

Хабр, привет! Я Саша Краснов, CTO контейнерной платформы «Штурвал». Название статьи — это наша цель: мы с командой хотим сделать Kubernetes удобнее и доступнее для всех, кому это нужно. Для больших компаний — за деньги, а для маленьких команд — бесплатно.

Для этого мы недавно выпустили «Штурвал Community Edition»: просто взяли все технологии enterprise-версии и отдали всем желающим. Без урезаний по функциям и пробных периодов, регистрации и СМС.

Управление контейнерами требует очень глубоких компетенций и много опытных специалистов в штате. Малые и средние компании и отдельные разрабы могут просто бесплатно взять нашу community-версию, не экспериментируя и не перебирая решения из интернета. А когда и если нагрузки вырастут, то им не придется переучиваться и менять платформу.

Скачать «Штурвал CE» можно здесь. Если хотите больше информации — добро пожаловать под кат.

Читать далее

Ближайшие события

25 – 26 апреля
IT-конференция Merge Tatarstan 2025
Казань

Как я маркетдату агрегировал. Визуализация данных Nasdaq, LSE и MOEX

Время на прочтение2 мин
Количество просмотров563

В предыдущей статье я рассказал о finmap.org - инструменте визуализации данных Мосбиржи. Спасибо хабравчанам за отзывы и предложения. Отдельная благодарность за донаты - я уже покрыть расходы на AWS. Благодаря вашим идеям, в finmap.org появилась строка поиска по тикеру, а в portfolio можно отобразить американские ETF.

В новой версии опубликован исходный код Github Workflows, добавлены данные торгов Лондонской биржи. Датафайлы приведены к общему формату, это сильно упростило разработку. Отображение исторических данных в виде гистограммы теперь доступно для всех площадок.

Читать далее

T-Банк выходит на арену: разбираем T-Lite и T-Pro в боевых условиях

Уровень сложностиСредний
Время на прочтение25 мин
Количество просмотров6.5K

На российском рынке искусственного интеллекта произошло событие, мимо которого сложно пройти даже самому заядлому скептику — T-Банк представил свои языковые модели T-Lite и T-Pro, основанные на китайской LLM Qwen 2.5. И хотя анонсов «революционных» нейросетей в последнее время становится всё больше, этот случай действительно заслуживает пристального внимания — перед нами не очередной наспех слепленный форк с громкими заявлениями, а результат полугодовой работы над полноценным решением с открытой лицензией Apache 2.0.

Что в итоге получилось

Как я решил проблему гибкого управления порядком импортов в большом проекте

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров801

Eslint плагин eslint-plugin-import-group

В одном из моих недавних проектов столкнулся с проблемой: в большом приложении, над которым работают десятки разработчиков, необходимо было обеспечить единообразный порядок импортов.

Читать далее

Встречаем YandexGPT 5 — в Алисе, облаке и опенсорсе

Время на прочтение17 мин
Количество просмотров44K

Привет, меня зовут Андрей Бут, я представляю команду разработки YandexGPT. Сегодня мы анонсируем новое поколение наших больших языковых моделей — YandexGPT 5.

Старшая модель — YandexGPT 5 Pro — уже применяется в чате с Алисой, а также доступна в Yandex Cloud через API. Кроме того, в чате с Алисой впервые можно переключиться на базовую версию модели, которая не использует внешнюю информацию из Поиска и не дообучалась «быть» виртуальным ассистентом.

Pretrain-версия младшей модели — YandexGPT 5 Lite Pretrain — опубликована в свободном доступе и будет полезна разработчикам, которые дообучают базовые версии моделей под свои задачи. Дообученная нами на её основе instruct-версия в ближайшее время станет доступна через API. 

Под катом — более подробно о том, как мы обучали наши модели и какой опыт накопили.

Читать далее

YTsaurus SPYT: как мы перешли от форка Apache Spark к использованию оригинальной версии

Время на прочтение24 мин
Количество просмотров1.8K

Всем привет! Меня зовут Александр Токарев, я работаю в Yandex Infrastructure и занимаюсь интеграцией Apache Spark (далее просто Spark) с YTsaurus. В этой статье я расскажу про то, как мы сначала форкнули и пропатчили Spark, а потом вернулись к использованию оригинальной версии и поддержали совместимость с множеством других версий.

YTsaurus — это разработанная Яндексом система для хранения и обработки больших объёмов данных. Она активно развивается с 2010 года, а в 2023 году была выложена в опенсорс. Подробнее почитать про историю создания и выход YTsaurus в опенсорс можно в статье Максима Бабенко.

В какой‑то момент мы решили подружить YTsaurus и Spark. Так и родился проект SPYT powered by Apache Spark (далее просто SPYT), который активно развивается с 2019 года. Основательница проекта Саша Белоусова уже рассказывала, как были реализованы SPI Spark для работы со структурами данных YTsaurus — это набор классов, интерфейсов, методов, которые мы расширяем или реализуем. Во многом эта статья и моё выступление на HighLoad++ 2024 являются продолжением её доклада.

Читать далее

Как сканировать документы А3 формата, если под рукой только сканер А4 формата

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров4.3K

Оцифровка чертежей и документов формата А3 не представляет сложности, если у вас есть сканер соответствующего размера. Однако что делать, если под рукой лишь стандартное МФУ формата А4?

Формат А3 в два раза больше А4: это два стандартных листа, соединенных по длинной стороне. В результате, чтобы оцифровать А3, приходится сканировать его по частям - левую и правую половинки, а затем как-то их объединять.

Ручная склейка занимает много времени, особенно если документов много. А если тратить время на ручную склейку не хочется? Автоматизация такого процесса избавляет от рутинной работы. Актуально для чертежей и схем.

Как легко склеивать документы А3 из А4

Rust 1.85.0 и Rust 2024

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров4.4K

Команда Rust рада сообщить о новой версии языка — 1.85.0, а также о стабилизации 2024-й редакции. Rust — это язык программирования, позволяющий каждому создавать надёжное и эффективное программное обеспечение.


Если у вас есть предыдущая версия Rust, установленная через rustup, то для обновления до версии 1.85.0 вам достаточно выполнить команду:


$ rustup update stable

Если у вас ещё не установлен rustup, вы можете установить его с соответствующей страницы нашего веб-сайта, а также посмотреть подробные примечания к выпуску на GitHub.


Если вы хотите помочь нам протестировать будущие выпуски, вы можете использовать канал beta (rustup default beta) или nightly (rustup default nightly). Пожалуйста, сообщайте обо всех встреченных вами ошибках.

Читать дальше →
1
23 ...

Вклад авторов