Все потоки

Apache *

Свободный веб-сервер

СтатьиПостыНовостиАвторыКомпании

KlimenkoIv 1 июн 2022 в 21:26

Apache NiFi. Быстрый доступ к логам

2 мин

7K

Apache * Data Engineering * Визуальное программирование *

Рассмотрим простой способ получить информацию из лога Nifi с помощью самого Nifi. Это может быть полезно при разработке, тестировании, отладке потоков. А также, поможет организовать получение событий, если у вас еще не готова инфраструктура мониторинга и логирования.

Читать далее

+2

SnezhSh 25 мая 2022 в 15:33

Apache Atlas – доступный data catalog

14 мин

17K

Блог компании GlowByteApache * Hadoop *

Туториал

В задачах построения и развития Data Platform с течением времени мы всегда приходим к вопросу эффективного управления данными.

Chief Data Officer, задавшись целью развить, вывести на новый уровень функцию управления данными, склоняются к “тяжеловесным” шагам, внедряя дорогостоящее вендорское ПО или начиная собственную разработку инструментов.

В то же время в открытом доступе есть законченные, испытанные временем продукты, с которых можно начать испытывать и развивать процессы и компетенции в области Data Governance, применив минимум затрат на внедрение и двигаясь поступательно методом “маленьких побед”.

Apache Atlas является одним из таких доступных open source-инструментов класса Data Catalog, который нам удалось полноценно опробовать и успешно замкнуть на него ряд процессов управления данными.

Читать далее

+7

edeshina 18 мая 2022 в 07:50

Apache Kafka и RabbitMQ: в чем разница и что лучше изучать?

6 мин

77K

Блог компании СлёрмIT-инфраструктура * Системное администрирование * Apache * Высоконагруженные системы *

Мы решили внести свой скромный вклад в развитие комьюнити и перевели оригинальную статью. Статья опубликована на сайте Simplilearn.

Мы все больше полагаемся на данные для выполнения задач в работе и повседневной жизни. Приложения, сервисы, ПО, мобильные устройства и другие элементы объединяются в сложную и разветвленную паутину, которая затрагивает большинство сфер нашей жизни.

В результате возрастает потребность в обработке потока информации между элементами этой системы. Устройства и приложения должны четко и безошибочно взаимодействовать друг с другом. Именно поэтому программисты используют брокеры сообщений и аналогичные инструменты для обмена информацией и коммуникации.

Читать далее

+15

rimecode 15 мая 2022 в 22:22

Apache Guacamole и взаимодействие с API: реальный кейс использования oVirt

4 мин

20K

Блог компании HOSTKEYХостингСерверное администрирование * Проектирование API * Apache *

Рассказываем о методах удаленного управления серверами, не зависящих от операционной системы. Мы уже писали о разработанной в HOSTKEY веб-консоли для материнских плат Supermicro, которая не требует локальной установки Java. Оборудованием Dell тоже можно управлять удаленно с помощью встроенной в DRAC консоли VNC. Показываем, как.

Узнать подробности

+6

ngis 14 мая 2022 в 09:38

Apache OpenOffice. Динамические массивы

Средний

21 мин

2.4K

Open source * Алгоритмы * Apache *

— Указатели в СтарБейсике видишь?
— …
— А они там есть.

Читать далее

+2

EvgenySalnikov 11 мая 2022 в 08:41

Прыжок горбатой лошади или как мы обновляем наши системы

6 мин

3.5K

Блог компании Lamoda TechKotlin * Apache * Программирование *

Привет! Меня зовут Евгений Сальников и я тимлид одной из команд Outbound, которая входит в департамент Business Process Automation в Lamoda. В нашем направлении мы отвечаем за сервисы доставки.

Эта статья написана по мотивам реальной задачи по обновлению нашей большой системы, а именно — переход с очень старой версии Apache Camel на актуальную. Я не расскажу чего-то особо нового, но если у вас уже есть Apache Camel и вам «только спросить», как с ним управляться — милости просим.

Читать далее

+17

nebelpfade 28 апр 2022 в 07:36

Как мы построили корпоративную шину данных на Kafka, которая обрабатывает до 3 млн сообщений в секунду

10 мин

32K

Блог компании ПочтатехБлог компании Конференции Олега Бунина (Онтико)Apache * IT-инфраструктура * Высоконагруженные системы *

Привет! Меня зовут Иван Гаас, я руковожу автоматизацией процессов разработки в Почтатехе — компании, создающей цифровые продукты для Почты России.

Среднее количество сообщений, которые мы обрабатываем в Почте — от 500 тысяч до миллиона в секунду. В пики, когда наша big data прогоняет свои 25 петабайт данных — до 3 миллионов. При этом кластер Kafka состоит всего из 12 серверов в каждом из 3 дата-центров и справляется с этим.

C 2016 года мы в три раза увеличили количество новых цифровых сервисов. Корпоративная шина на Kafka помогла быстро масштабироваться: количество интеграций за последнее время упало с 1000 до 300 и теперь растёт незначительно. Если раньше интеграция сервиса растягивалась на месяцы, то теперь достаточно нескольких дней.

Я расскажу, как мы построили шину, которая обеспечивает такую производительность.

Читать дальше

+35

Nexign 19 апр 2022 в 10:32

Apache Camel: direct для новичков

2 мин

3.8K

Блог компании NexignJava * Apache *

Многие из вас давно работают с различными Java-фреймворками, их в опенсорсе целое множество, и у каждого есть свои преимущества и недостатки. Сегодня хотим обсудить Apache Camel, а именно, компонент direct. Эта статья от инженера-программиста Nexign Андрея Малыгина будет полезна тем, кто уже работает на этом фреймворке и хочет сделать свою работу чуточку легче.

Узнать больше о компоненте direct

0

ivolake 15 апр 2022 в 09:55

Поднимаем Apache Superset — необходимый и достаточный гайд

9 мин

60K

DIY или Сделай самВизуализация данных * Apache * IT-инфраструктура * PostgreSQL *

Из песочницы

Пингвины для привлечения внимания. Как поднять Apache Superset, подключить к нему локальный Postgres и чтобы потом на вас коллеги не смотрели косо.

Читать далее

+3

kirillpal 14 апр 2022 в 15:56

Apache Kafka. Безопасность, мониторинг и управление кластером

21 мин

47K

Блог компании Национальный расчетный депозитарийСистемное администрирование * IT-инфраструктура * Apache *

Мы расскажем, как настроить безопасность кластеров Kafka и Zookeeper, какие инструменты можно использовать для мониторинга и управления кластером, а также про особенности продукта, с которыми мы столкнулись.

Почему Apache Kafka?

Apache Kafka — это унификация. Десятки поставщиков и потребителей, миллионы сообщений в день и огромные массивы данных — для этого нужна надежная, отказоустойчивая и высокопроизводительная шина данных. Существует множество версий дистрибутивов Apache Kafka, например vanilla kafka, oбразы от confluent, bitnami, wurstmeister и т.д. Мы расскажем про решение на базе сборок от Confluent в виде Docker-образов. Оно самое надежное в плане информационной безопасности. Конфигурирование и запуск контейнеров с Kafka в данном случае происходит с помощью docker-compose.

За время работы с Kafka мы прошли путь от «коробочного» решения до тонкой настройки безопасности кластера, применения TLS шифрования и разворачивания по рекомендациям вендора по построению геораспределенного кластера. В конфигурации «из коробки» нет первоначальных настроек безопасности. Для контроля доступов, вносимых изменений и безопасного взаимодействия перед нами встала задача настройки на кластере Apache Kafka TLS шифрования, аутентификации и авторизации средствами встроенного ACL.

TLS шифрование

Обеспечивает шифрование соединения между брокерами Kafka, серверами Zookeeper, клиентами и брокерами. Вся ключевая информация помещается в хранилища — keystore, которые разделяют на два вида:

• keystore, где хранятся ключи и сертификаты стороны, в отношении которой пройдет процедура аутентификации и установления защищенного соединения, например, приватный ключ и ассоциированный с ним и подписанный со стороны центра сертификации (ЦC) сертификат.

Читать далее

+5

ignashkin 14 апр 2022 в 12:58

Добро пожаловать в семью

9 мин

4.3K

Блог компании ЦифраПроектирование API * Apache * Data Engineering *

Привет, Хабр! Меня зовут Игнат Нахай и это мой первый пост. Я работаю в команде по внедрению платформы ZIIoT для промышленности. Конкретнее – отвечаю за архитектурные решения при внедрении платформы в информационный слой заказчика.

ZIIoT объединяет все источники промышленных данных на предприятии и через набор MES-сервисов позволяет управлять качеством, отслеживать генеалогию продукции, анализировать производительность, проводить оперативное и детальное планирование, контролировать состояние и распределение ресурсов и много чего еще. В связи с этим в платформе рождается большой объем информации, которая востребована в других информационных системах предприятия. Здесь я расскажу, как мы решали задачу построения информационных потоков и как нам в этом помог Apache NIFI.

Читать далее

+2

kot_review 6 апр 2022 в 08:00

Pulsar на KubeSphere. Установка платформы распределённого обмена сообщениями и потоковой передачи данных

7 мин

2K

Блог компании FirstVDSApache * Open source * Системное администрирование *

Перевод

Apache Pulsar и KubeSphere — мощные инструменты для нативных облачных приложений. В этом посте мы покажем, как развернуть Pulsar на KubeSphere с нуля.

KubeSphere — контейнерная платформа с открытым исходным кодом на базе Kubernetes, которая предоставляет пользователям ориентированный на приложениях опыт. В связи с этим она обладает полным набором инструментов для разработчиков, позволяющих управлять приложениями на протяжении всего их жизненного цикла. В этой статье в качестве примера я продемонстрирую, как установить Apache Pulsar на кластере KubeSphere. Apache Pulsar, облачный нативный инструмент распределённого обмена сообщениями и потоковой передачи данных, представляет собой передовую платформу для обеспечения нужд предприятий в потоковой передаче событий в реальном времени.

Читать дальше →

+8

Skyhook 5 апр 2022 в 12:35

Межкластерная репликация Apache Kafka между тремя дата-центрами

10 мин

21K

Блог компании AvitoTechБазы данных * Apache * Микросервисы * Хранение данных *

Я Роман Ананьев, NoSQL/Kafka-инженер в Авито. В этом материале расскажу, как мы попробовали использовать брокер сообщений Apache Kafka в трёх дата-центрах и что из этого получилось.

Сначала пробегусь по архитектуре Kafka, потому что она играет роль в репликации между кластерами. Затем коснусь самих способов репликации и расскажу о двух инструментах для неё: MirrorMaker и uReplicator. Основная часть статьи — про нашу реализацию Kafka cluster federation и то, как Kafka размазана на несколько дата-центров.

Читать далее

+23

pentestit-ru 31 мар 2022 в 12:17

Spring4Shell RCE — критическая уязвимость в Java Spring Framework

2 мин

17K

Блог компании PentestitИнформационная безопасность * Java * Apache *

Не успел мир отойти от Apache Log4j2, как в сети появились сообщения о новых 0-day уязвимостях. В Spring Framework для Java обнаружено сразу несколько уязвимостей "нулевого дня", позволяющих, в том числе, выполнять произвольный код (RCE).

Читать далее

+19

sergeykamov 25 мар 2022 в 06:00

Apache NLPCraft, подготовка к выходу мультиязычной версии 1.0

3 мин

1.7K

Natural Language Processing * Apache * Проектирование API * Java * Open source *

Apache NlpCraft — библиотека с открытым исходным кодом, предназначенная для интеграции языкового интерфейса в пользовательские приложения.

Подробнее с проектом можно ознакомиться на его сайте или, напрмер, по ссылкам на хабре. Состояние проекта - Apache инкубация. Так как java NLP сообщество весьма ограничено, продукт имеет небольшое, но достаточно активное количество пользователей.

Читать далее

+1

KlimenkoIv 22 мар 2022 в 12:37

Загрузка stage слоя DWH. Часть 3

7 мин

4.8K

Open source * Apache * Data Engineering * Визуальное программирование *

Каждый разработчик потоков Nifi сталкивается с тем, что через некоторое время потоки начинают повторятся. Бизнес хочет получать данные не по одному расписанию, а к определённым моментам времени. И возникает ситуация, когда управлять большим разросшимся потоком становится неудобно и сложно. Устранять ошибку проектирования приходится в десятках процессоры группах. И так далее...

Рассмотрим подход к параметризованному потоку загрузки, универсальному в сложившемся окружении, при обкатанных правилах формирования DWH, выполнения запросов к источникам, интервалам загрузки.

Читать далее

+4

kmoseenk 1 мар 2022 в 14:47

Мониторинг Apache Spark

8 мин

4.7K

Блог компании OTUSApache *

Перевод

Из этой статьи узнаете, как использовать Listener API и библиотеки качества данных, чтобы улучшить наблюдаемость данных для Apache Spark на разных уровнях.

Читать далее

+3

Hedgehog_art 25 фев 2022 в 13:51

И маленькому стартапу, и большому энтерпрайзу — Кафка, которую нужно знать

5 мин

11K

Блог компании СлёрмApache * Системное администрирование * Программирование *

Можно ли использовать Apache Kafka в качестве базы данных и какое у Кафки будущее? Провели небольшое интервью с нашим экспертом Георгом Гаалом. Он ответил на эти вопросы, а ещё рассказал о сильных и слабых сторонах платформы, возможностях её масштабирования и о том, кому надо изучать Кафку, а кому не стоит.

Читать далее

+11

rikki_tikki 22 фев 2022 в 15:32

Apache Spark

72 мин

53K

Блог компании OTUSApache * Машинное обучение *

Рассмотрим подробно, что такое Spark ML и как с ним работать.

Читать далее

+7

mr-pickles 21 фев 2022 в 10:10

Фаззинг сокетов: Apache HTTP Server. Часть 3: результаты

9 мин

2.3K

Блог компании Wunder FundИнформационная безопасность * Серверная оптимизация * Серверное администрирование * Apache *

Перевод

Прим. Wunder Fund: наш СТО Эмиль по совместительству является известным white-hat хакером и специалистом по информационной безопасности, и эту статью он предложил как хорошее знакомство с фаззером afl и вообще с фаззингом как таковым.

В первой части этой серии статей я рассказал о том, как организовать фаззинг Apache HTTP Server с привлечением кастомных мутаторов. Во втором материале я раскрыл вопрос создания перехватчиков ASAN, которые позволяют выявлять ошибки при использовании собственных реализаций пулов памяти.

Эта статья, третья и последняя, посвящена результатам моих исследований. Я расскажу тут об обнаруженных мной уязвимостях Apache.

Читать далее

+13

1 2 ...

13

14 15 ...