Articles / Bookmarks / Profile of kxl / Habr

Валерий Шинкевич @kxl

Разработчик ПО

Profile Publications 2Comments 252Bookmarks 1.4K

miwa Apr 21 2011 at 22:39

Мультимастер репликация для firebird на python

4 min

9.6K

Programming*

From sandbox

Однажды появилась задача синхронизации двух баз данных, работающих под управлением СУБД Firebird. Ситуация вкратце такова.

Есть программа учета, которая работает в двух магазинах, расположенных в нескольких километрах друг от друга. Подключение к интернету — через разных провайдеров с соответствующей нашим реалиям надежностью и скоростью. Сменить провайдера в каждом из случаев можно только на более дорогого с худшим качеством связи, так что размещение базы только в одном из магазинов и удаленное подключение из другого не получается ни под каким соусом. В каждом из магазинов вносятся приходные и расходные документы, редактируются справочники и ведется учет прочей хозяйственной деятельности. Учитывая, что вводимая информация имеет какую-ни-какую, а все же коммерческую ценность, вопрос безопасности передаваемых данных также нельзя игнорировать. Получив примерно такую вводную, пошел думать. Результат раздумий представляю на суд сообщества.

Читать дальше →

andrey_stepanov1 Apr 17 at 12:51

Оцениваем сложность алгоритмов на C# по памяти и времени с примерами

Hard

10 min

5.3K

.NET*Algorithms*fuse8 corporate blog

Tutorial

Продолжаем говорить о производительности и оптимизации кода. Сегодня поговорим о том, как и зачем оценивать сложность алгоритмов, а также наглядно покажем, как эта сложность влияет на производительность кода.

stalkermustang Mar 18 2023 at 10:43

GPT-4: Чему научилась новая нейросеть, и почему это немного жутковато

Easy

23 min

242K

Machine learning*Open Data Science corporate blogArtificial IntelligenceThe future is hereNatural Language Processing*

Review

В этой статье мы разберем новые удивительные способности последней языковой модели из семейства GPT (от понимания мемов до программирования), немного покопаемся у нее под капотом, а также попробуем понять – насколько близко искусственный интеллект подошел к черте его безопасного применения?

Поехали →

+192

338

stalkermustang Mar 6 2023 at 08:26

Как работает ChatGPT: объясняем на простом русском эволюцию языковых моделей с T9 до чуда

Easy

30 min

369K

Machine learning*Open Data Science corporate blogArtificial IntelligenceThe future is hereNatural Language Processing*

Review

✏️ Technotext 2023

В последнее время нам почти каждый день рассказывают в новостях, какие очередные вершины покорили языковые нейросетки, и почему они уже через месяц совершенно точно оставят лично вас без работы. При этом мало кто понимает — а как вообще нейросети вроде ChatGPT работают внутри? Так вот, устраивайтесь поудобнее: в этой статье мы наконец объясним всё так, чтобы понял даже шестилетний гуманитарий!

Погнали →

+343

283

ewolf Mar 15 at 12:19

Работа с Kubernetes: поднимаем локальный кластер и деплоим в него приложения

5 min

12K

Go*AvitoTech corporate blogKubernetes*

Павел Агалецкий, ведущий разработчик юнита Platform as a Service Авито, написал, как поднять кластер Kubernetes на локальном компьютере Mac с помощью подручных инструментов, а потом задеплоить в него простейшие приложения.

haulmont Mar 6 at 16:43

Микросервисы прагматика: как построить большую систему с помощью пачки монолитов

Medium

22 min

6.8K

Java*Haulmont corporate blogDevelopment Management*

Review

...

Попробую, попытаюсь объяснить. Наверное, для кого-то это будет оправданием, но я просто объясняю.

Как быстро зафейлить новый проект Java? Просто взять и применить все, что ты услышал на последней Java конференции;) Как быстро сделать энтерпрайзный проект минимальной командой в короткие сроки? Верно — подобрать оптимальную архитектуру и правильные инструменты. Senior Developer из команды Jmix Дмитрий Черкасов рассказывает о компромиссном варианте между хайповыми (все еще) микросервисами и монолитами, который называется Self-Contained Systems. Кажется, он выпьет меньше крови и сохранит ваши нервы. Дальше — рассказ от первого лица.

+11

vladipirogov Oct 9 2020 at 13:26

Программирование устройств на основе модуля ESP32

26 min

181K

EPAM corporate blogC*Programming microcontrollers*Developing for Arduino*IOT

Микроконтроллер — это интегральная схема, способная выполнять программы. Сегодня на рынке представлено множество таких моделей от самых разных производителей. Цены на эти устройства продолжают падать. Однокристальные чипы находят широкое применение в самых разнообразных сферах: от измерительных приборов до изделий развлечений и всевозможной домашней техники. В отличие от персональных компьютеров микроконтроллер сочетает в одном кристалле функции процессора и периферийных устройств, содержит оперативную память и постоянное запоминающее устройство в для хранения кода и данных, однако обладает значительно мешьшими вычислительными ресурсами. ESP32 — это микроконтроллер, разработанный компанией Espressif Systems. ESP32 представляет собой систему на кристалле с интегрированным Wi-Fi и Bluetooth контроллерами. В серии ESP32 используется ядро Tensilica Xtensa LX6. Платы с ESP32 обладают хорошей вычислительной способностью, развитой периферией и при этом весьма популярны ввиду низкой цены в диапазоне 7$ – 14$: Aliexpress, Amazon.

Читать дальше →

+28

NAGru Apr 25 2017 at 14:03

SNR-ERD: От “пинговалки” до линейки оборудования

7 min

22K

НАГ corporate blogComputer hardwareNetwork hardware

Начало двухтысячных — бурное развитие телекоммуникационных сетей. Монтажники, сутки напролет проводившие на крышах, прокладывая кабель до конечного абонента, остро нуждались в устройствах для проверки соответствия кабеля подключенному порту. Остро стояла и проблема “зависания” оборудования. Монтажникам приходилось постоянно курсировать между узлами связи и перезагружать их вручную. Так возникла идея разработки первого SNR-ERD.

+18

DAN_SEA Sep 20 2021 at 16:00

Удалённое управление питанием и перезагрузкой компьютера, при помощи внешнего девайса

9 min

37K

Development for IOT*RUVDS.com corporate blogDeveloping for Arduino*DIYElectronics for beginners

Каждый пользователь компьютера сталкивался хотя бы раз в своей жизни с такой ситуацией: ты ушёл к себе на работу, почти доехал до неё и вдруг вспомнил,- что забыл взять со своего личного компьютера какую-то очень важную вещь.

Ехать обратно — опоздаешь на работу. А ведь ситуация может развиваться и гораздо более драматично: допустим, человек поехал куда-то далеко за рубеж, в отпуск, и там ему приходит важный звонок, по результатам которого ему необходимо передать своему визави,- определённые документы. А документы остались дома! А дом находится за границей!

Или вот ещё такая беда: ваш персональный компьютер является мощной графической станцией, на которой установлено множество тяжёлых программ для работы с графикой, программными продуктами. А вы перемещаетесь по городу, имея в руках всего лишь «тонкий» клиент, в виде ноутбука…

Из этого описания становится понятно, что «тонкий» клиент не обладает соответствующей производительностью, для запуска множества высокопрофессиональных программ и проектов. Да и если даже он у вас достаточно мощный, — это в принципе неудобно, каждый раз синхронизировать проекты с «тонким» клиентом. Как быть в описанных выше ситуациях — мы и поговорим в этой статье.

Читать дальше →

+40

evaclick Jan 19 at 14:36

Machine Learning инженер: что/где/как изучать, чтобы въехать

12 min

27K

Machine learning*IT career

Привет, хаброчеловек!

В этой статье мы обсудим путь среднестатистического обывателя в Machine Learning, а именно — как стать ML-инженером. Поговорим о специфике области, какие требуются знания и скиллы, что нужно делать и с чего начать.

+11

asakaev Dec 25 2023 at 15:17

Calypso: Схема данных MongoDB на Scala

Hard

8 min

4.3K

Designing and refactoring*Scala*MongoDB*Functional Programming*m2_tech corporate blog

Review

✏️ Technotext 2023

Чтобы применять Domain-Driven Design, DDD Aggregate и Transactional outbox на MongoDB, наша команда создала open source — библиотеку calypso для работы с BSON.

Публикация для тех, кто стремится к современным практикам разработки и разделяет наше влечение к Scala 3.

Готовы к открытиям? Добро пожаловать в мир функционального программирования и надёжной работы с schema-on-read.

+74

Spinifex Jun 12 2021 at 19:52

Чему можно научиться у фикуса-душителя? Паттерн Strangler

6 min

9.2K

Programming*System Analysis and Design*Designing and refactoring*DevOps*Microservices*

При рефакторинге монолита на микросервисы часто мы уже обладаем работающей системой. У которой миллионы, тысячи активных пользователей. Возможно их 20, но они очень важные и очень активные. Как в таком случае отрефакторить все, чтобы внешне никто ничего не заметил? И как в этом поможет тропический фикус-душитель?

+16

Bee_brightside Jul 29 2022 at 16:19

Как реализовать магию Sqoop для загрузки данных через Spark

29 min

2.5K

SQL*билайн бизнес corporate blogBig Data*Data storage*Hadoop*

Очень часто приходится слышать, что Sqoop — это серебряная пуля для загрузки данных большого объёма с реляционных БД в Hadoop, особенно с Oracle, и Spark-ом невозможно достигнуть такой производительности. При этом приводят аргументы, что sqoop — это инструмент, заточенный под загрузку, а Spark предназначен для обработки данных.

Меня зовут Максим Петров, я руководитель департамента "Чаптер инженеров данных и разработчиков", и я решил написать инструкцию о том, как правильно и быстро загружать данные Spark, основываясь на принципах загрузки Sqoop.

Первичное сравнение технологий

В нашем примере будем рассматривать загрузку данных из таблиц OracleDB.

Рассмотрим случай, когда нам необходимо полностью перегрузить таблицу/партицию на кластер Hadoop c созданием метаданных hive.

+11

Sber Oct 19 2023 at 09:15

Посторонись, Copilot: подборка разнообразных AI-инструментов для разработчиков

Easy

4 min

29K

Programming*Сбер corporate blogMachine learning*Artificial Intelligence

Review

За пределами всем известного GitHub Copilot лежит огромный мир полезных приложений для программистов, и каждую неделю в нем появляется что-нибудь новенькое. В этом посте мы расскажем об этих инструментах — как полноценных конкурентах продукта GitHub, так и более специфических плагинах, а также о нашей собственной разработке в этом направлении.

+30

Flexxxey Oct 19 2023 at 13:00

YTsaurus SPYT: помогаем планировщику Apache Spark быть ещё эффективнее

Hard

13 min

2.3K

Конференции Олега Бунина (Онтико) corporate blogBig Data*Data Engineering*Yandex Cloud & Yandex Infrastructure corporate blog

В больших распределённых системах многое зависит от эффективности запросов: если на гигабайте данных неоптимальный запрос может выполняться за миллисекунды, то при увеличении массива в тысячи раз, сервер начнёт кряхтеть, пыхтеть и жаловаться. Чтобы избежать этого, помогут знания о работе распределённых систем и их частей, а именно — планировщиков.

Ещё с университетских времён я исследую распределённые системы, а последние два года в Яндексе адаптирую Apache Spark к внутренней инфраструктуре. Эта статья посвящена Apache Spark, а именно: как мы в рамках YTsaurus делали его ещё эффективнее. Написана она по мотивам моего доклада для «Онтико».

+17

Friflex_dev Oct 19 2023 at 16:31

Как быстро интегрировать Систему быстрых платежей (СБП) в приложение на Flutter

Medium

7 min

6.9K

Dart*Flutter*Friflex corporate blog

Tutorial

✏️ Technotext 2023

Всем привет! Меня зовут Мурат Насиров, я Flutter-разработчик в Friflex. Мы разрабатываем мобильные приложения и специализируемся на решениях для ритейла. На одном из наших проектов мне пришлось столкнуться с внедрением кнопки оплаты через Систему Быстрых Платежей (СБП). В этой статье я хочу поделиться своим опытом и наработками в быстрой интеграции нативных компонентов SDK СБП в кроссплатформенное приложение на Flutter.

+12

dprotopopov Oct 19 2023 at 19:59

Изучаем Q#. Алгоритм Гровера. Не будите спящего Цезаря

Easy

14 min

4.6K

Cryptography*Programming*.NET*Mathematics*Quantum technologies

Tutorial

~~Криптохомячкам посвящается ...~~

Алгоритм Гровера представляет собой обобщённый, независящей от конкретной задачи поиск, функция которого представляет "чёрный ящик" f: {0,1}^n to {0,1}^n, для которой известно, что EXISTS!w:f(w)=a, где a — заданное значение.

Считаем, что для f и заданного a можно построить оракул Uf: { |w> to |1>, |x> to |0> if |x> != |w> }

Алгоритм Гровера достаточно прост

Задаём в регистре (массиве кубитов) начальное значение H|0>
Повторяем несколько раз (исходя из оценки) пару трансформаций над регистром
- Отражение от решения Uw: { |w> to -|w>, |x> to |x> if |x> != |w> } или Uw = I-2|w><w|
- Отражение от s=H|0> Us = 2|s><s|-I
Забираем нужное решение из регистра (с большой долей вероятности, что оно правильное)

Не будите спящего Цезаря!

Применим этот алгоритм для решения задачи нахождения ключа шифра Цезаря ...

Читать дальше →

MichelleVermishelle Oct 12 2023 at 17:00

Диск – это лава. Исследуем методы выполнения пейлоада в памяти

22 min

7.9K

Information Security*IT systems testing*МТС corporate blog

Привет, Хабр! Меня зовут Миша, я работаю в МТС RED в команде тестирования на проникновение на позиции эксперта.

В ходе пентестов очень часто приходится бороться с антивирусами. Увы, это может отнимать много времени, что негативно сказывается на результатах проекта. Тем не менее есть парочка крутых трюков, которые позволят на время забыть про антивирус на хосте, и один из них - выполнение полезной нагрузки в памяти.

Ни для кого не секрет, что во время пентестов атакующим приходится использовать готовые инструменты, будь то нагрузка для Cobalt Strike, серверная часть от поднимаемого прокси-сервера или даже дампилка процесса lsass.exe. Что объединяет все эти файлы? То, что все они давным-давно известны антивирусам, и любой из них не оставит без внимания факт появления вредоноса на диске.

Заметили ключевой момент? Факт появления вредоноса на диске. Неужели если мы сможем научиться выполнять пейлоад в оперативной памяти, то пройдём ниже радаров антивирусов? Давайте разберёмся с техниками выполнения файлов полностью в памяти и увидим, насколько жизнь атакующих станет проще, если они научатся работать, не затрагивая диск.

+44

avshkol Aug 15 2022 at 01:06

Все, что вам нужно знать об Airflow DAGs, ч.1 — Основы и расписания

20 min

58K

Python*PostgreSQL*Apache*Data storages*Data Engineering*

Tutorial

Translation

Полное руководство по созданию DAG в Apache Airflow DAG, позволяющих создать конвейер данных из разных источников, запускаемый в определенные периоды времени с заданной логикой. Первая часть. Источник: DAGs: The Definitive Guide от astronomer.io

Добро пожаловать в полное руководство по Apache Airflow DAG, представленное командой Astronomer. Эта электронная книга охватывает все, что вам нужно знать для работы с DAG, от строительных блоков, из которых они состоят, до рекомендаций по их написанию, динамической генерации, тестированию, отладке и многому другому. Это руководство, написанное практикующими для практикующих.

PastorGL Sep 13 2023 at 14:50

Искусство ETL. Пишем собственный движок SQL на Spark [часть 2 из 5]

Hard

13 min

1.6K

Open source*Programming*Java*Big Data*Hadoop*

Tutorial

В данной серии статей я подробно расскажу о том, как написать на Java собственный интерпретатор объектно-ориентированного диалекта SQL с использованием Spark RDD API, заточенный на задачи подготовки и трансформации наборов данных.

Краткое содержание предыдущей серии:
Вступление
Постановка задачи
Проектирование языка. Операторы жизненного цикла наборов данных
Проектирование системы типов

Предупреждение о рейтинге «M for Mature»

Уровень сложности данной серии статей — высокий. Базовые понятия по ходу текста вообще не объясняются, да и продвинутые далеко не все. Поэтому, если вы не разработчик, уже знакомый с терминологией из области бигдаты и жаргоном из дата инжиниринга, данные статьи будут сложно читаться, и ещё хуже пониматься. Я предупредил.

Читать дальше →

+10

2 3 ...

71 72