Статьи / Закладки / Профиль ABIDB / Хабр

Владимир@ABIDB

Создание и поддержка BI решений

ПрофильСтатьи1ПостыНовостиКомментарии10

@python_leader 17 ноя в 07:56

Kafka реально быстрая, но я возьму Postgres

Средний

22 мин

12K

Программирование * Open source * Go * PostgreSQL * Базы данных *

Аналитика

Перевод

Команда Go for Devs подготовила перевод статьи о том, почему большинству проектов не нужна Kafka, «веб-масштабные» очереди и зоопарк из пяти баз данных. Автор на бенчмарках показывает, как далеко можно уехать на одном Postgres — и заодно разбирает, почему карго-культ масштабирования и «инфраструктура ради резюме» только мешают делать работу.

+34

@offiziellen 8 ноя в 00:00

Горизонтальное шардирование: проблемы, решения, практические рекомендации

Средний

10 мин

12K

Анализ и проектирование систем * Высоконагруженные системы * Программирование * Серверная оптимизация * Базы данных *

Рано или поздно один сервер перестает справляться. Вы можете купить ему больше памяти, больше CPU, более быстрые диски (вертикальное масштабирование), но в конце концов вы упретесь в потолок. Самый большой сервер конечен. Горизонтальное шардирование — это признание этого факта.

Это философия разделяй и властвуй, примененная к данным. Вместо одной гигантской таблицы users на одном сервере, вы создаете 10, 100 или 1000 маленьких таблиц users, разбросанных по разным серверам (шардам). Это дает почти безграничную масштабируемость на запись и чтение.

@MaDeLa 7 ноя в 14:52

Как решать LeetCode? Легко! Нужно просто…

Средний

8 мин

34K

Алгоритмы * Java * Программирование *

Туториал

Перевод

Просто знать 15 важных паттернов, которые помогут облегчить тернистый путь в решении алгоритмических задач. Про эти паттерны мы и расскажем в этой статье.

На сегодняшний день алгоритмические задачи встречаются не только в FAANG. Многие компании и на отечественном рынке всё чаще вводят дополнительный алгоритмический этап на собеседовании – и знание алгоритмов становится отличным «плюсиком» не только при трудоустройстве, но и в решении повседневных задач. Взглянем подробнее на эти паттерны.

Подробнее о паттернах

+73

@gennadybanin 8 окт в 17:10

Сапёр в эпоху LLM: Создание Text-to-SQL агента для базы данных SAP ERP

Простой

10 мин

6.8K

ERP-системы * SQL * Искусственный интеллект

Кейс

Привет, Хабр! Если вы читали мою прошлую статью Сапёр в эпоху LLM: Повайбкодим на ABAP , то уже знаете, что попытка «повайбкодить» на ABAP с помощью LLM — затея, мягко говоря, неоднозначная. Модели «галлюцинируют», выдумывают несуществующие BAPI и таблицы, и в целом чувствуют себя в закрытой экосистеме SAP не очень уверенно. Как говорится, вайбкодинг не задался.
В комментариях к статье прозвучала здравая мысль: будь у модели больше контекста, она бы справилась лучше.Раз появились такие идеи — значит, пора воплощать их в жизнь. На этот раз — новая серия экспериментов: в этот раз займемся переводом вопросов по SAP из обычного языка в SQL-запросы, плюс построим агента с необходимыми для этого инструментами.

@slava_rumin 2 окт в 14:10

Я сварил палки, выложил на Авито и заработал 10 млн за год

Простой

10 мин

185K

Лайфхаки для гиковИнтервьюРазвитие стартапаБизнес-модели *

Интервью

Сфотографировали, выложили объявление на Авито.

В тот же день я поехал в Москву с дочерью. Стою 2 часа в пробке, а мне звонят без остановки. Я отвечаю, объясняю, что мы продаем. Бешеный шквал звонков.

Дочь послушала все это, спросила:

— Папа, а что это за такой бизнес интересный?)

И я понял — тут есть деньги.

+32

108

@OBIEESupport 2 окт в 01:25

Приказ 221 v2 Роскомнадзора для простых админов — создать XML и выжить

Простой

4 мин

24K

Системное администрирование * Сетевое оборудованиеСерверное администрирование *

Туториал

От Роскомнадзора пришло недвусмысленное желание получить от вас XML с внутренностями вашего интернет-соединения.

Системный администратор почему-то спохватился в последний момент, но прислал инструкцию уровня "что-то на XML" и несколько таблиц от одного из известных форумов nag.ru.

С третьей-четвертой попытки у вас ничего не получилось загрузить по требуемому адресу. Давайте пошагово рассмотрим одну из типовых ошибок начинающих XML-писателей.

Как просто сделать требуемое

@smirnag 28 авг в 18:46

Игровой бот в Telegram с нуля: Как я автоматизировал создание контента с помощью Apache NiFi и LLM

Простой

13 мин

11K

Разработка игр * Искусственный интеллектOpen source * Groovy & Grails * Анализ и проектирование систем *

Из песочницы

Как быстро протестировать игровую идею без лишней сложности? Я создал текстовую игру в Telegram за выходные на Apache NiFi и Groovy, весь контент для которой генерируют языковые модели.

В итоге — легковесный, почти не требующий поддержки бот, которого не больно обновлять. Идеально для MVP.

Под катом — архитектура, этапы развития и как AI не просто отвечает, а становится движком продукта.

Все началось с желания сделать что-то интересное для подписчиков моего канала в Telegram. Захотелось интерактива — простой текстовой викторины или квеста. Но разворачивать полноценный бэкенд... Не для такого пет-проекта.

Цель была ясна: создать максимально простого и легковесного бота, которого было бы не больно поддерживать. Выбор пал на связку Apache NiFi для оркестрации и Groovy для скриптовой логики.

P.S. Полная инструкция по запуску, исходники скриптов и шаблон для NiFi я выложил в открытый доступ на GitHub. Буду рад звёздочкам и пул-реквестам!

FutureGuest Bot repository

@smirnag 22 сен в 13:47

OMS на Apache NiFi: От прототипа до почти микросервисной архитектуры

Простой

8 мин

5.2K

Open source * Анализ и проектирование систем * Проектирование API * Groovy & Grails *

Кейс

История о том, как очередная «быстрая костыль-интеграция» на коленке неожиданно превратилась в почти полноценную Order Management System (OMS) с элементами event-driven архитектуры. Всё это — без предварительного проектирования и без единой строчки кода на Java/Scala/Python (хотя тут немного лукавства, так как пару скриптов на Groovy все-таки имеется), на чистом Apache NiFi и SQLite.

Девизом этого проекта мог бы стать слоган: «Мы не ищем лёгких путей, мы ищем работающие решения». Я инженер в одной ритейл компании, который любит решать задачи, и сегодня расскажу, как закрыл боль бизнеса малой кровью, используя не совсем типичный для веб-сервисов инструмент.

Вот здесь можно посмотреть исходники

@Vinttri 16 сен в 09:32

Как избавиться от проприетарных ETL: кейс миграции на dbt

Простой

10 мин

8.1K

Блог компании ГазпромбанкData Engineering * Big Data * Python *

Кейс

Несколько лет назад наш корпоративный слой данных жил на проприетарных технологиях. Данных было много, а основная СУБД — MPP-система Sybase IQ — долго не обновлялась. Мы регулярно сталкивались с тем, что у кластера «падали» ноды, каталог базы повреждался, порой даже терялись данные, а вендор не спешил выпускать исправления или даже признавать проблему. ETL-процессы работали через IBM DataStage, который также перестал развиваться. Все решения были закрыты, и мы не могли влиять на их улучшение. Vendor lock-in означает, что вы зависите от поставщика: если вендор не поддерживает нужные возможности, развитие замедляется, а долгоживущие ошибки остаются нерешенными. Такое положение становилось критичным.

Мы поняли, что для устойчивого развития платформы нужно срочно искать альтернативу: переходить на стек, которым мы можем управлять сами. При этом важно было сохранить команду: десятки разработчиков и аналитиков уже работали с существующей моделью. Новому решению следовало быть удобным для аналитиков, прозрачным для бизнеса и гибким для инженеров.

В этой статье рассказываем о том, как мы перешли с проприетарных ETL-инструментов на open-source на базе dbt, какие проблемы решали по ходу внедрения, и как построили экосистему вокруг dbt для автоматизации рутинных задач.

+24

@Magnit_OMNI 20 авг в 10:25

CDC без боли: как мы делали отказоустойчивую репликацию с Debezium и Kafka

Средний

8 мин

7.1K

Блог компании Magnit TechБазы данных * Data Engineering * PostgreSQL * Хранение данных *

Кейс

Я Евгений Прочан, в платформенной команде Magnit OMNI развиваю инфраструктуру DWH. Расскажу здесь, почему нам понадобилось перейти от батчинга к CDC и как мы это делали. Причин перехода было две: потребность бизнеса в расширении возможностей инфраструктуры и нестабильность нашего старого процесса репликации.

Мы используем в основном базы данных PostgreSQL. Оттуда пакетами раз в час передаём данные в S3, ClickHouse и таблицы Iceberg. Наша потоковая нагрузка достигает примерно полутора терабайта данных, 6000 операций в секунду (около 1500 в самой нагруженной базе данных).

@ph_piter 20 авг в 12:28

Паттерны проектирования в Python, о которых следует забыть

8 мин

19K

Блог компании Издательский дом «Питер»Python * ООП *

Перевод

Попробуйте поискать в Интернете «Паттерны проектирования на Python» — и получите целую простыню туториалов, демонстрирующих, как в точности воспроизвести на Python паттерны проектирования из книги «Банды четырёх». Там же будут диаграммы классов, иерархии фабрик и столько шаблонного кода, что выхлопа хватит, чтобы отопить маленькую деревню. Так вам внушают, будто вы пишете «серьёзный» код. Умно. Профессионал ьно. Готово для корпоративного использования.

Но вот в чём проблема: большинство из этих паттернов решают проблемы, которые в Python просто отсутствуют. Паттерны разрабатывались для таких языков как Java и C++, где для выполнения самых базовых вещей требуется настоящая эквилибристика — нет ни функций первого класса, ни динамической типизации, ни модулей в качестве пространств имён. Разумеется, вам потребуется Фабрика или Синглтон, если без них в вашем языке просто не с чем работать.

Слепо копировать эти паттерны в Python — не признак большого ума. Из-за них ваш код сложнее читать, тестировать, а также объяснять очередному бедняге, которому этот код придётся поддерживать. Возможно, через три месяца этим беднягой станете вы..

+47

@junsanich 5 авг в 09:18

AI-трейдинг без кода

Средний

3 мин

7.4K

Финансы в IT

Туториал

Как связать большие языковые модели, биржу и собственный код без боли и лишних API-обёрток

MCP-сервер Alpaca превращает запросы GPT-моделей в реальные сделки на бирже — AI-трейдинг без строчки кода.

@powerman 15 мар 2024 в 09:11

Пиррова победа Domain-Driven Design

Сложный

7 мин

15K

Программирование * Анализ и проектирование систем * Проектирование и рефакторинг * Распределённые системы * Микросервисы *

Мнение

TL;DR: DDD неизбежно ведёт к избыточному (на порядки больше минимально необходимого) количеству саг в проекте, которые, в свою очередь, неизбежно ведут к нарушению целостности данных в БД.

DDD вполне успешно решает поставленную задачу: дать разработчикам инструменты, которые позволят им справиться (корректно реализовать и поддерживать) со сложной предметной областью. Но эта победа оказалась пирровой: инструменты, обеспечивающие корректность данных в памяти, оказались неспособны гарантировать корректность данных в БД. А что толку от изначально корректных данных в памяти, если со временем (после их сохранения в БД и последующего чтения) они перестают быть корректными? По сути, у DDD есть фатальный недостаток: DDD неизбежно приводит к нарушению целостности данных (инварианта бизнес-логики) в БД.

+31

101

@PatientZero 17 мая 2019 в 04:59

Чем быстрее вы забудете ООП, тем лучше для вас и ваших программ

7 мин

223K

ООП * Программирование * Качество кода *

Перевод

Объектно-ориентированное программирование — чрезвычайно плохая идея, которая могла возникнуть только в Калифорнии.

— Эдсгер Вибе Дейкстра

Возможно, это только мои ощущения, но объектно-ориентированное программирование кажется стандартной, самой распространённой парадигмой проектирования ПО. Именно его обычно преподают студентам, объясняют в онлайн-туториалах и, по какой-то причине, спонтанно применяют даже тогда, когда не собирались этого делать.

Я знаю, насколько она привлекательна, и какой замечательной кажется эта идея на поверхности. На разрушение её чар у меня ушли многие годы, и теперь я понимаю, насколько она ужасна, и почему. Благодаря этой точке зрения у меня есть чёткая уверенность в том, что люди должны осознать ошибочность ООП и знать решения, которые можно использовать вместо него.

Многие люди и раньше обсуждали проблемы ООП, и в конце этого поста я приведу список своих любимых статей и видео. Но прежде я хочу поделиться собственным взглядом.

Читать дальше →

+65

1280

@gen1lee 26 фев в 10:35

ООП: худшее, что случалось с программированием

Сложный

20 мин

71K

Программирование * Java * Веб-разработка * Качество кода * Разработка мобильных приложений *

Мнение

Перевод

В этой статье попробуем разобраться, почему ООП — худшее, что было придумано в программировании, как оно стало таким популярным, почему опытные программисты Java (C#, C++ и т.п.) в принципе не могут считаться крутыми инженерами, а код на Java - хорошим.

+53

1169

@xonika9 29 июл в 07:00

Путешествие одного промпта: Что на самом деле происходит под капотом у LLM?

Простой

15 мин

4.5K

Искусственный интеллектМашинное обучение *

Обзор

Загадка работы LLM: что происходит, когда вы нажимаете Enter? Разбираем пошагово путь вашего промпта от токенизации до генерации ответа. Узнайте, как устроены большие языковые модели, как ими управлять и какие мифы они развеивают.

+31

@Flampanzer 28 июл в 08:00

Расширение jsquery для PostgreSQL — точные и быстрые выборки из JSONB

Простой

14 мин

4.1K

Блог компании SelectelПрограммирование * IT-стандарты * Базы данных * PostgreSQL *

Обзор

Привет, Хабр! Это Антон Дятлов, инженер по защите информации в Selectel. В современных базах данных JSON — де-факто стандарт для хранения полуструктурированных сведений. PostgreSQL предлагает два специализированных типа для работы с ним: json и jsonb. Первый хранит точную текстовую копию документа со всеми пробелами и порядком ключей. Второй применяет оптимизированный бинарный формат.

Рассказываем про jsquery — расширение, которое предоставляет полноценный язык для формулирования выборок. Появляется возможность писать декларативные, понятные и очень быстрые инструкции для работы с jsonb-полями.

+60

@alexgreendev 28 фев в 07:09

Как пройти алгоритмическое собеседование: полный гид по алгоритмам, сложностям и стратегиям

31 мин

32K

Программирование * Алгоритмы * Карьера в IT-индустрииУчебный процесс в IT

Роадмэп

✏️ Технотекст 7

Не тратьте время на задачи – сначала разберитесь в основах. В статье:

1. Как проходят собеседования (ВАЖНО!)
2. Big O, оценка сложности алгоритмов
3. Популярные техники: два указателя, DFS, динамическое программирование и другие
4. Какие задачи решать, чтобы пройти в Яндекс

Читаем, практикуемся, получаем оффер!

+34

@istarun 21 фев в 05:59

Миллиарды векторов и немного магии: превращаем сырые данные с маркетплейсов в пригодные для анализа

Простой

9 мин

3.9K

Блог компании MPSTATSИскусственный интеллектМашинное обучение * Big Data * Обработка изображений *

Кейс

Привет, Хабр! Я — Игорь Старун, BigData Lead в MPSTATS. Я уже 3 года занимаюсь анализом данных на маркетплейсах, штудируя гигантские объёмы информации и превращая их из непотребного и нечитаемого вида в удобоваримый и анализируемый. Моя задача — собрать и подготовить данные так, чтобы помочь продавцам на маркетплейсах разобраться, что происходит с их товарами, конкурентами и продажами, чтобы они не утонули в хаосе карточек, цен и остатков. В этой статье я расскажу, как мы перерабатываем эти объемы грязных данных и структурируем для дальнейшего анализа.

Данные о товарах – это основа всего. Каждую неделю мы обходим более 200 миллионов карточек с Wildberries и Ozon. Названия, описания, характеристики, фотографии — всё это мы аккуратно собираем и складываем в базы данных (для разных задач мы используем ClickHouse, Postgres, MySQL и MongoDB) и облачные хранилища. Зачем? Чтобы потом сделать с этим что-то умное и полезное.

+24

@By-Lazarev 12 фев в 16:16

Прежде чем выбирать язык программирования, необходимо изучить SQL

Простой

10 мин

18K

Программирование * SQL *

Из песочницы

Если вы только выбираете язык программирования или уже программируете, но не уверены в своём выборе — эта статья для вас. Мы рассмотрим, какие бывают виды языков программирования, почему данные — это основа любой программы, как эти данные хранятся и как с ними работать. В конце статьи я приведу 5 бесплатных ресурсов, которые сам использовал для изучения SQL.

В этой статье отвечу на три вопроса: какие существуют виды языков программирования; почему нужно сначала изучить SQL; как учить SQL бесплатно.

-18