Comments 18
Вижу перегонять данные из MS Access в PostgreSQL средствами ETL было скучно неинтересно.
На сколько я себе это представляю, ETL, в данном случае, будет работать через тот же csv, потому что других вариантов вытащить и преобразовать нет. Ни о каком риалтайме тут речи не идёт. Или что вы имеете в виду под средствами ETL?
ETL популярная штука сдери энтерпрайза. Если брать готовое open source решение Pentaho Data Integration, Jaspersoft ETL то они написаны на Java, из-за чего поддерживают куча источников. Некоторые позволяют создавать Job и запускать из скриптов по крону.
С pentaho немного общался, когда думал как бы с MySQL на PostgreSQL переехать, он он мне уж слишком монструозным показался. Плюс, если верить быстрому гуглению, у него те же проблемы с доступом к MS Access, что у всех остальных: нужен либо системный ODBC со всеми вытекающими (тобишь с отсутствием нормального драйвера), либо использовать Java в виде MS Access JDBC Driver, и не известно как там себя Java поведёт.
В общем, мне был ближе Postgres. Потому что новых сущностей/сервисов плодить не надо, потому что можно поднапрячься и поулчить реалтайм, можно полностью скрыть реализацию от веб-приложения и оно даже не узнает откуда данные берутся. Хотя, поразбираться с ETL было бы полезно. Спасибо за наводку.
А тут не очень понятно как Access поведет при множественном доступе. Да и запросы будут побыстрее, если PostgreSQL не будет ходить в Access. Так же можем навешивать дополнительные индексы исходя из запросов.
Тут недавно была статья про легаси, из которой можно заключить, что мир сотоит не только из чистых стартатов, но и из долгоживущих компаний, которые, подчас, работают вдали от переднего края современных технологий. Так вот, у некоторых до сих пор аксес и прочий зоопарк в продакшене и с этим нужно как-то жить и что-то делать. Так что зачем это нужно? Чтобы удовлетворять побребности бизнеса, поддерживать его жизнеспособность, продолжать производить товары и/или оказывать услуги и получать за это деньги.
Ну одна из задач: есть база (а точнее несколько баз аксеса), суммарным весом под гигабайт, если не больше, и там в абсолютно денормализованном виде лежат данные. Эти данные в течение дня изменяются сотрудниками. Нужно в рандомные моменты времени сделать выборку по текущим данным, перенести их в соседнюю систему и там, на их основе, создать некое подобие документа, с которым человек продолжит работать, дополнять его, изменять и тд. Это если абстрактно без конкретики о предметной области.
На Access приложение было уже продвинутое, связь с MS-SQL-сервером была, т.е. на нём бизнес-логика работала. Там проблем нет.
К примеру интеграция с продуктами сторонних производителей. Та другая софтина может не иметь экспорта в другие форматы.
Как работать с MS Access в Linux