Sivchenko_translate Nov 11 2024 at 19:32

Запросто собираем базу данных при помощи команд Linux

6 min

24K

Development for Linux * SQL * Programming * Abnormal programming *

Translation

+53

Comments 33

mibori Nov 11 2024 at 20:40

А ещё есть такая штука -- https://www.nushell.sh/ . Но она не из коробки, конечно.

kt97679 Nov 11 2024 at 21:46

Nu pipelines use structured data so you can safely select, filter, and sort the same way every time. Stop parsing strings and start solving problems.

Т.е. мы уходим от парадигмы, что через пайп идет обычный текст? И это значит, что grep использовать нельзя и все существующие скрипты с nushell не совместимы?

mayorovp Nov 12 2024 at 08:34

Было бы удивительно, если бы скрипт, написанный под один шелл, был совместим с другим в общем случае (чистый sh - случай частный, и писать под него не так просто как кажется).

webhamster Nov 12 2024 at 07:16

Nu pipelines use structured data so you can safely select, filter, and sort the same way every time. Stop parsing strings and start solving problems.

По сути, первую массовую реализацию этого подхода сделали Microsoft в своем PowerShell. И на самом деле, это правильный и логичный подход, который должен прийти на смену парсинга строк. Пора уже отходить от низкоуровневой шелловской парадигмы "всё - строка" к более структурированной парадигме "всё - объект".

Kingas Nov 12 2024 at 12:15

Вот согласен, парсить надо только исходный файл, и дальше работатьс объектами, а не работа со строками на всех этапах.

И это круто, что PowerShell сделали кроссплатформенным, после того когда выпустили кроссплатформенный .NET. И можно использовать как доп инструмент, и не зависеть от используемого shell.

saboteur_kiev Nov 11 2024 at 21:07

А еще элегантнее делать это через IFS и read, после чего работать с массивом.
Это уменьшает расходы на запуск внешних команд и позволяет создавать различные внутренние структуры данных.
Если же делать именно базу данных, то проще воспользоваться консольным клиентом к sql базе, которых есть под все, включая sqlite, который умеет возвращать результат в csv

И делаешь что-то вроде

mybase="Buy milk:2024-10-21:2:open:Bobby:Jack:
Call bank:2014-10-20:1:closed:Bobby Jack:"
IFS=":" read -a myarray<<< "$mybase"

echo ${myarray[5]}

Либо можно грепать и считывать построчно

alan008 Nov 11 2024 at 21:37

Не хватает тега "Ненормальное программирование"

Sivchenko_translate Nov 12 2024 at 06:59

Вы правы, добавил хаб

Sivchenko_translate Nov 12 2024 at 06:59

Вы правы, добавил такой хаб

maxshopen Nov 12 2024 at 00:38

Осталось настроить индексы, журналирование и репликацию ;)

Politura Nov 12 2024 at 04:08

Транзакции

2medic Nov 12 2024 at 15:28

И обеспечить ссылочную целостность данных.

saboteur_kiev Nov 13 2024 at 09:26

Это же все текстовые файлы. Просто весь скрипт положить в гит и сразу появляется даже полноценный коммит, а еще можно настроить удаленный апстрим и будет еще и пуш

sshikov Nov 12 2024 at 16:49

Знаете, есть такая штука, как Hive. Там нет индексов, нет транзакций, репликацию обеспечивает Hadoop HDFS. При этом в качестве хранилища данных поддерживается любой разумный формат файлов, какой можно преобразовать в колонки таблицы. Включая и CSV, само собой. Единственное ограничение - что формат этот один на таблицу/партицию. И все это вполне себе работает с терабайтами.

Конечно, правильнее было бы сказать, что ACID там уже появился, но в тоже время, много-много лет многие пользователи (включая меня) работали с этим как с промышленной СУБД, при некоторых ограничениях, само собой.

Ну т.е. я к чему - все эти свойства, они в общем случае не обязательны.

boopiz Nov 12 2024 at 01:18

формально, набор файлов с данными не является "базой данных", так как по определению для любой элементарной БД нужна "схема" в соответствии с которой эти самые данные будут храниться. без этой самой "схемы" формально данные не являются структурированными в контексте связанного хранения, хоть и могут быть подчинены какой-то структуре внутри себя.

так что то, что тут описано это просто работа с неструктурированными текстовыми данными для получения какого-либо результата.

и возникает вопрос - зачем автор хотел натянуть сову на глобус?

Noah1 Nov 12 2024 at 05:15

Вы знакомы с нереляционными БД?

Dynasaur Nov 12 2024 at 07:30

нереляционные БД тоже имеют структуру

mayorovp Nov 12 2024 at 08:36

Однако эта самая структура-схема зачастую точно так же нигде не записывается, а лишь подразумевается.

sshikov Nov 12 2024 at 16:51

И еще она разная. В пределах одной "таблицы". По сути, это и значит, что ее нет - она есть у каждой записи, но у следующей записи она может быть другая.

wl2776 Nov 12 2024 at 04:15

А дальше Perl.

eyeDM Nov 12 2024 at 05:36

mem/троллейбус-буханка.webp

edo1h Nov 18 2024 at 14:01

Нифига себе как мем проапгрейдили, в webp, конечно, он интереснее смотрится

Dynasaur Nov 12 2024 at 07:21

чёта я не понял зачем. Чем какой-нибудь SQLite не устраивает? Чего достичь то пытаемся?

AnotherAnkor Nov 12 2024 at 08:24

Это просто пост про мотивам "база данных.xlsx".

bear11 Nov 12 2024 at 09:08

SQLite требует самой библиотеки/программ sqlite. А его может и не быть. Вы можете не иметь возможности устанавливать бинарные программы на компьютере, например, если у вас есть только user shell на машине и /home смонтирован noexec.

Vdm_ro Nov 12 2024 at 12:00

У вас нет допуска к запуску/установке программ на комп, но вам обязательно нужна на этом компе самопальная база данных... =))

saboteur_kiev Nov 13 2024 at 09:27

ну я с таким встречался.
не то, чтобы база данных, но если у тебя есть какой-то набор,например 100-200-300 данных, то их уже не очень удобно хранить линейным списком, хочется упорядочить.

astenix Nov 12 2024 at 09:38

Базы такого уровня сложности проще вести в бумажном блокноте.

UFO landed and left these words here

vvzvlad Nov 13 2024 at 15:59

Боже, но зачем? Sqlite весит немного, машстабируем, имеет стандартынй синтаксис команд и работает одинаково на любых системах

Dr_Zlo13 Nov 13 2024 at 16:08

echo "Take out the trash:$(date -I):3:open" > tasks
Вот эквивалентный код на SQL:
INSERT INTO tasks VALUES('Take out the trash', CURDATE(), '3', 'open')

Вообще-то эквивалентным кодом на SQL будет:

DELETE FROM tasks;
INSERT INTO tasks VALUES('Take out the trash', CURDATE(), '3', 'open')

Vilos Nov 13 2024 at 17:43

Шутка про cat ...grep и grep уже была?

gorod0k Nov 14 2024 at 08:02

Супер, конечно, только это нифига не база данных.

< Картинка троллейбус_из_хлеба.жпг >