juks Aug 15 2008 at 13:48

Конвейеры командной строки

2 min

4.5K

Habr

+24

Comments 30

gugu Aug 15 2008 at 13:58

а как же sed и awk?

sed (от англ. Stream EDitor) — потоковый текстовый редактор (а также язык программирования), применяющий различные предопределённые текстовые преобразования к последовательному потоку текстовых данных.

AWK — интерпретируемый скриптовый C-подобный язык построчного разбора и обработки входного потока (например, текстового файла) по заданным шаблонам.

Очень удобно преобразовывать текст из одного формата в другой (к примеру access_log в SQL INSERT statements)

juks Aug 15 2008 at 14:04

Хотел про это написать, но не стал. Подразумевается, что речь о совсем примитивных методах :-) Awk ведь не предел, можно и perl inliner применить :-)

juks Aug 15 2008 at 14:08

А вообще, если не трудно, то примеры пишите сюда, это ведь и есть цель данной публикации

gats Aug 15 2008 at 14:40

Пример:
netstat -n|grep ESTABLISHED|awk {'print $4“ “$5“ “$6'}|grep .80|sort -n|uniq -c|\
awk {'print $3'}|replace '.' ' '|awk {'print $1“.“$2“.“$3“.“$4'}|uniq -c|sort -n|\
awk '{if($1 > 15) print $2}'

Описание: особая конвейерная магия :)

ceesaxp Aug 17 2008 at 10:55

если нет replace, то можно на tr заменить… и с апострофами не все в порядке, кое-где надо со скобкой поменять :)

gats Aug 17 2008 at 22:38

Хабр их на «» заменял, пришлось извратиться :)

habracut Aug 15 2008 at 14:45

Помнится была задача — выборка последних ревизий в контроле версий (например за два дня)
Не нашел как это сделать стандартными средствами svn. Получился такой кодобред:

svn export . ../export
cd ../export
find . -type f -mtime +2 -exec rm {} \;
find -depth -type d -empty -exec rmdir {} \;
zip -r export.zip .

juks Aug 15 2008 at 14:58

По этому поводу можно добавить случай, когда нужно сделать из файлов, полученных из репозитория, просто файлы, то есть удалить все папки .svn

find. -type d -name «.svn» | xargs rm -r $1

А вообще, с svn возможна масса вариаций

habracut Aug 15 2008 at 15:05

как раз svn export это и делает ;)

juks Aug 15 2008 at 15:06

:-)

ipod Aug 15 2008 at 15:22

Тоже как-то написали утилиту на шарпе, а потом нашли свн экспорт :-)

A2K Aug 15 2008 at 15:41

зачем xargs, когда у find есть -exec?

juks Aug 15 2008 at 16:07

привычка :-)

malicious Aug 16 2008 at 22:12

Да и у find'а есть опция exec…

malicious Aug 16 2008 at 22:23

Не, ну как я не заметил комментарий A2K 'а? Я ведь внимательно прочитал ветку.

syndicut Aug 16 2008 at 01:56

head еще можно упомянуть как обратная tail'у


egrep -n -R 'Что-то' * - поискать что то в текущей директории и ниже, во всех файлах
find -name '*.php' -exec egrep -nH 'Что-то' '{}' ';' - ищем только по файлам *.php

drujebober Aug 16 2008 at 13:35

полезным может быть сочитание tail и head, например когда нужно вывести n-ю строку с конца или начала файла:
$ tail -n 5 file |head -n 1
это выведет 4-ю, с конца, строку

ukko Aug 16 2008 at 10:35

побольше бы примеров, цены бы не было данному топику… :)

BlackFaun Aug 16 2008 at 13:52

cat access_log | cut -d' ' -f1 | sort | uniq -c | sort -r -d

imho, здесь лучше написать cat access_log | cut -d' ' -f1 | sort | uniq -c | sort -r -g

rwz Aug 16 2008 at 20:03

еще лучше тогда
cut -d' ' -f1 access_log | sort | uniq -c | sort -r -g

зачем там лишний cat?

drujebober Aug 16 2008 at 13:55

Можно также упомянуть про tee, эта штука позволяет перенаправлять вывод одновременно в файл и на stdout, полезно при желании залогировать, что то требуещее интерактивного вмешательства.
С проходу приходит в голову следующее:

#apt-get dist-upgrade | tee dist-upgrade.log

leave Aug 16 2008 at 14:08

>>cat — всего лишь один из способов вывода содержимого файла или нескольких файлов.

и «склеивания» нескольких файлов в один

slakey Aug 16 2008 at 14:33

Тоже для борьбы с DDoS, но с таким, который не делает ошибок, а тупо запрашивает главную страницу:
tail -20 /var/log/nginx_access.log | grep «GET / „ | cut -d' ' -f1 | sort | uniq -d | xargs ipfw -q table 9 add $1
Покажет те айпишники, которые за последние 20 записей в логе более одного раза запросили главную страницу. При том, что трафик идёт неслабый — маловероятная ситуация, что это будет живой человек. Хотя пострадавшие бывают.
Ну, и конечно, одного запуска недостаточно, у меня это повторяет скрипт с интервалом 1 секунда.

slakey Aug 16 2008 at 14:34

что-то кавычки перековеркались, но суть понятна.

bubuq Aug 17 2008 at 04:16

Напечатать неуникальные строчки входного файла:

perl -ne 'print if ++ $_{$_} == 2' filename.txt

orca Aug 18 2008 at 12:01

Была такая задача: Есть каталог с лог файлами, в котором постоянно появляются новые логи (логи собираются с оборудования которое надо мониторить), нажен был скритп который бы автоматически добавлял новые логи в конфиг newsyslog для ротации. Написал такой скрипт:

find /var/log -print | grep log$ | sed 's/$.*$$/\1 user\: user 666 7 1000 \* JC \/var\/run\/syslog.pid 30/g' >> /etc/newsyslog1.conf && sort -u /etc/newsyslog1.conf > /etc/newsyslog.conf

juks Aug 18 2008 at 12:22

Очень по существу, так всегда лень заниматься этой ротацией

coylOne Aug 21 2008 at 23:36

tail -f esparus.com.access.log | grep Yandex — просмотр в реальном времени посещений от яндекса =)

cdev Sep 4 2008 at 17:04

Если надо поправить какую-то штуку (windows-1251) в нескольких файлах с кодом, но лень искать где оно есть:

joe `grep windows-1251 *.php |cut -f 1 -d :|grep -v \~|sort -u`

Посмотреть размер и дату создания какого-то бинарника:
ls -l `which ls`
и скрипт это или бинарник
file `which mozilla`

узнать какие файлы и каталоги самые жирные в этом каталоге
du -s * | sort -n

Узнать когда обращались к файлу «stat file»

Если на веб сервере запрещен просмотр каталога, а надо побыстрому выложить файлов:
ls -1 | sed s/«^.*»/'&<\/a>
'/g >index.html

Если с виндов привалило вайлов с РаЗнЫм кейсом в названиях:
#!/bin/sh

for i in $*
do
mv $i `echo $i |tr [: upper:] [: lower:]`
done

cdev Sep 4 2008 at 17:07

Про index:
ls -1 | sed s/«^.*»/'<a href=«&»>&<\/a><br>'/g

Show the best of all time