Ищем музыку на z-music.org с помощью bash / Хабр

Понятно, что «жертвой» сегодняшнего эксперимента будет z-music.org. На этом сайте есть возможность найти песню, послушать и скачать её.
Цель — написать bash скрипт для поиска музыки, используя «джентльменский набор» sed, awk и grep. Ну и плюс немного curl или wget по вкусу.

Немного поизучав z-music.org, становится ясно, что:

Поиск расположен по адресу z-music.org/search/. В качестве GET параметров можно передать текст запроса q, тип запроса (AJAX) action и номер страницы результата поиска page
Узнать bitrate песни можно отправив POST запрос на z-music.org/bitrate/ с данными "id=<SONG_ID>"
Прямая ссылка на скачивание песни выглядит как m1.z-music.org/t/<SONG_ID>_<HASH>. <HASH> нашёлся в скрипте по адресу z-music.org/theme/new/js/lang.js

Можно приступать к написанию скрипта. Для запросов к серверу я буду использовать curl, но ничего не мешает использовать wget. Вместо curl -s будет wget -q -O -, а вместо curl -F будет wget --post-data

Для начала запишем <HASH> в переменную hsh:

hsh=$(curl -s http://z-music.org/theme/new/js/lang.js | sed -n 's/^var hsh="\([^"]*\)";$/\1/p')

В переменных $query и $page будут лежать текст запроса и номер страницы результата. Отправим запрос на сервер:

curl -s "http://z-music.org/search/?page=$page&action=ajax&q=$query"

Получим кусок HTML. Информация о песне расположена в строках вида <a class="info" data-aid="SONG_ID"...>SONG_NAME</a>. Получим <SONG_ID> и <SONG_NAME>, разделённые табуляцией:

sed -n 's/^\s*<a class="info" data-aid="\([^"]*\)"[^>]*>\([^<]*\)<\/a>\s*$/\1\t\2/p'

Зная <SONG_ID> можно отправить запрос на bitrate. В ответ придёт JSON. Для того, чтобы вытащить само значение bitrate используем утилиту cut. Для разнообразия.

curl -sF "id=$songid" http://z-music.org/bitrate/ | cut -d'"' -f8

Ссылка на скачивание песни выглядит так: m1.z-music.org/t/${songid}_${hsh}/
Осталось всё это совместить в один скрипт. Пусть он будет «постранично» искать песни и выводить информацию только о тех, чей bitrate совпадает с наперёд заданным.

#!/bin/bash

case $# in
    1)
        query=$1
        bitrate=320
        ;;
    2)
        query=$1
        bitrate=$2
        ;;
    *)
        echo -e 'Usage:\n\tzmusic "song name"\nor:\n\tzmusic "song name" 256\nwhere 256 is bitrate'
        exit
        ;;
esac

hsh=$(curl -s http://z-music.org/theme/new/js/lang.js | sed -n 's/^var hsh="\([^"]*\)";$/\1/p')

# infinite loop incrementing search page
for (( page=1; page>0; page++ ))
do
    result=$( \
        curl -s "http://z-music.org/search/?page=$page&action=ajax&q=$query" | \
            sed -n 's/^\s*<a class="info" data-aid="\([^"]*\)"[^>]*>\([^<]*\)<\/a>\s*$/\1\t\2/p' | \
            awk -v hsh=$hsh -F"\t" ' \
            { \
                system("curl -sF \"id=" $1 "\" http://z-music.org/bitrate/ | cut -d\"\\\"\" -f8"); \
                print "http://m1.z-music.org/t/" $1 "_" hsh "/"; \
                print $2 "\n"; \
            }')

    # stop the script if nothing found on this page
    if [ -z "$result" ]; then exit; fi

    # output songs with $bitrate only
    while read -r res; do echo -e $res; done <<< "$result" | grep -A2 "$bitrate"
    echo -e "-- end of page $page --\n"
done

Пробуем найти что-нибудь про хабрахабр:

$ zmusic "хабр" "256\|320"
320
http://m1.z-music.org/t/-3ev4fnuc23h_2b49895762/
Хабр - Наркоманская песня
--
320
http://m1.z-music.org/t/-3ev4fnubytf_2b49895762/
ХаБр - Недомассаракш
--
320
http://m1.z-music.org/t/-3ev4fnuc1d3_2b49895762/
ХаБр - Путешествие [Ежи и Петруччо cover]
--
320
http://m1.z-music.org/t/-3ev4fntmcfl_2b49895762/
ХаБр - Не поедете на лифте (new single)
-- end of page 1 --