Честно говоря, никогда не обращал на это специального внимания, просто всякая служебная информация печатается как на первых, так и на последних страницах
конечно встречал, многие самодеятельные сканы зачастую начинаются сразу с содержания (иногда с вотермарка), а обложка, аннотация и введение идут в конце
А можно узнать, для чего этот номер нужен и как его можно будет использовать на практике (для чего) и вообще что он из себя предстовляет в кореном смысле?
Уникальный идентификатор книги. По нему можно найти любую книгу и, что важнее, найти её подробное описание. С полным списком авторов, годом издания, полным названием и т.п. Более того, существуют сайты, который предоставляют API для этого.
Я собираюсь написать программу каталогизатор книг. Аналог calibre, который мне не нравится.
Так вот, в программе достаточно будет указать на книгу, а информация о ней будет получена полностью автоматически.
Вообще-то есть (http://extracoder.com/genesis/index.html). Можете скачать этот индекс кинг (http://extracoder.com/SharedFilesDownload.aspx?pageid=25&fileid=8&mid=37), он не содержит рекламы и прочего хламья и поставить на свой сайт.
А на форуме (http://gen.lib.rus.ec) есть так же битторрент файлы для скачивания всех эти книг. И это не считая того, что можно качать по прямым ссылкам.
Локальный API пока в разработке, есть только пробные версии, там на форуме всё написано.
У меня была цель быстрой каталогизации существующей базы книг — был сделан краулер, который индексировал базу книг, по имени папки пытался логически определить всё что мог, потом пытался вычитать ISBN из файлов в папке и если удавалось тянул с амазона всю информацию о книге + категории по версии амазона. Ну и предоставлял вебморду для сотрудников библиотеки которые далее вручную разбирали книги которые не удалось опознать автоматически. В открытом доступе его нету, если интересно могу поискать скринкаст
Есть аналогичная софтина для виндовс и если не ошибаюсь линукс от активистов RuBoard
Что касается скрипта он не полностью соответствует стандарту ISBN и не опознаёт символ X в нём.
Я не уверен предоставляется ли исходный код, но бесплатно распостранялась собранная версия командлайновая которая получая параметром путь к PDF книге сканировала её на предмет нахождения петтерна ISBN-10 и возвращала в случае нахождения. Собственно ничего особенного, но для конечного пользователя проще в использовании. Для проф. пользования я бы рекомендовал сделать собственный парсер с учётом различного написания ISBN кода и исправленным определением X
Вот пример работы с системой (внутреннее название BookDozer). Основная масса книг распознаются и каталогизируются автоматически. Но для особых случаев предусмотрена и ручная обработка: www.youtube.com/watch?v=-dGIvOUYI6o
Альтернативно — полуавтоматическая обработка книги, для которой ISBN не нашёлся ни в самой ебуке ни в сопутствующих файлах: www.youtube.com/watch?v=zD1akDx19zY
Получение ISBN номера из книги в формате PDF