
18 категорий, почти 1,5 миллиона книг для жителей северо-американской зоны и около 0,5 миллиона для всех остальных — таковы размеры мобильного архива Google Books.
Одной из интересных особенностей нового архива, который всегда и везде можно носить с собой, является метод оцифровки бумажных носителей — для этого используется технология Optical Character Recognition, которая извлекает текст из книги таким образом, что мобильное устройство не видит разницы между веб-страницей и оцифрованным текстом, при этом деля его на заголовок, тело и даже переваривая сноски. Кликнув пару раз на любой строке или абзаце из книги можно увидеть отсканированный оригинал — это сделано для предупреждения ошибок оцифровки — если читатель видит неправильный текст, то кликнув два раза на любую строку он увидит то, как этот текст был напечатан в книге.
via GoogleBookSearchBlog