Comments 113
Спасибо. Недавно тоже искал что-то, что позволило бы читать статьи в оффлайне. Собирался уже что-то подобное реализовывать в связке с телеграм ботом, но так и не смог найти адекватный способ сохранения страницы на диск (особо и не искал, если честно).
А с каталогизацией пока никак — просто сохраняю куда-то «на всякий случай чтоб было». Хотя я в свое время обдумывал подобную задачу для электронных книг, там тоже все непросто — но ясно, что как минимум должна быть основная иерархическая структура, система тегов, система заметок, в идеале — полнотекстовый поиск, а также ридер основных форматов.
Добиться похожего функционала можно при помощи расширений. (Например: Save Webpages Offline As MHTML).
Или если вы хотите сохранить страницу из интернета в одном файле, который затем можно будет просмотреть в любом браузере (без расширений), то можно воспользоваться расширением SingleFile, который пытается сливать все ресурсы страницы в виде одного .html
Для простых страниц с картинками это вполне работает, но если брать уже современные сайты с большим количеством динамики, то тут уже как повезет.
P.S. Прошу простить за мой корявый русский.
А зачем добиваться от убитого гуглами продукта работоспособности за свой счёт? Не проще ли выкинуть это поделие на помойку и поставить нормальный браузер?
Мода следования за гуглами до хорошего не доведёт.
Очень удивлен и опечален тем, что из Хрома, оказывается, удалили этот флаг.Ну вообще-то решение на поверхности: не нужно использовать клон Хромиума от Гугла, использовать нужно сам Хромиум. И все: никаких дополнений, расширений, сторонних программ — сохранение в mhtml в самом Хромиуме никуда не делось.
https://www.httrack.com — есть хорошая программа для скачивания сайтов. Часто сталкивался с умирающими ссылками, поэтому особо полезные сайты начал скачивать. Там много тонких настроек, а еще она по умолчанию создает страницу, на которой будет отображаться все загруженное хозяйство. Кстати, надо бы скачать все свои закладки с хабры
Попытка выдачи чужого контента за свой и тем более попытка на этом заработать — безусловно попадает. А просто скачивание — безусловно нет. Хотя когда-то некоторые сайты ставили даже защиту от скачивания, нельзя было обращаться слишком часто с одного ip.
Увы, что угодно 100% не можете. Тем более, что в посте говорится, о синхронизации через дропбокс, то есть покидает
просто скачивание — безусловно нет
гм, хм… я бы не был так уверен, уровень маразма в законотворчестве растет по експоненте из года в год. Не удивлюсь если со временем даже пересказ на словах товарищу просмотренной странички в вебе станет незаконным)))
Нет. Дело не в скачивании, а в переиспользовании — пока вы не кричите на каждом углу что это ваше личное творение или не продаете без отчисления роялти все ок.
wget -r -k -l 7 -p -E -nc http://site.com/
Там много тонких настроек
Попробовал сохранить httrack`ом эту страницу, не трогая настроек, ничего не вышло. Наплодил мне десятки вложенных директорий «habr.com» пока я не заметил и не остановил.
Порой бывает полезно иметь в оффлайне раздел какого-то сайта. Мне могут заметить, что для этого есть HTTrack Website Copier, Offline Explorer или Teleport Pro. Но для разных сайтов с этими программами порой получаются разные танцы с бубном.
Недавно я озаботился скачиваем веток форума. И знаете — тут всё очень плохо. Я думал что уже давно какое-нибудь расширение для лисы есть, которое работает, по крайней мере, для популярных форумных движков. А вот… не нашел!
Для всего этого дела хотелось бы иметь какой-нибудь универсальный инструмент. Для видео/аудио, например, я использую youtube-dl, под который был написан скрипт-обёртка «под себя». Кстати, он далеко не только с ютуба скачивать умеет.
Еще интересно чем скачивать дискуссии google groups. Например предложения в стандарт С++ (сейчас кстати там вроде сами обсуждения закрыли и переместили на lists.isocpp.org, но старые пока еще доступны). Это бесценный кладезь идей, и очень хотелось бы иметь его оффлайн в структурированном виде (сам веб-интерфейс групп весьма корявый).
Полная замена Scrapbook.
Работает на последнем FF, выглядит как старый Scapbook. Формат файлов остался старый, от Scrapbook — можно поставить и работать со старым архивом. Один китаец формат скрапбука раскурил и сделал это расширение. Требует внешнего исполняемого файла на Go для общения с ФС. Я лично собираю этот файл из исходников — на идущий в комплекте с расширением ругались антивирусы.
Есть баг — не сохраняет файлы больше мегабайта. Если его исправить — будет совсем полная замена скрапбуку.
Потом начались странности: то одна сохранённая страница стала нечитаемой. То другая.
Ну и…
Сохранять надо все в один html файл, весь медиа контент вставлять прямо туда как base64, ссылки править с относительных на абсолютные, если таковое нужно. Как это сделать руками? Анрил, надо писать софт. Все остальные способы — будет криво / косо / с кучей папок
судьба оффлайновой коллекции интернет-страничек
Уже давно использую MS OneNote.
Храню в нем как ссылки, так и наиболее интересные статьи (в том числе и те, которые в онлайне давно канули в Лету).
По факту — это моя персональная БД, которая мобильнее, проще и легче в использовании, чем старая (использую с 1997 года) добрая Access.
8 основных записных книжек, в каждой — по десятку-другому разделов. Число страниц учету не поддается. Перестал использовать закладки в браузерах как менее удобный вариант.
(прим.: речь об MS OneNote 2016, а не о той урезанной поделке, что входит в состав 10 и Офис Онлайн)
Да, видите, вам тоже ещё предстоит решать, что делать с OneNote рано или поздно
Я думаю, что к тому времени когда OneNote 2016 станет неактуальным — все переменится пару раз. Прога доступна для свободного скачивания, там проблема скорее в информированности о ее существовании.
Я пробовал хранить записные книжки в папке dropbox, но это плохо работало.
Одна из проблем в том, что OneNote использует для синхронизации какие-то свои способы (через OneDrive, подозреваю), поэтому возможность вести записки, доступные везде, завязана на работоспособность функции логина в Microsoft account.
За все годы у меня не было проблем с учетной записью МС, хотя там есть некоторые не вполне очевидные тонкости (например, надо помнить свой логин и пароль ).
Тонкости там в том, что учетных записей у МС два вида, хотя предупреждений об этом нигде нет (обычная ситуация, когда инструкции пишет не тьютор, а разработчик). Обычный пользователь абсолютно не в курсе, что рабочая учетная запись — это совсем не та учетка, которую он получает при бесплатной регистрации в OneDrive.
Например, у меня в активном пользовании есть другой почивший софт: Picasa. Вот там уже давно сломалась интеграция с геотегами: увидеть на карте точку снимка нельзя, потому что API поменяли.
меня беспокоит то, что OneNote Desktop навсегда останется на версии 2016
Меня больше беспокоит то, что «кризис доткомов» начала 2000х повторится, но уже с «облачными технологиями».
Что-нибудь типа проблемы с прибылью у операторов, результатом которой станет исчезновение неограниченных по времени бесплатных аккаунтов в «облаках» и резкое повышение стоимости платных.
(подписка на год на Офис 365 первоначально у нас стоила очень приемлемо. Но с тех пор ее стоимость увеличилась в четыре раза).
Microsoft на днях объявила, что возрождает OneNote 2016
А можно ссылку на источник информации?
With that in mind, we’re pleased to announce that we are continuing mainstream support for OneNote 2016 beyond October 2020, so that you can continue using the version of OneNote that works best for you. New support dates for OneNote 2016 now align with Office 2019 (October 10, 2023 for mainstream support and October 14, 2025 for extended support). We also want to make deployment and installation easier for organizations and individuals, so for Windows users, starting in March 2020, when you deploy or install Office 365 subscriptions that include the Office desktop apps or Office 2019, the OneNote desktop app will be installed by default alongside Word, Excel, and PowerPoint. If you’d like to install OneNote 2016 earlier, you can get it here: aka.ms/InstallOneNote.
techcommunity.microsoft.com/t5/Office-365-Blog/Your-OneNote/ba-p/954922
www.theverge.com/2019/11/7/20953691/microsoft-onenote-to-do-integration-fluid-framework-future-features-ignite-2019
“We are literally merging all of our modern code back into the legacy 2016 codebase to create a unified single codebase that we can ship and deliver OneNote from,” explained Ben Hodes, product manager of OneNote, at a Microsoft Ignite session today. “The reason we’re doing this modern merge is to get back to a single codebase and start to deliver these features in the coming year and a half.”
myignite.techcommunity.microsoft.com/sessions/79266?source=schedule
Пользуюсь ей постоянно. 6 записных книжек. Вот сейчас сравнил с той версией, которая в комплекте Office 2016. Что там настолько урезано, не понял: форматирование текста, вставки медиа, таблиц, фигур, запись с микрофона etc — присутствует.
Что там настолько урезано, не понял
Что до функциональности — я так и не нашел, как в онлайн- версии включить функцию автоматической вставки ссылки на скопированную информацию («Источник:»)
В 2016 вопрос решается просто — по правой кнопке либо вставка (с ссылкой на источник), либо специальная вставка (без ссылки на источник).
В онлайн версии надо жать «Ctrl+V» (хорошая фича для обучения использованию сочетаний клавиш, но плохо во всем остальном) — и без вариантов.
Еще один недостаток онлайн- версии — расположение списка разделов вертикально (хорошо для вертикально ориентированного смартфона, но плохо для десктопа, так как заметно сокращает полезную площадь для записей, что довльно критично для мониторов в 22")
Плюс в онлайн версии просто полно багов.
Например, есть проблемы со вставкой изображений — в 2016 все норм, в онлайн- версии часть изображений вставляется с искажением пропорций (если блоки идут параллельно, а не последовательно)
При этом возникают проблемы с корректировкой размера изображений — и это всего один из многочисленных мелких глюков.
Но я говорил не об онлайн-версии, а об UWP, которая часто идет в комплекте с системой при установке Win 10 и ставится из Microsoft Store
Не вижу никакого смысла в использовании этой версии OneNote.
На своих десктопах сразу ставлю OneNote 2016, благо она фришная.
На чужих машинах захожу в OneNote Online через браузер.
И для смартфона не странно ли использовать браузерную версию, если есть приложение для Android/iOS?
У меня Лумия 950XL )
Поскольку будущее этой линейки не ясно, на перспективу присмотрел вот такой девайс:

Одно слово — Pocket. Бесплатно, удобно, на всех платформах.
Поддержу, сам им пользуюсь. Альтернативой есть instapaper. Они конечно не сохраняют 1 в 1 страничку, но наоборот парсят статьи и сохраняют их в пригодном для чтения виде.
Можно добавлять в название файлов теги, в каких-нибудь скобках, сохраняя по папкам — категориям и потом любым продвинутым поиском искать.
Однако я последнее время склоняюсь к тому, что всё мне никогда не перечитать. Думаю, как бы себя отучить от всего этого дела.
Отличный софт для хранения информации.
Спасибо. Тоже задумываюсь о хранении полезных статей в оффлайне, но нужна возможность и с андроида добавлять/читать.
Сейчас стоит Pocket, но там не видел возможности хранить одну и ту же страницу за разные даты (разные версии).
Все требуемые вами функции там есть + гораздо больше. В торентах легко найти.
я не говорю что Evernote предел мечтаний, но он неплох. Кстати в основном сохраняю или фрагмент страницы и/или упрощенную версию… то есть сохранять страницу целиком мне например не нужно… и очень удобная функция сразу предлагающая блокнот в который будет сохранятся «награбленное» в основном предлагает правильно.
и оффлайн на компе вроде и в бесплатной версии
а вот то что можно поставить только на 2 устройства огорчает… у меня собственно на 3х устройствах почему-то работает, наверное с 2х андройдов не захожу одновременно :)
Это решение видели?
Еще есть другой хороший аналог evernote — nimbusnote, тоже довольно удобный (меньше ограничений, чем в evernote; продуманное сохранение тегов; есть хорошая веб версия и вебклипперы). Правда, как оказалось на электрон перевели, что ок, но я все-равно сохранил старую версию (портативная).
У evernote, как правильно выше писали есть оффлайн блокноты в которых, если я правильно помню, нет ограничений на размер и количество блокнотов. Файл evernote можно синхронизировать отдельно. Минусы — размер базы в случае больших коллекций. У evernote мне нравится клиппер, в настройках можно выбрать любую клавишу или сочетание, чтобы скопировать выбранный фрагмент (обычно ставил F1) и можно за секунду скопировать любой нужный текст (почему-то больше нигде такой функциональности не нашел). В мак-версии, кстати, такой возможности нет, зато скриншотер круче и удобнее, т.к. можно последовательно копировать участки экрана, а потом все скопом сохранить в одну заметку. Есть смысл смотреть старые версии evernote, которые могут быть удобнее.
Onenote тоже довольно удобный и можно использовать как оффлайн-решение, синхронизируя файлы облаком. У него замечательные мобильные приложения (н-р с поддержкой рукописного ввода, голосовых заметок и т.д.) с интеграцией с другими программами Microsoft.
Я был бы рад, если бы доработали zotero или схожую библиографическую базу для научных публикаций, т.к. это однозначно гораздо более интересная альтернатива, особенно после смерти scrapbook. Zotero отличная программа (даже можно сказать лучшая) для ведения библиографии, которой пользуются куча университетов и она поддерживает сохранение pdf (преимущественно), веб-снапшотов и вообще любых других файлов. К сожалению, странички-снапшоты не сохраняются в единые файлы и в-целом функционал снапшотов очень бедный. Вероятно какой-нибудь аддон решил бы проблему (zotero основан на firefox, причем есть как стендалон, так и файрфоксная версия, т.е. потенциал вроде есть), но пока нет альтернатив.
Уппс, не то написал, не оффлайн, а локальный блокнот (несинхронизуемый блокнот, создается по File->New Local Notebook). Подписка на локальные блокноты не нужна. Оффлайн блокноты — это когда для мобильных версий (точно под андроид), там действительно нужна подписка.
CitaviРазве бесплатная? Посмотрю, спасибо.
Оффлайн пдф и в зотеро есть. Правда настройки по умолчанию неудобные, но есть статья на хабре про это (лучше апдейт той статьи на r-bloggers)
> Подписка на локальные блокноты не нужна.
А как их синхронизировать?..
Разве бесплатная? Посмотрю, спасибо.
В бесплатной ограничение на 100 источников на проект вроде бы, но я купил (там классический способ: купил и забыл, если новые версии не нужны).
Правда, они моськи, тоже всё больше напирают на облачные функции и подписку, а основная функциональность развивается медленно. Но в любом случае хорошая штука. Я пишу в основном в Word, так что хороший плагин для Word для меня тоже аргумент.
А как их синхронизировать?..Такие только дропбоксом или экспортом.
ограничение на 100 источников на проект
На попробовать хватит. Пока что кажется, что в citavi продуманный и удобный интерфейс, посмотрю, любопытно.
Цена сильно кусается и подписки я тоже не поддерживаю. Кроме того, к коммерческим решениям, автоматически требований и хотелок больше. Там и конкуренция сильнее, например тот же paperpile, endnote и другие.
Кроме всего прочего, в зотеро я перешел, т.к. там более прозрачная работа с заметками и выделениями в pdf (их можно выгрузить). До этого работал в закрытый по уши mendeley, больше не хочется связываться. Какой-нибудь менеджер с поддержкой майндмапов пожалуй устроил бы меня полностью, но видимо такие варианты сильно непопулярны.
создаю записку, но она автоматически куда-то уходит «в облако», и у меня берут деньги за право доступа к своим собственным записям, и я не могу их даже себе скачать и перекинуть на другой компьютер. Это, на мой взгляд, какой-то верх вымогательства: пока вы нам платите, можете записки читать, а так они не ваши, перестанете платить, потеряете
Такого в evernote нет, если достигнуть лимита на загрузку в облако, то синхронизация отключится. При этом все старые записи доступны и будут скачиваться, в том числе и на другой компьютер. Впрочем сейчас много альтернатив evernote, просто он удобный. Ту страничку я тоже сохранял в локальные заметки, все сохранилось, кмк, очень похоже на оригинал.
синхронизация отключится. При этом все старые записи доступны и будут скачиваться, в том числе и на другой компьютер.
Ну вот предположим, синхронизация больше не работает, а я что-то там ещё дописал на своём компьютере. Это же мой комп, мои файлы, как их перенести на другой? Хоть флешкой, хоть дропбоксом, можно?
Еще можно Enex-файлы конвертировать в другие форматы, вот например в html нагуглил скрипт (не проверял). Также Joplin утверждает что Evernote via .enex files can be imported. Onenote тоже умеет импортировать (сам onenote по-моему коряво страницы импортирует из веба, но может сейчас улучшили). Evernote еще умеет html-файлы из каталога импортировать.
Конечно, бесплатный лимит у evernote очень маленький (60 Mb вроде), для веба, но с другой стороны веб стал очень жирным. Я не рассматриваю evernote как наиболее правильный способ бекапа записей, но программа довольно удобная и есть куча сторонних доработок/клипперов и пр. Есть из чего выбрать. В любом случае неплохо бы отдельно бекапить базу enex на всякий случай.
Кмк, вы любопытный вопрос подняли. Жаль, что никому особенно локальное сохранение ресурсов не интересно. Раньше я пользовался scrapbook с экспортом в chm, но вот и scrapbook умер и chm ушел/устарел. Evernote все еще живет, что удивительно, хотя куча аналогов давно полегло.
Имхо для академического использования было бы круто иметь удобный вариант для организации, цитирования и сохранения старых ресурсов и pdf, но пока не встретилось all-in-one solution. У маковского marginnote интересная концепция, но он только с epub/pdf и не может в библиографию, да и для win его нет. Добавить бы сохранение в epub в какой-нибудь зотеро, сквозной интерфейс для аннотаций, с любыми уровнями связности, цены бы не было.
Pocket очень хорошо подходит для сохранения и последующего оффлайн чтения и каталогизации (через теги).
Если речь идёт о долговременном хранении, то отдельные html-файлы самое разумное решение.
Они не зависят от функционирования конкретной прикладной программы.
Да и вообще, одним надо одно, другим другое. Удивительно то, что так сложно найти софт, который эту нехитрую, казалось бы, функциональность реализует.
Сам я давно пробовал эту фичу, потом в итоге перешёл на сохранение через Firefox plugin «SingleFile».
At the moment, Pocket for Mac is our sole offline option on desktop, available on macOS computers only. The Pocket team is looking into expanding offline support so PC users can enjoy Pocket offline in the future.
И даже была возможность задать пароль на открытие базы! Неоднократно забывал свои же пароли на свои же всякие разные рабочие базы gso, ёкарный бабай.
Но потом я перешёл в окружение Linux и веб-приложений, и как-то оказалось, что контент важнее, и что plain text невероятно рулит, и читается в любых условиях, и редактируется, и восстанавливается, ну и всё такое.
И что полностью сохранять веб-страницы незачем, бо очень много «мусора», но сохранять их в plain text бывает заморочно (заголовки, списки, болд), поэтому фаерфоксовское расширение www.printfriendly.com решило за меня всё. При экспорте приблуда сама удаляет много всякого, плюс разрешает пройтись по тексту и поудалять что-то ещё. Остаётся текст, который можно читать в любом окружении (некоторые pdf можно читать и в терминале).
Теперь у меня много pdf файлов, и нет времени их пересматривать, организовывать в какие-то логические структурные сущности и всё такое. То есть, это надо делать с каждым скачиваемым файлом сразу, и я делаю так только тогда, когда там что-то очень важное (то есть, редко).
Для чтения и откладывания напотом пользуюсь Feedly (аналог Google Reader, в него можно отправлять статьи на телефоне, когда находишь longread в интернете). Мне хватает одной папки там: «Read later». Личный органайзер у меня программа Treeline (она кросплатформенная, что одно время для меня было важно, когда дома был Windows, а на работе Linux), работающая с файлом в дропбоксе. Сохраняю в ней ссылки на важные статьи. На случай прихода Чебурнета и т.п. сохраняю в ней текст самых ценных статей. Там может картинки или ссылки и не переносятся. Но мне норм, я даже не замечаю, ведь ценен именно текст.
«Прочту потом»: трудная судьба оффлайновой коллекции интернет-страничек