Обновить

Комментарии 27

 Роутер с подсетью 192.168.0.1 пробрасывает 443 порт на мой роутер 192.268.2.1, а тот в свою очередь на сервер с адресом 192.168.2.10. Второй роутер (cudy, прошитый на openwrt) нужен, т.к. на нем поднято xray ядро я думаю и так всем понятно зачем, да и просто удобно лично мне. 

Вообще не очевидно, зачем 443 пробрасывать через два роутера. Это ж входящее соединение, а xray вы используете для ... ну назовем это так - исходящего траффика. Выглядит так как будто надо просто на Роутере А, исходящий траффик завернуть на роутер Б и на этом успокоиться (схема ессно условная). А еще лучше вообще все реализовать на одном роутере... ... в том же pfsense(и прочих альтернативных CHR).

Смысл в том что чем больше у вас устройств - тем больше точек отказа, больше (меньше) TTL и еще пучек приколов может быть. Например поддержка Jumbo Frame разного размера. Да и просто электричества одно устройство жрет меньше чем три отдельных.

Так же рекомендую ооочень осторожно относиться к торчащим в сеть self-hosted сервисам, вот прям очень-очень осторожно. VPN в домашнюю сеть все же лучше. Или хотя бы использовать прокси CloudFlare и закрыть доступ из всех стран кроме вашей\тех в которых бываете (да-да белые списки они такие).

Из текущего списка:

рекомендую посмотреть в сторону paperless-ngx - у меня прям wow-эффект был когда выстроил пайплайн работы с документами (сканы, чеки, счета и прочая бумага)

Можете описать свой пайплайн для paperless? Интересно с какими проблемами столкнулись, к какой структуре в итоге пришли и как себя проявляет встроенный анализатор.

Можете описать свой пайплайн для paperless? 

Это не тянет на статью, но и не на 5 минут. Если кратко:

  • Всем входящим документам вешается тег inbox. Кроме совсем уж очевидных которые не меняются и всегда одинаковые типа чеков за коммуналку;

  • На дашборде (не путать с фильтрами) кроме inbox'а ничего нет - как итог открывая приложение всегда попадаю в раздел документов которые а.надо разгрести б.были добавлены последними;

  • Основная задача любой документ в первую очередь закинуть в пайперлесс, теги и метаинформацию - потом. По факту inbox разгребаю раз в месяц. Но! ничего не теряется, и в худшем случае перед глазами будет 20 документов вида scan_0123.pdf которые не долго протыкать;

  • Наш рабочий МФУ умеет сканить на почту. Т.е. я кладу бумагу, ввожу мыло, нажимаю скан и МФУ отправляет на почту письмо. По отправителю, почтовик кладет письмо в папку scans, и оттудава Paperless забирает pdf'ку самостоятельно, парсит, присваивает корреспондетна, теги, тип и пр. Аналогично работает скачивание чеков об оплате всякого. В общем, paperless ползает в почту, но не во всю, а только в определенные каталоги;

  • Корреспондент и тип документа - как есть только без правовой формы (если появится дубль, но пока такой ситуации не было), то же касается типа "справка", "акт", "договор", "выписка" и пр. - в таком случае автоматическое распознавание работает хорошо и почти не ошибается;

  • Теги - половина вручную, половина . "вычет 2024", "мащина". Для меня это сущности и контекст. Автоматом навешиваются однозначные теги. Например, если в тексте есть имя домашних животных.

  • в Custom Fields у меня ровно одно поле - "связанный документ" - удобно когда к договору идут допники и можно связать все отношением один ко многим. Ну и со счетами удобно - вот счет за комм.услуги, вот пачка чеков об оплате

На самом деле работа как с почтой, настраиваешь фильтр, папку, ключевые слова и потом просто смотришь как inbox сам разгребается (в почте). Оставляя тебе 2-3 письма которые непонятно куда пихать.

Единственное чего мне не хватает в paperless это возможности задать множество корреспондентов. Ситуация возникает когда сам пишешь письмо и отправляешь в несколько организаций.

Комуналка уже в электронном виде, чеки тоже в приложении банка. Не совсем понимаю что сканить и зачем.

Не совсем понимаю что сканить и зачем.

Претензии, договора, допники, чеки за кэш, накладные, передачу ПД, акты, приказы и распоряжения (если это есть в вашей организации), справки и заключения от врачей или ветеринаров

Комуналка уже в электронном виде, чеки тоже в приложении банка.

и да и нет, приложение банка не парсит что именно было куплено. Т.е. на вопрос "сколько лет холодильнику" надо будет поковырять приложение или искать в памяти контекст. Бонусом, вы можете сменить банк и, чтобы не ловить спамм, снести приложение, отозвать ПД.

Плюс в реальности есть ситуации со связанностью. Договор -> чек -> рекламация (в случае поломки) или накладная, или акт приемки -> что-то сломалось -> претензия -> письма -> суды и понеслось. Понятно что чаще всего есть только чек, но вот в оставшихся 10% случаев, хранить все в папочках крайне неудобно.

Про комуналку +- так же - у меня в банке одна платежка, после чего расчетный центр присылает пачку чеков по каждой сервисной компании. Так вот, в случае вопросов, на платежку всем будет плевать, нужны будут чеки о переводе конкретной организации.

Сразу - почему не хранить это все в почте? Можно, но в случае взлома злоумышленник получит доступ к пучку документов в том числе и домашнему адресу. Не секьюрно это. Так же провайдер может внезапно превратиться в тыкву или ввести плату/рекламу, что там еще мэйл.ру с яндексом выдумают

Почему не хранить в почтовом клиенте, оффлайн? можно, но тогда вы получите два хранилища документов - а это как известно совсем не удобно, надо держать в голове где, какой документ хранится плюс почтовики не распознают текст в сканах и не имеют по нему поиска.

Общий вывод - проще иметь одну систему хранения, чем 2, 3, 5

"я поставиль Proxmox (без HA), я понаставиль контейнеров из докера" -- мощная статья! Вот это лаба!

Без НА pve теперь уже не комильфо?

Классный хоумлаб получился. Почему не рейд?

Чтобы что?

Мне важнее оказалась предсказуемость. Я вручную разметил диск и форматировал разделы. Если перестанет хватать, докину второй и солью их через mergerfs.
RAID - круто, но надежность я достигаю тем, что внимательно слежу за дисками, делаю кучу копий скриптами. Мне важнее, что я понимаю, как у меня сделано форматирование, как написан fstab. И я могу в любой момент вытащить свой диск, воткнуть в свежий сервер и так как там простая ext4 - я уверен, что все без проблем примонтируется.

ext4 не умеет отслеживать целостность данных. бекап не спасет если вы забекапите поврежденные файлы.

это правда, ну я пока проблему повреждения байтов решаю множеством бэкапов на разных дисках

а что посоветуете с дисками, чтобы обезопасить данные? raid и если да, то какой?

можно посмотреть в сторону zfs или btrfs, они и raid умеют.

Чтобы не открывать порты на роутере я использую VPS и lxc с Netbird на домашнем сервере

Круто, я тоже сайт держу на куди TR3000 + i2p нём же крутится + вгсервер + 2 роутер AX3000t сяоми, на котором запрет2 + зероблок итд, инет подключен в ван сяоми от лан порта куда, сам пров заходит в ван 2.5 у куди (статика белая РТ + недавно Ipv6 настроил), пока что сильно проще все, просто флешка в порт юсб 3.0 воткнута на ней контент сайта, и вторая копия сайта в клирнет смотрит (уменьшенная, чисто фронт с архивом Zapret-а от Bolvan для винды висит с обновляемыми стратегиями)

Не понял, у вас роутерт как веб сервер что ли?

да, uhttpd на опенврт

Кинетик ... как много в этом звуке для сердца русского слилось...

Круто! У меня похожий набор сервисов, только на Proxmox. А не много такой камушек кушает? Я не стал играть в эксперта, взял мини пк на N100, но вот его уже мало. Хочу собрать узел на хорошем процессоре, но боюсь счёт за электроэнергию не вывезу...

btop говорит около 6-9w, это без майнкрафт сервера, но со всем остальным, вроде неплохо

Что только не придумаешь в эпоху суверенного интернета! А статья крутая

Привет, тёзка! Классная сборка. Мой homelab попроще: Firebat AK2 (Intel N100, 16GB RAM).

Контейнеры пока что эти:

  • Nginx. Инструмент мощный, вот только устал от его синтаксиса, в планах так же на Caddy переехать

  • Certbot с bash скриптами

  • VoidAuth

  • Beszel. Ставил Prometheus с экспортёрами и Grafana, но поднимать >5 контейнеров только ради мониторинга с чудовищной документацией такое себе

  • Dozzle. Из минусов: нет чтения системных логов, только контейнеры

  • Homepage

  • Poznote

  • Commafeed и сервер на Bun для генерации RSS постов из Telegram каналов

  • Pi-hole тоже был и тоже замучился с конфигами. Попробую dnsmasq

Когда на git будешь переезжать, рекомендую GitLab (облачный и self hosted runner вполне норм). Сам на него недавно переехал из GitHub. Сравнивая free tier, у GitLab удобнее менеджмент секреток и создание своих CI/CD конфигов. Пишут, что Gitea хорош, правда его пока не тыкал.

В планах много чего добавить и поменять. Действительно, приятное хобби (хотя скорее досуг).

С белым IP как борешься с ботами/скраперами/парсерами? Для Nginx есть такой репозиторий.

Fedora OS которая иммутабельная и требует перезагрузки на каждый чих?

Следующий этап изучить гипервизор proxmox и netbird в самохост варианте (с обратным прокси) на арендном vps. И не открывать порты на роутере.

вот да, это главное, что надо следом решить, как корректно обращаться к серваку из глобальной сети, спасибо за рекомендацию, буду читать

Уважаемо, уважаемо. Сам подсел на homelabing. Тоже сначала использовал nginx, а потом на prohomelab прочитал у автора про traefik - крайне удобная вещь, благодаря динамическому конфигу, указал пару лейблов в docker compose и traefik сам подтянул все и порт выставил. Ну и можно настроить чтобы он сертификаты выпрашивал у let's crypt.

Хотел узнать насчет обсидиана, а как синхронизацию сделали? Чет пытался его использовать, но так нормально и не смог организовать синхронизацию.

Блин, теперь тоже хочу маленькую стоечку из жестких дисков, а то у меня 1 через USB подключен и все)

Тоже думаю построить какую-нибудь полноценную железку. Сейчас использую keenetic и 4 малинку. Подскажите, что по шумности у полноценной железки? Пробовал активное охлаждение на малинке: какой бы куллер ни брал, ночью всё равно слышно. Понятно, что можно на gpio сделать умное охлаждение и тп. Вопрос про полноценный системный блок: там же уже CPU куллер, куллер блока питания - как будто бы уже нужен чулан, в который всё это закинуть.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации