Статьи / Закладки / Профиль plotn1 / Хабр

@plotn1

Пользователь

ПрофильСтатьи11ПостыНовостиКомментарии78

ab429 16 мар в 07:05

Gemini Embedding 2 + мультимодальный RAG: эмбеддим видео и картинки — разбор и туториал

Простой

15 мин

Искусственный интеллектМашинное обучение * Базы данных *

Туториал

10 марта Google выкатил Gemini Embedding 2 - embedding-модель, которая умеет превращать в векторы не только текст, но и картинки, видео, аудио и PDF. Причем все это ложится в одно векторное пространство. Раньше если вы хотели искать по видеобиблиотеке через RAG, приходилось городить огород: транскрибировать аудиодорожку, описывать кадры через Vision LLM, склеивать в текст, и только потом эмбеддить. Каждый шаг - потеря информации. Теперь можно скормить модели MP4 напрямую, и текстовый запрос «как настроить авторизацию» найдёт и статью из базы знаний, и фрагмент видеоинструкции.

Но сама по себе модель не решает проблему. LLM не может «прочитать» MP4, поэтому найденное видео без текстового описания - может быть бесполезно. Ключ - в правильной архитектуре: нативный эмбеддинг для поиска + параллельная генерация текстового описания для LLM: два канала, которые работают вместе и выводят мощь RAG наполную катушку.

В этой статье разберем что нового в Gemini Embedding 2 и построим полноценный мультимодальный RAG с нуля - Python, Supabase, Gemini API.

P.S. С кодом.

xcillx 14 мар в 22:31

Доступ к домашнему серверу без белого IP: reverse SSH tunnel через autossh + Xray

Средний

3 мин

18K

DevOps *

Из песочницы

Иногда нужно получить SSH-доступ к домашнему серверу (ноутбуку или мини-серверу на Ubuntu), который находится за NAT/CGNAT провайдера. Публичный IPv4 отсутствует, а использовать VPN или облачные туннели (ngrok, Cloudflare Tunnel и т.п.) не хочется.

Один из простых способов — обратный SSH-туннель с помощью autossh + проксирование через уже существующий Xray-клиент (VLESS + Reality), который и так работает для выхода в интернет.

babaiiika 15 мар в 03:08

Как я в одиночку начинаю IoT-стартап на Rust в Бразилии

Средний

15 мин

18K

Rust *

Кейс

Начну с короткого рассказа, как я докатился до жизни такой ) Меня зовут Егор, мне 28. У меня нет диплома программиста, нет опыта работы в IT и нет ни одного коммерческого проекта в резюме. Зато я всю жизнь очень любил железо — буквально с детства, будучи ещё в детском саду, я чинил себе джойстики на Sega, а потом на PS1. В школьные годы открыл для себя сначала Ucoz, потом Wix, Tilda, WordPress, и уже к институту освоил React. Но так сложилось, что это для меня всегда было просто хобби — как и собирать себе датчики для дома: датчики влажности, открытия дверей и т.д. ))

Возможно, я бы мог стать программистом и зарабатывать приличные деньги, но учился в школе с военным уклоном, а после школы стал предпринимателем — занимались производством металлоконструкций и мебели ) После череды ссор с партнёром стал аккаунт-менеджером в Достависте, и отработал там славные 4 года (и по вечерам програмировал мечтал об магазине аля САМОКАТ ), что, собственно, и позволило мне отправиться в Грузию в 2021 году перезимовать и познакомиться с будущей женой.

Грузия, которая не случилась

Жили в Грузии, всё было кайф. Купил там квартиру не в центре Батуми, буквально на кредитку(было так дешево ), в начале 2022 года — до начала событий . Август 2025. Мы с женой (беременной, она грузинка) пошли в Турцию на визаран — так как ПМЖ мне не давали, а давали справку о том, что я «угроза нац. безопасности». На границе меня разворачивают — аргументируя тем, что я слишком долго туристом у них живу.

Месяц живу в Турции, жена быстро всё продаёт. В Россию не хочется — у меня повестки висят и ничего в России кроме родственников нет. Решили поехать туда, где паспорт по рождению ребёнка и не слишком дорого. Так и выбрали Бразилию.

+63

rozhnev 13 мар в 10:01

Почему `SUM() OVER (ORDER BY ...)` иногда считает «неправильно»: разбираем оконные фреймы в SQL

Простой

9 мин

9.8K

SQL * PostgreSQL * MySQL * Microsoft SQL Server * Базы данных *

Туториал

Почему SUM() OVER (ORDER BY ...) иногда даёт неожиданный результат, даже когда запрос синтаксически правильный? В статье на практических примерах разбираю, как работают оконные фреймы в SQL, чем отличаются ROWS, RANGE и GROUPS, где чаще всего возникает путаница и как писать накопительные итоги и скользящие метрики без сюрпризов. Если используете оконные функции в аналитике, этот разбор поможет сделать их поведение предсказуемым и управляемым.

+33

Askarzh 13 мар в 07:16

Как я перестал переключать раскладку ради одного символа: Прокачиваем русскую клавиатуру в Windows для Markdown и кода

Простой

3 мин

17K

Подготовка технической документации * Машинное обучение * Контент и копирайтинг * Искусственный интеллект

Туториал

Из песочницы

Стремительное развитие ИИ в последние годы привело к невиданному росту популярности Markdown. Почти все современные LLM — от ChatGPT до Claude — по умолчанию выдают ответы в этом формате. Мы привыкли оформлять в нем заметки в Obsidian, писать промпты, вести документацию в GitHub и общаться в рабочих мессенджерах. Markdown стал «лингва-франка» современного интернета.

Но есть одна проблема. Использовать Markdown с русским языком — это боль.

Вам нужно поставить заголовок? Alt+Shift -> # -> Alt+Shift обратно. Нужно выделить код? Снова чечётка по клавишам переключения раскладки. Стандартная русская раскладка в Windows будто застряла в прошлом веке. Клавиша Shift+3 выдает нам символ №, который в 2024 году нужен крайне редко, в то время как жизненно необходимые решетки, собаки и скобки заставляют нас постоянно прыгать между языками.

Я решил эту проблему для Windows с помощью небольшого скрипта на AutoHotkey (v2).

+55

cyberscoper 12 мар в 15:32

Как ТСПУ ловит VLESS в 2026 и почему XHTTP — следующий шаг

Средний

7 мин

136K

Сетевые технологии * Информационная безопасность * Системное администрирование * Open source * Настройка Linux *

Аналитика

Разбор методов детекции, которые работают прямо сейчас. JA3/JA4-отпечатки, поведенческий анализ и архитектура XHTTP, которая закрывает именно эти дыры

Если твой VLESS+Reality сервер лёг в последние месяцы — ты не один. В сообществах фиксируют волны блокировок, которые раньше не достигали хорошо настроенных Reality-серверов. Что конкретно изменилось, как это устроено на уровне алгоритмов — и почему XHTTP сейчас выглядит как правильный следующий шаг.

+281

272

ru_vds 12 мар в 07:09

После блокировки мессенджеров Matrix стал единственной альтернативой?

Средний

6 мин

134K

Блог компании RUVDS.comСистемное администрирование * Мессенджеры * ХостингOpen source *

Туториал

Как известно, в РФ почти полностью заблокировали WhatsApp* (принадлежит запрещённой организации), а будущая работа Telegram под вопросом. Звонков уже не осталось, только текстовые сообщения, передача файлов тормозит. Судя по всему, начался шейпинг трафика. А если эффективен шейпинг, то сработает и полная блокировка, которую планируют в первых числах апреля, по слухам от РБК.

У нас остаётся всё меньше рабочих способов общения. Если отбросить совсем странные варианты вроде Google Docs или Max, то самая оптимальная альтернатива — это опенсорсные мессенджеры, такие как XMPP (Jabber) и Matrix/Element. Для максимальной надёжности такого общения в федеративной сети желательно поднять свой собственный сервер. Это можно сделать на домашнем сервере или VPS.

Тема актуальна в том числе для закрытых сообществ, которые раньше общались в группах Telegram, WhatsApp* (принадлежит запрещённой организации) и Viber. Родственники, корпоративные рабочие команды, домовые чаты, игровые сообщества и др. Теперь их можно перенести в Matrix/Element на своём сервере.

+97

324

xpltt 10 мар в 17:25

Синхронизируем Obsidian быстро, безопасно, удобно и бесплатно

Средний

4 мин

17K

Git * Информационная безопасность * Open source *

Туториал

гайд по синхронизации obsidian vault через git с шифрованием через git-crypt и gpg (заметки хранятся на сервере в зашифрованном виде, локально обычный markdown )

+11

GeeksCat 5 мар в 18:05

Семь игр на «ведроид», которые не захочется удалять

Простой

17 мин

36K

Блог компании Timeweb CloudИгры и игровые консолиГаджеты

Обзор

Для начала — всем привет!

Раз за разом, то тут, то там я натыкаюсь на мнение, мол, мобильные игры — донатная помойка. Так как я сам много играю в мобилки, то этот тезис я хочу разбить с помощью поста про тягачи, этого поста (а если он «выстрелит» — и других).

Список поигранных мобилок у меня большой, а значит выбор трудный. Но я его сделал. Для начала я выбрал несколько (точнее — семь штук) классных игр, в которые играю; они являются поделками одной и той же компании — Home Net Games.

+36

AlexWllI 23 фев в 14:39

Цифровой суверенитет в кармане: почему пора поднять свой Matrix-сервер, пока мессенджеры лихорадит

Простой

7 мин

31K

Мессенджеры * Информационная безопасность * Облачные сервисы *

Туториал

(В статье описывается простой и безопасный способ поднятия собственного Matrix Synapse сервера с компонентами web интерфейса пользователя и видеосвязи на основе opensource скрипта. Статья состоит из 2-х частей, теоретической и практической. Если вы сразу понимаете о чем речь, чтобы сэкономить время можете сразу перейти к практической части.)

Matrix Synapse (эталонная реализация сервера) предлагает уровень безопасности, который многим коммерческим продуктам только снится. Сквозное шифрование (E2EE) на базе протоколов Olm и Megolm обеспечивает приватность не только один на один, но и в групповых чатах. При этом ключи шифрования хранятся только на ваших устройствах, а не на сервере. Даже если кто-то получит доступ к базе данных вашего Synapse, он увидит там лишь нечитаемый шум.

Федерация — киллер-фича протокола. Это работает как электронная почта: вы можете иметь адрес на matrix.my-company.ru и спокойно писать пользователю на matrix.org. Это создает глобальную сеть без единой точки отказа и единого цензора. Если один сервер или целый сегмент сети заблокируют, остальная сеть продолжит жить. Для бизнеса это означает возможность строить защищенные каналы связи с партнерами, сохраняя данные внутри своего контура сети.

+23

tzirulnicov 4 мар в 20:13

Умная колонка своими руками

Средний

13 мин

34K

DIY или Сделай самArduino * Raspberry Pi * Умный домИскусственный интеллект

Туториал

В этой статье я расскажу, как сделать своими руками две умные колонки, полностью поддерживающие русский язык:

1) На микроконтроллере esp32s3, используя XiaoZhi

2) На Raspberry Pi автономную голосовую колонку с камерой, которая будет работать и распознавать всё, что не только слышит, но и видит перед собой, даже при отсутствии Интернета! С локально запущенными моделями ИИ, связка Ollama+Gemma3:1b+Moondream+OpenWakeWord+Whisper.cpp+Silero TTS

А также расскажу, как подключить обе эти колонки к Home Assistant для управления устройствами умного дома.

+30

vibe_analyst 3 мар в 08:58

Как я создала локального AI-ассистента для системного аналитика: от Telegram-бота до полноценного помощника (часть 1)

Простой

5 мин

9.4K

Python * Анализ и проектирование систем * Искусственный интеллект

Из песочницы

Привет! Меня зовут Фаина, я системный аналитик с опытом более 5 лет. В последнее время все чаще стала задумываться как системному аналитику в текущих реалиях применять в работе ИИ. Так началось мое погружение в увлекательный мир LangChain, ИИ, RAG и векторные БД.

Для начального исследования я решила попробовать что-то достаточно простое и базовое. Так в мою голову пришла идея создать ТГ бота, который напоминает о запланированных делах

abubakr_ai 24 фев в 07:00

Параллельный поиск в PostgreSQL: Погружение в архитектуру и производительность pg-smart-search SDK

Средний

8 мин

6.1K

PostgreSQL * Node.JS * Open source *

Кейс

Многие проекты рано или поздно утыкаются в «потолок» стандартного поиска. Обычный LIKE перестает справляться, когда данных становится больше 100 тысяч строк, а пользователи начинают ошибаться в каждом втором слове. Типовым решением в такой ситуации считается внедрение Elasticsearch или Meilisearch.

Но внешние движки — это всегда «налог» на инфраструктуру: лишняя память, задержки на сетевой хоп и, самое главное, головная боль с синхронизацией данных. В этой статье мы разберем, как выжать из PostgreSQL производительность специализированного поисковика, используя Node.js как оркестратор параллельных стратегий и механизм AbortSignal для предотвращения лишней нагрузки на БД. Разбираем внутреннее устройство SDK pg-smart-search.

ScriptShaper 19 фев в 04:01

Я заменил Google на 50 строк Python. Через месяц я забыл, как пишется tar -xzf

Простой

8 мин

87K

Программирование * Системное администрирование * DevOps * Искусственный интеллектPython *

Кейс

Десять лет в девопсе. Десять. И я гуглю tar -xzf. Не раз в год — раз в неделю. Ну, может раз в десять дней, если повезёт. Открываю хром, набираю «tar extract gz linux», пролистываю три рекламы, нахожу ответ на SO, копирую, вставляю, закрываю вкладку. Через неделю — по новой.

Я не идиот. Точнее, может и идиот, но не поэтому. Просто tar — это такой синтаксис, который у меня физически отказывается залезать в долговременную память. Там дефис или нет? xzf или xfz? Или zxf? Вроде порядок не важен? Или важен?..

Короче. Месяц назад я написал скрипт, который это решил. А потом скрипт решил больше, чем я хотел.

+238

284

katherine_a 19 ноя 2025 в 08:33

Что такое API Gateway: 10 главных функций и роль в архитектуре микросервисов [полный гайд]

Средний

9 мин

12K

Анализ и проектирование систем * Проектирование и рефакторинг *

Туториал

Микросервисная архитектура уже давно стала нормой для IT-продуктов. И одну из центральных ролей в таком подходе занимает API Gateway.

В этой статье разберём, что такое API Gateway, зачем он нужен в микросервисной архитектуре, какие 10 ключевых функций он выполняет, и является ли он потенциальной точкой отказа в системе.

Внутри вы найдёте много картинок и примеров схем архитектуры, чтобы объяснения были максимально понятными.

Материал будет полезен системным аналитикам, начинающим архитекторам, разработчикам и тестировщикам, особенно при подготовке к собеседованиям в продуктовые компании.

Оглавление:
Что такое API Gateway
10 главных функций API Gateway
Виды API Gateway
API Gateway - центральная точка отказа
Примеры схем архитектуры с API Gateway в нотации C4 (и не только)
Заключение и полезные ссылки

+11

ohld 16 фев в 07:54

Увольняем джуниора: автоматизируем анализ данных c Claude Code, Codex, Cursor, OpenCode

Простой

6 мин

23K

SQL * PostgreSQL * Big Data * GitHub *

Туториал

Вспомните, как вы онбордили аналитика: показывали данные, примеры рабочих SQL, неочевидные легаси и костыли — и через какое-то время он начинал перформить самостоятельно.

Чтобы научить AI-агента — нужно пройти ровно те же шаги, только вместо недель, на обучения потратятся часы, а в результате большая часть рутины аналитика будет автоматизирована.

В этой статье я расскажу, как я автоматизировал свой анализ данных, и дам пошаговую инструкцию, которую вы с легкостью сможете повторить это у себя в проекте.

Статья будет полезна как предпринимателям, которые хотят оптимизировать процессы, так и аналитикам, которые хотят прокачать себя. Погнали!

Уволить

Walker2000 10 ноя 2025 в 04:00

Домашний супер-компьютер для ИИ: какой выбрать в 2025?

Простой

10 мин

17K

ВидеокартыГаджетыИскусственный интеллектКомпьютерное железоБудущее здесь

Обзор

Вполне возможно, что в этом году происходит зарождение нового тренда. Он заключается в переносе вычислительных мощностей ближе к пользователю - прямо домой, на его личную вычислительную станцию. Похоже, что большие языковые моделей (LLM) и генеративный ИИ перестают быть прерогативой дата-центров.

В этой статье приведен обзор решений, которые можно применить в качестве домашних вычислительных станций ИИ сегодня.

by-sonic 11 фев в 21:13

TeamViewer мёртв, AnyDesk блокирует РКН. Я написал замену на WebRTC

Простой

6 мин

54K

Сетевые технологии * macOS * Windows * СофтСистемное администрирование *

Обзор

TL;DR: TeamViewer заблокировал все бесплатные подключения из России в 2022 году. AnyDesk с апреля 2025 года блокируется Роскомнадзором — тысячи жалоб, соединения не устанавливаются или обрываются. Российские аналоги стоят от 72 000 ₽/год и заточены под корпорации. Я сделал Portal — удалённый рабочий стол на WebRTC с прямым P2P-соединением, без серверов-посредников. macOS + Windows. 1 устройство бесплатно. Сайт — portal-app.ru. Telegram — @portalremote.

Что случилось с TeamViewer

5 мая 2022 года TeamViewer объявил о полном прекращении работы в России и Беларуси. Компания:

Заблокировала все бесплатные (нелицензионные) подключения из России и в Россию

Прекратила продажу новых лицензий

Отказалась продлевать существующие контракты

Если вы сейчас скачаете TeamViewer и попробуете подключиться — получите «Невозможно подключиться к партнёру». Всё. Без вариантов. Двадцать лет люди привыкали к этому инструменту, а потом в один день он просто перестал работать.

Соник, что ты сделал?

+18

147

cyberscoper 10 фев в 13:10

Повышаем стабильность Telegram: поднимаем партизанский MTProxy с Fake TLS

Простой

4 мин

359K

Информационная безопасность * Сетевые технологии * Системное администрирование * DIY или Сделай самDevOps *

Туториал

Привет, Хабр!

Telegram блокируют всё активнее. VPN детектят и режут. Обычные прокси живут неделю. Что делать? Ответ MTProto Proxy с Fake TLS: специализированный прокси, который маскируется под обычный HTTPS-трафик к легитимным сайтам вроде 1c или sberbank. Для DPI это выглядит как обычный визит на сайт, а на деле стабильный Telegram.

Сегодня разберём полную инструкцию: от выбора правильного VPS до эффективной маскировки и мониторинга.

Читать туториал

+148

249

bobastia 10 фев в 08:01

Обзор лучших API для распознавания речи 2026

Простой

6 мин

9.8K

SaaS / S+S * ИнфографикаИскусственный интеллектОблачные сервисы * Звук

Обзор

Всем снова привет! В прошлом году мы сравнивали решения для транскрибации речи, и с тех пор многое изменилось. Большинство провайдеров выпустили новые модели, много у кого появились новые фичи, и я решил обновить статью. Если вы - бизнес и вам нужен надежный API, или если вы просто энтузиаст, и вам интересно подобрать решение для себя, добро пожаловать!

+16

2 3 ...

23 24