Articles / Bookmarks / Profile of Faositb / Habr

Егор@Faositb

User

ProfileArticles1PostsNewsComments18

zarazaexe Apr 25 at 07:32

Это — всё что вам надо знать о белых списках: как устроены и 6 способов обхода

Medium

10 min

136K

Information Security * Network technologies * IT Infrastructure * Open data * Reverse engineering *

Analytics

Думаю, вы уже в курсе, что происходит в РФ с белыми списками: работают белые списки, ТСПУ в режиме drop-all пропускает только одобренные IP + SNI, рунет медленно, но верно становится интранетом

Мы просканировали 46 млн российских IP-адресов, нашли 63 тысячи выживших, разобрали работу ТСПУ. И главное - актуальные методы пробива (от Serverless-функций и покупки VPS с белым IP до туннелей через WebRTC).

+581

237

Shannon Apr 23 at 22:13

Выжать больше из локальных LLM. Ollama медленнее llama.cpp в 3 раза. UD_Q4_K_XL лучше чем Q4_K_M, а вес тот же и т.д

21 min

38K

Artificial Intelligence

✏️ Technotext 8

Самый просто способ запустить локальную LLM - это установить ollama или LM Studio. Это быстро и просто, но вы теряете и в скорости, и в качестве. Почему UD_Q4_K_XL лучше при том же размере, почему квант Q3 может быть медленнее чем Q4. Хорошая ли идея взять REAP для вырезания ненужных экспертов из MoE. Кто быстрее, Linux или Windows. В общем как выжать больше из локальных LLM на домашнем железе.

+199

105

rRenegat Apr 24 at 09:01

Ваш RAG не умеет думать. А мой умеет

Medium

8 min

27K

RUVDS.com corporate blogMachine learning * Artificial IntelligenceDatabase Administration * Open source *

Review

Привет, Хабр!

Базовые RAG-системы уже научились неплохо справляться с прямыми вопросами по тексту. Но только если ответ лежит в одном конкретном абзаце, а вопрос сформулирован почти так же, как сам исходный документ. Попробуйте заставить систему связать факты из трёх разных источников или сделать банальный логический вывод. В большинстве случаев результат будет неутешительным. А уж про поиск скрытых связей я даже спрашивать боюсь.

Сегодня рассмотрим open-source RAG-фреймворк HippoRAG 2. В сфере RAG главным преимуществом данного фреймворка является качество ответов, потому что принципы его работы основаны на реальном человеческом мозге. Давайте разберёмся, откуда он взялся, как устроен изнутри и как его запустить.

+91

callsauI Apr 19 at 10:15

Приватная Cвязь на Go и Flutter

Hard

8 min

10K

Go * Flutter * Dart * Information Security * Decentralized networks *

Case

From sandbox

Пока все обсуждают очередные сливы баз и особенности модерации в популярных «безопасных» мессенджерах, решил попробовать пойти другим путем. В этой статье рассказываю, как я скрестил Flutter и Go через CGO, прикрутил libp2p для создания P2P-сети и реализовал честное E2EE шифрование (Double Ratchet для личек и MLS для групп). Никакой централизации, никаких единых точек отказа. Делюсь результатами эксперимента.

+11

AndreyShafirin Apr 10 at 14:15

Перестаньте искать лучшую компанию. Ищите подходящее давление

Easy

14 min

27K

IT careerIT-companiesPersonnel Management * Development Management * Brain

Opinion

From sandbox

Разбор 6-ти кластеров ИТ‑сред и тест на совместимость для тех, кто хочет построить карьеру, сохранив нервную систему.

Так сложилось, что моя профессиональная ИТ кривая прошла через стартапы, галеры, продуктовку, бигтех, энтерпрайз и госуху. И если в юности я делал выбор места работы не осознанно и не всегда удачно, то с возрастом появлялось настойчивое желание эту тему отрефлексировать, чтобы ответить на вопрос: «Чего ж тебе ещё надо собака?». У меня есть предположение, что я не одинок в этом вопросе выбора, поэтому хочу поделиться тем что из этого получилось. Погнали...

Надпись на храме Аполлона в Дельфах иногда высмеивают, но в управлении карьерой это может оказаться весьма неплохим инструментом. «Познай себя» означает честную инвентаризацию своей толерантности к хаосу, амбициям и типам давления. На мой взгляд, большинство профессиональных неудач — это не от недостатка скиллов, а чаще конфликт личности и среды. Я часто наблюдал как один и тот же человек, совершенно непригодный к одной ситуации, буквально «расцветал» в другой. Когда ваша внутренняя прошивка несовместима с операционной системой компании, трение сжигает ресурс быстрее, чем работа. Когда ваша внутренняя прошивка совпадает с операционной системой компании, трение минимально. Энергия уходит в работу, а не в преодоление среды.

Рынок IT гетерогенен и давно уже кристаллизовался в кластеры с мало‑пересекающимися правилами игры. Ошибка в выборе кластера стоит 2–3 лет жизни и куска нервной системы. Специалисты часто мечутся между средами, пытаясь играть по чужим правилам, и закономерно проигрывают.

+155

Tirarex Mar 27 at 13:01

Я вскрыл платёжный терминал «Сбера» — внутри оказалась игровая консоль и телефон

Medium

12 min

451K

RUVDS.com corporate blogSmartphonesManufacture and development of electronics * GadgetsDIY

Review

Наверное, каждый видел эти терминалы «Сбера» на кассах магазинов. Раньше там был радостный кот, а сейчас бегают разноцветные глаза. И не знаю, как вам, а мне всегда было интересно, что эти девайсы имеют под капотом. Можно ли туда поставить свои приложения? Неужели «Сбер» сам их сделал? Да и было бы забавно заставить работать игры на нём.

И вот он в моих руках, а далее в статье есть все ответы на вопросы выше. Ну и ещё мы с него звонить будем.

+494

189

Ka1seR Mar 23 at 08:00

Нормальные формы в базах данных. Как в БД появляются аномалии

Easy

9 min

14K

Selectel corporate blogSQL * SQLite * Database Administration * Data storage *

Tutorial

Привет Хабр! В прошлой статье мы детально разобрали функциональные зависимости. Возможно, после нее у вас, как и у многих, остался закономерный вопрос: зачем нам вообще так париться, выискивая эти зависимости? Как это применяется в проектировании баз данных?

Естественно, можно спроектировать базу данных, вообще не заботясь ни о каких правилах. И она даже будет работать! Все будет прекрасно ровно до первого ее реального использования в продакшене. При проектировании «абы-как» возникают три типовые проблемы: избыточность, аномалии обновления, аномалии удаления.

И вот это уже плохо.

+78

ret77876 Oct 22 2024 at 08:16

Запускаем Yolo на пятирублёвой монете или Luckfox Pico Mini

Medium

29 min

64K

Artificial IntelligenceC++ * RoboticsMachine learning * Image processing *

Tutorial

✏️ Technotext 7

В данной статье речь пойдет про использование очень маленькой Luckfox Pico Mini. Я расскажу про особенности платы, её настройку, а также о том как запускать на ней нейронные сети для детекции объектов с камеры.

Мне удалось добиться скорости детекции в 15 FPS (или даже 50!), результат, который по силам далеко не каждому одноплатнику.

+144

b1tway Mar 10 at 07:01

LLM Inside: выжимаем максимум из Decoder Attention на GPU

11 min

15K

Яндекс corporate blogServer optimization * High performance * Machine learning * GPGPU *

✏️ Technotext 8

Привет, Хабр! Меня зовут Андрей Шукшов. Я пишу YNMT в Яндекс R&D — это движок инференса, на котором работают почти все наши большие языковые модели (LLM). Бо́льшую часть времени я пытаюсь понять, почему некоторые вещи работают медленно и как сделать так, чтобы у них это получалось чуточку быстрее.

Если вы запускали локальную LLM, то, возможно, тоже удивлялись: почему железо, способное рендерить фотореалистичные миры в реальном времени, работает в темпе печатной машинки? В своей статье я попробую хотя бы отчасти ответить на этот вопрос. Под микроскопом посмотрим на механизм Attention в режиме генерации (декодирования) и, вооружившись лучшими современными практиками ускорения на GPU, объединим всю математику в один эффективный kernel, который выжмет максимум производительности из имеющегося у нас железа.

+66

antipov_dmitry Oct 29 2025 at 08:18

Выбираем векторную БД для AI-агентов и RAG: большой обзор баз данных и поиск смысла

18 min

22K

Database Administration * Artificial IntelligenceMachine learning * System Analysis and Design *

В этой статье я сделал обзор основных векторных баз данных: Milvus, Qdrant, Weaviate, ChromaDB, pgvector, Redis, pgvectorscale, LanceDB, ClickHouse, Vespa, Marqo, ElasticSearch.

Если вы запутались в разнообразии векторных баз данных или хочется верхнеуровнево понимать как они устроены, чем отличаются и для чего вообще нужны, то эта статья будет очень полезна. Мы пошагово соберем все ожидания от векторных БД, посмотрим бенчмарки, а затем попробуем собрать все воедино.

+26

br0mberg Aug 28 2025 at 14:29

RAG и векторные БД: НЕ Сизифов LLM на Java и Spring Ai

Medium

14 min

34K

RUVDS.com corporate blogJava * System Analysis and Design * Artificial IntelligenceMachine learning *

Tutorial

Привет! Меня зовут Бромбин Андрей, и сегодня я разберу на практике, что такое RAG-системы и как они помогают улучшать поиск. Покажу, как использовать Spring AI, векторные базы данных и LLM. Ты получишь теорию и пример реализации на Java и Spring Boot – от идеи до работающего сервиса. Без сложных формул – только чёткие объяснения и код.

Обновить резюме

+84

vikorbit Dec 8 2025 at 09:50

Векторный поиск: как выбрать систему и не пожалеть

22 min

12K

Тензор corporate blogOpen source * Artificial IntelligenceSearch engines * Database Administration *

Review

От поиска по архивам документов и медиафайлам до рекомендательных систем и AI приложений — всюду работают эмбеддинги и векторный поиск. Но когда дело доходит до выбора конкретного инструмента, глаза разбегаются: Qdrant, Milvus, Weaviate, Redis, Elasticsearch, Pgvector…

Если вы:

• планируете внедрять семантический поиск в свой продукт,
• выбираете между проверенными временем БД и специализированными системами обработки векторов,
• ищете независимые бенчмарки,

то этот материал — для вас. Мы разберем основные концепции векторного поиска, сравним популярные open-source решения и протестируем скорость их работы с учетом загрузки процессора и памяти.

+38

SharplEr Jul 28 2024 at 11:19

Дизайн встраиваемой базы данных для ANN запросов: MusyaDB

Hard

23 min

7.7K

Search engines * System Analysis and Design *

Я решил задизайнить встраиваемую базу данных. Это даст вам почувствовать вкус настоящего инженерного искусства. Статья получилась размером с небольшую книгу и разбивается на две больших статьи. В первой части мы поймем с чего вообще начинается дизайн таких систем, выберем алгоритмы и модель вычислений.

+19

nmzgnv Apr 23 2024 at 08:34

Векторные базы данных: простым языком про устройство и принцип работы

Easy

11 min

101K

Точка Банк corporate blogArtificial IntelligenceData storage * Big Data * Open source *

Только изучили один инструмент, как сразу же появились новые? Придется разбираться! В статье мы рассмотрим новый тип баз данных, который отлично подходит для ML задач. Пройдем путь от простого вектора до целой рекомендательной системы, пробежимся по основным фишкам и внутреннему устройству. Поймем, а где вообще использовать этот инструмент и посмотрим на векторные базы данных в деле.

+32

interpres Mar 4 at 13:01

Одна формула, позволяющая понять 3D-графику

Easy

9 min

31K

RUVDS.com corporate blog3D-graphics * Algorithms * Programming * JavaScript *

Tutorial

Translation

Учась в школе, я обнаружил очень простую математическую формулу, о которой не перестаю думать и сегодня. Смысл её в следующем: представьте, что у вас есть 3D-точка в воображаемом 3D-пространстве за экраном. Для проецирования этой 3D-точки на экран нужно взять её координату X, поделённую на Z, и аналогично её Y / Z. И в результате вы получите проекцию точки на экран: $x'=\frac{x}{z}$ и $y'=\frac{y}{z}$ . А если у вас есть множество точек в этом 3D-пространстве за экраном, и вы начнёте их анимировать и вращать их, а потом воспользуетесь этой формулой для рендеринга всех точек на экране, то это будет выглядеть, как 3D-сцена или 3D-объект. Давайте попробуем эту формулу в деле.

+125

adshpagin Feb 24 at 06:59

Технологии в основе VK Видео: от загрузки файла до кадра на экране зрителя

Medium

11 min

22K

VK corporate blogWorking with video * IT Infrastructure * High performance * Java *

Review

✏️ Technotext 8

В 2025 году платформа VK Видео стала лидером в России по ежедневной и ежемесячной аудитории. За этим результатом стоит не только рост числа авторов и объёма контента. В его основе системное развитие технологий: мы последовательно масштабируем инфраструктуру, совершенствуем пайплайны обработки видео и инвестируем силы в стабильность воспроизведения на всех пользовательских устройствах и при любых условиях сети. Это постоянная инженерная работа, направленная на предсказуемое и стабильное качество сервиса при быстрорастущей нагрузке.

Меня зовут Алексей Шпагин, я руководитель разработки бэкенда видеоплатформы VK. В статье расскажу о технологиях, лежащих в основе VK Видео, и жизненном цикле контента на платформе: от загрузки и обработки до доставки зрителям.

Загляни под капот VK Видео

+103

AskePit Feb 25 at 16:03

C++: экономим на спичках

Medium

17 min

17K

C++ * C *

Case

Недавно на работе мы столкнулись с большим потреблением памяти в игре. Связано оно было с хранением большого количества информации о террейне и свойствах его клеток, которое нужно игре для разных геймплейных расчетов. Проблема насущная, особенно остро проявляется как раз в больших массивах или матрицах с большими размерностями.

Довольно типичный случай — у вас есть вполне себе нормальная структура, которая хранит информацию об одном объекте. Но самих объектов очень и очень много. Скажем, у вас 1000x1000 клеток террейна. А это уже целый миллион объектов! И вот ваша структура размером с несчастные 32 байта множится миллион раз и разрастается до объемов 30.5 Mб оперативной памяти.

Эта статья — она не про умные решения этой проблемы, она чуть приземленнее. Прежде чем приступать к дорогостоящим по времени и ресурсам переделкам, стоит совершить, так сказать, нулевой шаг оптимизации - попробовать оптимизировать саму структуру или класс, хранящий информацию, так, чтобы он стал занимать меньше места. Сэкономим на спичках!

Сэкономить на спичках!

+82

luknix Feb 16 at 08:06

Тетрис в ядре Linux

Medium

19 min

19K

Timeweb Cloud corporate blogDevelopment for Linux * Configuring Linux * System Programming * Abnormal programming *

Tutorial

Вероятно, вы знаете, что если запустить ядро Linux без корневой файловой системы или файла initramfs, то оно упадет с сообщением о панике ядра.

Но возможна ли работа ядра Linux без этих, вроде бы обязательных компонентов? Ответ на вопрос — да, возможна, но использовать такие возможности в конечном продукте не стоит.

При запуске ядра ему могут передаваться параметры через командную строку. Одним из параметров является rootwait, указывающий ядру на то, что нужно подождать появление корневой файловой системы. В этом случае ядро ожидает появление корневой системы, а не завершается выполнение ядра с ошибкой.

Формально ничто не мешает написать модуль ядра, который взаимодействует с клавиатурой и дисплеем и временно выполняет функции пользовательского приложения, пока ядро ожидает корневую файловую систему.

Пользовательским приложением может быть, например, игра Тетрис. Она из-за своей простоты в реализации и зрелищности добавляет наглядности в изучении темы и дает чувство завершенности. А мысль о том, что тетрис, работает в ядре, усиливает эффект.

+87

avshkol Feb 14 at 22:10

Возможно, самый гениальный код на python на сегодня: разбираем 200-строчный microgpt от Андрея Карпаты

Medium

27 min

52K

Python * Artificial IntelligenceHistory of ITPopular science

Review

Translation

Буквально на днях Андрей Карпаты, один из ранних сооснователей OpenAI, покинувший компанию, исследователь нейросетей, опубликовал на Гитхаб фантастическую вещь: чистый (без специализированных библиотек) 200-строчный python-код трансформера, аналога GPT-2, для изучения всеми желающими. И написал в блоге статью для понимания этого кода (и работы трансформеров). Я перевёл статью и комментарии к коду — ведь этот код (я уверен!) войдёт в ИТ-историю...

Присоединяйтесь к этому завораживающему сеансу разоблачения gpt-магии, за считанные годы овладевшей миром!..

+134

PB_Academy Jan 3 2025 at 08:00

Оптимизация SQL запросов

Medium

6 min

81K

SQL * Big Data * Designing and refactoring *

Tutorial

Оптимизация SQL-запросов является одной из ключевых задач при работе с реляционными базами данных. Эффективные SQL-запросы позволяют значительно улучшить производительность приложений и обеспечить более быстрый доступ к данным. В данной статье мы рассмотрим как переписать запрос, чтобы выполнялся быстрее. В статье пойдет речь о PostgreSQL, хотя применять данные советы к любой базе данных SQL Ниже будут представлены термины и операторы, о которых пойдет в данной статье.

Читать про оптимизацию

+86

2 3 ...

9 10