Статьи / Закладки / Профиль dan

Даниил Солопов@dan_sw

Software Engineer, Bachelor of Computer Science

ПрофильСтатьи9Посты1НовостиКомментарии282

@artyc99 1 авг в 15:02

Барьеры памяти «Golang»

Средний

16 мин

9.3K

Go * Программирование * Assembler *

Обзор

Данная статья направлена на повышение уровня понимания принципов работы барьеров памяти, которые лежат в основе атомарных операций. Она не описывает историю и первопричины появления данного механизма, а служит объяснением основных подходов.

Идеей было донести простыми словами и примерами механизмов работы барьеров памяти, поэтому в данной статье нет углубления в синтаксис ассемблер команд или архитектур процессоров.

+16

@Adm1ngmz 22 июл в 16:35

Как я превратил простую HTML-инъекцию в SSRF с помощью рендеринга PDF

4 мин

Информационная безопасность * Bug hunters *

Перевод

Сегодня я расскажу вам об интересной уязвимости, которую я нашёл в одном закрытом баг-баунти проекте: простая HTML-инъекция превратилась в полноценную SSRF с утечкой учетных данных AWS.

Заварите себе кофе, и давайте начнем! 😉

+14

@MagicHappens 22 июл в 09:31

Защита от тёмных искусств: DLL-Hijacking

Средний

12 мин

1.8K

Блог компании FirstVDSИнформационная безопасность * Системное администрирование * Windows *

Представьте: пользователь открывает совершенно легитимную программу — скажем, видеоплеер, корпоративный мессенджер или даже встроенный в Windows инструмент. Программа запускается, выполняет свои функции. Антивирус молчит. Мониторы пользователя не показывают ничего подозрительного. Но в этот самый момент, под прикрытием доверенного процесса, в памяти компьютера уже тихо работает вредоносный код, крадущий конфиденциальные данные или готовящий почву для атаки на сеть. Как он туда попал и почему не был обнаружен?

Один из возможных вариантов — использование атакующими техники DLL-Hijacking (Mitre T1574.001). Я встречал мнение, что техника (а если быть точным, то это подтехника для T1574: Hijack Execution Flow) DLL Hijacking — баян десятилетней давности и не может считаться актуальной угрозой для корпоративных Windows-сред. Затрудняюсь определить причину такого мнения, потому что атаки с использованием DLL-библиотек явно не ушли в прошлое — их по-прежнему упоминают в уважаемых отчетах по кибербезу — к примеру, здесь (Mandiant M-Trends 2024, стр.50) и здесь (Лаборатория Касперского, «Азиатские APT-группировки: тактики, техники и процедуры»).

Причин широкого распространения таких атак несколько. В первую очередь, это скрытность, так как вредоносное ПО выполняется в контексте легитимного процесса, обходя сигнатурные проверки антивирусов, а для обнаружения требуется EDR и навыки работы с ним.

Во-вторых, простота, так как для успеха часто достаточно лишь правильно названного файла .dll, помещенного в «нужную» папку, куда пользователь или приложение его случайно положат или откуда запустят уязвимую программу.

В-третьих, техника работает на всех актуальных версиях Windows, поскольку уязвимы не столько сами ОС, сколько миллионы приложений, полагающихся на стандартный (и небезопасный по умолчанию) механизм поиска библиотек.

Наконец, как мне думается, в последнее время из-за распространения нейросетей сильно упал входной порог компетенций для конструкторов вредоносов. Я не эксперт в разработке приложений, но подозреваю, что написать вредоносную dll-библиотеку с помощью ChatGPT значительно проще, чем без него.

В этой статье мы:

За 90 секунд освежим в памяти, что такое DLL, как работает, в чем фундаментальная уязвимость механизма загрузки.

Осветим примеры атак с подменой DLL согласно их классификации.

Расскажем о защитных мерах для предотвращения атак этого типа.

Приведем рекомендации для SOC по обнаружению атаки (и объясним, почему цифровая подпись — не гарантия легитимности библиотеки).

Итак, добро пожаловать под кат!

@Vass 27 мар 2009 в 10:18

Разбор опций командной строки в UNIX-подобных системах

7 мин

49K

Программирование *

Туториал

Введение

Одной из важных задач любой программы, будь она консольной или графической является интерпретация аргументов командной строки. Формально аргументами называются все слова в командной строке(в том числе и имя самой команды) разбитые разделителем (как правило, это пробел и табуляция), кавычки же позволяют включать разделители в аргументы.
Аргументы можно подразделить на опции и операнды. Опции изменяют поведение программы или предоставляют ей дополнительную информацию. У опции могут быть свои аргументы, которые являются информацией необходимой только для этой опции.

Продолжим здесь

+66

@Skapix 27 янв 2018 в 10:32

Эволюция системных вызовов архитектуры x86

13 мин

49K

Assembler * Системное программирование *

Про системные вызовы уже много было сказано, например здесь или здесь. Наверняка вам уже известно, что системный вызов — это способ вызова функции ядра ОС. Мне же захотелось копнуть глубже и узнать, что особенного в этом системном вызове, какие существуют реализации и какова их производительность на примере архитектуры x86-64. Если вам также интересны ответы на данные вопросы, добро пожаловать под кат.

Читать дальше →

+74

@anatolii-potapov 19 июл в 14:00

T-Pro 2.0 — открытая гибридно-ризонинговая русскоязычная LLM

Сложный

9 мин

10K

Блог компании Т-БанкМашинное обучение * Искусственный интеллект

Кейс

Всем привет! На связи Толя Потапов, MLE в Т-Банке. Мы продолжаем развивать собственную линейку моделей GEN-T и внутренние продукты на основе своих моделей: агенты в саппорте, внутренние копилоты для сотрудников и Вселенную ассистентов.

Мы уже делились большими языковыми моделями T-lite 0.1, T-lite 1.0 и T-pro 1.0. Модели завоевали популярность и скачиваются суммарно более 15к раз в месяц.

Сегодня делимся новой моделью T-pro 2.0, обученной на основе модели Qwen3 32B, но с более плотной токенизацией на русском языке. Модель поддерживает гибридный ризонинг и позволяет сгенерировать рассуждение перед тем как отвечать. Это помогает в сложных задачах, где требуется несколько последовательных выводов, таких как математика.

Мы дообучали модель в несколько этапов, чтобы прокачать общее качество решения задач на русском и улучшить генерацию рассуждений.

Расскажу общие детали процесса обучения модели, основные характеристики и результаты замеров качества. Поделюсь, какие сложности у нас возникали и на чем планируем сосредоточиться.

+43

@offiziellen 19 июл в 00:00

Разработка высоконагруженных API: проблемы, решения, практические рекомендации

Средний

14 мин

26K

Микросервисы * Серверная оптимизация * Программирование * Высоконагруженные системы * Анализ и проектирование систем *

Ваш проект взлетел. Первые пользователи превратились в тысячи. Тысячи стали десятками тысяч. Метрики в дашбордах рисуют красивую кривую, устремленную вверх. Но есть и другие кривые, которые ползут вверх с не меньшей скоростью. Время ответа сервера. Количество ошибок 502 и 504.

То, что летало на ста запросах в секунду, начинает задыхаться на десяти тысячах. Это не ошибка, это физика. Архитектура для этих двух миров — это как велосипед и грузовой поезд. Они оба едут, но задачи у них разные. Так что давайте забудем про теорию и посмотрим, где обычно рвется и как это чинить, чтобы не переписывать все с нуля каждый раз, когда у вас прибавляется нолик в статистике пользователей.

+250

@OlegSivchenko 19 июл в 08:36

Галлюцинации и многообразия. Зачем искусственному интеллекту многомерные миры

11 мин

1.8K

Сейчас на Хабре много пишут о галлюцинировании нейронных сетей и больших языковых моделей в частности. Хорошим введением в эту тему, написанным с философских позиций, мне представляется текст уважаемого Дэна Рычковского @DZRobo «Когда ИИ закрывает глаза: путешествие между воображением и галлюцинациями». Базовое техническое погружение в тему вы найдёте в статье уважаемой @toppal «Причины возникновения галлюцинаций LLM», это перевод академической статьи специалистов Харбинского технологического института, опубликованной в конце 2024 года. Действительно, в большинстве источников галлюцинации ИИ рассматривают либо в негативном ключе, либо как неизбежный побочный эффект, связанный с попытками «вшить» синтетический аналог воображения в вычислительную сеть.

Я же хочу остановиться на менее известном аспекте работы нейронок, в котором галлюцинации могут восприниматься как положительная и даже необходимая часть работы алгоритма. Речь пойдёт об искусственном повышении размерности данных, подаваемых на вход в нейросеть, и о том, к чему такая практика может приводить. Наиболее известное проявление такого эффекта известно в англоязычных источниках под названием «проклятие размерности» (curse of dimensionality).

+23

@Penguin_pelmen 17 июл в 10:15

Мониторинг CPU и RAM на панели задач C++

Простой

4 мин

4.3K

C++ *

Из песочницы

Приветствую читателя этой статьи. Я студент, учусь по направлению «Приборостроение», но большую часть времени занимаюсь программированием. Все таки это меня привлекает больше. Задумывался по поводу смены ОС на Arch Linux, но пока отложил эту затею в долгий ящик. Смотрел различные ролики на YouTube и заметил, что многие пользователи ставят себе Polybar, в котором можно легко настраивать информацию, выводимую на нечто похожее на Панель задач в Windows. Тогда я подумал «А почему бы не сделать такое в винде?!» и сразу начал гуглить что к чему. Попытался найти готовые аналоги, но ничего не впечатлило, поэтому решил написать свою программу на C++.

@interpres 14 июл в 13:01

Пишем простой драйвер Linux для устройства, ничего не зная о драйверах и о USB

Простой

12 мин

10K

Блог компании RUVDS.comLinux * Настройка Linux * Компьютерное железо

Перевод

Пару месяцев назад я купил Nanoleaf Pegboard Desk Dock — последнее слово в технологиях USB-хабов с RGB-светодиодами и крючками для устройств. К сожалению, это чудо инженерной мысли поддерживает только гейминговые операционные системы — Windows и macOS, поэтому возникла необходимость в драйвере для Linux.

В своих постах я уже настраивал Windows VM с пробросом USB и пытался выполнить реверс-инжиниринг официальных драйверов. При этом я задумался, а нельзя ли написать производителю и попросить у него спецификации или документацию его протокола. К моему удивлению, техподдержка Nanoleaf ответила мне всего через четыре часа, предоставив полное описание протокола, используемого Desk Dock, а также полосами RGB-светодиодов. Документация по большей мере подтвердила то, что я обнаружил самостоятельно, но также я нашёл в ней пару других мелких подробностей (например, управление питанием и яркостью), которые были мне неизвестны.

Сегодня мы попробуем написать драйвер на основании протокола (который я изучил реверс-инжинирингом), параллельно сверяясь с официальной документацией. Однако здесь есть одна небольшая проблема: раньше я ни разу не писал драйверов для устройств под Linux, а с USB-устройствами взаимодействовал только как пользователь.

+99

@Asimandia 13 июл в 22:05

BirdCLEF+ 2025: обзор соревнования и ключевые решения топ-5 команд

Средний

4 мин

1.1K

Искусственный интеллектМашинное обучение * TensorFlow * R * Python *

Дайджест

BirdCLEF+ 2025 — очередная часть ежегодного соревнования от Cornell Lab of Ornithology по распознаванию звуков дикой природы. В этом году участникам предстало предсказывать целевое животное на коротких фрагментах записи, балансируя между качеством моделей и жёсткими ограничениями железа.

Разобраться в псевдолейблинге...

@bsergik 18 июн 2011 в 09:18

Знакомство с межпроцессным взаимодействием на Linux

11 мин

239K

Программирование *

Межпроцессное взаимодействие (Inter-process communication (IPC)) — это набор методов для обмена данными между потоками процессов. Процессы могут быть запущены как на одном и том же компьютере, так и на разных, соединенных сетью. IPC бывают нескольких типов: «сигнал», «сокет», «семафор», «файл», «сообщение»…

В данной статье я хочу рассмотреть всего 3 типа IPC:

именованный канал
разделенная память
семафор

Отступление: данная статья является учебной и расчитана на людей, только еще вступающих на путь системного программирования. Ее главный замысел — познакомиться с различными способами взаимодействия между процессами на POSIX-совместимой ОС.

Читать дальше →

+77

@naumtsevalex 15 июн в 02:10

Фундаментальные вопросы по ML/DL, часть 1: Вопрос → Краткий ответ → Разбор → Пример кода. Линейки. Байес. Регуляризация

Средний

23 мин

3.8K

Искусственный интеллектАлгоритмы * Python * Математика * Машинное обучение *

Туториал

У каждого наступает момент, когда нужно быстро освежить в памяти огромный пласт информации по всему ML. Причины разные - подготовка к собеседованию, начало преподавания или просто найти вдохновение.

Времени мало, объема много, цели амбициозные - нужно научиться легко и быстро объяснять, но так же не лишая полноты!

Обращу внимание, самый действенный способ разобраться и запомнить - это своими руками поисследовать задачу! Это самое важное, оно происходит в секции с кодом.

Будет здорово получить ваши задачи и разобрать в следующих выпусках!

Как только разберетесь приступайте к части 2!

Взглянуть на старое под новым углом →

@boterxxx 9 июл в 16:44

Готовимся к собесу: positional encodings в 2025 году

Простой

9 мин

4.1K

Машинное обучение * Искусственный интеллектNatural Language Processing *

Обзор

Если вы до сих пор считаете, что positional encoding в трансформерах — это знаменитые sin/cos из статьи 2017 года, то боюсь, что собеседование для вас закончится автоматическим реджектом.

Позиционное кодирование заметно эволюционировало с момента появления оригинальной статьи о трансформерах. В современных LLM и моделях компьютерного зрения, таких как FLUX, уже давно не используется классическое sin/cos-кодирование.

@kmatveev 9 июл в 06:19

Как работает база данных Firebird, часть 1

Сложный

21 мин

1.8K

Базы данных * C++ * Open source * Firebird/Interbase *

В этой серии статей я залезу внутрь реляционной базы данных Firebird. Я не буду рисовать архитектуру в виде прямоугольников, соединённых стрелками. Вместо этого я буду показывать куски кода, описывать, что они делают и как вызывают друг друга, чтобы выполнить конкретную работу.

+10

@ChislitelLab 8 июл в 08:48

Мультитенантность в Kubernetes: возможные подходы и инструменты

8 мин

2.4K

Блог компании Лаборатория ЧислительOpen source * Kubernetes * IT-инфраструктура * DevOps *

Обзор

Хабр, привет!

Меня зовут Алиса, и я руковожу командой разработки контейнерной платформы «Штурвал». В последнее время мы с командой много работали над реализацией мультитенантности и перепробовали множество разных вариантов. Ниже я расскажу, как тенанты помогают закрыть «боли» при работе с K8s на примере трех проблем и поделюсь полезными инструментами.

Эта статья будет интересна тем, кто:

👉 «с ноги» врывается в свой первый кубер;
👉 самостоятельно строит Kubernetes-платформу;
👉 управляет одним или множеством кластеров K8s.

P. S. 31 июля в Москве состоится первая независимая конфа Kubernetes Community Day. Два пространства с хардкорными докладами и воркшопами от крутых экспертов из VK, МКБ, Yandex Cloud, «Лаборатории Числитель», ecom.tеch, Cloud ru, Luntry, FUN&SUN, Lamoda Tech и др. Участие бесплатное. Регистрация тут.

+11

@interpres 7 июл в 13:01

Ходим в Интернет с отключённым IPv4

Средний

14 мин

58K

Блог компании RUVDS.comСетевые технологии * Сетевое оборудованиеНастройка Linux * IPv6 *

Туториал

Перевод

Несколько дней назад в маршрутизаторе моего провайдера после отключения электричества поломался IPv4. К счастью, подключение по IPv6 продолжало работать, но доступна была только малая часть веб-сайтов.

В этом посте я расскажу, как на помощь мне пришли Linux, WireGuard и Hetzner, благодаря которым я смог получить доступ ко всему Интернету через одно лишь соединение IPv6.

+64

@NickRoot69 4 июл в 13:16

Я построил Vision Transformer с нуля — и научил его обращать внимание

Простой

6 мин

4.2K

Искусственный интеллектМашинное обучение * Python *

Из песочницы

В этой статье я не просто объясню, что такое ViT — я покажу вам, как создать эту магию своими руками, шаг за шагом, даже если вы никогда раньше не работали с трансформерами для задач с изображениями.

+10

@Seleditor 3 июл в 08:40

Telegram-бот, который умеет слушать: разработка на grammY

Простой

12 мин

3.7K

Блог компании SelectelJavaScript * NestJS * Мессенджеры * Программирование *

Туториал

Представьте: собеседник отправляет голосовое сообщение на пять минут, а вы не можете отвлечься и прослушать все от начала до конца? Что делать? Максим, ведущий канала RED Group, подошел к вопросу творчески и показал, как на базе grammY и SpeechService в NestJS разработать бота, который будет слушать и структурировать по таймкодам голосовые сообщения.

Инструкция будет полезна новичкам, которые только погружаются в работу с Telegram Bot API с помощью JavaScript. Кроме того, в конце материала мы разберем, как задеплоить готового бота на сервер, чтобы он работал вне зависимости от локальной машины. Подробности под катом!

Читать дальше →

+47

@aio350 27 мая в 08:05

Как работает Node.js

Средний

22 мин

11K

Блог компании Timeweb CloudJavaScript * Node.JS * Веб-разработка * Программирование *

Обзор

Перевод

После прочтения этой статьи вы хорошо поймете следующее:

как работает цикл событий (event loop) в Node.js, включая все его фазы
как Node.js выполняет JavaScript в одном потоке (single thread)
как Node.js использует библиотеку libuv и внутренние API для обработки асинхронных операций
почему знание работы цикла событий так важно для написания эффективного серверного кода

Понять, как JS работает "под капотом" в браузере (см. эту короткую 15-минутную статью), проще, чем понять устройство Node.js. В браузере нет сложных фаз и многослойных механизмов, как в Node.js.

Но почему в Node.js все устроено сложнее? Зачем столько фаз, которые так непросто понять?

Читать дальше →

+28

1 2 3 4

6 7 ...

29 30

Барьеры памяти «Golang»

Как я превратил простую HTML-инъекцию в SSRF с помощью рендеринга PDF

Защита от тёмных искусств: DLL-Hijacking

Разбор опций командной строки в UNIX-подобных системах

Введение

Эволюция системных вызовов архитектуры x86

T-Pro 2.0 — открытая гибридно-ризонинговая русскоязычная LLM

Разработка высоконагруженных API: проблемы, решения, практические рекомендации

Галлюцинации и многообразия. Зачем искусственному интеллекту многомерные миры

Мониторинг CPU и RAM на панели задач C++

Пишем простой драйвер Linux для устройства, ничего не зная о драйверах и о USB

BirdCLEF+ 2025: обзор соревнования и ключевые решения топ-5 команд

Знакомство с межпроцессным взаимодействием на Linux

Фундаментальные вопросы по ML/DL, часть 1: Вопрос → Краткий ответ → Разбор → Пример кода. Линейки. Байес. Регуляризация

Готовимся к собесу: positional encodings в 2025 году

Как работает база данных Firebird, часть 1

Мультитенантность в Kubernetes: возможные подходы и инструменты

Ходим в Интернет с отключённым IPv4

Я построил Vision Transformer с нуля — и научил его обращать внимание

Telegram-бот, который умеет слушать: разработка на grammY

Как работает Node.js

Информация

Специализация