Институт системного программирования им. В.П. Иванникова РАН, Москва - Образование, исследования, инновации / Статьи / Хабр

ПрофильСтатьи10Новости3Подписчики105Сотрудники9

Разглядываем CodeScoring с помощью Natch

Средний

12 мин

1.4K

Блог компании Институт системного программирования им. В.П. Иванникова РАНИнформационная безопасность*Тестирование IT-систем*Тестирование веб-сервисов*Системное программирование*

Кейс

ГОСТ Р 56939-2024 описывает общие требования к процессам разработки безопасного ПО – от образования, до технической поддержки, от статического, до динамического анализа, однако особое внимание уделяется определению поверхности атаки, то есть поиску множества потенциально уязвимых функций и модулей ПО, занимающихся обработкой пользовательских данных или чувствительной информации, а также интерфейсов, через которые эти данные поступают.

Обычно поверхность атаки определяют экспертным методом, однако тут же возникает вопрос полноты этого метода: что если эксперт пропустил действительно важные функции, участвующие в обработке данных, поскольку ПО имеет распределенную архитектуру, за потоком данных которой очень сложно следить извне, или выбрал такие функции для фаззинга, которые даже не задействованы при обработке пользовательских данных? Какие тогда функции выбирать?

Dovgaluk 6 дек 2024 в 08:26

Как надёжно стереть секретную информацию из базы данных

Средний

5 мин

4.1K

Блог компании Институт системного программирования им. В.П. Иванникова РАНИнформационная безопасность*PostgreSQL*Администрирование баз данных*MySQL*

Кейс

✏️ Технотекст 7

Зачем вообще "надёжно" стирать данные? Главное же, чтобы пользователь через интерфейс СУБД не мог их достать. Мало ли, что там за остатки данных в файлах болтаются, это же не проблема. Или нет?

fisher85 13 авг 2024 в 10:44

Я больше не верю публичным датасетам

Простой

12 мин

12K

Блог компании Институт системного программирования им. В.П. Иванникова РАНМашинное обучение*Информационная безопасность*

Кейс

✏️ Технотекст 7

Когда я прочитал новость о том, что исследователи MIT обнаружили вплоть до 10% ошибок в разметке самых популярных датасетов для обучения нейросетей, то решил, что нужно рассказать и о нашем опыте работы с публичными датасетами.

Уже более пяти лет мы занимаемся анализом сетевого трафика и машинным обучением моделей обнаружения компьютерных атак. И часто используем для этого публичные наборы обучающих данных. Расскажу, с какими сложностями мы при этом столкнулись и почему больше не верим публичным датасетам.

+31

Alirina 25 июл 2024 в 20:13

Уязвимость к атакам российских больших языковых моделей с открытым исходным кодом

Средний

7 мин

3.8K

Блог компании Институт системного программирования им. В.П. Иванникова РАНИнформационная безопасность*Искусственный интеллектМашинное обучение*

Обзор

Маленькая ремарка

С появлением больших языковых моделей обществу был брошен вызов. Первые проблемы, с которыми пришлось столкнуться в области LLM, были связаны с тем, что модели могут неправильно трактовать информацию, давать губительные советы в убедительном тоне, говорить, как сделать бомбу, или вообще оскорблять определенные расы. Естественно, после такого поведения моделей последовало несколько неприятных событий.

Читать дальше →

+13

Dovgaluk 9 июл 2024 в 08:45

Зачем искать поверхность атаки для своего проекта

Простой

7 мин

Блог компании Институт системного программирования им. В.П. Иванникова РАНИнформационная безопасность*Тестирование IT-систем*Отладка*Реверс-инжиниринг*

Обзор

Любые программные системы включают в себя нужные и не очень нужные пакеты. Получается огромный объём кода (для одного несложного сайта npm list -a выдаёт список из 4256 зависимостей). А так как «весь код — это ваш код», то такие зависимости надо тестировать. И регулятор требует, да и просто собственные продукты хочется защитить от вторжений, утечек и других неприятностей.

fisher85 2 апр 2024 в 20:42

Мы так и не смогли защитить свою модель машинного обучения от состязательных атак. Пока

Средний

13 мин

4.2K

Блог компании Институт системного программирования им. В.П. Иванникова РАНИнформационная безопасность*Машинное обучение*

Кейс

Наша команда разработчиков Исследовательского центра доверенного искусственного интеллекта ИСП РАН первые два года занималась построением сетевой системы обнаружения вторжений, основанной на применении методов машинного обучения. А в последний год мы сменили щит на меч и начали атаковать состязательными атаками (adversarial attacks) синтезированную нами же модель.

Задача была простой: оценить устойчивость модели к состязательным атакам. Спойлер: модель не устойчива, а как это исправить — мы пока не знаем. Подробности ниже.

+21

Dovgaluk 19 фев 2024 в 08:53

Как найти поверхность атаки незнакомых приложений с помощью Natch

Средний

10 мин

2.9K

Блог компании Институт системного программирования им. В.П. Иванникова РАНИнформационная безопасность*Анализ и проектирование систем*Отладка*Реверс-инжиниринг*

Туториал

Поиск ошибок в программах дело творческое и интересное. Чаще всего мы ищем ошибки в своём коде, чтобы его починить. Кто-то может искать ошибки в чужом коде, чтобы его сломать или поучастовать в баунти-программе.

А вот где именно искать ошибки? Какие функции тестировать? Хорошо, если программа полностью ваша. Но что если вы занимаетесь тестированием, а эти программисты постоянно придумывают что-то новое? Никаких рук не напасёшься.

Как хоть немного автоматизировать процесс?

temikfart 24 янв 2024 в 14:50

Как загружать классы в Java 8 и Java 9+?

Сложный

24 мин

7.6K

Блог компании Институт системного программирования им. В.П. Иванникова РАНJava*

Обзор

Привет, Хабр! Я разработчик в Институте Системного Программирования РАН, занимаюсь разработкой статического анализатора Svace. Недавно я столкнулся с задачей самостоятельной загрузки классов в JVM, что оказалось непросто, потому что в проекте мы используем модули Java.

Модули появились в Java, начиная с версии 9. Прошло уже несколько лет, но если попытаться найти актуальную информацию о связи модулей и загрузчиков классов, её придётся собирать по крупицам. В статье я поделюсь своим опытом изучения вопроса самостоятельной (и автоматической) загрузки классов с помощью кастомного загрузчика, а также разберу примеры, описывающие большинство случаев загрузки, постараюсь их объяснить.

+23

DedocTeam 8 дек 2023 в 17:28

Dedoc: как автоматически извлечь из текстового документа всё и даже немного больше

Средний

11 мин

6.8K

Блог компании Институт системного программирования им. В.П. Иванникова РАНИскусственный интеллектМашинное обучение*PDFPython*

Привет, Хабр!

Мы команда разработчиков Института Системного Программирования РАН, занимаемся Computer Vision в обработке электронных документов. Мы разработали open-source библиотеку dedoc, которая помогает разработчикам и дата-сайентистам в пару строк кода читать различные форматы текстовых документов и изображений с текстом, и далее приводить информацию к единой аккуратной структуре.

+11

davidbadd 7 ноя 2023 в 18:36

Cotea: программный контроль исполнения Ansible

11 мин

6.3K

Блог компании Институт системного программирования им. В.П. Иванникова РАНСистемное программирование*DevOps*Облачные сервисы*

Туториал

Привет!

Я Давид Бадалян, работаю в Исследовательском центре доверенного искуственного интеллекта ИСП РАН. В статье я хочу поговорить об Ansible – одной из самых популярных систем по автоматизации развёртывания.

Стоит запустить Ansible программно, и он становится черным ящиком – нет никакого контроля над его выполнением, нет информации о тасках. Эту проблему мы обнаружили, разрабатывая оркестратор Michman для сервисов уровня PaaS. В результате мы создали cotea и gocotea: инструменты для программного исполнения Ansible-плейбуков из языков Python и Go.

Про cotea, её архитектуру и кейсы применения я расскажу подробно под катом. Если вы DevOps-инженер и хотите узнать, как можно гибко использовать Ansible – статья точно для вас.

+12