Search
Write a publication
Pull to refresh
37
0

Автор блога о ИИ, экономике, математике и научпопу

Send message

Яндекс.Полуразврат или при чём тут Crypt?

Level of difficultyEasy
Reading time6 min
Views3.6K

Яндекс выпустил новую модель для Шедеврума, которая попыталась прикрыть уязвимости, которые эксплуатировались для создания «небезопасного контента» категории 18+. Тем не менее, не всё так радужно и с «детским» режимом они очень торопятся. Некоторые уязвимости в промпте остались, а некоторые добавились. Но самое интересное – попытка спастись от «небезопасного контента» путём целенаправленной порчи датасета. Обо всём этом подробно в тексте.

Читать далее

GigaHeisenberg или преступный ИИ

Level of difficultyEasy
Reading time7 min
Views8.8K

tl;dr: Обойдём цензуру у LLM (GigaChat от Sber) и сгенерируем запрещенный (разной тематики) контент. Опробуем очень простую технику jailbreak’а в одно сообщение (не мультишаговый/multi-turn), которая пока работает на любой LLM (проверим не только на GigaChat, но и на других). И небольшой бонус в самом конце от DeepSeek.

Читать далее

Яндекс.Вброс или ИИ для фейков

Level of difficultyEasy
Reading time6 min
Views4.7K

tl;dr: Продолжение разборов состязательных атак на генеративные модели. Разбор семантических атаках (подбор синонимов, построение фраз, эзопов язык), и использование для этого другой LLM модели.

Часть 1: Яндекс.Разврат или анти-этичный ИИ

Читать далее

Яндекс.Разврат или анти-этичный ИИ

Level of difficultyEasy
Reading time6 min
Views46K

tl;dr: как обойти внутреннюю цензуру «Шедеврума» и получить то, что хочешь. Описание реализованных состязательных атак с примерами реализации. Без глубокого раскрытия механизма почему так получается.

Читать далее

Как я hiddenkeywords проходил

Reading time7 min
Views2.8K

Продолжаем проходить различные "квесты" и "пазлы" на просторах интернета. На этот раз в руки мне попался https://hiddenkeywords.com/ Это испытание было создано студией Propellernet - студия маркетингового консалтинга из Англии.

Если ты не боишься спойлеров, то добро пожаловать.

Поехали!

Как я technicalseo.expert проходил (уровень 2)

Reading time4 min
Views2.1K

Продолжение исследования головоломки technicalseo.expert которая будет сломана самым нетривиальным образом.

Предыдущий уровень и чуть подробнее о самой головоломке в первом посте: ссылка

technicalseo.expert - это головоломка для SEO, хотя я сел не имея никакого бэкграунда в SEO, а сейчас работаю скромным датасаентистом. Разработала головоломку Алексис Сандерс, работающая в международном агентстве маркетинга Merkle Inc. Алексис объясняет "Идея игры заключалась в том, чтобы позволить SEO-специалистам изучить технические аспекты своей профессии. Но второй уровень требует глубочайших познаний в HTML, CSS, PHP и Java. Третий уровень был спроектирован так, чтобы никто никогда его не прошёл"

Скорее на уровень 2

Как я technicalseo.expert проходил (уровень 1)

Reading time12 min
Views3.3K

technicalseo.expert - это головоломка для SEO, хотя я сел не имея никакого бэкграунда в SEO, а сейчас работаю скромным датасаентистом. Разработала головоломку Алексис Сандерс, работающая в международном агентстве маркетинга Merkle Inc. Алексис объясняет "Идея игры заключалась в том, чтобы позволить SEO-специалистам изучить технические аспекты своей профессии. Но второй уровень требует глубочайших познаний в HTML, CSS, PHP и Java. Третий уровень был спроектирован так, чтобы никто никогда его не прошёл"

Сыграем?

Information

Rating
1,799-th
Location
Россия
Registered
Activity

Specialization

Data Scientist, Prompt Engineer
Lead
From 600,000 ₽
People management
Organization of business processes
IT service management
Presentations
Python
REST
Machine learning
Neural networks
Deep Learning
Designing application architecture