Pull to refresh
2
6
Богдан @Bogdan_m01

User

Send message

Мониторинг токсичного контента в AI продуктах

Reading time7 min
Views976

С ростом популярности LLM (больших языковых моделей) начинает подниматься вопрос о внедрении систем мониторинга LLM, которые будут проверять промпт пользователей на наличие токсичного контента, среди которого можно выделить промпт-инъекции и джейлбрейки (jailbreaks), а также ответ LLM, среди которого может быть сгенерированный неэтичный контент, утечки данных (пароли, промпт-инструкции и другая тайная от пользователя информация).

У таких моделей как GPT-4 на текущий момент времени достаточно сильный слой защиты, который не так просто поломать и достать нужную информацию, поэтому о ней речи не пойдет. В некоторых случаях, если речь идет о корпоративной тайне и прочих тонкостях работы с данными в бизнесе, может возникнуть потребность в локальной интеграции небольшой модели для внутренних нужд компании. Тогда и задача бизнеса в интеграции условного чат бота для общения с клиентами будет решена, а все данные останутся в компании, или нет?

Проблема таких моделей в том, что они подвержены атакам и генерации токсичного контента, что в свою очередь ведет к возможным PR рискам для бизнеса и финансовым потерям, а также может противоречить локальным требованиям к безопасности.

Читать далее
Total votes 4: ↑3 and ↓1+6
Comments2

Предсказание выбытия насосов

Level of difficultyMedium
Reading time7 min
Views5.6K

Всем привет, меня зовут Богдан. В ML я начал свое посвящение осенью 2023 года и за этот год успел поработать над таким неоднозначным проектом как "Предсказание выбытия насосов". На данную тему на Хабре уже есть несколько статей, которые я в своё время нашел и опыт которых я пытался перенести в свой учебный big data пет проект :)
ссылки на других ребят тут: ссылка 1 и ссылка 2

Хочу сказать что в данной статье не будет кода, она будет посвящена размышлениям, неудачам и иногда смешным попыткам решить данную проблему. Ну а также наверное где-то я буду кидать ссылки на совершенно разные вещи и немного похвастаюсь нашим финальным решением и тем, к чему меня привело участие во всем этом.

Если вы хотите посмотреть на то как это реализовано под капотом, то добро пожаловать в репу на гитхабе
Здесь расписано множество вещей, которые я успел попробовать пока работал над этой задачей в них входят как удачные решения, так и не очень.

Читать далее
Total votes 5: ↑5 and ↓0+8
Comments10

Классификация экзопланет (часть II построение моделей)

Level of difficultyMedium
Reading time8 min
Views1.4K

Это вторая и заключительная часть статьи, в которой мы рассматриваем задачу классификации экзопланет. Если предыдущая статья была больше про предобработку данных, то здесь мы будем строить модели, отбирать лучшие и экспериментировать.

Читать далее
Total votes 4: ↑4 and ↓0+4
Comments2

Классификация экзопланет (часть I обработка данных)

Level of difficultyMedium
Reading time6 min
Views1.5K

В космосе есть нечто завораживающее и прекрасное, в то же время человек устроен так, что ему если ему что то не известно, то стоит этого бояться (спасибо нашим мамам папам в n-ном поколении за столь широкий диапазон восприятия информации и реагирования на неё), тем не менее всегда находились безумцы исследователи, мечтатели и просто люди, которым в лом заниматься тем, что уже итак без них придумали и хорошо работает, поэтому они стремились придумать что то новое. Кто то занимается курсами по бесконечным саморазвитиям, открывает новые виды дыхания, а также наполняет свои чакры и чувствует прилив сил, а кто-то действительно пытается обнаружить то, что обычному человеку скорее всего в ближайшие лет 50 (а может и больше) не понадобится, ведь вряд-ли мы сможем покинуть нашу солнечную систему раньше этого срока. Однако в том чтобы смотреть в ночное небо и пытаться нарисовать у себя в голове линии, которые называют большой медведицей или тот же ковш, а может и повезет увидеть млечный путь во всей своей красе, есть нечто притягательное и необычное, то что заставляет одновременно почувствовать себя, как говорят некоторые маленькой точкой, но в то же время не забываем что у нас есть микромир, для которого человек, грубо говоря уже сам является целой вселенной. Как писала Лиза Рэндалл в 'достучаться до небес', человек, он где то посередине всего этого мира.

В машинном обучении есть один неоспоримый плюс- возможность заниматься чем угодно, если об это 'что угодно', есть данные. В данной статье мы обработаем данные с орбитального телескопа Kepler, сделаем отбор признаков и построим ml модель для классификации экзопланет. Это первая часть статьи с этими данным. В ближайшем будущем выйдет вторая часть, где будут построены новый модели, в том числе нейросети для данных с Kepler.

Читать далее
Total votes 5: ↑5 and ↓0+5
Comments0

Information

Rating
837-th
Date of birth
Registered
Activity