Как стать автором
Обновить

Как стать автором

Уязвимые гиганты: что общего между зулусским языком и LLM

Уровень сложностиПростой
Время на прочтение10 мин

Сейчас, когда каждый чих в интернете может привести к новому стартапу или технологическому прорыву, большие языковые модели (LLM) занимают своё законное место на передовой научно-технического прогресса. Они умнее, быстрее и эффективнее человека в ряде задач: написание кода, создание контента, перевод текстов и многое другое. Однако, такая высокая степень умения ставит нас перед новым набором проблем – их безопасностью и устойчивостью.

Кто бы подумал, что искусственный интеллект кусается? На деле, конечно, дело не в физическом нападении, а в уязвимостях, которые могут быть использованы злоумышленниками. Большие языковые модели действительно могут попасть под угрозу, и влияние таких событий может оказаться далеко не виртуальным.

Меня зовут Дарья Лютова, я data scientist в ЦАД ВАВТ, также я учусь в магистратуре AI Talent Hub ИТМО и интересуюсь вопросами обучения и безопасности языковых моделей. В этом посте, вместе с вами, хочу пойти дальше простого обсуждения существования уязвимостей в LLM и предлагаю вникнуть в тему проблем безопасности, касающуюся больших языковых моделей, выявить слабые места и прийти к пониманию методов их укрепления. Очень надеюсь, что эта информация поможет тем, кто преследует цель не только достичь новых высот в области AI, но и удостовериться, что их достижения надежны и устойчивы к киберугрозам.

Поехали!
Всего голосов 9: ↑8 и ↓1+11
Комментарии8

Самое худшее собеседование

Время на прочтение4 мин

Каждый из нас проходил собеседования. В разных компаниях процессы трудоустройства могут сильно отличаться друг от друга. Например, в ряде случаев вас ожидает часовой прогон по теории Frontend'a, а где-то вы столкнетесь с кучей этапов проверок: алгоритмы, теория, софт-часть и т.д. За свою 4-летнюю карьеру Frontend-разработчика я собрал конструктор самого худшего собеседование по-моему мнению.

P.S. Далее вы столкнетесь с субъективным мнением автора, которое может не соответствовать вашим ожиданиям

Читать далее
Всего голосов 44: ↑32 и ↓12+26
Комментарии98

Как не выгореть от операционки — мои самые эффективные правила планирования

Уровень сложностиПростой
Время на прочтение3 мин

Подарите 25 час в день и 8 день в неделю. Да еще одну неделечку к отпуску... Знакомо? Вот и я долгое время грустно смотрела в свой календарь и не понимала, куда все время уходит время и почему задачи закрываются в последний, самый горящий момент.

Привет, я Аня, и я решила расправиться с этим вопросом раз и навесгда. Понять, как разложить дела по полочкам и выделить время на то, что действительно важно, — это не просто каприз, это основа, которая толкает к целям и раскрашивает жизнь яркими красками. А если ты во главе коллектива, это ещё и прямой путь к успеху всей конторы.

Принципы личной эффективности, которые я применила в своей жизни, также работают и в бизнесе. Четкая ответственность, соблюдение сроков, прямая коммуникация, и обратная связь — это фундамент моих рабочих процессов. Agile и Kanban помогли мне организовать работу так, что каждый час на счету, а моя команда постоянно развивается и достигает новых высот.

Итак, путь к личной эффективности начнем с небольшого аудита.

Сначала я анализирую, куда уходит моё время. Это даёт чёткое понимание, сколько времени у меня на самом деле есть и на что оно тратится. Такой аудит помогает выявить "воров времени" и переосмыслить приоритеты.

Менее важные задачи составляют около 65% общего списка. Хотя их вклад в достижение конечных целей минимален — примерно 15%, они несут в себе риск стать "ворами времени". Для эффективного управления временем критично научиться отличать эти задачи от ключевых и при необходимости делегировать их или же вообще исключить из списка приоритетов.

Читать далее
Всего голосов 13: ↑5 и ↓8+1
Комментарии9

Парсинг веб-сайтов: взгляд изнутри

Уровень сложностиПростой
Время на прочтение5 мин

Статья о парсинге веб-сайтов освещает следующие аспекты:

• Понятия парсинга и скрапинга;
• Законность и этика парсинга;
• Парсинг с использованием requests и BeautifulSoup;
• Статические страницы;
• Динамические страницы;
• Работа с API;
• Защита от парсеров;
• Способы обхода.

Читать далее
Всего голосов 14: ↑10 и ↓4+9
Комментарии10

Нескучная стеганография, или как мы зашифровали секретные ключи пользователей в джипегах

Уровень сложностиСредний
Время на прочтение10 мин

Рассказываем, как использовать методы стеганографии и шифрования в децентрализованных сервисах на IPFS. Исключаем риски, связанные с централизованным хранением логинов и паролей. Используем метод LSB, «наименьший значащий бит». Внутри статьи — примеры кода на C# и алгоритме AES для шифрования и расшифровки. 

Читать далее
Всего голосов 9: ↑7 и ↓2+7
Комментарии4

Обработка текста. Модель Sequence-to-sequence

Уровень сложностиСложный
Время на прочтение9 мин

Модель Sequence to sequence

Рассмотрим принцип работы модели seq2seq, модификации, как верно подготовить данные для модели.

Читать далее
Всего голосов 3: ↑3 и ↓0+3
Комментарии1

Давайте поговорим о Kubernetes

Уровень сложностиСредний
Время на прочтение12 мин

Всем привет! Меня зовут Андрей, я DevOps инженер.

Когда я начинал изучать Kubernetes (K8s), я перечитал много статей, и, что в статьях, что в документации, информация была сильно разрознена, обрывочна. Сложно было скомпоновать информацию в единое целое.

На тот момент, мне бы хотелось найти одну большую статью, пусть и не полностью, но достаточно подробно описывающую процессы управления кластером K8s, деплоя и обслуживания приложений в нём.

Примерно такую статью я постарался написать.

Читать далее
Всего голосов 9: ↑9 и ↓0+9
Комментарии10

Как я разрабатывал веб-сервис по бронированию электронных зарядных станций для электромобилей (часть 1)

Уровень сложностиСредний
Время на прочтение19 мин

Привет всем, на связи Арсений Елисеев, я fullstack-разработчик в одном ИТ-интеграторе! Относительно недавно мы получили заказ на разработку веб-сервиса, который позволял бы нашим клиентам, владельцам электрокаров, строить маршруты и на их протяжении бронировать электронные зарядные станции под свои нужды. Я представил свою версию системы и хотел бы поделиться с вами ходом мыслей. Возможно, кто-то захочет прокомментировать мою модель или дать совет.

Читать далее
Всего голосов 5: ↑5 и ↓0+5
Комментарии5

Продуктовый подход к pet-проекту или как я разработал музыкальное веб-приложение

Уровень сложностиСредний
Время на прочтение9 мин

Что вам может дать продуктовый подход к pet-проекту? Если смотреть на pet-проект не как на лабораторную работу, а как на будущий продукт, начинаешь лучше понимать весь цикл разработки. При таком подходе ты сперва выступаешь в роли заказчика: определяешь, какую задачу пользователя решаешь, как это сделать наилучшим образом, а потом подбираешь технологии, которыми легче всего реализовать функционал или которые хочется попробовать. В тексте я расскажу о развитии моего pet-проекта по созданию музыкального стримингового веб-приложения и чему удалось научиться, используя данный подход.

Читать далее
Всего голосов 37: ↑35 и ↓2+35
Комментарии31

Между строк: Создание элементов интерфейса через VectorApi Unity UI Toolkit

Уровень сложностиСредний
Время на прочтение8 мин

В недалеком прошлом, я рассказывал, про то, как можно создавать свои кастомные элементы через генерацию мэша, будет полезно ознакомиться для понимания многих аспектов этой статьи.

Сегодня будем разбирать альтернативный способ создания, использую VectorApi.

Рассмотрим, как работает painter2D, какими функциями обладает и зачем оно может вам пригодиться.

Создать элементы
Всего голосов 5: ↑5 и ↓0+5
Комментарии4

Как работает multiprocessing в Python под капотом

Уровень сложностиСложный
Время на прочтение12 мин

Я довольно давно пишу на Python и во многих проектах использовал multiprocessing — пакет стандартной библиотеки языка Python, который предоставляет интерфейс для работы с процессами, очередями, пулами процессов и многими другими удобными инструментами для параллельного программирования. В какой-то момент я понял, что мне не хватает более детального понимания работы этой библиотеки.

Мне захотелось залезть в исходники multiprocessing, разобраться и заодно написать статью. Данная статья в основном рассчитана на новичков в Python и тех, кто хочет подробнее разобраться в том, как именно создаются процессы и пулы в Python и погрузиться в детали реализации.

Читать далее
Всего голосов 17: ↑17 и ↓0+18
Комментарии2

Искусственный химический элемент Технеций и его польза

Уровень сложностиСредний
Время на прочтение16 мин

Технеций находится в 7 группе 5-го периода таблицы Менделеева, в окружении давно известных и хорошо изученных элементов. Но его ячейка под номером 43 долгое время оставалась вакантной. В 1937 году новый элемент был наконец получен на циклотроне и выделен – в следовых количествах, которые нельзя ни взвесить, ни увидеть глазом. Дело в том, что 43-й элемент не имеет стабильных изотопов, а из тех, что есть, самый долгий период полураспада – 2,6·106 лет – имеет изотоп Тс-97. Чтобы в земной коре оставалось хоть какие-нибудь количества занесенного при сжатии протооблака радиоактивного элемента, его период полураспада должен быть не менее 150 млн. лет. Таким образом, никакого первозданного 43 элемента на Земле остаться не могло.

В атомных реакторах происходит накопление технеция уже в макроскопических количествах – примерно 1 кг в год - за кампанию на тонну облученного топлива. Физика ядерных процессов такова, что в реакторах накапливается преимущественно изотоп 99Тс, обладающий периодом полураспада чуть более 200 тысяч лет. Этот элемент обладает богатой химией и насчитывает девять целочисленных степеней окисления от -1 до +7. Несмотря на, казалось бы, не очень значительное количество технеция в отработавшем топливе (0.1%), поливалентность этого элемента сказывается на процессах разделения урана и плутония. Значительное количество неожиданных окислительно-восстановительных и каталитических реакций с участием технеция приводило к непредсказуемым результатам при переработке ядерного топлива. Именно это инициировало изучение химии и технологии технеция как отдельного элемента. Лучшее понимание поведения технеция позволило решить многие проблемы, связанные с переработкой отработанного ядерного топлива, и в основном нейтрализовать вредоносные побочные процессы.

 О том, какие возможности сулит применение изотопов технеция, рассказывает научный сотрудник лаборатории химии технеция ИФХЭ РАН, кандидат химических наук Михаил Александрович Волков.

Читать далее
Всего голосов 20: ↑19 и ↓1+21
Комментарии4

Страх и ненависть в HeadHunter'е, или как искать работу в 2024 году: 10 простых советов

Уровень сложностиПростой
Время на прочтение4 мин

У нас было 2 месяца до окончания денежной подушки, 75 компаний в джоб-листе, 5 друзей в Линкедине, половина пройденного курса по поиску работы и бесконечное множество телеграм каналов с вакансиями всех сортов и расцветок, а также аккаунт в Хабре, Гикджобе, ящик с резюме, пинта чистого корвалола и валерьянка. Не то чтобы это был необходимый запас для поиска работы, но раз уж решил менять место работы, то сложно остановиться...

Читать далее
Всего голосов 43: ↑11 и ↓32-19
Комментарии74

Запуск MacOS 13+ в VMware на процессорах AMD (OpenCore)

Время на прочтение7 мин

Всем привет. Делюсь своими изысканиями по запуску виртуальных машин MacOS на процессорах AMD. Возможно кому-то будет полезным.

Предыстория: в наличии несколько виртуалок, с которыми долгое время не было никаких проблем. Версии - от Mojave до Monterey, они даже обновлялись штатно. Далее, при апдейте на Ventura/Sonoma ловим кернел панику - никакие рекомендации из интернета не помогли. Глаз пал в сторону хакинтоша, но как его конфигурировать под вмварь тоже оказалось не совсем понятным, поэтому и напишу этот гайд:
вводные - Ryzen 5950X, Windows 10, VMware Workstation 16.2 (была версия 16.0, пока не столкнулись в проблемой апдейта макоси).

Читать далее
Всего голосов 18: ↑18 и ↓0+18
Комментарии6

Как успешно пройти собеседование на Technical Product Manager в Тинькофф? Личный опыт

Уровень сложностиПростой
Время на прочтение7 мин

Всем привет, меня зовут Виктор и на днях я выхожу в Тинькофф на позицию тех-продакта в Платформу базовых мобильных технологий.

Во время подготовки к собеседованиям мне очень помогла статья на Хабре, однако там речь шла о позиции QA. Поэтому в этой статье я хочу рассказать о личном опыте прохождения всех этапов собеседования на Технического Продакта, а также дать пару советов, как повысить свои шансы на успех.

Читать далее
Всего голосов 13: ↑11 и ↓2+12
Комментарии24

Privacy Manifest: что нужно о нём знать для внедрения в проект

Уровень сложностиСредний
Время на прочтение11 мин

На работе я столкнулся с задачей внедрения Privacy Manifest в проект. Изучение вопроса началось с прочтения документации Apple, а продолжилось просмотром WWDC-сессии на тему конфиденциальности. После внедрения оказалось, что для корректной работы над задачей нужно изучить больше информации. Поэтому я решил поделиться опытом в формате инструкции. Покажу, как внедрять Privacy Manifest на примере вымышленного проекта, и дам практические советы по внедрению манифеста конфиденциальности.

Читать далее
Всего голосов 16: ↑15 и ↓1+19
Комментарии12

Zigbee шлюз для счетчиков Меркурий

Время на прочтение1 мин

Давно удивлялся, почему не смотря на распространенность счетчиков Меркурий и возможность съема с них показаний через RS-485, на рынке DIY устройств не было Zigbee шлюза для них. Этот пробел я решил восполнить самостоятельно.

Читать далее
Всего голосов 41: ↑39 и ↓2+52
Комментарии26

Четырехуровневая амплитудно-импульсная модуляция (PAM4) в DWDM системах

Уровень сложностиСредний
Время на прочтение7 мин

Динамика развития современного общества диктует требования непрерывного роста количества передаваемых данных. Общий объем глобального IP трафика увеличивается ежегодно. По данным, приведенным в отчете Data Age, к 2025 году этот показатель составит 175 ЗБ (Зеттабайт) в год. Перед операторами связи стоит задача комплексной модернизации сети для удовлетворения возрастающих потребностей.

Читать далее
Всего голосов 3: ↑3 и ↓0+3
Комментарии5

Введение в МММ. Часть 1

Время на прочтение5 мин

Это первая статья из цикла, в котором я расскажу про медиа микс моделирование.

В первой части я познакомлю вас с терминами моделей медиа микс, эффектами и данными которые вам понадобятся для построения моделей.

Во второй части я расскажу подробнее про моделирование и оптимизацию: как выбрать подход и метрики, собрать и предварительно обработать данные, и, собственно, перейти к моделированию. 

Третья часть будет посвящена практическим советам для построения медиа микс моделей через Robyn — это экспериментальный пакет для моделирования маркетинговых смесей (MMM) от Meta Marketing Science.  

В четвертой мы рассмотрим подробнее PYMC-Marketing — это решение для маркетинговой аналитики на основе языка Python.

Итак, давайте перейдем к разбору основных понятий и проблем, с которыми сталкиваются аналитики успешности каналов медиа маркетинга. 

Читать далее
Всего голосов 2: ↑1 и ↓1+2
Комментарии1

Управление документацией в растущей компании: DocFX + Gitea + «Этос»

Уровень сложностиПростой
Время на прочтение6 мин

По мере увеличения кодовой базы любая компания начинает испытывать потребность в упорядочивании разрозненной документации, иными словами — создании собственной «базы знаний». О чём стоит помнить при выборе конкретных инструментов и как сделать их одинаково удобными для разработчиков и техписателей, попробуем разобраться в сегодняшней статье.

Читать далее
Всего голосов 3: ↑3 и ↓0+3
Комментарии2