Статьи / Закладки / Профиль Siddthartha / Хабр

Садовников Антон Петрович @Siddthartha

Developer

ПрофильСтатьиПосты2НовостиКомментарии1K

ret77876 22 окт 2024 в 08:16

Запускаем Yolo на пятирублёвой монете или Luckfox Pico Mini

Средний

29 мин

33K

Искусственный интеллектC++ * РобототехникаМашинное обучение * Обработка изображений *

Туториал

✏️ Технотекст 7

В данной статье речь пойдет про использование очень маленькой Luckfox Pico Mini. Я расскажу про особенности платы, её настройку, а также о том как запускать на ней нейронные сети для детекции объектов с камеры.

Мне удалось добиться скорости детекции в 15 FPS (или даже 50!), результат, который по силам далеко не каждому одноплатнику.

+144

The-Founder-1 18 окт 2024 в 02:29

Wolfram Natural Language Understanding или спасение для студентов

Средний

12 мин

5.9K

Машинное обучение * Python * TensorFlow * Искусственный интеллект

Обзор

Wolfram — крутая штука. Сколько школьников получило из-за него пятерку, а сколько студентов зачет, не сосчитать...

Устроено все просто: плохой ученик загружает задачку и получает приятный результат с хорошей оценкой. Все задачи считаются алгоритмически.

Хоть скопируй лабораторную по физике...

Поэтому главной загадкой этого сервиса становится перевод неподготовленной информации студента в удобоваримый для алгоритмов вариант данных.

Языковая модель (NLU) — разгадка.

igumnov 16 окт 2024 в 15:39

rustsn — Open Source проект генерации кода и взаимодействия с уже существующим через LLM

Простой

3 мин

3.9K

Rust * Искусственный интеллектПрограммирование *

Кейс

Я работал над созданием инструмента под названием rustsn, который позволяет генерировать, компилировать и тестировать код с использованием LLM (Large Language Models). Изначально идея заключалась в том, чтобы автоматизировать процесс написания небольших фрагментов кода — так называемых сниппетов — для разных языков программирования на основе объяснений, предоставленных пользователем. Этот инструмент стал развиваться и обрастать новыми возможностями, такими как генерация полного кода для приложений и объяснение существующего кода на основе векторных представлений (эмбеддингов).

Когда я только начинал работу над rustsn, основной задачей было добиться того, чтобы пользователь мог, например, просто описать словами, какую функцию ему нужно написать, а система автоматически генерировала бы рабочий код. Я начал с Rust, поскольку этот язык обладает мощными возможностями для работы с типами и тестированием, что делает его идеальным для написания безопасного и производительного кода. Позже я добавил поддержку других языков, таких как JavaScript, Python, и TypeScript.

Этот инструмент стал гораздо больше, чем просто генератор кода. Например, я добавил команду ask, которая позволяет получать объяснение к существующему коду вашего проекта. Для этого используется специальная модель, которая анализирует исходники и находит наиболее релевантные файлы на основе вашего вопроса.

В ближайшее время я планирую значительно расширить функционал rustsn. Первое, что я хочу сделать — это интегрировать Docker, чтобы пользователи могли запускать инструмент не только на хостовой машине, но и в контейнерах. Это упростит развертывание и использование инструмента на различных платформах, обеспечив стабильность окружения.

kmoseenk 15 окт 2024 в 11:14

Улучшенная глобальная настройка в Playwright с использованием авторизации и проектными зависимостями

Средний

10 мин

2.8K

Блог компании OTUSТестирование IT-систем * Тестирование веб-сервисов *

Перевод

Многие команды используют глобальную настройку для входа в приложение и последующего использования этой настройки для тестов, которые должны выполняться в авторизованном состоянии. Однако у такого подхода есть несколько важных ограничений. Например, при использовании глобальной настройки вы не видите трейсы для этапа настройки тестов, и этот этап настройки не отображается в HTML-отчёте. Кроме того, глобальная настройка не поддерживает использование фикстур.

Для решения этой проблемы создаются проектные зависимости.

+14

kmoseenk 10 окт 2024 в 13:37

Визуальные трансформеры (ViT)

Средний

18 мин

7.4K

Блог компании OTUSМашинное обучение * Python *

Перевод

С момента своего появления в 2017 году в публикации Attention is All You Need трансформеры стали доминирующим подходом в обработке естественного языка. В 2021 году в статье An Image is Worth 16x16 Words трансформеры были успешно адаптированы для задач компьютерного зрения. С тех пор для компьютерного зрения было предложено множество архитектур на основе трансформеров.

В этой статье мы рассмотрим трансформер зрения (Vision Transformer, ViT) в том виде, в котором он был представлен во второй статье. Она включает в себя открытый код ViT, а также концептуальные объяснения компонентов. Реализация ViT, рассмотренная в статье, выполнена с использованием пакета PyTorch.

+10

AV_Tar 9 окт 2024 в 12:48

Нейронная сеть учится понимать сигналы светофора

Простой

21 мин

3.6K

Машинное обучение * Искусственный интеллект

Туториал

Из песочницы

Сегодня нейронные сети всё чаще используются для решения различных задач – от распознавания лиц до управления беспилотными автомобилями. Однако для тех, кто только начинает знакомиться с этой технологией, может показаться, что процесс обучения нейросети — это что-то сложное и непонятное.

Задача проста: у нас есть светофор, и мы хотим научить модель решать, можно ли продолжать движение на перекрестке в зависимости от того, какой сигнал светофора горит. В статье использованы базовые принципы машинного обучения и простой код на Python, чтобы построить модель, которая способна интерпретировать показания светофора, закодированные в виде числовых данных. Приведен как «рукописный» код обучения нейронной сети, так и с применением библиотеки TensorFlow. Проведено несколько экспериментов с разными параметрами сети. В конце на десерт самое интересное – дадим обученной сети показания светофоров, которых не бывает в реальной жизни, такие как зеленый и красный горящие одновременно, посмотрим, что на это скажет сеть.

lelyakuznetsova 9 окт 2024 в 14:38

Обучение GigaChat с контекстом в сотни тысяч токенов

Средний

13 мин

4.7K

Блог компании JUG Ru GroupИскусственный интеллектМашинное обучение * Конференции

Помните фразу «640 килобайт памяти хватит всем»? Запросы человечества вечно растут, а индустрии надо поспевать.

Вот и с языковыми моделями так. Ещё недавно мы все удивлялись тому, на что они стали способны. А теперь нам этого мало: «ну хорошо, а может модель в диалоге учитывать то, что я сказал сотни реплик назад?»

Весной на нашей конференции I'ML Евгений Косарев (SberDevices) рассказал о том, как к увеличению контекста подошли при работе над GigaChat. А сейчас мы публикуем текстовую расшифровку его доклада. Ссылки на его видеозапись тоже прилагаем: YouTube, VK Видео.

+15

Sber 8 окт 2024 в 10:33

Пока не исправили — модифицируй, или Анализ расширений атаки уклонения для LLM

Средний

10 мин

2.1K

Блог компании СберМашинное обучение * Информационная безопасность *

Обзор

Добрый день, уважаемые читатели Хабра. В связи с бурным развитием генеративных моделей и реализованных на них чат‑ботов (ChatGPT, Gemini, Bard, Notion AI, Compose AI, Poe, Phind) у пользователя появляется ложное чувство, что модели стали умнее, защищённее и, в целом, ближе к совершенству, сравнимы с человеческим интеллектом. Отсюда мы получаем целый пласт заблуждений. Например, что модели нас «чувствуют», «понимают», ведь мы выкладываем для них столько информации о себе, начиная от стилистики нашего письма, что уже является неким цифровым отпечатком нашей личности, и заканчивая оценкой их собственной работы. На самом деле это миф. И трендом 2023–2024 годов стало обширное внимание публики к XAI:

• как они (генеративные модели) устроены и как они принимают решения;

• как проводятся атаки уклонения (склонение моделей к неверной выдаче);

• как эти атаки (уклонения) связаны с другими атаками на LLM и какие они могут быть для эскалации деструктивного поведения системы;

• с какой позиции верно интерпретировать выход генеративной модели;

• разработка системы эшелонированной защиты моделей;

• разработка системы внутреннего критика для модели.

Для начала начнём с существующих атак и их анализа. Заинтересованных приглашаем под кат.

+18

codezombie 24 дек 2013 в 20:43

Spanner. NewSQL хранилище от Google

4 мин

26K

Big Data * NoSQL *

Spanner – географически распределенная высокомасштабируемая мультиверсионная база данных с поддержкой распределенных транзакций. Хранилище было разработана инженерами Google для внутренних сервисов корпорации. Research paper [8], описывающий базовые принципы и архитектуру Spanner, был представлен на научной конференции 10th USENIX Symposium on Operating Systems Design and Implementation в 2012 году.

Spanner является эволюционным развитием NoSQL-предшественника – Google Bigtable. Сам же c Spanner относят к семейству NewSQL-решений. В research paper [8] заявляется, что дизайн Spanner позволяет системе масштабироваться на миллионы вычислительных узлов через сотни дата-центров и работать с триллионами строк данных.

Читать дальше →

+50

olegbunin 18 сен 2019 в 09:16

Мал, да удал. Анбоксинг микровиртуалки Firecracker

11 мин

13K

Блог компании Конференции Олега Бунина (Онтико)Высоконагруженные системы *

Записывайте рецепт микровиртуалок Firecracker. Берем два популярных метода изоляции многопользовательской нагрузки — виртуальные машины и контейнеры. Выжимаем лучшее из обоих подходов, максимально упрощаем, тестируем на настоящем хайлоаде. В итоге получаем непробиваемую изоляцию виртуалок, которые можно запускать за сотни миллисекунд. Именно это решение работает под капотом AWS Lambda и Fargate, запуская в облаке миллионы serverless-функций и контейнеров каждую секунду. Оно называется Firecracker.

Этот инструмент микровиртуализации доступен в OpenSource. Если ваши задачи требуют мульти-тенантной изоляции, (ну, например, вы решили сделать собственное облако), Firecracker — это то, что надо.

Василий Пантюхин, архитектор Amazon Web Services, расскажет об архитектуре Firecracker, о том, как он используется AWS Lambda, сравнит его с альтернативными решениями и приведет примеры интеграции.

Дисклеймер: всё, что ниже — это личное мнение Василия, и оно может не совпадать с позицией Amazon Web Services.

+30

rosemorozenkova 26 сен 2024 в 10:21

Готовим по рецепту: CI/CD в MLOps

Средний

15 мин

6.1K

Блог компании КуперDevOps * Машинное обучение * Python *

Туториал

Всем привет! Меня зовут Роза и я MLOps-инженер в Купере. Под катом расскажу, как построить CI/CD-пайплайн для ML-приложений с нуля, поэтапно и без боли. Ну почти :)

Раньше очень часто работа DS-инженера заканчивалась на подготовке кода модели в Jupyter-ноутбуке, а дальше его подхватывали команды разработки и доводили до продакшена. У такого подхода есть минусы. Например, если произойдёт инцидент, непонятно кто ответственен за сервис — команда разработки или авторы ML-модели?

К счастью, культура разработки меняется: теперь ML-инженер — это специалист, который разрабатывает свой ML-сервис на всем пути от общения с бизнесом до продакшена. Этот подход хорошо описывает принцип «you build it, you run it»: кто построил модель, тот её и запускает. Как раз в этом здорово помогает CI/CD.

Погнали!

+18

igumnov 18 сен 2024 в 18:04

Создание инструмента генерации кода с помощью Rust и локальных LLM от Ollama

Средний

4 мин

4.7K

Программирование * Rust * Искусственный интеллект

Туториал

Это реакция на выпуск ChatGPT o-preview. Попытка добавить логику в LLM с открытым исходным кодом, которые можно запустить дома на скромном GPU или даже на CPU

Сейчас я работаю над инструментом на основе Rust, который автоматизирует генерацию, компиляцию и тестирование кода с использованием больших языковых моделей (LLM). Идея заключается в том, чтобы взаимодействовать с LLM для генерации кода на основе предоставленных пользователем объяснений, компилировать код, разрешать зависимости и запускать тесты, чтобы убедиться, что все работает так, как ожидается.

Я хотел бы оптимизировать процесс кодирования функций на основе описаний на естественном языке. Я хотел создать систему, в которой я мог бы ввести объяснение того, что должна делать функция, и чтобы инструмент обрабатывал все остальное от генерации кода до тестирования.

Работа инструмента начинается с того, что запрашивает у пользователя объяснение функции, которую он хочет создать. Затем он взаимодействует с LLM для генерации кода функции, компилирует его и проверяет на наличие ошибок компиляции. Если ошибки обнаружены, инструмент пытается их устранить, возможно, путем добавления зависимостей или переписывания кода. После успешной компиляции кода он генерирует тесты для функции, запускает их и снова обрабатывает любые ошибки, итеративно улучшая код или тесты.

Первый шаг — получить объяснение от пользователя:

+11

badcasedaily1 20 сен 2024 в 17:33

Генерация AST на Rust

Простой

5 мин

2.2K

Блог компании OTUSПрограммирование * Rust *

Обзор

Сегодня мы рассмотрим одну из тем систем компиляции — генерацию абстрактного синтаксического дерева или просто AST на Rust. Создадим свое собственное AST, разберем, как структурировать синтаксическое дерево, и рассмотрим, как использовать возможности Rust для создания парсеров и обработки узлов дерева.

+12

Albert_Wesker 12 сен 2024 в 07:55

Как уменьшить образ Docker для работы с устройствами IoT

Сложный

10 мин

5.4K

Блог компании Timeweb CloudGo * Rust * Raspberry Pi * Интернет вещей

Кейс

Перевод

На устройствах интернета вещей (IoT) зачастую слишком мало ресурсов, и их не хватает, чтобы подтягивать и использовать тяжеловесные образы Docker. В этой статье будет показано, как можно уменьшить образ Docker на 36-91% при помощи инструментов patchelf и strace, не перекомпилируя при этом контейнеризованные приложения. Также рассмотрим, как создавать минимальные образы для собственных приложений, написанных на Rust, Go, C/C++.

+26

stalkermustang 11 сен 2024 в 04:55

Большие и чёрные (ящики): что мы знаем о том, как «думают» нейросети?

Средний

30 мин

72K

Блог компании Open Data ScienceИскусственный интеллектНаучно-популярноеМашинное обучение * Будущее здесь

Обзор

ChatGPT вышел уже почти два года назад, а датасаентисты до сих пор никак не могут определиться — являются ли нейросети тварями дрожащими, или всё же мыслить умеют? В этой статье мы попробуем разобраться: а как вообще учёные пытаются подойти к этому вопросу, насколько вероятен здесь успех, и что всё это означает для всех нас как для человечества.

Узнать →

+178

empenoso 26 авг 2024 в 00:25

Как сделать из обычного квартирного домофона IP камеру видеонаблюдения

Сложный

7 мин

22K

Умный домРабота с видео * Open source * Настройка Linux *

Кейс

В моей квартире установлен аналоговый домофон Визит, вызывная панель которого оснащена камерой. Этот домофон не современный, а координатный - аналоговый и ему больше 10 лет.

В статье разбираюсь, что нужно для того, чтобы получать видеопоток с камеры домофона в режиме реального времени в RTSP формат и затем управлять этой камерой в системе видеонаблюдения и умном доме.

Узнаём всё про соседей 👀

+30

mr-pickles 19 авг 2024 в 08:30

Автоматизация управления ML-экспериментами с помощью СI/CD

Средний

17 мин

Блог компании Wunder FundМашинное обучение * Программирование * Python *

Перевод

ML‑эксперименты, по своей природе, полны неопределённости и сюрпризов. Небольшие изменения могут вести к огромным улучшениям, но иногда даже самые хитрые уловки не дают результатов.

В любом случае — успешная работа в сфере машинного обучения держится на систематическом применении итеративного подхода к экспериментам и на исследовании моделей. Именно здесь ML‑специалисты часто сталкиваются с беспорядком. Учитывая то, как много путей они могут избрать, им тяжело бывает удержать в поле зрения то, что они уже попробовали, и то, как это отразилось на эффективности работы моделей. Более того — ML‑эксперименты могут требовать много времени. С ними сопряжён риск пустой траты денег на повторные запуски тех экспериментов, результаты которых уже известны.

С помощью трекера экспериментов, вроде neptune.ai, можно скрупулёзно логировать сведения об экспериментах и сравнивать результаты разных попыток. Это позволяет выяснять то, какие настройки гиперпараметров и наборы данных вносят положительный вклад в эффективность работы моделей.

Но запись метаданных — это лишь половина секрета успешного ML‑моделирования. Нужно ещё иметь возможность проведения экспериментов таким образом, который позволяет быстро получать нужные результаты. Многие команды дата‑сайентистов, в основе рабочих процессов которых лежит система Git, сочли CI/CD‑платформы идеальным решением.

В этой статье мы исследуем вышеописанный подход к управления ML‑экспериментами и поговорим о том, в каких ситуациях его применение оправдано. Мы уделим основное внимание платформе GitHub Actions — системе, интегрированной в GitHub. Но освещённые здесь идеи применимы и к другим CI/CD‑фреймворкам. TL;DR под катом.

+16

arudakov 1 дек 2020 в 07:03

n8n. Автоматизация ИБ со вкусом смузи

13 мин

66K

Блог компании ГК ЛАНИТJavaScript * Node.JS * Open source * Информационная безопасность *

Всем давно очевидна польза тотальной автоматизации, в том числе, и в области информационной безопасности. В условиях большого кадрового дефицита как никогда актуальна идея снятия рутинной рабочей нагрузки как со специалиста по информационной безопасности, так и со специалистов в других областях.

В компаниях, где отлажены процессы ИБ, а также в центрах реагирования и мониторинга используется ПО, позволяющее автоматизировать принятия решений по возникающим инцидентам, но даже при этом многим до сих пор приходится писать скрипты для автоматизации рутинных операций. Что делать, если автоматизировать рутину вам хочется, но не хочется покупать дорогостоящее специализированное решение, разбираться с ним и потом долго настраивать его под свои нужды? А еще больше не хочется изобретать велосипед со скриптами и делать нечто свое, попутно изучая программирование и работу с БД?

Источник

TL;DR: Telegram, REST API, Shodan, DNS-over-HTTPS. Пишем бота в Telegram для парсинга инфы с shodan и поиска эксплойтов на exploit-db. Находим баг в работе n8n.

Ответ есть – добро пожаловать во фронтенд ~~со смузи и гироскутерами~~.

Читать дальше →

+28

gofat 10 июл 2024 в 08:35

Prompt engineering 101

Простой

26 мин

22K

Блог компании X5 TechNatural Language Processing * Python * Искусственный интеллектМашинное обучение *

Из песочницы

✏️ Технотекст 7

Привет!

Использование LLM все больше проникает в бизнес. И ритейл — не исключение. В X5 мы решили сделать небольшую методичку по prompt engineering для обычного бизнес‑пользователя. Мы посмотрели на получившийся результат и решили поделиться этой методичкой с сообществом, чтобы как можно больше людей смогли овладеть разными техниками, позволяющими работать с LLM эффективнее.

Для этого нам сначала придется разобраться с тем, как вообще устроены LLM, затем поговорим о промптах: общие принципы построения, техники оптимизации и промпты для изображений. А на десерт предложим вам продвинутые техники работы с LLM: автоматизированные подходы по улучшению промптов, Retrieval‑Augmented Generation и разметка данных для ML с помощью LLM.

+16

xufana 9 авг 2024 в 07:18

Интеграция LLM в корпоративные чат-боты: RAG-подход и эксперименты

Простой

11 мин

Блог компании X5 TechPython * Искусственный интеллектIT-компании

✏️ Технотекст 7

Всем привет! На связи команда AI-Run из X5 Tech, мы занимаемся генеративными сетями в целом и языковыми моделями в частности. В этой статье мы опишем наш опыт работы с большими языковыми моделями (LLM), их внедрение для обработки корпоративных данных, а также поделимся нашими результатами и выводами.

Ещё мы расскажем о нашем подходе к использованию LLM, подробно остановимся на методе Retrieval Augmented Generation (RAG) и рассмотрим примеры использования чат-ботов на корпоративных порталах X5.

Эта статья будет полезна разработчикам, которые интересуются внедрением LLM для работы с корпоративными данными. Она основана на нашем выступлении на митапе, но не ограничивается им, а, скорее, дополняет его.

+17

3 4 ...

29 30

В рейтинге: Не участвует

Откуда: Луганск, Луганская обл., Украина

Дата рождения: 10 марта 1981

Зарегистрирован: 2 декабря 2006

Активность: сегодня в 07:31

Специалист

Ведущий

От 10 800 $

PHP

ООП

Docker

Rust

Linux

Асинхронное программирование

MQTT

Геоинформационные системы

Машинное обучение

Computer Science

Запускаем Yolo на пятирублёвой монете или Luckfox Pico Mini

Wolfram Natural Language Understanding или спасение для студентов

rustsn — Open Source проект генерации кода и взаимодействия с уже существующим через LLM

Улучшенная глобальная настройка в Playwright с использованием авторизации и проектными зависимостями

Визуальные трансформеры (ViT)

Нейронная сеть учится понимать сигналы светофора

Обучение GigaChat с контекстом в сотни тысяч токенов

Пока не исправили — модифицируй, или Анализ расширений атаки уклонения для LLM

Spanner. NewSQL хранилище от Google

Мал, да удал. Анбоксинг микровиртуалки Firecracker

Готовим по рецепту: CI/CD в MLOps

Создание инструмента генерации кода с помощью Rust и локальных LLM от Ollama

Генерация AST на Rust

Как уменьшить образ Docker для работы с устройствами IoT

Большие и чёрные (ящики): что мы знаем о том, как «думают» нейросети?

Как сделать из обычного квартирного домофона IP камеру видеонаблюдения

Автоматизация управления ML-экспериментами с помощью СI/CD

n8n. Автоматизация ИБ со вкусом смузи

Prompt engineering 101

Интеграция LLM в корпоративные чат-боты: RAG-подход и эксперименты

Информация

Специализация