Статьи / Закладки / Профиль witdex / Хабр

@witdex

Пользователь

ПрофильСтатьи1ПостыНовостиКомментарии255

@Ologos 29 ноя 2024 в 08:16

Обзор на Model Context Protocol (MCP) от Anthropic

Средний

6 мин

7.9K

Программирование * Проектирование API * Искусственный интеллектTypeScript *

Из песочницы

Перевод

На заре появления LLM пользователям приходилось просто копировать свой код в текстовое окно, чтобы ИИ могла его обработать. Естественно, такой подход быстро всех утомил, и разработчики начали искать свои способы загрузки данных в модель. У этого подхода была серьезная проблема — каждому приходилось изобретать велосипед заново.

Именно поэтому появился протокол MCP (Model Context Protocol) — универсальный способ дать искусственному интеллекту доступ к нужным данным, неважно где они хранятся — на компьютере пользователя или же в интернете.

@artmaro 3 окт 2024 в 09:00

Replit Agent программиста не заменит! Или как мы пробовали писать код с помощью нейросети

Средний

10 мин

2.4K

Блог компании Конференции Олега Бунина (Онтико)Блог компании RaftМашинное обучение * Искусственный интеллектХакатоны

Кейс

Привет, Хабр! Это компания Raft и я — руководитель AI продуктов Евгений Кокуйкин. А на фото выше — троица из нашей команды — техлид Саша Константинов, AI Project Manager & QA Lead Толя Разумовский и Data scientist Арсений Пименов на конференции Олега Бунина AIConf. Недавно в сети появился Replit Agent с многообещающими заявлениями. Мол, этот инструмент пишет код лучше программистов и скоро их заменит. Хотя в Raft мы и пишем код по старинке — вручную, но следим за технологиями и стремимся использовать новшества там, где это может быть полезно. Решили испытать Replit Agent в деле и даже устроили внутри команды мини-хакатон. Делимся впечатлениями.

+11

@artmaro 5 янв в 13:55

Обзор уязвимостей для LLM. Часть 1. Атака

7 мин

2.7K

Блог компании Конференции Олега Бунина (Онтико)Блог компании RaftИскусственный интеллектМашинное обучение * Информационная безопасность *

Обзор

Большие языковые модели где только не применяют: генерируют внешний вид автомобилей, домов и кораблей, саммаризируют круглые столы и конференции, придумывают тезисы к статьям, рассылкам и презентациям. Но при всех «плюшках» от внедрения ИИ, не стоит забывать про безопасность. Большие языковые модели атакуют разнообразными изощрёнными способами. В топе новостей о нейросетях — многомиллионные инвестиции в средства защиты от промпт-инъекций. Поэтому поговорим о том, какие угрозы существуют и почему инвесторы платят большие деньги за создание таких бизнесов. А во второй части статьи расскажу, как от них защищаться.

Привет, Хабр! Меня зовут Евгений Кокуйкин и я — руководитель AI-продуктов в Raft. Запускаю лабораторию AI Security в AI Talent Hub/ИТМО.

+13

@artmaro 1 апр в 08:05

Разбираемся в AI проектах OWASP: обзор для разработчиков и ИБ-специалистов

12 мин

2.4K

Блог компании RaftБлог компании OWASPИнформационная безопасность * Машинное обучение * Искусственный интеллект

OWASP — некоммерческая организация, которая занимается выпуском руководств и фреймворков в области безопасности. В условиях активного внедрения генеративного ИИ в самые разные сферы, OWASP анонсировал больше десяти разных проектов, чтобы охватить новые угрозы и привлечь внимание к безопасности AI-систем. Ниже расскажу про основные инициативы и документы, которые могут пригодится в работе тимлидам, разработчикам и специалистам по информационной безопасности.

На первый взгляд в глаза бросается обилие проектов, документов и рекомендаций. Материалы в отчётах пересекаются и запутаться в инициативах OWASP — легко. Связано это с тем, что проекты ведут разные команды и лидеры. В OWASP более 1000 человек только в slack-канале и около 100 активных участников.

Надеюсь, эта статья поможет вам разобраться в специфике каждого гайда, и облегчит выбор подходящего документа под ваши потребности. Начнём с главного документа по AI от OWASP. Меня зовут Евгений Кокуйкин и мы в AI Security лаборатории Raft изучаем прикладные аспекты безопасности GenAI-систем. В OWASP я веду один из стримов, про которые пойдёт речь ниже.

+10

@SSP_blog 20 ноя 2023 в 05:50

15 примеров задач по SQL на собеседовании по вакансии системного аналитика

Средний

15 мин

96K

Блог компании SSP SOFTКарьера в IT-индустрииSQL *

Туториал

Привет, Хабр! Если вы читаете этот материал, скорее всего, вы готовитесь к собеседованию. Важным аспектом работы системного аналитика (СА) является умение эффективно работать с базами данных, и SQL — это ключевой инструмент для этого. Будьте готовы, что на техническом собеседовании вас могут попросить назвать операторы SQL, написать запросы для извлечения, обновления или удаления данных, создания новых таблиц и многого другого. Давайте посмотрим на некоторые примеры таких заданий.

@egaoharu_kensei 28 мар 2024 в 10:06

Логистическая и Softmax-регрессии. Основная идея и реализация с нуля на Python

Сложный

9 мин

22K

Python * Data Mining * Алгоритмы * Машинное обучение * Искусственный интеллект

Туториал

Начнём с более простого. Логистическая регрессия — линейный бинарный классификатор, основанный на применении сигмоидальной функции к линейной комбинации признаков, результатом которого является вероятность принадлежности к определённому классу. Обычно порог устанавливается 0.5: если вероятность меньше порога — класс относится к 0, а если больше — к 1. В принципе, условия определения логистической регрессии такие же как и у линейной за исключением бинаризации таргета.

@Squirrelfm 11 янв 2024 в 05:07

Про fine-tuning моделей простыми словами

Простой

6 мин

37K

Блог компании RaftМашинное обучение * Искусственный интеллектNatural Language Processing *

Обзор

Вы, наверное, уже не раз слышали о тонкой настройке (fine-tuning) моделей. На самом деле, в нашей компании мы настраиваем модель каждые 10 секунд. До написания этой статьи я даже настроил свой завтрак, на всякий случай, потому что, как мы все знаем, все лучше, когда хорошо настроено.

Но что это на самом деле? Это просто другой модный термин или в нем есть смысл? ? Давайте выясним.

@uaoleg 29 окт 2013 в 21:48

Ускоряем Nginx за 5 минут

5 мин

312K

Высоконагруженные системы *

Попытайтесь повторить это сами

Как правило, настроенный должным образом сервер Nginx на Linux, может обрабатывать 500,000 — 600,000 запросов в секунду. Но этот показатель можно весьма ощутимо увеличить. Хотел бы обратить внимание на тот факт, что настройки описанные ниже, применялись в тестовой среде и, возможно, для ваших боевых серверов они не подойдут.

Минутка банальности.

yum -y install nginx

На всякий пожарный, создадим бэкап исходного конфига.

cp /etc/nginx/nginx.conf /etc/nginx/nginx.conf.orig
vim /etc/nginx/nginx.conf

А теперь можно и похимичить!

Бдыжь-бдыжь

+72

128

@SSP_blog 12 июл 2024 в 09:02

Разработчикам, аналитикам и архитекторам: рецензия на книгу «Проектирование архитектуры API»

Простой

9 мин

8.8K

Блог компании SSP SOFTКарьера в IT-индустрииУчебный процесс в ITПрофессиональная литература * Проектирование API *

Обзор

Сегодня представляем на Хабре очень интересную книгу — переводное издание «Проектирование архитектуры API» («Mastering API Architecture») издательства O'REILLY. Это руководство по разработке и реализации API (программных интерфейсов приложений). Разобраны базовые вопросы обмена информацией в микросервисной архитектуре, обработка запросов на сайтах и в веб‑приложениях (парадигма REST). Бонусами к статье — промокод «SSPSOFT» на русское издание и ссылка на оригинальный текст книги (бесплатная копия книги в PDF).

+17

@obus 16 июн 2016 в 15:25

Метрики качества ранжирования

7 мин

158K

Блог компании E-ContentaАлгоритмы * Математика * Машинное обучение * Поисковые технологии *

Туториал

В процессе подготовки задачи для вступительного испытания на летнюю школу GoTo, мы обнаружили, что на русском языке практически отсутствует качественное описание основных метрик ранжирования (задача касалась частного случая задачи ранжирования — построения рекомендательного алгоритма). Мы в E-Contenta активно используем различные метрики ранжирования, поэтому решили исправить это недоразуменее, написав эту статью.

Читать дальше →

+13

@basalov_yurij 17 авг 2022 в 10:03

Как с помощью BERT организовать поиск похожих текстов

5 мин

8.4K

Машинное обучение * Поисковые технологии *

Технотекст 2022

Что нужно, чтобы с помощью BERT организовать поиск похожих текстов, а также как можно решить задачу многоклассовой классификации нестандартным способом.

@xmoonlight 26 сен 2012 в 16:59

Определение части речи слова на PHP одной функцией

3 мин

41K

PHP * Алгоритмы * Программирование *

Из песочницы

Прочитав пост http://toster.ru/2410/, я написал функцию, которая определяет из строки слов их части речи. Определение, конечно не 100%, но можно легко дорабатывать.

Функция возвращает массив значений групп:

1. прилагательное
2. причастие
3. глагол
4. существительное
5. наречие
6. числительное
7. союз
8. предлог

Пример вызова функции:

print_r(chastrechiRUS('В небе летит красивый сверкающий самолёт'));

Результат работы функции (массив):

Array ( [0] => 8 [1] => 4 [2] => 3 [3] => 1 [4] => 2 [5] => 4 )

Читать дальше →

+45

@PashaPodolsky 21 мар 2021 в 07:56

Устройство поисковых систем: базовый поиск и инвертированный индекс

24 мин

37K

Программирование * Поисковые технологии * Анализ и проектирование систем * Алгоритмы * Rust *

Под капотом почти каждой поисковой строки бьется одно и то же пламенное сердце — инвертированный индекс. Именно инвертированный индекс принимает текстовые запросы и возвращает пользователю список документов, а пользователь смотрит на всё это дело и радуется котиками, ответам с StackOverflow и страничкам на вики.

В статье описано устройство поиска, инвертированного индекса и его оптимизаций с отсылками к теории. В качестве подопытного кролика взят Tantivy — реализация архитектуры Lucene на Rust. Статья получилась концентрированной, математикосодержащей и несовместимой с расслабленным чтением хабра за чашкой кофе, осторожно!

Читать дальше →

+37

@basalov_yurij 25 окт 2020 в 10:55

Как построить полнотекстовый поиск с помощью нейронных сетей

8 мин

16K

Алгоритмы * Машинное обучение * Поисковые технологии *

Из песочницы

Почему с помощью обычного полнотекстового поиска сложно искать очень короткие документы и как быть, если хочется это сделать.

Читать дальше →

+12

@aio350 17 июн 2022 в 06:53

JavaScript: заметка о сканере предварительной загрузки и пропуске невидимого контента

12 мин

6.1K

Блог компании Timeweb CloudJavaScript *

Привет, друзья!

В этой заметке я хочу рассказать о двух вещах:

Сканере предварительной загрузки (теоретическая часть).
Пропуске невидимого контента (практическая часть).

Обе технологии используются браузером для повышения скорости загрузки веб-приложений.

Теоретическая часть представляет собой адаптированный и дополненный перевод этой статьи. Практическая часть — это небольшой эксперимент по применению новых свойств CSS, о которых рассказывается в этой статье (перевод).

Если вам это интересно, прошу под кат.

Читать дальше →

+17

@badcasedaily1 20 дек 2023 в 07:51

Shadow Dom в fullstack

Простой

12 мин

6.4K

Блог компании OTUSВеб-разработка * Программирование *

Обзор

Shadow DOM – это нечто вроде дополнения к обычному DOM, позволяющее инкапсулировать стили и разметку компонентов, скрывая их от основного дерева документа. Это механизм, который позволяет упаковать HTML-структуру, стили и скрипты в изолированные компоненты.

Shadow DOM обеспечивает инкапсуляцию — значит, CSS и JavaScript могут работать в рамках конкретного компонента, не влияя на остальную часть страницы. Это решает проблему "глобальной области видимости", с которой сталкиваются многие разработчики, и позволяет создавать более предсказуемые и устойчивые веб-приложения.

@Nikolay_nc 2 сен 2023 в 07:46

Пережевывая Матрицу Несоответствий — Confusion Matrix

Простой

7 мин

29K

Машинное обучение * Статистика в ITИнтервью

Из песочницы

Понятие Confusion Matrix является довольно простым в объяснении, но при этом начинающим Data Scientist-специалистам бывает порой нелегко разобраться в отношениях True Positive (TP), False Positive (FP), True Negative (TN), False Negative (FN) — кирпичиками, составляющими данную матрицу. Цель этой статьи познакомить читателя с альтернативным представлением Матрицы Ошибок. Данный способ, по мнению автора, является наиболее наивным методом графического восприятия самой Матрицы Несоответствий, не предполагающий запоминания самой таблицы матрицы. Данный подход позволит легко ориентироваться в выводах, основанных на комбинации элементов Confusion Matrix, глубже понять проблему дисбаланса классов в задачах классификации.

@PyLounge 28 июн 2022 в 04:03

Computer Science или что должен знать программист?

5 мин

108K

Программирование * Учебный процесс в ITКарьера в IT-индустрии

Программисты бывают разные. Мобильные разработчики на Kotlin и Swift, веб-программисты, использующие PHP, Python, Ruby, хардкорные электронщики на Си и Assembler. Главным их отличием является сфера, в которой они работают и используемый язык. Однако не редки случаи, когда, например, веб-разработчики уходят в mobile, электронщики в gamedev и т.д. А конкретно язык программирования вообще можно переучить за пару месяцев. Пропорции условны, а границы размыты. Языки и технологии меняются, и если всё так подвижно и непостоянно, что же объединяет всех этих людей? А объединяет их умение программировать в целом, не зависимо от языка, платформы и технологии...и знание английского языка, пока не поздно учи английский (вставка из «Криминальное чтиво»)

Умение же программировать складывает из практического навыка написания программ и теоретической базы из различных областей Computer Science. Какие алгоритмы нужно знать программисту, нужно ли ему разбираться в компьютерах, системах счисления, делить в уме столбиком и что вообще должен знать программист в широком смысле этого слова. На эти вопросы вам сегодня постарается ответить Макс. Один из автора YouTube-канала PyLounge, Поехали!

-4

@respectpick 2 мар 2021 в 18:40

Читаем EXPLAIN на максималках

19 мин

99K

Блог компании СитимобилMySQL * Серверная оптимизация * Базы данных *

Технотекст 2021

Многим, кто работает с MySQL, известно, что команда EXPLAIN используется для оптимизации запросов, получения информации об использованных и возможных индексах. Большинство разработчиков и администраторов СУБД этой информацией и ограничивается. Я же предлагаю изучить команду EXPLAIN максимально подробно.

+14

@shmoulevsky 6 мая 2024 в 14:50

Meilisearch — организация поиска в связке с Laravel

Сложный

8 мин

12K

PHP * SQL * Проектирование API * Laravel * Rust *

Обзор

Hola, Amigos! Меня зовут Евгений Шмулевский, я backend-разработчик на Laravel в агентстве продуктовой разработки Amiga. В статье описываю организацию поиска через Meilisearch и нюансы использования в связке с Laravel.

+12

3 4