Pull to refresh
16K+
35
Марк Конаков@Mark_K

Data Scientist, специализуруюсь на NLP

11,5
Rating
111
Subscribers
Send message

Как Пентагон случайно изобрел будущее демократии

Level of difficultyEasy
Reading time4 min
Reach and readers7.8K

В мае 2001 года DARPA разослала запрос предложений под сухим названием «Electronic Market‑Based Decision Support». Суть: покажите нам, что рынки предсказаний работают для задач разведки. К декабрю две фирмы получили гранты. Проект назвали FutureMAP, а его публичную часть — Policy Analysis Market — задумали как биржу фьючерсов на политические события Ближнего Востока.

Перевороты, удары, смены режимов. Трейдеры ставят деньги, агрегированная цена дает оценку вероятности — честнее, чем отчет аналитика, который пишет то, что хочет услышать начальник.

28 июля 2003-го сенаторы Дорган и Уайден вытащили проект на пресс‑конференцию. На демо‑скриншотах кто‑то из разработчиков для красоты вписал примеры контрактов: «убийство Арафата», «ракетный удар КНДР». Заголовок написал себя сам — «федеральный тотализатор на терактах». Пентагон свернул всё за сутки. Глава подразделения Джон Пойндекстер подал в отставку.

Это был первый случай, когда идея prediction markets столкнулась не с логической, а с моральной стеной. Экономически PAM был абсолютно здрав — Университет Айовы к тому времени годами предсказывал выборы через торговлю фьючерсами точнее любых опросов. Но оказалось, что существуют решения, которые общество отказывается отдавать рынку не потому, что рынок ошибётся, а потому что сама постановка вопроса в формате ставки — непристойна. Политическая гигиена победила эпистемическую эффективность.

Идеи, которые лежали в основе PAM, принадлежали Робину Хансону из Джорджа Мейсона. Он пошёл дальше спецслужб и в 2000-м сформулировал футархию — систему, где голосованием выбирают только цели, а способ достижения определяет рынок. Хочешь рост ВВП? Открой два условных рынка: «ВВП через год при политике А» и «ВВП через год при политике Б». Где цена выше — то и делаем.

Читать далее

Как китайцы (опять) всё украли у Antropic

Level of difficultyMedium
Reading time2 min
Reach and readers14K

Китайская команда shareAI‑lab сделала то, что мы все хотели, но ленились — взяли Claude Code, разобрали до последнего байта и собрали заново. С нуля. С документацией.

Если вы когда‑нибудь задавались вопросом «а как вообще работает этот магический агент, который пишет код за меня» — вот вам ответ в 12 сессиях. Без воды, без маркетинговых слайдов и совершенно бесплатно.

Читать далее

Затачиваем меч для вайбкодинга

Level of difficultyEasy
Reading time1 min
Reach and readers18K

С легкой подачи Andrej Karpathy идея вайбкодинга захватила массы, поэтому решил накинуть несколько полезных, на мой взгляд, настроек Cursor, которые сделают рабочий процесс еще более вайбовым.

Читать далее

Пузырь ИИ скоро лопнет?

Reading time2 min
Reach and readers52K

За последние несколько лет трудно вспомнить более хайповую тему, чем искусственный интеллект. Акции Nvidia устремились в небеса, и кажется, что даже долгими зимними вечерами мы будем греться не от радиатора, а от работающей карточки графического процессора.

Но по законам драмы эйфория не может длиться вечно, а значит, нас ждет перипетия.

Читать далее

GPT или GigaChat — ответит RAGAS

Reading time8 min
Reach and readers8.6K

В предыдущей статье мы разбирались с тем, как RAGAS помогает оценить работу ретриверов в RAG-системах. Продолжая наше исследование, теперь мы переключаемся на другой важный аспект - качество языковых моделей, или LLM. Эти модели играют центральную роль в создании тех ответов, которые мы видим при общении с чат-ботами. Понять, насколько эффективны они в своей задаче, крайне важно, так как именно от их работы зависит успешное взаимодействие пользователей с системой.

Читать далее

Как сделать чат-бота лучше, нужен всего лишь простой советский… RAGAS

Reading time8 min
Reach and readers13K

В вводной части обзора мы познакомились с концепцией Retrieval Augmented Generation (RAG) и её расширением через методологию RAGAS (Retrieval Augmented Generation Automated Scoring). Мы разобрались, как RAGAS подходит к процессу оценки эффективности и точности RAG-систем.

В этой части мы более подробно рассмотрим техническую сторону RAGAS. Как обычно, начнем с более простых и интуитивно понятных примеров, потом перейдем к более сложным сценариям.

Читать далее

Оцениваем RAG-пайплайны

Reading time4 min
Reach and readers15K

RAG (Retrieval Augmented Generation) - это популярный подход, объединяющий извлечение данных из баз и генерацию текста, позволяя моделям AI давать ответы на вопросы, основанные на информации, которую они не видели в процессе обучения. Важным этапом в развитии RAG является его эффективная оценка, и именно здесь на сцену выходит RAGAS (Retrieval Augmented Generation Automated Scoring) - метод автоматизированной оценки, который позволяет не только оценить качество ответов, но и анализировать процесс генерации в деталях.

Читать далее

LlamaIndex: создаем чат-бота без боли и страданий. Часть 3

Reading time7 min
Reach and readers7.3K

Завершаем исследование фреймворка llamaIndex. В этой части разбираемся с ретриверами, которые обеспечивают различные способы извлечения релевантного контекста из индексов документов.

Читать далее

LlamaIndex: создаем чат-бота без боли и страданий. Часть 2

Level of difficultyEasy
Reading time5 min
Reach and readers8.9K

Продолжаем изучать фреймворк для создания AI-ботов. В этой части узнаем про тонкости индексирования собственной базы документов.

Читать далее

LlamaIndex: создаем AI-бота без боли и страданий

Level of difficultyEasy
Reading time6 min
Reach and readers39K

В этой статье рассмотрим мощный фреймворк для работы с большими языковыми моделями LlamaIndex: узнаем, как настроить и использовать LlamaIndex, и увидим его в действии на примере поиска ответа в заданном тексте.

Читать далее

LangChain для бывалых: создаем свои инструменты

Level of difficultyMedium
Reading time5 min
Reach and readers16K

Сегодня попробуем разобраться в инструментах(Tool). Инструменты являются исполнительной частью агента, которая как раз и добавляет языковой модели дополнительную функциональность. Например, LLM может наврать в базовых арифметических операциях, и лучше доверить вычисления калькулятору. В этот момент и приходит на помощь tool. В самом фреймворке уже есть готовые реализации для популярных задач, но они, естественно, не могут покрыть весь спектр потребностей, поэтому разработчики предусмотрели создание пользовательских типов.

Читать далее

LangChain для бывалых — память и агенты. часть 2

Level of difficultyMedium
Reading time9 min
Reach and readers14K

Добро пожаловать во вторую часть статьи о фреймворке LangChain.

В этой части мы перейдем к более продвинутым возможностям агентов и узнаем, как использовать их для работы с собственной базой данных и моделирования.

Читать далее

LangChain для бывалых: память и агенты. часть 1

Level of difficultyMedium
Reading time5 min
Reach and readers24K

В своей предыдущей статье я написал о многообещающем фреймворке LangChain. Туториал был достаточно коротким; удалось охватить только самые базовые концепции проекта (и то не все). В этой части предстоит более глубокое погружение. Разберемся, как можно добавить память в диалоги с LLM, а также задействуем мощь агентов.

Читать далее

Катаемся на аттракционе AutoGPT

Level of difficultyEasy
Reading time4 min
Reach and readers11K

AI агенты - автономные программы на основе искусственного интеллекта, способные определять и выполнять задачи самостоятельно для достижения поставленных целей. Они становятся все более популярными и обсуждаемыми. В статье разбирается проект AutoGPT, позволяющий запускать своих агентов самостоятельно.

Читать далее

LangСhain: создаем свой AI в несколько строк

Level of difficultyMedium
Reading time6 min
Reach and readers118K

В этой данной статье познакомимся с LangChain, перспективным фреймворком для работы с языковыми моделями. С его помощью можно создать свой собственный аналог ChatGPT всего в несколько строк кода. Благодаря модульной структуре, LangChain позволяет быстро и легко разрабатывать AI приложения различной сложности.

Читать далее

AI в действии: 5 приложений, которые упростят вашу жизнь

Level of difficultyEasy
Reading time2 min
Reach and readers13K

Развитие искусственного интеллекта (AI) продолжает идти вперед, делая его все более доступным для широких масс. В этой статье я собрал 5 AI‑приложений, которые помогут сделать жизнь немного проще и веселее — от просмотра видео на YouTube до создания креативного контента.

Читать далее

ChatGPT на стероидах: возможности плагина-ретривера для семантического поиска

Level of difficultyMedium
Reading time6 min
Reach and readers12K

OpenAI внедрил поддержку плагинов в ChatGPT, позволяя подключаться к сторонним сервисам и искать информацию в сети. Один из таких плагинов – Retrieval Plugin.

В статье описывается процесс установки, настройки окружения и интеграции плагина, а также тестирование его работы через векторный поиск.

Читать далее

Заклинания для Героев машинного обучения

Level of difficultyEasy
Reading time2 min
Reach and readers5.3K

В мире машинного обучения алгоритмы и методы обработки данных могут сравниться с магическими практиками. Пора достать с балкона артефакты, пополнить запас маны и приступить к изучению самых необходимых в боях заклинаний.

Читать далее

Information

Rating
653-rd
Location
Москва, Москва и Московская обл., Россия
Registered
Activity