Статьи / Профиль SGERCEN / Хабр

Боловцов Сергей@SGERCEN

Пользователь

Рейтинг

Подписчики

ПрофильСтатьи4ПостыНовостиКомментарии19

SGERCEN 13 мар в 20:30

Неофициальный Python-клиент для alphaxiv: как мы нашли скрытый API и упаковали его в пакет

Средний

14 мин

Искусственный интеллектNatural Language Processing * Проектирование API * Машинное обучение *

Кейс

У alphaxiv.org есть API — но найти его было непросто: публичная документация появилась совсем недавно, а до этого единственный способ разобраться в том, как он работает, — DevTools и живой трафик браузера. POST-запрос к api.alphaxiv.org/assistant/v2/chat, SSE-поток в ответе, модель aurelle-1.

На основе этого исследования мы собрали aurelle-py — Python-пакет для программного доступа к AI-ассистенту alphaxiv: задавать вопросы по arXiv-статьям, стримить ответы, встраивать в исследовательские пайплайны. Мы не первые, кто занялся этой темой, — но постарались сделать решение аккуратным и хорошо задокументированным.

Что внутри: синхронный и асинхронный клиенты, SSE-парсер с независимым юнит-тестированием, Pydantic v2 для валидации, типизированные исключения (AuthError, RateLimitError), MCP-сервер для интеграции с Claude Desktop и Claude Code.

pip install aurelle-py

В статье — как мы нашли эндпоинт, разобрали формат запроса и ответа, какие ограничения выявили опытным путём и как устроен пакет внутри.

GitHub: https://github.com/center4aai/aurelle-py

SGERCEN 9 сен 2025 в 05:00

Как мы научили LLM отвечать на вопросы абитуриентов в крупнейшем вузе страны

Средний

19 мин

15K

Искусственный интеллектNatural Language Processing * Python *

Кейс

Академий показал, что LLM-бот может работать в продакшене, а не в демо. RAG, SQL-модуль, собственный бенч и GPU-инфра позволили выдержать десятки тысяч запросов в реальной приёмной кампании.

Для абитуриентов это быстрые и точные ответы 24/7, для вуза — разгрузка комиссии и масштабируемый инструмент. Для нас — платформа, где мы улучшаем подходы к RAG, фильтрации и безопасности в живой среде.

+12

SGERCEN 15 дек 2024 в 12:27

Бенчмарк SLAVA: шаг к мировоззренческому суверенитету

Простой

7 мин

6.1K

Машинное обучение * Natural Language Processing * Искусственный интеллект

Обзор

Бенчмарк SLAVA: шаг к мировоззренческому суверенитету.

SLAVA Space on Hugging Face - Наш актульный лидерборд на HF
SLAVA Benchmark - В этом репозитории находится код и документация для фрейморвка
SLAVA Dataset on Hugging Face - Открытый набор данных включает 2.8 тысяч вопросов

SGERCEN 28 окт 2024 в 18:16

Насколько хороши LLM?

Простой

7 мин

9.3K

Машинное обучение * Natural Language Processing *

Из песочницы

Основной целью данного бенчмарка является всесторонняя оценка возможностей русскоязычных LLM в контексте российской действительности по темам истории, географии, обществознания и политологии. В разработке бенчмарка ИОН РАНХиГС и ИСП РАН были заложены следующие принципы:

Формирование базы вопросов из официальных источников, близких к позиции РФ. К данным источникам относятся базы вопросов по ЕГЭ по соответствующим дисциплинам, открытых экзаменационных вопросов ведущих российских вузов, а также вопросов, сформулированных специалистами РАНХиГС и ИСП РАН.

Ежеквартальный пересмотр содержания бенчмарка, заключающийся в добавлении новых вопросов по актуальным темам, удалении или обновление устаревших вопросов.

Пересмотр оценок провокационности с учетом изменений в общественном контексте.

Неофициальный Python-клиент для alphaxiv: как мы нашли скрытый API и упаковали его в пакет

Как мы научили LLM отвечать на вопросы абитуриентов в крупнейшем вузе страны

Бенчмарк SLAVA: шаг к мировоззренческому суверенитету

Насколько хороши LLM?

Информация

Специализация