Articles / Profile of SGERCEN / Habr

Боловцов Сергей@SGERCEN

User

Subscribers

ProfileArticles4PostsNews1Comments20

SGERCEN Mar 13 at 20:30

Неофициальный Python-клиент для alphaxiv: как мы нашли скрытый API и упаковали его в пакет

Medium

14 min

9.1K

Artificial IntelligenceNatural Language Processing * API * Machine learning *

Case

У alphaxiv.org есть API — но найти его было непросто: публичная документация появилась совсем недавно, а до этого единственный способ разобраться в том, как он работает, — DevTools и живой трафик браузера. POST-запрос к api.alphaxiv.org/assistant/v2/chat, SSE-поток в ответе, модель aurelle-1.

На основе этого исследования мы собрали aurelle-py — Python-пакет для программного доступа к AI-ассистенту alphaxiv: задавать вопросы по arXiv-статьям, стримить ответы, встраивать в исследовательские пайплайны. Мы не первые, кто занялся этой темой, — но постарались сделать решение аккуратным и хорошо задокументированным.

Что внутри: синхронный и асинхронный клиенты, SSE-парсер с независимым юнит-тестированием, Pydantic v2 для валидации, типизированные исключения (AuthError, RateLimitError), MCP-сервер для интеграции с Claude Desktop и Claude Code.

pip install aurelle-py

В статье — как мы нашли эндпоинт, разобрали формат запроса и ответа, какие ограничения выявили опытным путём и как устроен пакет внутри.

GitHub: https://github.com/center4aai/aurelle-py

SGERCEN Sep 9 2025 at 05:00

Как мы научили LLM отвечать на вопросы абитуриентов в крупнейшем вузе страны

Medium

19 min

15K

Artificial IntelligenceNatural Language Processing * Python *

Case

Академий показал, что LLM-бот может работать в продакшене, а не в демо. RAG, SQL-модуль, собственный бенч и GPU-инфра позволили выдержать десятки тысяч запросов в реальной приёмной кампании.

Для абитуриентов это быстрые и точные ответы 24/7, для вуза — разгрузка комиссии и масштабируемый инструмент. Для нас — платформа, где мы улучшаем подходы к RAG, фильтрации и безопасности в живой среде.

+12

SGERCEN Dec 15 2024 at 12:27

Бенчмарк SLAVA: шаг к мировоззренческому суверенитету

Easy

7 min

6.1K

Machine learning * Natural Language Processing * Artificial Intelligence

Review

Бенчмарк SLAVA: шаг к мировоззренческому суверенитету.

SLAVA Space on Hugging Face - Наш актульный лидерборд на HF
SLAVA Benchmark - В этом репозитории находится код и документация для фрейморвка
SLAVA Dataset on Hugging Face - Открытый набор данных включает 2.8 тысяч вопросов

SGERCEN Oct 28 2024 at 18:16

Насколько хороши LLM?

Easy

7 min

9.3K

Machine learning * Natural Language Processing *

From sandbox

Основной целью данного бенчмарка является всесторонняя оценка возможностей русскоязычных LLM в контексте российской действительности по темам истории, географии, обществознания и политологии. В разработке бенчмарка ИОН РАНХиГС и ИСП РАН были заложены следующие принципы:

Формирование базы вопросов из официальных источников, близких к позиции РФ. К данным источникам относятся базы вопросов по ЕГЭ по соответствующим дисциплинам, открытых экзаменационных вопросов ведущих российских вузов, а также вопросов, сформулированных специалистами РАНХиГС и ИСП РАН.

Ежеквартальный пересмотр содержания бенчмарка, заключающийся в добавлении новых вопросов по актуальным темам, удалении или обновление устаревших вопросов.

Пересмотр оценок провокационности с учетом изменений в общественном контексте.

Неофициальный Python-клиент для alphaxiv: как мы нашли скрытый API и упаковали его в пакет

Как мы научили LLM отвечать на вопросы абитуриентов в крупнейшем вузе страны

Бенчмарк SLAVA: шаг к мировоззренческому суверенитету

Насколько хороши LLM?

Information

Specialization