Комментарии / Профиль NeKonn / Хабр

Константин@NeKonn

Пользователь

ПрофильСтатьи1ПостыНовостиКомментарии10

Гибридный поиск с QWEN3-Max и RoSBERTa или RAG на графах

NeKonn 4 фев в 10:37

А самое решение есть в открытом доступе или решение полностью close source?

Запускаем Qwen3-VL-30B на 48GB VRAM

NeKonn 7 ноя 2025 в 05:54

а в llama-cpp-python работает?
Я просто пытался запустить через скрипт питона с этой оберткой и постоянно получал ошибку:

llama_model_load: error loading model: error loading model architecture: unknown model architecture: 'qwen3vlmoe'

llama_model_load_from_file_impl: failed to load model

Exception ignored in: <function LlamaModel.__del__ at 0x0000029C1909D3A0>

И не могу понять, то ли сама обертка не поддерживает пока еще новые qwen3vl, то ли я что-то не так делаю

Qwen3-VL теперь работает в llama.cpp

NeKonn 7 ноя 2025 в 05:50

а c llama-cpp-python работает? Я просто пытаюсь gguf веса, выкаченные с HF попробовать воспроизвести через llama-cpp-python и получаю постоянно ошибку

llama_model_load: error loading model: error loading model architecture: unknown model architecture: 'qwen3vlmoe'

llama_model_load_from_file_impl: failed to load model
Exception ignored in: <function LlamaModel.__del__ at 0x0000029C1909D3A0>
?

Как готовить Triton: рецепты вашей собственной Inference-платформы

NeKonn 6 ноя 2025 в 13:31

Антон, здравствуйте!
У меня такой вопрос, а чем triton server лучше, чем тот же vllm, есть ли у вас такая информация?

Ну и в целом, как вы считаете, для системы чата (на подобии веб версии чата гпт, квена, дипсика и др.) что лучше использовать для общения с LLM - vllm, tgi, triton server и почему? В чате также подразумевается агентная структуруа, т.е. не только общение с LLM, но и работа с созданными агентами.

Автоматизация разведочного анализа данных (EDA) с помощью Python

NeKonn 13 фев 2025 в 07:11

На мой взгляд, лучше всего подойдут курсы от МФТИ. Можно найти лекции на ютубе. Если же говорить прям о курсах в классическом понимании (с решением задачек и т.д.), то на платформе stepic можно найти курс "Основы статистики", а также дополнительно можно пройти курс от Carpov Course по математике для анализа данных.

Автоматизация разведочного анализа данных (EDA) с помощью Python

NeKonn 13 фев 2025 в 07:01

Если дадите пояснение в виде предложения/вопроса, то постараюсь ответить.

Автоматизация разведочного анализа данных (EDA) с помощью Python

NeKonn 11 фев 2025 в 12:06

Полностью согласен с вами, что есть и другие решения. В статье я сразу отметил, что не претендую на звание первооткрывателя ни в области проводимых статистических тестов, ни в области универсальности подобного решения. Я не первый и наверняка не последний, кто под свои нужды написал нечто подобное. Свидетельством тому может послужить большое количество библиотек для autoML.

T-Lite и T-Pro – открытые русскоязычные опенсорс-модели на 7 и на 32 млрд параметров

NeKonn 21 янв 2025 в 13:23

Подскажите, а сколько примерно GPU вам понадобилось для файнтюна моделей?

Как дела у российского геймдева: 7 достойных игр последних лет

NeKonn 26 авг 2024 в 05:14

Atomic Hart и впрямь крутейшая игра, вышедшая за последнее время от РФ производителей. Не испытывал такого удовольствия от Российских игр со времен Сталкера. Особенно понравилась вариативность концовок

Transfer learning: подробный гайд для начинающих

NeKonn 20 авг 2024 в 17:29

Весьма подробная статья, спасибо! А в Альфа-банке подобное применяется, если не секрет?

В рейтинге: Не участвует

Откуда: Москва, Москва и Московская обл., Россия

Дата рождения: 26 мая 1993

Зарегистрирован: 6 февраля 2024

Активность: сегодня в 04:17

Ученый по данным, ML разработчик

Средний

От 500 000 ₽

ООП

Python

C++

Алгоритмы и структуры данных

Оптимизация кода

Информация

Специализация