Комментарии / Профиль avalonsec / Хабр

Адепт-линуксоид, python developer — любитель.

Более мощное семейство моделей YandexGPT 4: рост качества ответов, длинный контекст, пошаговые рассуждения

avalonsec 25 окт 2024 в 03:07

У яндекса их модель выдает ответы на уровне 3.5. Не понимаю почему огромная компания с их bigdata не могут сделать мультиагентную систему которая будет давать ответы в зависимости от области. Файтюненая модель llama с доступом к интернет поиску и то даёт ответы лучше и это с учётом того что это всё тренеровалось тупо на не большой выборке данных на обычной пользовательской видеокарте, не говоря уже о A100.

Более мощное семейство моделей YandexGPT 4: рост качества ответов, длинный контекст, пошаговые рассуждения

avalonsec 25 окт 2024 в 03:00

Скрывают что б не опозориться.

-2

Как с помощью supervised fine-tuning кастомизировать LLM

avalonsec 18 окт 2024 в 06:28

А есть мануалы по обучению с подкреплением(PPOTrainer)?

Как с помощью supervised fine-tuning кастомизировать LLM

avalonsec 18 окт 2024 в 06:26

Многие уже отфайтюнили llama 3.1 8b с квантованием fp8. И вполне успешно практикуют базы знаний rag.

Машинный перевод GPT-4o статьи «Uncensor any LLM with abliteration»

avalonsec 16 окт 2024 в 16:43

Llama 405 и gemini pro не пробовал, но думаю принцип тот же.

Машинный перевод GPT-4o статьи «Uncensor any LLM with abliteration»

avalonsec 16 окт 2024 в 16:42

Пробовал только mlabonne/Meta-Llama-3.1-8B-Instruct-abliterated работает нормально. Вот хочу на её основе обучить свою.

Машинный перевод GPT-4o статьи «Uncensor any LLM with abliteration»

avalonsec 16 окт 2024 в 15:18

Для llama3 да, а для gpt4 уже требуется несколько уровней абстракции. Я писал статью с промтом Алисы что бы имитировать логику o1 и обойти ограничения цензуры. Я сейчас пытаюсь собрать датасет для более широкой поддержки русского языка, llama изначально создавалась для англоязычной аудитории, а поддержка русского сильно ограничена.

Представлен открытый проект Databye для анонимизации и преобразования конфиденциальных данных в базах

avalonsec 7 окт 2024 в 02:06

Это делается для аналитики и составления датасетов для обучения моделей.

Информация

Специализация