Pull to refresh
6
0
Дэн Рычковский @DZRobo

Art-Director | AI-LLM Enthusiast Researcher

Send message

Спасибо за перевод!

скорей всего это потому что в демке просто претрейн модель стоит, без дообучения и тонкой настройки вот и все:)

как то так, очевидно что он бредит, с "igor_kz_bot" поржал конечно=)

ахаха, неплохо-неплохо, я думаю нужно в яндекс диалогах с подобным вопросом тоже прийти, конечно это могут быть и галюцинации=)

все так =) я как раз сейчас жду 5-ю серию чтоб докинуть в свой ПК к существующей.

На самом деле АИ сейчас правда доступный для экспериментов, если хочется просто пощупать что это такое, то вот квантованная модель Qwen 2.5 для обычной RTX 4070 например зайдет
https://huggingface.co/bartowski/Qwen2.5-7B-Instruct-GGUF
вообще по наблюдениям Qwen2.5 пока одна из лучших небольших open source моделей которая хорошо работает на русском языке. При этом правда хорошие ответы от нее начинаются на 32B, лично тестировал =)

Круто потому что это новый игрок в OpenSource LLM, и они 100% должны сделать мидловые модели. Чем более конкурентная среда, тем больше исследований и более передовые технологии, ну....
Понятно что конкретно эта модель для мини комнад с каким-то бюджетом на оборудование и исследования, но это вдохновляет! Меня покрайнемере точно, поэтому я и поделился с вами новостью!)

Молодцы что не стоите на месте, респект!
А расскажите пожалуйста, вы архитектуру старую сохранили, на трансформере ruGPT-3.5 работаете или обновили пирог архитектурный? было бы интересно про архитектуру текущую отдельно почтитать, если не секрет конечно. И еще пару вопросов, если не секрет на каких мощностях GPU работает ваша MAX? На каких мощностях и как долго дообучали MAX?

Добрый день:) Онлайн бы послушал посмотрел, да, физически увы не смогу прийти пока что.
Про такие-себе философы, в LLM сильно зависит от контекста и того как строится диалог + контекстное окно все-таки пока не позволяет долго обсуждать важное, например если нужно обсудить конкретное филосовское направление то лучше сослаться на пару книг, рассказать свои мысли, обсудить чутка около важные касательные темы и только потом уже подводить к основному диалогу. Очень сильно зависит сейчас все от уменя задающего вопрос, держать линию диалога и фокус.
Про создание бота философа интересная история, я сейчас занимаюсь пока исследованиями модернизации опенсорсных LLM и глубже погружаюсь в тему самой работы на низком уровне, потому что вижу что есть архитектурные ограничения которые мешают нормально общаться моделям.
И кстати! На реддите буквально недавно прошла AMA серия с OpenAI, похоже что все-таки совсем не загорами архитекутрное обновление которое позволит еще более естественно общаться и из важного они прям скоро расширят контекстное окно, это круто.
https://www.reddit.com/r/ChatGPT/comments/1ggixzy/ama_with_openais_sam_altman_kevin_weil_srinivas/
Про сотрудничество - тоже очень заманчиво, но тут пока все упирается в мое время, как только я погружусь на должном уровне в техническую сторону вопроса и смогу еще больше уделять времени "психологическому и филосовскому" аспекту, то я думаю можем обсудить детали, мне интересно да.

Спасибо большое, было интересно почтитать, каритнка с М10 очень, конечно, нормальный ЦОД напоминает=)

Пожалуйста:)
Про лимит токенов на самом деле нужно помнить, когда сложные темы обсжудаются. Потому-что он может наступить "внезапно" (на текущий момент даже предупреждения нет в десктопной и веб версии о близком лимите, просто выдается ошибка о том что ассистент не может сгенерировать ответ, в мобильном приложении тебе постфактум говорят что лимит), а поднимать сложную тему опять в новом чате это тоже искусство своего рода, нужно подготовить нормально вводные со старого чата.

Information

Rating
Does not participate
Registered
Activity

Specialization

Art Director, AI-LLM Enthusiast Researcher
Lead
Adobe Photoshop
People management
Building a team
Planning
Information Technology
Python
Art Directing
Unreal Engine
Unity3d
Git