Comments / Profile of DZRobo / Habr

Дэн Рычковский@DZRobo

Art-Director | AI-LLM Enthusiast Researcher

Subscribers

ProfileArticles3PostsNews1Comments16

Масло, вода, ртуть, акварель. Простой тест для LLM… или нет?

DZRobo Sep 9 2025 at 14:55

как и обещал, добавил гифки, GLHF=)

Масло, вода, ртуть, акварель. Простой тест для LLM… или нет?

DZRobo Sep 8 2025 at 19:23

Я подумал что видео более репрезентативно, там в статике будет ничего не понятно. Завтра немного гифок нарежу (но скорей всего коротких совсем), должно слегка помочь:)

Масло, вода, ртуть, акварель. Простой тест для LLM… или нет?

DZRobo Sep 3 2025 at 06:46

Да, у каждой модели есть свои нюансы, тестом как раз и проверял возможность модели "достраивать" себе контекст даже в размытых условиях. Здесь фокус был именно на продуктах от OpenAI, если будет интерес аудитории, то я проведу сходный тест и на других моделях и опубликую его тут.

Масло, вода, ртуть, акварель. Простой тест для LLM… или нет?

DZRobo Sep 3 2025 at 06:43

Да, пардон забыл его, опросом как раз и хотел посмотреть степень распределения (хотя бы на вскидку) кто чем пользуется среди пользователей Хабра =)
Включил его в опросник, спасибо что напомнили.

Когда ИИ закрывает глаза: Путешествие между воображением и галлюцинациями

DZRobo Mar 23 2025 at 15:58

Все так, я как раз аккуратно в статье говорю о том, что сейчас, есть технические ограничения, но которые будут решены, если к этому будут стремиться и будут решены в ближайшем будущем. Именно поэтому я везде употребляю (на текущий момент и Март 2025).
Сейчас не хватает рефлексии, дополнительного опыта о внешнем мире и конечно же сквозной памяти с выборочным сохранением важных моментов, по аналогии с работой человеческого мозга. Я думаю первыми будут ChatGPT, Claude и Gemini.
Это статья побуждающая всех подумать между строк =)

KAN: Kolmogorov–Arnold Networks

DZRobo Nov 9 2024 at 07:08

Спасибо за перевод!

Tencent представила Hunyuan-Large — крупнейшую открытую модель с 389 миллиардами параметров

DZRobo Nov 7 2024 at 14:47

скорей всего это потому что в демке просто претрейн модель стоит, без дообучения и тонкой настройки вот и все:)

Tencent представила Hunyuan-Large — крупнейшую открытую модель с 389 миллиардами параметров

DZRobo Nov 7 2024 at 05:37

как то так, очевидно что он бредит, с "igor_kz_bot" поржал конечно=)

Tencent представила Hunyuan-Large — крупнейшую открытую модель с 389 миллиардами параметров

DZRobo Nov 7 2024 at 05:30

ахаха, неплохо-неплохо, я думаю нужно в яндекс диалогах с подобным вопросом тоже прийти, конечно это могут быть и галюцинации=)

Tencent представила Hunyuan-Large — крупнейшую открытую модель с 389 миллиардами параметров

DZRobo Nov 6 2024 at 15:43

все так =) я как раз сейчас жду 5-ю серию чтоб докинуть в свой ПК к существующей.

Tencent представила Hunyuan-Large — крупнейшую открытую модель с 389 миллиардами параметров

DZRobo Nov 6 2024 at 09:47

На самом деле АИ сейчас правда доступный для экспериментов, если хочется просто пощупать что это такое, то вот квантованная модель Qwen 2.5 для обычной RTX 4070 например зайдет
https://huggingface.co/bartowski/Qwen2.5-7B-Instruct-GGUF
вообще по наблюдениям Qwen2.5 пока одна из лучших небольших open source моделей которая хорошо работает на русском языке. При этом правда хорошие ответы от нее начинаются на 32B, лично тестировал =)

Tencent представила Hunyuan-Large — крупнейшую открытую модель с 389 миллиардами параметров

DZRobo Nov 6 2024 at 06:27

Круто потому что это новый игрок в OpenSource LLM, и они 100% должны сделать мидловые модели. Чем более конкурентная среда, тем больше исследований и более передовые технологии, ну....
Понятно что конкретно эта модель для мини комнад с каким-то бюджетом на оборудование и исследования, но это вдохновляет! Меня покрайнемере точно, поэтому я и поделился с вами новостью!)

GigaChat MAX — новая, сильная модель GigaChat

DZRobo Nov 2 2024 at 16:45

Молодцы что не стоите на месте, респект!
А расскажите пожалуйста, вы архитектуру старую сохранили, на трансформере ruGPT-3.5 работаете или обновили пирог архитектурный? было бы интересно про архитектуру текущую отдельно почтитать, если не секрет конечно. И еще пару вопросов, если не секрет на каких мощностях GPU работает ваша MAX? На каких мощностях и как долго дообучали MAX?

Как диалоги с LLM превращаются в танец идей

DZRobo Nov 1 2024 at 10:47

Добрый день:) Онлайн бы послушал посмотрел, да, физически увы не смогу прийти пока что.
Про такие-себе философы, в LLM сильно зависит от контекста и того как строится диалог + контекстное окно все-таки пока не позволяет долго обсуждать важное, например если нужно обсудить конкретное филосовское направление то лучше сослаться на пару книг, рассказать свои мысли, обсудить чутка около важные касательные темы и только потом уже подводить к основному диалогу. Очень сильно зависит сейчас все от уменя задающего вопрос, держать линию диалога и фокус.
Про создание бота философа интересная история, я сейчас занимаюсь пока исследованиями модернизации опенсорсных LLM и глубже погружаюсь в тему самой работы на низком уровне, потому что вижу что есть архитектурные ограничения которые мешают нормально общаться моделям.
И кстати! На реддите буквально недавно прошла AMA серия с OpenAI, похоже что все-таки совсем не загорами архитекутрное обновление которое позволит еще более естественно общаться и из важного они прям скоро расширят контекстное окно, это круто.
https://www.reddit.com/r/ChatGPT/comments/1ggixzy/ama_with_openais_sam_altman_kevin_weil_srinivas/
Про сотрудничество - тоже очень заманчиво, но тут пока все упирается в мое время, как только я погружусь на должном уровне в техническую сторону вопроса и смогу еще больше уделять времени "психологическому и филосовскому" аспекту, то я думаю можем обсудить детали, мне интересно да.

Как мы задумали небольшую выставку, а в итоге открыли два неизвестных советских компьютера. Часть 2

DZRobo Nov 1 2024 at 06:34

Спасибо большое, было интересно почтитать, каритнка с М10 очень, конечно, нормальный ЦОД напоминает=)

Как диалоги с LLM превращаются в танец идей

DZRobo Oct 31 2024 at 10:24

Пожалуйста:)
Про лимит токенов на самом деле нужно помнить, когда сложные темы обсжудаются. Потому-что он может наступить "внезапно" (на текущий момент даже предупреждения нет в десктопной и веб версии о близком лимите, просто выдается ошибка о том что ассистент не может сгенерировать ответ, в мобильном приложении тебе постфактум говорят что лимит), а поднимать сложную тему опять в новом чате это тоже искусство своего рода, нужно подготовить нормально вводные со старого чата.

Information

Specialization