Комментарии / Профиль java73 / Хабр

Алексей@java73

Kotlin/Python fun hobby

Подписчики

Мессенджер Ласточка. Мы в Rustore. Cобственный DSL и федеративная архитектура

И не придут

Вы по закону как владелец средства распространения информации и сообщений между пользователями сами должны все им обеспечить, причем в случае мессенджера по самой полной.

Запускаем Qwen3.6 35B-A3B + opencode локально на RTX 4070 12GB — AI-ассистент для разработки без облака

java73 25 мая в 17:42

Если говорить об llama.cpp, то с ним чем проще, тем оказалось эффективнее: все что касается gpu/cpu - в auto, вручную только установил экспериментально лично на своем железе parallel в 1 и mtp в 2, контекст да, квантую в 8 и ещё кастомный jinja шаблон специфично под qwen, но это не к эффективности относится. Ну и в целом последние сборки llam'ы все лучше и лучше делают свою магию, ускоряя TFT, так и MTP. Уж не знаю чего делают, но работает вполне приемлемо.

Qwen3.6 27B MTP весит на +0.3 Гб больше, а даёт ускорение в ~2 раза. С 60 t/s до 130 t/s без потерь. Что такое MTP

java73 18 мая в 18:14

Сами документы - на глазок, а точнее на корректность выполнения по сути, проверяю глазами, да. Но технически также сравниваю скорость, объем раздумывания, смотрю, что модель там в своих размышлениях делала. Строго ли следовала инструкциям. Грузила ли нужные инструменты в правильной последовательности.

Qwen3.6 27B MTP весит на +0.3 Гб больше, а даёт ускорение в ~2 раза. С 60 t/s до 130 t/s без потерь. Что такое MTP

java73 18 мая в 12:20

с 5090 я и без курения это сделаю) у меня 4070.

Qwen3.6 27B MTP весит на +0.3 Гб больше, а даёт ускорение в ~2 раза. С 60 t/s до 130 t/s без потерь. Что такое MTP

java73 18 мая в 12:18

Это ошибка так ориентироваться. Надо взять свои собственные привычные сценарии использования и на них прогнать. Вот и поймете. Я так по своим задачам вынужденно сделал выбор в пользу qwen 3.6 moe против Gemma 4 26b, потому что именно в конкретных задачах квен выдала просто идеальный результат (создание документов по образцам, написание договора, due diligence контрагента по всяким апи и реестрам в тырнете, напиисание протоколов, решений в корпоративной сфере).

Qwen3.6 27B MTP весит на +0.3 Гб больше, а даёт ускорение в ~2 раза. С 60 t/s до 130 t/s без потерь. Что такое MTP

java73 18 мая в 12:06

Это еще тогда +1 Гб на mmproj в память и -1 Гб для базы, не сильно нужно в целом мне)

Qwen3.6 27B MTP весит на +0.3 Гб больше, а даёт ускорение в ~2 раза. С 60 t/s до 130 t/s без потерь. Что такое MTP

java73 18 мая в 06:25

На 4070 без ti гонял и так и эдак. На moe модели увеличения скорости больше, чем на 10-15 процентов не получил. Задачи агентные в основном, на чистой генерации простыни текста, разумеется, быстрее, чем при частых префиллах контекста.

А вот dense модели буквально ускоряются почти в два раза, но у меня это понеслось не с параметром 4, а с параметром 2 токена. Но речь о том, что трудно в целом использовать в работе, например, модель 27b, которая не влезает полностью в видео, и скорость работы 3.5 или 7 токенов в секунду не сильно принципиальна. Чрезмерно ужатые кванты на порядок тупее хорошей и быстрой moe модели на 35b, которая и так пахала где-то на 40-50 т/с, и mtp даёт минимальный прирост, но не забываем, что на сейчас главный минус - mtp нельзя запустить вместе с vision мультимодальностью у qwen.

Qwen3.6 27B MTP весит на +0.3 Гб больше, а даёт ускорение в ~2 раза. С 60 t/s до 130 t/s без потерь. Что такое MTP

java73 18 мая в 06:19

Есть же уже mtp сборка от unsloth

Запускаем Qwen3.6 35B-A3B + opencode локально на RTX 4070 12GB — AI-ассистент для разработки без облака

java73 26 апр в 10:14

При этом почти весь РАМ забит (28 из 32 Гб), а видео память только 6 из 12 Гб. Может есть куда двинуть ползунки еще? Контекст поставил 65535, кинул длинную агентную задачу (найти файл, в нем взять список из 10 товарных знаков, по каждому сходить в интернет и проверить срок действия и последние изменения), выполняет все, но сильно медленно конечно. Слабое место - прцессинг промпта (ну или вывода инструментов, в моем случае снапшота chrome dev tools). Агентную задачу выполнил на отлично, выполнял 33 минуты с половиной. Но круто, пока это первая и последняя модель, локально справившаяся с агентной задачей.

Запускаем Qwen3.6 35B-A3B + opencode локально на RTX 4070 12GB — AI-ассистент для разработки без облака

java73 26 апр в 09:30

Также благодарю за подсказу по настройкам. Сопоставимый уровень железок, только cpu другой, i7 12700KF, LM STUDIO не хочет больше 4 ядер отдавать.

Это нормальная скорость или можно и лучше? Сейчас схожу в opecode на использовании инструментов ее проверю.

Почему памятники надо ставить тем, кто автоматизирует MS Word

java73 22 сен 2025 в 08:08

Я html пользовался от безысходности. Там в целом все сложнее, чем можно в двух словах описать. В общем, docx обязательное условие, в нем проще всего всем участникам составить и только он был у всех, к примеру, проект договора, дальше самим или с моей помощью расставить тэги для подстановки, а потом этот шаблон просто будет использоваться для генерации готовых документов приложением.

Почему памятники надо ставить тем, кто автоматизирует MS Word

java73 22 сен 2025 в 07:14

Вся идея в том, что шаблоны то и делают секретари, бухгалтеры и из доступных средств имеют только ворд, и еще тут усилия предстоят объяснить что такое ${var}.

Почему памятники надо ставить тем, кто автоматизирует MS Word

java73 21 сен 2025 в 20:19

Интересно, насколько они сами знают свой продукт? Таких вопросов не задаст тот, кто хоть раз двигал изображение в Ворде.

Полная история создания игры Elite (1984). Часть 2

java73 1 фев 2023 в 08:30

Спасибо!!!!!

Полная история создания легенды компьютерных игр. Elite (1984). Часть 1

java73 31 янв 2023 в 08:35

Никто не заставляет идти на поводу одисейщиков. Я как летал, так и летаю по настроению.

Полная история создания легенды компьютерных игр. Elite (1984). Часть 1

java73 31 янв 2023 в 08:08

О, да!!! Спасибо. Наконец-то. Я бы книжку купил на эту тему как про Doom)

Чему я научился делая игры на LibGDX

java73 21 сен 2021 в 11:48

По мне, так дополнительный движок Ashley к LibGDX в разы упрощает понимание игростроя в связке с ООП и дает правильную концепцию деления игровых сущностей, игровых систем и рендеринга. Не знаю насчет Java, но с Kotlin оно спаривается очень хорошо, плюс есть свои ktx на все библиотеки, еще более упрощающие синтаксис.

Пишем комикс-приключение на Kotlin

java73 28 июн 2021 в 07:59

Зачем делать на Kotlin так?:

class Game {
    private lateinit var store: Store
    private lateinit var question: Question

    fun init(context: Context) {
        this.store = StoreFactory.getStore(context)

        question = store.getQuestionById(1)
    }

Когда идиоматичнее так:

class Game(context: Context) {
    private val store = StoreFactory.getStore(context)
    private var question = store.getQuestionById(1)

А это вы просто пишете с помощью Kotlin на другом каком-то языке, кажется, паскале:


fun getAnswers(): List<Answer> {
        val list: MutableList<Answer> = ArrayList(this.answers)
        val shouldAdd: Int = 4 - list.size

        for (i in 1..shouldAdd) {
            list.add(Answer("", -1))
        }

        return list
    }

Я бы предложил так (хотя сама идея добавить пустышками до нужного кол-ва так себе, явно неразумное ограничение, с которым нужно бороться в другом месте):

fun getAnswers(): List<Answer> = listOf(answers, List(4 - answers.size) { Answer("", -1) }).flatten()

Rx и Mvp уже пару лет вытесняются Kotlin coroutines и Mvvm/Mvi. Активити фрагментами или вообще Compose. Для json есть библиотеки Kotlin serialization, для андроида — gson, moshi и т.д.

Proto DataStore + AndroidX Preferences на Kotlin

java73 2 июн 2021 в 05:50

Сделал по идиоме Kotlin для класса Settings...:

companion object {
        const val HOUR_TO_MILLIS = 60 * 60 * 1000   // hours to milliseconds
        const val TRANSLATE_SWITCH = "translate_to_ru"
        const val REFRESH_INTERVAL_BAR = "refresh_interval"
        const val IS_PREFERENCES_CHANGED = "preferences_changed"
    }

Proto DataStore + AndroidX Preferences на Kotlin

java73 2 июн 2021 в 03:46

Оставляю, чтоб было что улучшить при следующем взгляде на код) Я потом вынес в константу ключ, по которому взаимодействуют фрагменты, а строки для различения классов, так как используются только в одном месте, оставил бы.

2 3