Comments 5
Странно что в сравнении нет qwen3
Да, верное уточнение. Моделей очень много. Много противоречивой информации. Как-то так и вышло... На Хабре есть хорошая обзорная статья, которая компенсирует недостаток: https://habr.com/ru/companies/x-com/articles/913138/
Почему именно эта модель в ряду других опенсорсных?
Выглядит как отдельное описание некого концепта применения ИИ в интегрированных системах анализа и принятия решений и отдельное нахлабучивание на неё конкретной модели, без обоснования ключевых метрик по сравненияю с qwen2.5-coder, qwen3, а также моделей 70B+. Всё-таки говорим о применении в крупном, дорогом производстве, есть ли смысл гнаться за модельками, квантовка которых должна умещаться в 24Gb?
Хотя для массового потребления, да, удачный формат.
Добрый день! Спасибо за комментарии. Для уточнения, небольшая цитата из заключения: "В результате проведенного исследования изучена возможность применения и адаптации большой языковой модели OpenThinker2-32B, как дополнительного и вспомогательного инструмента, который целесообразно использовать для повышения эффективности работы автоматизированных систем прогнозируемого обслуживания многостадийных технологических процессов для малых и средних промышленных предприятий". Статья - действительно, если так можно выразиться, "проверка гипотезы". Модель OpenThinker2-32B, мне лично, понравилась и я написал о ней статью. В отношении qwen3, согласен, мое упущение.
Пока писал статью, пока публиковал (журнал почти два месяца ее рассматривал), вышла новая третья версия модели https://huggingface.co/collections/open-thoughts/openthinker3
Анализ возможности применения модели OpenThinker2-32B в автоматизированных системах прогнозируемого обслуживания