Pull to refresh

Comments 6

Это по настоящему иссскуство об одном факте написать длинно и несколько раз Мы возьмём нейросеть чтобы сэкономить бюджет так как мы ее используем для обучения. Вопрос, почему лицо котрое хочет поучится само не найдёт нейросеть для этого? Да, вы помогли выбрать бюджетный вариант.

Я провёл тест, qwen указал победителем gemma4 в задачах правдоподобности сгенерированного текста с загрузкой контекста

Мне кажется, без Gemini это сравнение не очень полезно

Есть ещё дистилляция top tier моделей. Не дает ли это уменьшение перплексии для deepseek/mimo и иже с ними ?

Как-как называется платформа, га которой таким образом уроки публикуют? Ну, знаете, чтобы обходить ее по широкой дуге, ибо не хочется внезапно выяснить, что неделю изучал нейрослоп.

Статья в целом интересная, хотел только сказать имхо.

Англицизмы хуже иероглифов. Про CJK я уже сказал — регулярка, автопроверка, готово. А вот с английскими вставками всё сложнее. «Supply chain» в русском тексте — это норма, устоявшийся термин. «Key performance indicators» — тоже скорее норма, хотя можно было написать «ключевые показатели эффективности». А «Let’s consider the following approach» посреди русского абзаца — это уже артефакт, модель переключилась на английский.

с точки зрения тестирования, анлицизмы действительно хуже иероглифов.

Но с точки зрения прода – нет. Даже если это артефакт, мне явно будет намного проще понять на английском, даже если это будет условная «confidenциальность», чем вот это

静态的 бухгалтерский учет

Это вообще дилема века. Вот китайцы они классные дешёвые, у Qwen ко всему прочему одни из лучших маленьких (до 20b точно, а больше мой комп не тянет) моделей, но они поголовно страдают иероглифами.

Sign up to leave a comment.

Articles