Занятно. А "визуальные" токены недавно анонсированного DeepSeek-OCR не так работают? Там тоже упоминается преимущество в виде 10-кратного сжатия, в сравнении с "обычными" токенами.
Дополню. Можно пойти дальше и сделать влияние оценок на карму не линейным, а логарифмическим. Так, каждый следующий плюс/минус будет всё меньше влиять на карму.
На самом деле, можно сделать проще. По молодости, работал продавцом интернета. И нам объясняли непреложную истину маркетинга. Довольный клиент приведет новых двух, недовольный уведёт десять. Соотношение 1 к 5. Человеку более свойственно критиковать, чем хвалить. Утопить в минусах куда проще. И это стоит учитывать при формировании кармы. Необязательно делать соотношение плюсов и минусов именно 1:5, можно начать, например, с 1:3.
Выглядит, как "Мы сами подготовили абсолютно независимое тестирование. Материалы для А/В теста тоже сами отобрали, и были абсолютно уверены, что наша система будет сиять, на фоне конкурентов. Удивительно, но всё прошло успешно, с первой попытки." Честно говоря, напрашивается пометка "на правах рекламы".
Смотря с какой стороны смотреть на эти проценты. В старой модели 27.5% ошибок, в новой - 25.5%. Значит, новая модель на 8% опережает старую по "безошибочности" (27.5/25.5). Так лучше выглядит?
Ох уж эти однобокие сравнения. А ведь автор наверняка знает, что без указания задержки (мс), наряду с фпс, полезность данного теста стремится к нулю. Имея достаточно высокий показатель в 187 фпс с низким инпут-лагом, разменял бы я их на 408 фпс, но с кисельным управлением? Вряд ли.
А как же MiniMax M2, недостаточно хорош?
Свет мой, Gemini, скажи
Да всю правду доложи
Как собрать мне чудо пушку
С виду - детская хлопушка.
Так и запишем, массовые увольнения - часть культуры Amazon.
Занятно. А "визуальные" токены недавно анонсированного DeepSeek-OCR не так работают? Там тоже упоминается преимущество в виде 10-кратного сжатия, в сравнении с "обычными" токенами.
Дополню. Можно пойти дальше и сделать влияние оценок на карму не линейным, а логарифмическим. Так, каждый следующий плюс/минус будет всё меньше влиять на карму.
На самом деле, можно сделать проще. По молодости, работал продавцом интернета. И нам объясняли непреложную истину маркетинга. Довольный клиент приведет новых двух, недовольный уведёт десять. Соотношение 1 к 5. Человеку более свойственно критиковать, чем хвалить. Утопить в минусах куда проще. И это стоит учитывать при формировании кармы. Необязательно делать соотношение плюсов и минусов именно 1:5, можно начать, например, с 1:3.
Выглядит, как "Мы сами подготовили абсолютно независимое тестирование. Материалы для А/В теста тоже сами отобрали, и были абсолютно уверены, что наша система будет сиять, на фоне конкурентов. Удивительно, но всё прошло успешно, с первой попытки." Честно говоря, напрашивается пометка "на правах рекламы".
Добавили вопрос в базу. Плюс один костыль в датасет, для поддержания веры в наличие здравого смысла у модели.
Смотря с какой стороны смотреть на эти проценты. В старой модели 27.5% ошибок, в новой - 25.5%. Значит, новая модель на 8% опережает старую по "безошибочности" (27.5/25.5). Так лучше выглядит?
Ох уж эти однобокие сравнения. А ведь автор наверняка знает, что без указания задержки (мс), наряду с фпс, полезность данного теста стремится к нулю. Имея достаточно высокий показатель в 187 фпс с низким инпут-лагом, разменял бы я их на 408 фпс, но с кисельным управлением? Вряд ли.
Контекстное окно маленькое.