Сразу отмечу, что работает она не идеально. Во-первых, ChatGPT или помнит далеко не все, или временами вспоминает не совсем то, что нужно было бы. Во-вторых, он плохо отличает реальность от вымысла и, например, считает моими реальными друзьями некоторых персонажей из текстовых RPG, которые мы разыгрывали ранее.
Судя по презентации гугла, у них идет анализ видеоряда целиком со звуком, а у яндекса только текстовая информация... но нужно смотреть, одно дело сказать, другое дело на практике пощупать.
В презентации примеры просмотра рекламного видео, какой абсурд, одна компания тратит на порядок больше денег что бы сделать рекламное видео вместо рекламного текста, а потом народ будет тратить деньги на то что бы из видео сделать рекламный текст, непонятно только зачем это всем участникам кроме посредника в лице гугла, который будет и генерировать это видео и декодировать.
как искали, как давали!? реализация RAG определяет качество драматически.
Специально для этого бенчмарка выпустили ограниченную версию o3 и gpt-4.1? повторяю, в интернет или во внутреннюю базу openai они кажется лезут самостоятельно без спросу.
прежде чем начать тестировать модели, они проходят часовой инструктаж.
было бы неплохо почитать о том, что в этом инструктаже было
p.s. судя по тому что предыдущие версии deepseek r1 и v3 стояли рядом, проблема не в интеллекте, а в знаниях. Reasoning обычно добавляет модели заметно очков, а вот новая версия r1-0528 стоит значительно выше, архитектура сети не менялась, ее дотюнили, возможно добавили знаний (создатели нейронки, имеющие на руках обучающую выборку это могут сделать)
Model rating comparisons
Еще момент, странно сравнивать модели, с доступом к интернету (на сколько я понял как минимум gpt-4.1 умеет давать ссылки и судя по ответу подозрительно умеет добавлять в контекстное окно необходимую информацию самостоятельно) и без него
p.p.s. очень жаль, что в исследовании отсутствовала модель qwen3-30b-a3b, по личным тестам, удивительно как им удалось в 3b эксперта впихнуть заметное качество
к сожалению супермаркеты тоже очень хотят снимать сливки с каждого по разному, вводя усложненные системы скидок...
Скрытый текст
хотя пока они эксплуатируют схему сокрытия настоящей цены товара усложнением алгоритма (т.е. цена будет почти для всех одинаковой, но узнать настоящую простым взглядом на ценник будет сложно), например скидка в магазине лента может доходить до 1/3 суммы на чеке, т.е. цены в среднем на ценниках выше чем в момент оплаты, но самое главное, не каждый товар подвержен скидке, и узнать это не просто... типовой сценарий, несколько товаров заполняют чек основным объемом скидки а остальные товары скидка минимальна или отсутствует, но клиент при взгляде на ценник вычитает ожидаемую скидку с каждого товара
Положите на счет минимальные 5$ и пополняйте по мере необходимости, мой счет на 5$ сгорел через год не использования (мне было удобнее openrouter использовать)
Приложение это хорошо. Но как я понимаю, лучшие результаты (по затратам времени) получаются не от простого зубрения словаря, а общение с нативным спикером с использованием новых слов.
Я думал что практически все функции обучения иностранными языками уже прочно взяли на себя ИИ. Мало того, если речь об английском, можно с бесплатным microsoft copilot поговорить голосом, состряпав голосом системный промпт (главное неудобство) получить неплохую помощь в общении с нативным терпеливым спикером.
Модифицируй свое приложение, добавив 'chatgpt', в системный промпт которого добавь список слов, которые сегодня тебе нужно выучить.
А с практической точки зрения то что? Как проверяли результат и чего достигли?
Мультимодальные модели это самый верх мейнстрима, их создавать то не просто, а уж тюнить без потери их качества и подавно сложно, а вы собираетесь их peft-ом тюнить с 8-битной квантизацией?
99% проблем при работе с изображениями - они не всегда как следуют распознаются, а дальше модели делают на основе этих ошибок неверные рассуждения, умножая процент ошибки на процент галлюцинации.
Китай пока не может (но они смогут, не сомневайтесь) производить конкурентное оборудование, они пока только 'паразитируют' (перепаивают чипы памяти на десктопном железе)... и да они в любом случае молодцы, сумели составить конкуренцию топам за на пару порядков меньшие деньги, там где нет денег и оборудования, они взяли мозгами.
Ну так речь не о заработке денег, а о методах, вы же согласны что если бить всех окружающих людей по голове, и забирать все из карманов, - очень прибыльная методика, и что бы капитализм до такого не скатывался, создаются различные ограничения, с помощью законов.
Я считаю что такой подход, когда цена назначается персонально для потребителя (читай введение неравномерной комиссии) - мошенничеством, и должно регулироваться.
Вы же первые недовольны, когда таксисты используют несовершенство алгоритмов (прямая аналогия с отсутствием регуляции и законов) поднимают цены в каких-нибудь зонах, просто договорившись не брать заказы с пол часика-часок, и вот уже вы не можете уехать из непопулярного района по адекватной цене и платите 3х ценник только потому что компания допустила это в алгоритме.
Пример опасного ИИ - рекомендательные алгоритмы и принуждение в их использовании (удаление других инструментов - фейсбук, тиктоки/ютуб шортсы и не только,..)... 'всем ясно' что это вредно, особенно детям до 22 лет, но никто не спешит регулировать и ограничивать.
Вместо полумер, лучше бы прямо в законе сказали - вот таким то компаниям можно, остальным нини. И вообще, почему они вообще заморачиваются, США самая богатая страна, владеет буквально важнейшим ресурсом, необходимым для развития ИИ - оборудованием и компетенциями.
С оборудованием там вообще сказка - искусственно созданные монополии, заградительные цены для других и деление планеты на 'этим можно а тем нини'. Внутри себя, для военки, 'продавайте даром', в крайнем случае нарисуют еще денег, не в первой, и вон кстати организационно, топы ИИ компаний уже подчиняются непосредственно минобороны
Все да но момент про безопасность это чушь, безопасность и удобство часто не совместимые вещи, конечно останавливаться на КПП и показывать пропуск это неудобство, но без него в охраняемый периметр проще проникнуть (читай дешевле злоумышленнику и дороже защищаться).
“повторное подтверждение паролем — одна из самых ненадёжных и UX-неграмотных форм безопасности”.
Повторный ввод пароля - естественно по таймеру от последнего его ввода, нужен что бы усложнить жизнь злоумышленникам, получившим доступ к устройству пользователя на короткое время. Особенно это имеет смысл, если доступ к функционалу поделить на две группы - менее опасная, не требующая повторной аутентификации и та что должна ее требовать. Естественно это вопрос вероятностей - уменьшаем таймер между запросами пароля - уменьшаем вероятность взлома/кражи данных.
Интересно, зачем нужен облегченный менеджер для kvm? он лучше virt-manager на libvirt? Типа полнофункциональные (какие еще то) не достаточно плохи и нужно еще хуже?
А можно нам другие цели, типа сделать мир лучше и удобнее?
p.s. Вот облегченный менеджер docker было бы интересно, а то официальный это монстр, требующих чуть ли не отдельную машину, к тому же не очень удобный (я перебрал кучу, с целью исключить самописные скрипты или возню с копипастой id контейнеров... все отстой)
Поведение птицы наводит на мысли что видео сгенерировано (какой кошмар, что теперь приходится об этом задумываться в принципе)... а слоны при первой встречи с устройство встали в оборонительное построение (детеныши внутри, хоботами наружу)
Утечки обучающего датасета само собой (это самое важное в разработке нейронок), алгоритмы (я знаю что с python можно без исходников распространять приложение, но много ли так делают?) и итоговые веса.
гугл вполне себе адекватные модели делает, а уж среди мультимодальных моделей с тремя и более модальностями они наверное первые. Да та же голосовая модель их, которая по текстовым инструкциям может генерировать речь и звуки... где такая у openai?
самое важное, что нужно знать про эту технологию
Что за referal trafic в колонке у бота? это же бот, какой нафиг реферер?
Судя по презентации гугла, у них идет анализ видеоряда целиком со звуком, а у яндекса только текстовая информация... но нужно смотреть, одно дело сказать, другое дело на практике пощупать.
В презентации примеры просмотра рекламного видео, какой абсурд, одна компания тратит на порядок больше денег что бы сделать рекламное видео вместо рекламного текста, а потом народ будет тратить деньги на то что бы из видео сделать рекламный текст, непонятно только зачем это всем участникам кроме посредника в лице гугла, который будет и генерировать это видео и декодировать.
как искали, как давали!? реализация RAG определяет качество драматически.
Специально для этого бенчмарка выпустили ограниченную версию o3 и gpt-4.1? повторяю, в интернет или во внутреннюю базу openai они кажется лезут самостоятельно без спросу.
было бы неплохо почитать о том, что в этом инструктаже было
p.s. судя по тому что предыдущие версии deepseek r1 и v3 стояли рядом, проблема не в интеллекте, а в знаниях. Reasoning обычно добавляет модели заметно очков, а вот новая версия r1-0528 стоит значительно выше, архитектура сети не менялась, ее дотюнили, возможно добавили знаний (создатели нейронки, имеющие на руках обучающую выборку это могут сделать)
Model rating comparisons
Еще момент, странно сравнивать модели, с доступом к интернету (на сколько я понял как минимум gpt-4.1 умеет давать ссылки и судя по ответу подозрительно умеет добавлять в контекстное окно необходимую информацию самостоятельно) и без него
p.p.s. очень жаль, что в исследовании отсутствовала модель qwen3-30b-a3b, по личным тестам, удивительно как им удалось в 3b эксперта впихнуть заметное качество
к сожалению супермаркеты тоже очень хотят снимать сливки с каждого по разному, вводя усложненные системы скидок...
Скрытый текст
хотя пока они эксплуатируют схему сокрытия настоящей цены товара усложнением алгоритма (т.е. цена будет почти для всех одинаковой, но узнать настоящую простым взглядом на ценник будет сложно), например скидка в магазине лента может доходить до 1/3 суммы на чеке, т.е. цены в среднем на ценниках выше чем в момент оплаты, но самое главное, не каждый товар подвержен скидке, и узнать это не просто... типовой сценарий, несколько товаров заполняют чек основным объемом скидки а остальные товары скидка минимальна или отсутствует, но клиент при взгляде на ценник вычитает ожидаемую скидку с каждого товара
протестировать что?
Положите на счет минимальные 5$ и пополняйте по мере необходимости, мой счет на 5$ сгорел через год не использования (мне было удобнее openrouter использовать)
у openrouter есть бесплатные модели free, но как обычно результат не гарантируется, лучше заплатить, хоть криптовалютой
p.s. вам жалко 5-10$ на эту задачу?
Приложение это хорошо. Но как я понимаю, лучшие результаты (по затратам времени) получаются не от простого зубрения словаря, а общение с нативным спикером с использованием новых слов.
Я думал что практически все функции обучения иностранными языками уже прочно взяли на себя ИИ. Мало того, если речь об английском, можно с бесплатным microsoft copilot поговорить голосом, состряпав голосом системный промпт (главное неудобство) получить неплохую помощь в общении с нативным терпеливым спикером.
Модифицируй свое приложение, добавив 'chatgpt', в системный промпт которого добавь список слов, которые сегодня тебе нужно выучить.
А с практической точки зрения то что? Как проверяли результат и чего достигли?
Мультимодальные модели это самый верх мейнстрима, их создавать то не просто, а уж тюнить без потери их качества и подавно сложно, а вы собираетесь их peft-ом тюнить с 8-битной квантизацией?
99% проблем при работе с изображениями - они не всегда как следуют распознаются, а дальше модели делают на основе этих ошибок неверные рассуждения, умножая процент ошибки на процент галлюцинации.
Китай пока не может (но они смогут, не сомневайтесь) производить конкурентное оборудование, они пока только 'паразитируют' (перепаивают чипы памяти на десктопном железе)... и да они в любом случае молодцы, сумели составить конкуренцию топам за на пару порядков меньшие деньги, там где нет денег и оборудования, они взяли мозгами.
Ну так речь не о заработке денег, а о методах, вы же согласны что если бить всех окружающих людей по голове, и забирать все из карманов, - очень прибыльная методика, и что бы капитализм до такого не скатывался, создаются различные ограничения, с помощью законов.
Я считаю что такой подход, когда цена назначается персонально для потребителя (читай введение неравномерной комиссии) - мошенничеством, и должно регулироваться.
Вы же первые недовольны, когда таксисты используют несовершенство алгоритмов (прямая аналогия с отсутствием регуляции и законов) поднимают цены в каких-нибудь зонах, просто договорившись не брать заказы с пол часика-часок, и вот уже вы не можете уехать из непопулярного района по адекватной цене и платите 3х ценник только потому что компания допустила это в алгоритме.
Пример опасного ИИ - рекомендательные алгоритмы и принуждение в их использовании (удаление других инструментов - фейсбук, тиктоки/ютуб шортсы и не только,..)... 'всем ясно' что это вредно, особенно детям до 22 лет, но никто не спешит регулировать и ограничивать.
Вместо полумер, лучше бы прямо в законе сказали - вот таким то компаниям можно, остальным нини. И вообще, почему они вообще заморачиваются, США самая богатая страна, владеет буквально важнейшим ресурсом, необходимым для развития ИИ - оборудованием и компетенциями.
С оборудованием там вообще сказка - искусственно созданные монополии, заградительные цены для других и деление планеты на 'этим можно а тем нини'. Внутри себя, для военки, 'продавайте даром', в крайнем случае нарисуют еще денег, не в первой, и вон кстати организационно, топы ИИ компаний уже подчиняются непосредственно минобороны
Все да но момент про безопасность это чушь, безопасность и удобство часто не совместимые вещи, конечно останавливаться на КПП и показывать пропуск это неудобство, но без него в охраняемый периметр проще проникнуть (читай дешевле злоумышленнику и дороже защищаться).
Повторный ввод пароля - естественно по таймеру от последнего его ввода, нужен что бы усложнить жизнь злоумышленникам, получившим доступ к устройству пользователя на короткое время. Особенно это имеет смысл, если доступ к функционалу поделить на две группы - менее опасная, не требующая повторной аутентификации и та что должна ее требовать. Естественно это вопрос вероятностей - уменьшаем таймер между запросами пароля - уменьшаем вероятность взлома/кражи данных.
Интересно, зачем нужен облегченный менеджер для kvm? он лучше virt-manager на libvirt? Типа полнофункциональные (какие еще то) не достаточно плохи и нужно еще хуже?
А можно нам другие цели, типа сделать мир лучше и удобнее?
p.s. Вот облегченный менеджер docker было бы интересно, а то официальный это монстр, требующих чуть ли не отдельную машину, к тому же не очень удобный (я перебрал кучу, с целью исключить самописные скрипты или возню с копипастой id контейнеров... все отстой)
наивный, скорее - сделай что бы 'нам' было хорошо за 'их' счет.
Поведение птицы наводит на мысли что видео сгенерировано (какой кошмар, что теперь приходится об этом задумываться в принципе)... а слоны при первой встречи с устройство встали в оборонительное построение (детеныши внутри, хоботами наружу)
Хм... на основе .proto файлов нужно создавать классы
Как ни крутил, их голосовые агенты говорят на русском с диким акцентом, а еще у меня список голосов небольшой и find voice ничего не делает
Утечки обучающего датасета само собой (это самое важное в разработке нейронок), алгоритмы (я знаю что с python можно без исходников распространять приложение, но много ли так делают?) и итоговые веса.
гугл вполне себе адекватные модели делает, а уж среди мультимодальных моделей с тремя и более модальностями они наверное первые. Да та же голосовая модель их, которая по текстовым инструкциям может генерировать речь и звуки... где такая у openai?