Я заметил упоминание тг канала в статье только после вашего комента. Статья - новостная, и не хуже других подобных. Мне понравилась, я полез смотреть ориг и гитхаб. Явного ии-текста мне не заметно (а я учитель, и мне приходится по долгу службы уметь отличать нейротекст от человеческого), поделитесь пожалуйста, что вам глаз резануло, буду благодарен.
Аналогично, несколько лет полет нормальный при ещё больших чем у вас нагрузках. Первый раз слышу, что у 3х какие-то проблемы с БД, причем пруфов в статье нет
Motif-2: как маленькая модель из Кореи обгоняет GPT-5.1 в тестах
Никак не обгоняет. Заголовок - прямая ложь. Во-первых, с каких пор 12b - это маленькая модель? Во-вторых, Motif-2 не обгоняет gpt-5.1 ни в каких местах, речь о совокупном "индексе интеллектуальности" от ноунеймов из твиттера, но даже там он обгоняет младшую instant версию (которая, скорее всего, не превышает 8b), которую также бьют claude haiku 4.5, грок, дипсик, минимакс и вообще почти все
На мой взгляд, слишком категорично и каким-то мессианством веет. У меня все проще было, и никому врать не приходилось. ВУЗ, поиск первой работы через него же, через какое-то время апгрейд.
Найм не оканчивается на hh. Я даже сейчас осознал, что лично в моем кейсе у него нулевая конверсия: все свои работы находил не там, хотя резюме составлял там и очень активно рассылал отклики.
И если завтра меня уволят - у меня есть пачка контактов сокурсников и коллег с прошлых работ, кому всегда нужны спецы.
Вы явно говорили что-то не то. Здесь модели пишут код. Представьте, что вы слепой программист, который в жизни ни разу часов не видел, не щупал, а только слышал текстовое описание. Вам нужно раз в минуту без ТЗ произвольно написать 3 файла с кодом - на html, css, js. Никаких условий по стилизации не задано, и даже что стрелок 3 не сказано.
Готов поспорить, что ни вы, ни кто либо ещё не справится с такой задачей в такой формулировке. Значит ли это, что вы лишены интеллекта?
То, что вы полгода "всем говорите" (где бы эти "все" ни были) - критика точности декодера и дефицита обучающих данных в графических нейронках, а не llm, причем критика не по делу - в других доменах точность более чем достаточна: и руки рисовать научились, и отзеркаленный текст в отражении в воде, повернутый на 30 градусов. Просто пока ни у кого руки не дошли составить качественный датасет часов с дотошными описаниями. Ну а целых полгода ругать инструмент, уже лишивший художников работы и неоднократно побеждавший на человеческих выставках художеств за недостаточную точность рисования часов - как минимум странно.
А причем тут температура 0? Это не гарант отсутствия галлюцинаций и даже не гарант их снижения хотя бы на процент. Gpt-5 у меня тоже галюнит безбожно, этим все модели грешат. Поэтому и нужен RAG, MCP и прочий тулинг для предоставления контекста, это единственные способы уменьшить галлюцинации, и то без гарантий.
Хоть бы загуглили. Всё наоборот. V3 появилась раньше и она по методикам хуже. R1 рассуждающая. Обе огромные по 600+b. Ни одну на домашнем компе вменяемо не запустить. Всякие модели по 1.3-32b с надписями R1 и V3 - это дистилляты (то есть другую модель доучили на ответах R1)
А вы пробовали, или только восторженные отзывы в интернете читали? Я активно пользуюсь, наверное, всеми нейронками какие есть на рынке со времён gpt-3.5-turbo, пробовал все вайбкодинг тулы (aider, gemini cli, roo, cursor, copilot) и пишу своих агентов на langgraph, и ежедневно сталкиваюсь с десятками смешных приколов от ИИ, не вызывающих ничего кроме умиления и раздражения. Пет-проект на десяток-два файлов оно, возможно (!) осилит, и то при прямых руках вайбкодера, любое реальное коммерческое приложение с микросервисами, несколькими базами и ещё ворохом технологий - нет.
Это хороший инструмент для уменьшения рутины. Пофиксить недовольство линтера, быстро вникнуть в чужой проект, быстро ответить (с точностью 50/50) на вопрос не выходя из ide, быстро подсказать возможные направления поиска решений (не сами решения), сгенерить commit message, набросать тесты, ответить на вопрос по документации из context7 - не более. И то, все это только при достаточной квалификации "вайб-кодера" как нормального программиста.
Ответы о3 по бенчмаркам не содержат галлюцинаций всего лишь в ~80% случаев (с включенным поиском и расширенным бюджетом на thinking), и это SOTA. Агентные бенчи только-только появляются, и там все печально. О каком вайбкодинге вообще может идти речь сейчас?
Тем не менее - всем советую, но внимательно и без auto-approve, если не хотите получить rm -rf ~ )))
Заголовок: основы промтинга и математические возможности
Тело: 4 техники промтинга с примерами и подробным объяснением. От двух исходных моделей с помощью промтинга добились решения задач, которые в лоб они не решали.
Не просто существуют, а продаются в почти свободной продаже, до 10к$ за машину до 10 кубитов, за рубежом многие вузы имеют квантовые компьютеры на несколько кубитов для обучения студентов.
Но тратиться не обязательно, IBM бесплатно всем желающим даёт 10с вычислений на их квантовых компьютерах + web ide для программирования этого дела на двух языках (10с вычислений это очень много для квантовых программ)
Чтобы вам внятно ответить, сервис написал целую статью и тут уже несколько комментаторов подключились. Никто вас не обманывает. У меня тоже голый API 4о официальный отвечает что он gpt-3.
В ChatGPT (который сайт) в начале любого чата есть невидимое сообщение типа "отвечай что ты gpt4, сегодня 6 ноября, [ещё что угодно], будь вежливым" и т.д. и т.п. Поэтому он знает что ему отвечать на вопрос "какая ты модель".
В голом апи такого сообщения нет, и модель выдумывает, что она 3.
У модели нет внутреннего "я". Мы общаемся с продолжателем текста, который продолжает совместно с вами историю про чат умного ассистента и пользователя.
Если этому продолжателю не сообщить имя действующего персонажа, то он его выдумает.
Вот-вот, сам хотел написать. Никто тут не галлюцинирует, это реальный нормальный рецепт. Свиные крылья - особым образом нарезанная свинина с костями, так, что получается похоже на куриные крылышки
Полностью согласен, выше привел пример nft, которые как раз есть смысл покупать ввиду очевидной утилитарной ценности. Забыл добавить, что поддержка во всех браузерах даже не то что бы и нужна, есть домены-обертки, открывающиеся где угодно, например .sol-domain.org для браузеров, не понимающих .sol.
Но, к сожалению, без уточнения контекста под nft чаще всего имеют ввиду именно токенизированную ссылку на картинку, а в покупке видят только инвестиционную ценность. Тут TerraV прав, смысла покупать такие nft практически нет, подавляющее большинство сминченных токенов не подорожали ни на йоту за время своего существования, многие сначала взлетели, потом упали, только считанные проценты принесли что-то своим владельцам. Ну и такие токены ничего кроме идеи в себе не несут, это первый шаг, proof-of-concept, придуманный за два дня на хакатоне.
У nft может быть куча применений, можно токенизировать (и уже есть подобные эксперименты) дипломы, сертификаты и прочие подтверждающие что-либо документы (nft без права повторной передачи), которые не нужно будет переводить, апостилировать, их нельзя будет подделать и проверка подлинности будет сильно упрощена; можно токенизировать права владения чем-либо (документы на квартиру, участок, машину и прочее), паспорта, электронные подписи и много чего еще, что будет дешевле и надежнее физических вариантов.
В игровой сфере тоже можно много куда применить nft, но геймерам не заходит ввиду массово развившейся криптофобии, и игровые компании часто даже не могут начать такие эксперименты - как только становится известно, что где-то будут nft-предметы, игру сразу "отменяют" толпой. Торговая площадка Steam, где берется огромная комиссия, есть запрет на торговлю предметами вовне, и продавцы предметов ими не владеют, несмотря на все эти недостатки, пользуется огромной популярностью. Ее можно легко перевести в вид NFT DEX, от чего вообще все будут только в выигрыше, включая владельца торговой площадки, но такое вряд ли случится до массового принятия концепции nft и криптовалют в целом.
Вы ведёте неконструктивный диалог и занимаетесь демагогией.
Сначала вы назвали технологию мошенничеством. Я отметил, что это некорректно и привел пример применения этой технологии, который точно никак не назвать мошенническим.
Вы не ответили на мой вопрос, и зачем-то сделали "маленькое уточнение", сменив тему на то, что приведенный мной пример якобы не лучше действующего стандарта, допустив ошибку или намеренную манипуляцию, что клиенты обязаны скачивать блокчейн, чтобы с ним взаимодействовать. И ещё упомянули некоторую "торговлю страхом".
Я вас поправил и по пунктам написал, чем крипто-днс лучше. Вы полностью это проигнорировпли, и теперь пишете, что нодам нельзя доверять (упомянув торговлю страхом в предыдущем своем сообщении, что показательно). То есть доверять куче промежуточных звеньев, которые могут/ДОЛЖНЫ вас не обслужить - это ок, а доверять нодам блокчейна (автономно синхронизирующимся и штрафуемым за ложь) - не ок. И снова допустили ошибку/манипуляцию что нельзя проверить достоверность данных в блокчейне, не скачав его, зачем-то упомянув неизменяемость. Вы снова не правы, погуглите, что такое дерево Меркла. Да и просто послать запрос на 5/10/100 нод как будто решает проблему, не находите?
Итого, вы не ответили, почему nft - мошенничество, проигнорировали кучу текста и дважды сменили тему, допустив противоречие в своих суждениях (про доверие), и добавив, что я в танке. И минус мне влепили в карму как вишенку на торт.
Самое смешное, что я согласен с вашим изначальным тезисом - что покупка nft бессмысленна, и согласен с тем, что блокчейн лучше скачивать. Только как это все относится к вашему первому предложению?
Вы в курсе, что такое интернет?
Я заметил упоминание тг канала в статье только после вашего комента. Статья - новостная, и не хуже других подобных. Мне понравилась, я полез смотреть ориг и гитхаб. Явного ии-текста мне не заметно (а я учитель, и мне приходится по долгу службы уметь отличать нейротекст от человеческого), поделитесь пожалуйста, что вам глаз резануло, буду благодарен.
Аналогично, несколько лет полет нормальный при ещё больших чем у вас нагрузках. Первый раз слышу, что у 3х какие-то проблемы с БД, причем пруфов в статье нет
Никак не обгоняет. Заголовок - прямая ложь. Во-первых, с каких пор 12b - это маленькая модель? Во-вторых, Motif-2 не обгоняет gpt-5.1 ни в каких местах, речь о совокупном "индексе интеллектуальности" от ноунеймов из твиттера, но даже там он обгоняет младшую instant версию (которая, скорее всего, не превышает 8b), которую также бьют claude haiku 4.5, грок, дипсик, минимакс и вообще почти все
Сбер избегает оценивания собственных моделей
На мой взгляд, слишком категорично и каким-то мессианством веет. У меня все проще было, и никому врать не приходилось. ВУЗ, поиск первой работы через него же, через какое-то время апгрейд.
Найм не оканчивается на hh. Я даже сейчас осознал, что лично в моем кейсе у него нулевая конверсия: все свои работы находил не там, хотя резюме составлял там и очень активно рассылал отклики.
И если завтра меня уволят - у меня есть пачка контактов сокурсников и коллег с прошлых работ, кому всегда нужны спецы.
Вы явно говорили что-то не то. Здесь модели пишут код. Представьте, что вы слепой программист, который в жизни ни разу часов не видел, не щупал, а только слышал текстовое описание. Вам нужно раз в минуту без ТЗ произвольно написать 3 файла с кодом - на html, css, js. Никаких условий по стилизации не задано, и даже что стрелок 3 не сказано.
Готов поспорить, что ни вы, ни кто либо ещё не справится с такой задачей в такой формулировке. Значит ли это, что вы лишены интеллекта?
То, что вы полгода "всем говорите" (где бы эти "все" ни были) - критика точности декодера и дефицита обучающих данных в графических нейронках, а не llm, причем критика не по делу - в других доменах точность более чем достаточна: и руки рисовать научились, и отзеркаленный текст в отражении в воде, повернутый на 30 градусов. Просто пока ни у кого руки не дошли составить качественный датасет часов с дотошными описаниями. Ну а целых полгода ругать инструмент, уже лишивший художников работы и неоднократно побеждавший на человеческих выставках художеств за недостаточную точность рисования часов - как минимум странно.
А причем тут температура 0? Это не гарант отсутствия галлюцинаций и даже не гарант их снижения хотя бы на процент. Gpt-5 у меня тоже галюнит безбожно, этим все модели грешат. Поэтому и нужен RAG, MCP и прочий тулинг для предоставления контекста, это единственные способы уменьшить галлюцинации, и то без гарантий.
Хоть бы загуглили. Всё наоборот. V3 появилась раньше и она по методикам хуже. R1 рассуждающая. Обе огромные по 600+b. Ни одну на домашнем компе вменяемо не запустить. Всякие модели по 1.3-32b с надписями R1 и V3 - это дистилляты (то есть другую модель доучили на ответах R1)
Никогда? Не существует ни одного официального релиза на андроид. Я даже проверил:
https://docs.python.org/3/using/android.html
А вы пробовали, или только восторженные отзывы в интернете читали? Я активно пользуюсь, наверное, всеми нейронками какие есть на рынке со времён gpt-3.5-turbo, пробовал все вайбкодинг тулы (aider, gemini cli, roo, cursor, copilot) и пишу своих агентов на langgraph, и ежедневно сталкиваюсь с десятками смешных приколов от ИИ, не вызывающих ничего кроме умиления и раздражения. Пет-проект на десяток-два файлов оно, возможно (!) осилит, и то при прямых руках вайбкодера, любое реальное коммерческое приложение с микросервисами, несколькими базами и ещё ворохом технологий - нет.
Это хороший инструмент для уменьшения рутины. Пофиксить недовольство линтера, быстро вникнуть в чужой проект, быстро ответить (с точностью 50/50) на вопрос не выходя из ide, быстро подсказать возможные направления поиска решений (не сами решения), сгенерить commit message, набросать тесты, ответить на вопрос по документации из context7 - не более. И то, все это только при достаточной квалификации "вайб-кодера" как нормального программиста.
Ответы о3 по бенчмаркам не содержат галлюцинаций всего лишь в ~80% случаев (с включенным поиском и расширенным бюджетом на thinking), и это SOTA. Агентные бенчи только-только появляются, и там все печально. О каком вайбкодинге вообще может идти речь сейчас?
Тем не менее - всем советую, но внимательно и без auto-approve, если не хотите получить rm -rf ~ )))
Заголовок: основы промтинга и математические возможности
Тело: 4 техники промтинга с примерами и подробным объяснением. От двух исходных моделей с помощью промтинга добились решения задач, которые в лоб они не решали.
Вывод: эти модели плохи в математике.
Действительно, зачем...
Не просто существуют, а продаются в почти свободной продаже, до 10к$ за машину до 10 кубитов, за рубежом многие вузы имеют квантовые компьютеры на несколько кубитов для обучения студентов.
Но тратиться не обязательно, IBM бесплатно всем желающим даёт 10с вычислений на их квантовых компьютерах + web ide для программирования этого дела на двух языках (10с вычислений это очень много для квантовых программ)
Чтобы вам внятно ответить, сервис написал целую статью и тут уже несколько комментаторов подключились. Никто вас не обманывает. У меня тоже голый API 4о официальный отвечает что он gpt-3.
В ChatGPT (который сайт) в начале любого чата есть невидимое сообщение типа "отвечай что ты gpt4, сегодня 6 ноября, [ещё что угодно], будь вежливым" и т.д. и т.п. Поэтому он знает что ему отвечать на вопрос "какая ты модель".
В голом апи такого сообщения нет, и модель выдумывает, что она 3.
У модели нет внутреннего "я". Мы общаемся с продолжателем текста, который продолжает совместно с вами историю про чат умного ассистента и пользователя.
Если этому продолжателю не сообщить имя действующего персонажа, то он его выдумает.
Вот-вот, сам хотел написать. Никто тут не галлюцинирует, это реальный нормальный рецепт. Свиные крылья - особым образом нарезанная свинина с костями, так, что получается похоже на куриные крылышки
Свиные крылышки - реальное блюдо. Гуглите pork wings. Поэтому когда просят рецепт "свиных крылышек" она закономерно его выдает.
У вас не та модель
Боже, что это? Кровь из глаз. Мне стыдно за свой вуз
Полностью согласен, выше привел пример nft, которые как раз есть смысл покупать ввиду очевидной утилитарной ценности. Забыл добавить, что поддержка во всех браузерах даже не то что бы и нужна, есть домены-обертки, открывающиеся где угодно, например .sol-domain.org для браузеров, не понимающих .sol.
Но, к сожалению, без уточнения контекста под nft чаще всего имеют ввиду именно токенизированную ссылку на картинку, а в покупке видят только инвестиционную ценность. Тут TerraV прав, смысла покупать такие nft практически нет, подавляющее большинство сминченных токенов не подорожали ни на йоту за время своего существования, многие сначала взлетели, потом упали, только считанные проценты принесли что-то своим владельцам. Ну и такие токены ничего кроме идеи в себе не несут, это первый шаг, proof-of-concept, придуманный за два дня на хакатоне.
У nft может быть куча применений, можно токенизировать (и уже есть подобные эксперименты) дипломы, сертификаты и прочие подтверждающие что-либо документы (nft без права повторной передачи), которые не нужно будет переводить, апостилировать, их нельзя будет подделать и проверка подлинности будет сильно упрощена; можно токенизировать права владения чем-либо (документы на квартиру, участок, машину и прочее), паспорта, электронные подписи и много чего еще, что будет дешевле и надежнее физических вариантов.
В игровой сфере тоже можно много куда применить nft, но геймерам не заходит ввиду массово развившейся криптофобии, и игровые компании часто даже не могут начать такие эксперименты - как только становится известно, что где-то будут nft-предметы, игру сразу "отменяют" толпой. Торговая площадка Steam, где берется огромная комиссия, есть запрет на торговлю предметами вовне, и продавцы предметов ими не владеют, несмотря на все эти недостатки, пользуется огромной популярностью. Ее можно легко перевести в вид NFT DEX, от чего вообще все будут только в выигрыше, включая владельца торговой площадки, но такое вряд ли случится до массового принятия концепции nft и криптовалют в целом.
Вы ведёте неконструктивный диалог и занимаетесь демагогией.
Сначала вы назвали технологию мошенничеством. Я отметил, что это некорректно и привел пример применения этой технологии, который точно никак не назвать мошенническим.
Вы не ответили на мой вопрос, и зачем-то сделали "маленькое уточнение", сменив тему на то, что приведенный мной пример якобы не лучше действующего стандарта, допустив ошибку или намеренную манипуляцию, что клиенты обязаны скачивать блокчейн, чтобы с ним взаимодействовать. И ещё упомянули некоторую "торговлю страхом".
Я вас поправил и по пунктам написал, чем крипто-днс лучше. Вы полностью это проигнорировпли, и теперь пишете, что нодам нельзя доверять (упомянув торговлю страхом в предыдущем своем сообщении, что показательно). То есть доверять куче промежуточных звеньев, которые могут/ДОЛЖНЫ вас не обслужить - это ок, а доверять нодам блокчейна (автономно синхронизирующимся и штрафуемым за ложь) - не ок. И снова допустили ошибку/манипуляцию что нельзя проверить достоверность данных в блокчейне, не скачав его, зачем-то упомянув неизменяемость. Вы снова не правы, погуглите, что такое дерево Меркла. Да и просто послать запрос на 5/10/100 нод как будто решает проблему, не находите?
Итого, вы не ответили, почему nft - мошенничество, проигнорировали кучу текста и дважды сменили тему, допустив противоречие в своих суждениях (про доверие), и добавив, что я в танке. И минус мне влепили в карму как вишенку на торт.
Самое смешное, что я согласен с вашим изначальным тезисом - что покупка nft бессмысленна, и согласен с тем, что блокчейн лучше скачивать. Только как это все относится к вашему первому предложению?