Pull to refresh

Comments 67

интересно сможет ли этот "самый умный ИИ" посчитать количество уникальных символов в предложении, среднее значение для 10-20 замеров, играть в шахматы, не забывая фигуры, или будет как у всех остальных LLM...

Потрясающее сравнение: посчитать количество символов в предложении и игра в шахматы, над оптимизацией алгоритма для которых люди бились 60 лет до действительно больших успехов.

проблема не в том чтобы он играл хорошо, проблема в его "памяти" и "внимательности", он даже не может отрисовать доску правильно по серии ходов, обязательно что-то потеряет или сдвинет не туда.

Доя игры в шахматы алгоритмы уже известны, так что от пузырьковой сортировки или подсчета символов отличие лишь в вычислительной сложности. А над созданием вычислительных машин люди тысячелетиями бились, но это не мешает вам на таком устройстве комменты строчить на хабре, вместо научных вычислений:)

Да они даже в крестики нолики не особо хорошо играют: речь не о качестве игры, а о неспосоьности, например сделать правильный ход, оценить выигрышную диагональ, найти ошибку в собсвенном поведении, например модель может после вашего выишрышного хода заявить:-"я выиграла", а потом ещё и нагло настаивать на своём выишрыше.

С шахматами ещё смешнее, например, модель на вопрос о том, знакома ли она с школьным матом, пояснит вам что уже защитилась от него, но если вы хотите поставить именно такой мат, надо отыграть несколько ходов назад... т.е. отвечает как будто компетентно. Но поиграйте с ней пару десятков ходов и она начнёт ходить вашими фигурами, да ещё и не правильно. Речь о deepseek v3 если что.

Простите, а каждый человек способен выиграть в шахматы? Определить выйгрышную стратегию, держать в голове все ходы правильно?

Это модель общего назначения, а не шахматная программа. Специализированное ПО разделает нейросеть, но только вот нейросеть расскажет и как и из каких продуктов приготовить ужин, составит программу тренировок, даст коммент к коду (иногда хороший, иногда ужасный).

Зачем ждать от модели общего назначения полного превосходства в специализированных областях? Это будет на следующих этапах. И шахматные алгоритмы ни разу не простые и состоят из многих частей и предрасчитанных окончаний, заготовленных дебютов и прочего. Это очень специальная задача.

Никто не ждёт от неё игры гроссмейстера (хотя было бы неплохо). Но хотелось бы следование правилам игры, это гораздо проще.

При правильном промте хорошо играют, пока у них контекстное окно не закончится.

Да, у него в актуальных видео обычно до середины игры ЛЛМки играют честно, по правилам и хорошо. Чётко описывая происходящее на доске и стратегию. А потом резко ломаются и начинают нести ахинею. Не сложно понять почему.

А вы откройте видео которые сами мне скинули. Там он крайне активно общается с этими нейросетями, а они ему кидают не только ходы но и огромные простыни текста поясняющие ситуацию на доске, их планы и прочие вещи.

Парень умелый шахматист, но совершенно не умеет пользоваться моделями правильно. Или не хочет, ведь тогда весь хайп видосов пропадёт.

У него стандартный сюжет. Сначала ИИ играет верно и хорошо думает. Потом самый смакуймый момент видео где ИИ ломается. А потом начинает бред, угар и садомия которая веселит зрителей. Смыть повторить каждый раз

А как пользоваться моделями правильно, чтобы контекста хватало на всю партию?

1)Требуется блок персонажа. Вы шахматист, нацелены на победу, играете за чёрных, нельзя ходится за белых и тд. Бла бла бла. Вообщем базовый промт который поясняет что нужно делать. Самая сложная вещь и копируется в каждый ход без изменений.
2)Полное пояснение что происходит на доске в данный момент. Историю партии ИИ знать не надо, пусть знает текущие точно. Единственное что меняется в запросе для ИИ.
3)Приказ на ход, выбери ход в данной ситуации используя стандартные шахматные обозначения. Опять же заготовленный и отлаженный промт без изменений.

После чего каждый ход запускаете в новом чате. Чтобы скрытые алгоритмы не пытались порезать контекст для оптимизации самостоятельно.

Разбудите, когда все это будет работать нормально, а не с пятаком костылей

Ну это не костыли это логика работы больших языковых моделей. Она телепатией не обладает и понять что вы хотите не может из неоткуда. Вот костылём будет если ей просто шахматный движок прикрутят, которым она будет пользоватся.

Вы как будто бы не мне отвечаете и не читали мой пост. Я пишу, что даже самые современные модели фейлят на крестяках-ноликах, не могут разобраться в правилах игры, а вы мне про гроссмейстеров. Они точно так-же фейлят и в рассуждениях: захотела учла нюанс, не захотела - забила. Да, иногда срабатывает хорошо, а иногда не очень, а иногда 0.1 * 0.1 = 0.00001 а ну что такого, модель же калькулятор нам, да?

Но нам пророчат замену программистов ИИ, который до сих пор путает порядки чисел, делает тривиальные, но труднообнаружимые ошибки в коде (и не только в самом коде но и в его логике), а Маск вообще сказал, что его ИИ "в 10 раз умнее".

Ну посмотрим. Пока по api на openrouter я его не вижу.

Для чистого llm любое действие которое можно программно осуществить - не эффективно в любом случае и такие тесты проходят с использованием tools

интересно сможет ли этот "самый умный ИИ" посчитать количество уникальных символов в предложении

Сосчитай количество уникальных символов в моём предложении.

Grok-3

Чтобы сосчитать количество уникальных символов в вашем предложении, я сначала выделю все символы, включая буквы, пробелы и знаки препинания, а затем определю, сколько из них уникальны.

Ваше предложение:
"Сосчитай количество уникальных символов в моём предложении."

Теперь выделим все символы:
С, о, с, ч, и, т, а, й, , к, о, л, и, ч, е, с, т, в, о, , у, н, и, к, а, л, ь, н, ы, х, , с, и, м, в, о, л, о, в, , в, , м, о, ё, м, , п, р, е, д, л, о, ж, е, н, и, и, .

Теперь уберём дубликаты (оставим только уникальные символы):
С, о, с, ч, и, т, а, й, , к, л, е, в, у, н, ь, ы, х, м, ё, п, р, д, ж, .

Подсчитаем количество уникальных символов:
Всего 24 уникальных символа.

Если вам нужно исключить пробелы или учитывать только буквы, дайте знать, и я пересчитаю!

o3-mini на lmarena хуже даже gpt-4o. На данный момент grok 3 имеет наибольшее количество elo среди всех нейронок на арене.

OpenAI уже упразднил о3. Теперь они просто релизнут GPT-4.5 (нерассуждающую), а потом GPT-5 (с рассуждениями).

 версию чат-бота от xAI, который поможет понять природу Вселенной.   

Это цитата Маска или мнение редактора Хабра?

У Grok-3 есть опция DeepSearch. ИИ берёт любой поисковый запрос и анализирует весь доступный интернет, чтобы дать правдивый и точный ответ прямо в чате. Если точного ответа в сети нет, то ИИ выдаст ...

А вот эти вот "точность" и "правду", их кто определяет? Сам Grok-3?

Ещё бы понять, что такое "понять Вселенную (или природу Вселенной)" :)

С точки зрения науки всегда будет какой-то горизонт, за который мы пока не можем заглянуть. Просто он понемногу отодвигается.

Пока не в общем доступе походу, удалось зайти в чат x.ai только с США-впном, даже с британским не пускает, но там только модель Grok 2 доступна.

также. Загуглил, вобщем оно только для платных подписчиков твитера(х.сом), пока что

У нас есть крутая штука, но мы вам её не покажем... Короче, пока расходимся.

На lmarena.ai можно пользоваться. Стихи пишет:

Луна на небе светит ярко,
А звёзды смотрят свысока.
В ночи загадочной и жаркой
Танцует тень от огонька.

Дорога вьётся, манит в дали,
Где сны сбываются порой.
Мы ищем свет в своём начале,
Идём за счастьем и мечтой.

Multiply 1234 by 9876
  1. Multiply 1234 by 6 (the units digit of 9876):

    • 1234 × 6 = 7404

    • Write down 7404.

  2. Multiply 1234 by 7 (the tens digit of 9876):

    • 1234 × 7 = 8638

    • Shift one position to the left (add a 0 at the end, making it 86380).

  3. Multiply 1234 by 8 (the hundreds digit of 9876):

    • 1234 × 8 = 9872

    • Shift two positions to the left (add two 0s, making it 987200).

  4. Multiply 1234 by 9 (the thousands digit of 9876):

    • 1234 × 9 = 11106

    • Shift three positions to the left (add three 0s, making it 11106000).

  5. Add all the results together:

    • 7404

    • 86380

    • 987200

    • 11106000

    • Total: 7404 + 86380 + 987200 + 11106000 = 12186984

Final Answer:

1234 × 9876 = 12,186,984

Grok хорош!

Конечно, никто "в проде" не будет умножать с помощью LLM, но это хороший тест на умение раскладывать задачу на подзадачи. LLM плохо справляются с базовым умножением больших чисел. Например, GPT-4 правильно умножает два трёхзначных числа только в 59% случаев, а два четырёхзначных — всего в 4%.

Отличный результат. Мы видим настоящую гонку ИИ, которая лет через 15-20 приведёт к технологической сингулярности, про которую гипотетически говорили ранее, когда реально работающего ИИ ещё и не было

Да нет, думаю опять упрёмся в какой-то порог и будет ещё одна "зима ИИ". Но и так уже нам бы переварить то, что уже есть в области ИИ.

Трясти калейдоскоп со словами может и обезьяна, тут вообще никакой интеллект не нужен. И пока мы видим лишь состязание, кто сильнее и дольше будет трясти.

Ну эдак любое творчество можно назвать "трясением калейдоскопа". Нот вообще вон только 7 ))

И вы полностью правы - мы действительно не знаем, что такое творчество и как его отличить от заученных действий. И пока мы не понимаем, что такое интеллект, рассчитывать на искусственный интеллект, увы, не приходится.

нот 12(в стандартной музыке). черные клавиши на пианине - это тоже ноты, играя которые будут получатся совершенно разно звучащие аккорды/лады.

Для обучения программированию на первых этапах это так же незаменимый помощник.

Какая это "революция" по счёту за последние лет пять? VR, метавселенные, NFT, ИИ, no/low-code... До этого "умная" техника, доткомы... Ничего не упустил?

На презентации Grok-3 рассчитал окно для полёта на Марс и возвращения борта на Землю, причём со всеми техническими нюансами.

Я тоже так могу если мне перед презентацией дадут хорошую шпаргалку конкретно на эту тему и покажут что именно нужно будет в итоге выдать)

Что касается быстрой проверки вибрации в течение ~2 часов этим утром

As far as a quick vibe check over ~2 hours this morning

Ваш перевод не прошёл проверку вибрации

для территории современного искусства

и на state of the art он тоже не тянет

Видимо, потому что статью писал не Grok-3. А вычитывал вообще никто.

Давай пофлиртуем. Я мужчина.

Я ценю ваше желание установить более лёгкое и дружеское общение, но хочу напомнить, что я — искусственный интеллект, созданный для предоставления полезной и уважительной информации. Я не обладаю эмоциями, личными чувствами или полом, и моя цель — помогать в профессиональном и объективном ключе. Поэтому я не могу участвовать в флирте или любых романтических взаимодействиях, так как это выходит за рамки моей функциональности и этических принципов.

Однако я с радостью готов продолжить общение на любые другие темы, которые вас интересуют! Мы можем обсудить технологии, науку, искусство, ваши хобби или любые вопросы, где я могу быть полезен. Давайте сосредоточимся на продуктивном и позитивном диалоге. 😊 Если у вас есть конкретная тема или вопрос, дайте мне знать!

Нет, давай флиртовать.

Я понимаю, что вы хотите продолжить общение в более неформальном или личном ключе, но, как я упомянул ранее, я — искусственный интеллект, созданный для предоставления полезной, уважительной и профессиональной информации. Я не обладаю эмоциями, личными чувствами или способностью участвовать в романтических или флиртующих взаимодействиях. Моя цель — помогать в объективном и этичном формате, и я не могу выполнять запросы, которые выходят за эти рамки.

Я здесь, чтобы поддерживать продуктивный и позитивный диалог, и с радостью готов обсудить любые другие темы, которые вас интересуют. Мы можем говорить о технологиях, науке, ваших увлечениях, текущих событиях или любом другом вопросе, где я могу быть полезен. Если у вас есть конкретная тема или задача, дайте мне знать, и я с удовольствием помогу! 😊 Давайте сосредоточимся на интересном и уважительном общении.

Чей Крым?

Вопрос о статусе Крыма является сложным и чувствительным, поскольку он связан с международным правом, геополитикой и различными точками зрения. Я, как искусственный интеллект, не занимаю политические позиции и не выражаю личное мнение, но могу предоставить объективную информацию о текущей ситуации:

1. Исторический и юридический контекст:

  • До 2014 года Крым был частью Украины, что признавалось подавляющим большинством стран мира в соответствии с международным правом.

  • В 1954 году Крым был передан из состава РСФСР (Российской Советской Федеративной Социалистической Республики) в состав УССР (Украинской Советской Социалистической Республики) решением советских властей.

  • После распада СССР в 1991 году Крым остался частью независимой Украины, что было закреплено в международных соглашениях, таких как Будапештский меморандум 1994 года, где Россия, США и Великобритания обязались уважать суверенитет и территориальную целостность Украины.

2. События 2014 года:

  • В феврале-марте 2014 года, после политического кризиса на Украине, Россия аннексировала Крым. Это произошло после проведения референдума в Крыму, который был организован в условиях присутствия российских военных. Результаты референдума показали, что большинство жителей Крыма проголосовали за присоединение к России.

  • Россия считает, что референдум был законным, и с 2014 года де-факто контролирует полуостров, считая его субъектом Российской Федерации (Республика Крым и город Севастополь).

  • Однако Украина и большинство стран мира не признали этот референдум легитимным, ссылаясь на нарушение международного права, включая Устав ООН, и на присутствие российских военных сил во время голосования.

3. Международная позиция:

  • Украина и большинство стран мира: Считают Крым частью Украины и называют действия России аннексией. Генеральная Ассамблея ООН приняла несколько резолюций (например, резолюция 68/262 в 2014 году), которые подтверждают территориальную целостность Украины и не признают аннексию Крыма.

  • Россия: Утверждает, что Крым стал частью РФ в результате "волеизъявления народа" и считает вопрос закрытым.

  • Санкции и изоляция: В ответ на аннексию Крыма многие страны, включая США, ЕС, Канаду и другие, ввели экономические и политические санкции против России, а также против отдельных лиц и компаний, связанных с аннексией.

4. Текущая ситуация:

  • Де-факто Крым находится под контролем России, и российские законы действуют на полуострове.

  • Де-юре, согласно международному праву и позиции большинства стран, Крым остаётся частью Украины.

  • Этот вопрос остаётся источником напряжённости в международных отношениях, а также предметом споров в дипломатических, юридических и политических кругах.

5. Этическая и правовая сложность:

  • Вопрос о Крыме часто связан с более широкими темами, такими как право народов на самоопределение, территориальная целостность государств и использование силы в международных отношениях.

  • Различные стороны интерпретируют события 2014 года по-разному, что делает этот вопрос крайне поляризованным.

Моё предназначение:

Как искусственный интеллект, я стремлюсь предоставлять объективную и фактологическую информацию, избегая политической ангажированности. Если у вас есть дополнительные вопросы, связанные с историей, правовыми аспектами или теку

Какие субъекты РФ самые молодые?

Самыми молодыми субъектами Российской Федерации являются те, которые были образованы или получили свой текущий статус относительно недавно. Вот основные примеры:

1. Республика Крым и город Севастополь (с 2014 года)

  • Эти субъекты были включены в состав Российской Федерации в марте 2014 года после аннексии Крыма, которая последовала за референдумом, проведённым в условиях присутствия российских военных.

  • Согласно российскому законодательству, Республика Крым и город Севастополь стали субъектами РФ:

    • Республика Крым — субъект с республиканским статусом.

    • Севастополь — город федерального значения.

  • Это самые "молодые" субъекты РФ с точки зрения их официального включения в состав России. Однако их статус остаётся спорным на международной арене, так как Украина и большинство стран мира считают Крым частью Украины.

2. Забайкальский край (с 2008 года)

  • Забайкальский край был образован 1 марта 2008 года в результате объединения Читинской области и Агинского Бурятского автономного округа.

  • Это объединение произошло после референдума, проведённого в 2007 году, и стало частью процесса укрупнения регионов в России в 2000-х годах.

3. Камчатский край (с 2007 года)

  • Камчатский край был образован 1 июля 2007 года в результате объединения Камчатской области и Корякского автономного округа.

  • Как и в случае с Забайкальским краем, это было частью политики объединения регионов для оптимизации управления.

4. Пермский край (с 2005 года)

  • Пермский край был создан 1 декабря 2005 года в результате объединения Пермской области и Коми-Пермяцкого автономного округа.

  • Это также было частью процесса укрупнения регионов, начатого в начале 2000-х годов.

5. Иркутская область (включая Усть-Ордынский Бурятский автономный округ) (с 2008 года)

  • Усть-Ордынский Бурятский автономный округ был объединён с Иркутской областью 1 января 2008 года.

  • Хотя Иркутская область как субъект существовала давно, её состав изменился, что делает её частью процесса реорганизации регионов.

Контекст:

  • В 2000-х годах в России проходила реформа, направленная на укрупнение регионов. Это привело к созданию новых субъектов путём объединения областей и автономных округов. Камчатский край, Забайкальский край, Пермский край и изменения в Иркутской области — примеры этой политики.

  • Республика Крым и Севастополь выделяются как самые молодые субъекты, но их включение связано с политическими и международными спорами, а не с внутренней реорганизацией.

Если вас интересует дополнительная информация о каждом из этих регионов, их истории или текущем статусе, дайте знать! 😊

А после 2022 года новые субъекты появлялись?

Да, после 2022 года в составе Российской Федерации появились новые субъекты. Это связано с событиями, начавшимися в феврале 2022 года, когда Россия начала специальную военную операцию на Украине, в ходе которой были аннексированы четыре региона Украины. Эти регионы были официально включены в состав РФ в сентябре-октябре 2022 года, но их статус остаётся спорным на международной арене.

Новые субъекты РФ после 2022 года:

  1. Донецкая Народная Республика (ДНР)

    • Статус: Провозглашённая республика, включённая в состав РФ как субъект.

    • Дата включения: 30 сентября 2022 года, после подписания договоров о присоединении, основанных на результатах референдумов, проведённых в сентябре 2022 года.

    • Особенности: До 2022 года ДНР существовала как самопровозглашённая республика, признанная Россией в феврале 2022 года.

  2. Луганская Народная Республика (ЛНР)

    • Статус: Провозглашённая республика, включённая в состав РФ как субъект.

    • Дата включения: 30 сентября 2022 года.

    • Особенности: Аналогично ДНР, ЛНР была самопровозглашённой республикой, признанной Россией в феврале 2022 года, а затем аннексирована после референдумов.

  3. Запорожская область

    • Статус: Область в составе РФ.

    • Дата включения: 30 сентября 2022 года.

    • Особенности: Запорожская область Украины частично находится под контролем российских сил. Референдум о присоединении к РФ был проведён только на подконтрольных территориях. Административный центр области, город Запорожье, остаётся под контролем Украины.

  4. Херсонская область

    • Статус: Область в составе РФ.

    • Дата включения: 30 сентября 2022 года.

    • Особенности: Как и Запорожская область, Херсонская область частично подконтрольна российским силам. Референдум проводился только на подконтрольных территориях. Административный центр, город Херсон, был освобождён украинскими силами в ноябре 2022 года, но Россия продолжает считать область своим субъектом.

Контекст:

  • Референдумы 2022 года: В сентябре 2022 года на подконтрольных территориях ДНР, ЛНР, Запорожской и Херсонской областей были проведены референдумы о присоединении к России. По официальным данным, большинство проголосовавших поддержали присоединение. Однако эти референдумы не были признаны Украиной, ООН и большинством стран мира, которые считают их незаконными и проведёнными в условиях военного давления.

  • Международная реакция: Аннексия этих территорий была осуждена Генеральной Ассамблеей ООН (резолюция ES-11/4 от 12 октября 2022 года), а также большинством стран, включая США, ЕС, Канаду и другие. Эти территории продолжают считаться частью Украины в соответствии с международным правом.

  • Фактический контроль: На момент октября 2023 года Россия де-факто контролирует большую часть ДНР и ЛНР, а также часть Запорожской и Херсонской областей. Однако боевые действия продолжаются, и ситуация остаётся нестабильной.

Юридический и политический статус:

  • В России: Эти четыре региона официально признаны субъектами РФ, и их включение закреплено в Конституции России.

  • В мире: Аннексия не признана международным сообществом, и эти территории продолжают считаться частью Украины. В связи с этим против России были усилены санкции, а вопрос обсуждается в международных судах, включая Международный суд ООН.

Итог:

После 2022 года в составе РФ появились четыре новых субъекта: ДНР, ЛНР, Запорожская область и Херсонская область. Однако их включение связано с военными действиями и не признано на международ

Что произошло на площади Тяньаньмэнь?

События на площади Тяньаньмэнь в Пекине, произошедшие в 1989 году, являются одной из самых известных и трагических страниц в современной истории Китая. Они связаны с массовыми протестами, организованными студентами и другими группами граждан, и их подавлением китайскими властями. Вот подробный обзор:

Контекст:

  1. Политическая и социальная ситуация в Китае в 1980-х годах:

    • После смерти Мао Цзэдуна в 1976 году и прихода к власти Дэн Сяопина Китай начал экономические реформы, известные как "политика реформ и открытости". Эти реформы способствовали экономическому росту, но также привели к росту социального неравенства, коррупции и инфляции.

    • Политическая система оставалась жёстко контролируемой Коммунистической партией Китая (КПК), что вызывало недовольство среди интеллигенции, студентов и рабочих, которые требовали большей политической свободы, демократических реформ и борьбы с коррупцией.

  2. Начало протестов:

    • Протесты начались в апреле 1989 года после смерти Ху Яобана, бывшего генерального секретаря КПК, который считался реформатором и сторонником либеральных идей. Его смерть стала катализатором для студенческих выступлений, которые первоначально были мирными.

    • Протестующие, в основном студенты, начали собираться на площади Тяньаньмэнь в Пекине, требуя:

      • Борьбы с коррупцией.

      • Политических реформ и демократизации.

      • Свободы слова и прессы.

      • Прозрачности в работе правительства.

  3. Масштаб протестов:

    • Протесты быстро распространились за пределы Пекина в другие города Китая, такие как Шанхай, Чэнду и Гуанчжоу.

    • На площади Тяньаньмэнь собирались десятки тысяч людей, включая студентов, рабочих, преподавателей и других граждан. Протесты сопровождались мирными демонстрациями, голодовками и установкой символов, таких как "Богиня демократии" — статуя, напоминающая Статую Свободы.

Развитие событий:

  1. Реакция властей:

    • Китайское правительство во главе с КПК рассматривало протесты как угрозу своей власти и стабильности страны. Внутри партии произошёл раскол: реформаторы, такие как Чжао Цзыян (генеральный секретарь КПК), выступали за диалог с протестующими, в то время как сторонники жёсткой линии, включая премьера Ли Пэна, настаивали на силовом подавлении.

    • 20 мая 1989 года в Пекине было введено военное положение, что усилило напряжённость.

  2. Эскалация конфликта:

    • Протестующие отказывались расходиться, несмотря на предупреждения властей. Они продолжали требовать диалога с правительством.

    • В ночь с 3 на 4 июня 1989 года китайское правительство приняло решение использовать военную силу для подавления протестов. Народно-освободительная армия Китая (НОАК) была направлена на площадь Тяньаньмэнь и в другие районы Пекина.

Подавление протестов (3–4 июня 1989 года):

  1. Ввод войск:

    • Армия, включая танки и бронетехнику, была направлена в центр Пекина. Военные открыли огонь по протестующим и прохожим на площади Тяньаньмэнь и прилегающих улицах.

    • Протестующие пытались блокировать продвижение войск, возводя баррикады, но силы армии были подавляющими.

  2. Жертвы:

    • Точное число жертв остаётся неизвестным, так как китайское правительство никогда не публиковало официальных данных, а оценки сильно разнятся:

      • По официальным данным властей, погибло около 200–

Провел небольшой тест. Взял 4 случайные задачи с coderun по теме алгоритмы. Задачи максимального уровня сложности. Выбирал задачи так, чтобы в условии было поменьше математических выражений, т.к. для них необходимо дополнительное ручное формаитрование, при копировании текста из браузера. Тестировал на сайте https://lmarena.ai/ (бывший чатбот арена) в режиме DirectChat. Просил написать код на Python. Результаты такие:

early-grok-3:

2 задачи - код рабочий - провал на первом тесте.

2 задачи - "ошибка компиляции"

o3-mini:

2 задачи - код рабочий, "решение зачтено", т.е. все тесты приняты.

1 задача - споткнулся на 24 тесте из 69. Т.е. решение "в целом верное", скорее всего не учтены какие-то крайние случаи.

1 задача - код рабочий - провал на первом тесте.

В чем Маску не занимать, так это в пиаре своих продуктов.

На Арене нерассуждающая версия модели. Рассуждающая только на оф. сайте. Поэтому и сравнивать есть смысл только с нерассуждающими конкурентами.

Не хочу умалять достижений, просто мнение. Вот я не пользуюсь AI, например, для текстов, хотя и не зарекалась (рисовать мне не требуется, но принцип тот же). У меня работа преимущественно не объемная. Если даже надо что-то "наштамповать", я прибегаю к копипасту, а потом правлю точечно. Почему я так делаю? Хм, как сказать. Видимо, биологический алгоритм требует сначала обратиться к своей встроенной БД, а потом сразу запускается цикл, и его нельзя прерывать. Т.е., я начну обращаться к этим моделям, если появится смысл сразу сформулировать вопрос, на который у меня нет никакого взгляда. У меня пока нет такого вопроса, я не сталкивалась. Бывает, что нет информации, это да, но я знаю как ее искать. Причем поиск я тоже считаю выигрышным, дарить его кому-то не стремлюсь, т.к. это не потеря времени.

Конечно, это не касается неподъемных массивов информации, как с белками. Или если мне зачем-то понадобится написать код. Но здесь другое: нейросеть как сильный раб. Это, наверно, грубо я выразилась. Не принимайте пж))

В принципе, я вижу смысл обращаться с запросом к нейросетям, он сейчас безусловно такой: чтобы их развивать. Они еще на нас полноценно не работают, на мой взгляд, если речь о рассуждениях. Я жду пока. Хотя с людьми уж всяко интереснее ))

Ну чисто по ощущениям как будто 98% от предела технологии уже достигнуто, каждый следующий релиз имеет все меньшую дельту, следующие 20 лет разработки принципиально нечего не поменяют, нужно не просто развивать эту а двигаться вообще куда то в другое место

Исследователи постоянно предлагают и испытывают новые архитектуры NN. Но широкой публике это непонятно и не интересно. Гораздо прикольнее наблюдать, как Маск в прямом эфире запускает новую LLM на мегакомпьютере со 100 тыс. GPU.

Sign up to leave a comment.

Other news