Pull to refresh
2K+
393
Евгений Трифонов@phillennium

ContentProvider

0,5
Rating
373
Subscribers
Send message

Конкретно Альтману доверия мало, но о решении задач обычно сообщает не он, а сами математики в местах вроде erdosproblems.com, где они также общаются на форуме. Не вчитывался в форум, но если правильно понимаю, они публично помогают другу, делятся частичными результатами, порой показывают промпты и цепочки рассуждений модели. Думаю, в таком формате было бы сложно создать большую подтасовку так, чтобы другие математики этого не заметили.

Так в этом году новые модели постоянно задачи Эрдёша берут (счёт на десятки уже), а в прошлом году постоянно ни одной взять не могли.

Когда недавно вышел GPT-5.5, с ним в первые же дни взяли целый ряд задач, который с 5.4 взять не получалось. Разница бросается в глаза.

Так что постоянство результата налицо. По чему можно заметить, что токены-то тоже не то что бы полностью случайные.

Нуу, тут есть тот нюанс, что в прошлом году бросать всё подряд уже пробовали, но тогда ничего подобного не прилипало. Получается, что просто бросать недостаточно, липкость бросаемых штук со временем растёт, и это важно)

По тексту новости сложно полностью понять «прорыв или хайп», я сам недостаточно компетентен в теме для оценки, но полазал по твитам математиков и у них вижу следующее:

1. Это самый впечатляющий результат ИИ в математике на данный момент. Ранее среди задач Эрдёша чаще всего ИИ брал малозначимые, до которых математикам попросту не было большого дела. Но вот эта могла бы входить в «топ-10» его задач, и люди над ней реально бились.

2. Тут нет ситуации «человек так не мог бы». Если бы группа живых математиков поставила задачу опровергнуть гипотезу и потратила много времени, вероятно, они бы могли справиться. Но предполагалось, что она верна, а время математиков не бесконечное, поэтому его тратили на попытки доказать, а не опровергнуть. Так что ИИ помог с тем, на что у людей недостаточно ресурсов.

3. Решение полностью было найдено ИИ, но живые математики тут по-прежнему важны, потому что его недостаточно просто найти — например, важна ещё качественная публикация о нём, с которой оно помогает продвинуть науку в целом, а не просто существует в вакууме. С таким у людей пока заметно лучше.

Угу, такие новости без ссылки ощущаются почти бессмысленными: непонятно, произошло повышение способностей моделей или нет

Погуглил, нашёл только фрагмент презентации (по которому новость и написана), там немножко показывают «в действии» («смотрите, запустили Doom»), но по такому демо тоже немного поймёшь

Да, возможно. По твиттеру Илона Маска вообще бывает ощущение, что главный приоритет xAI — это генерация полураздетых женщин на радость самому Маску

Интересно, почему у них столько времени ушло: все основные конкуренты Grok ещё в прошлом году официальными CLI обзавелись

Думал, что это намеренная позиция, но теперь похоже, что просто тормозили

Если правильно понимаю, пока что Anthropic дали Mozilla закрытый доступ к Mythos именно командам безопасности для поиска security bugs, а не всего остального. Так что возможно, что для других задач в Mozilla эту модель пока ещё и не применяли. Ну и вопросы вроде тормозов к другой части их команды — не к red team, про которую в этом посте.

Формулировка «код с поддержкой ИИ» странновато звучит. Сначала воспринял её как «текстовый редактор с поддержкой формата docx» — то есть как будто это код как-то поддерживает ИИ.

Понятнее, наверное, что-то вроде «код, созданный с помощью ИИ».

Когда нужно лазать в гугл, это создаёт стимул запоминать команды, чтобы в следующий раз лезть за ней уже не пришлось. А когда всё быстро и «можно просто писать естественным языком», стимул исчезает.

С «деградацией», по-моему, палка о двух концах.

С одной стороны, да, возникает соблазн делегировать подобному инструменту сложность.

Но с другой — в принципе-то с ним возможно и учиться. Например, есть CLI-инструменты с кучей параметров вроде ffmpeg, и люди порой сторонятся их, потому что «как это упомнишь, не проводить же в гугле полжизни». А если описывать задачу естественным языком и вдумчиво читать получившуюся команду, то можно и инструментом пользоваться, и понемногу что-то о нём узнавать-запоминать. И в итоге, если «внезапно отключат интернет», уметь вручную больше прежнего, а не меньше.

Захотелось пересмотреть теперь твой доклад про DDD, возможно, он стал актуальнее прежнего)

Хмм, а неплохо вы за два года до релиза ChatGPT наводку дали

О, как раз недавно сам вспоминал этот свой хабрапост по причине «в 2026-м он ощущается ещё актуальнее, чем когда его публиковал».

Поэтому ваш комментарий перекликается с этими ощущениями.

А как вы сейчас на этот пост попали? Гуглили что-то, или ещё тогда его читали, а теперь вспомнили?

Я редактор текста, приятно видеть, что кто-то читает его настолько внимательно :) Спасибо, исправил в части про Gaia «мс» на «микросекунд», чтобы стало вообще без сокращений и был минимальный шанс запутаться — так ок?

В серверной вполне используется. Мне стоило текст сформулировать так, чтобы это сразу же понятно было — но если вчитаться, то вещи вроде «решили писать на Kotlin + Spring 5» явно не про мобильную :)

Всем участникам видео будет доступно сразу, а на YouTube со временем тоже окажется, но с ощутимой задержкой.

Да, исправили, спасибо

Сейчас этого доклада в VK Видео ещё нет, но вскоре появится на VK-странице JPoint, там постепенно выкладывают все видеозаписи JPoint 2024: https://vk.com/video/@jpoint_joker

Если я правильно понял описание доклада, то Алексей основные преимущества LINQ to DB видит при запросах на получение данных, и этому посвятил предыдущий доклад. А в случае с операциями записи может действительно не быть каких-то суперпреимуществ, но если уж рассказал про чтение, то теперь надо и про запись)

1
23 ...

Information

Rating
2,436-th
Location
Москва, Москва и Московская обл., Россия
Date of birth
Registered
Activity