Comments / Profile of phillennium / Habr

Евгений Трифонов@phillennium

ContentProvider

373

Subscribers

ProfileArticles416PostsNews18Comments3.2K

ИИ без галлюцинаций: как Lean 4 заставляет модели доказывать правду

phillennium Jul 7 at 20:00

Большие языковые модели могут галлюцинировать. В ответ на это появляется Lean 4

Проект Lean возник в 2013 году, как он мог появиться «в ответ на» модели, которых ещё не было?

Формальной верификацией люди занимались десятилетиями (и до всякого Lean тоже), она и без ИИ имеет смысл, просто с ним стала гораздо актуальнее и полезнее прежнего.

Google предлагает единый «водяной знак» для изображений, видео и текста, созданных ИИ

phillennium May 26 at 18:31

Вероятно, с SynthID лучше, чем без, но это явно не станет абсолютным стандартом (как минимум созданные ранее открытые модели уже не исчезнут), а в гугле по запросу «how to bypass synthid» уже вылезает немало.

В итоге при виде подозрительной картинки решения вопроса так и нет, SynthID выглядит полумерой, и есть ощущение, что человечеству ещё придётся решать это как-то иначе (автоподписью в камерах?)

«Не сетка»: ИИ впервые в истории сам решил центральную проблему геометрии

phillennium May 21 at 11:06

Конкретно Альтману доверия мало, но о решении задач обычно сообщает не он, а сами математики в местах вроде erdosproblems.com, где они также общаются на форуме. Не вчитывался в форум, но если правильно понимаю, они публично помогают другу, делятся частичными результатами, порой показывают промпты и цепочки рассуждений модели. Думаю, в таком формате было бы сложно создать большую подтасовку так, чтобы другие математики этого не заметили.

«Не сетка»: ИИ впервые в истории сам решил центральную проблему геометрии

phillennium May 20 at 23:49

Так в этом году новые модели постоянно задачи Эрдёша берут (счёт на десятки уже), а в прошлом году постоянно ни одной взять не могли.

Когда недавно вышел GPT-5.5, с ним в первые же дни взяли целый ряд задач, который с 5.4 взять не получалось. Разница бросается в глаза.

Так что постоянство результата налицо. По чему можно заметить, что токены-то тоже не то что бы полностью случайные.

«Не сетка»: ИИ впервые в истории сам решил центральную проблему геометрии

phillennium May 20 at 22:46

Нуу, тут есть тот нюанс, что в прошлом году бросать всё подряд уже пробовали, но тогда ничего подобного не прилипало. Получается, что просто бросать недостаточно, липкость бросаемых штук со временем растёт, и это важно)

+11

«Не сетка»: ИИ впервые в истории сам решил центральную проблему геометрии

phillennium May 20 at 20:50

По тексту новости сложно полностью понять «прорыв или хайп», я сам недостаточно компетентен в теме для оценки, но полазал по твитам математиков и у них вижу следующее:

1. Это самый впечатляющий результат ИИ в математике на данный момент. Ранее среди задач Эрдёша чаще всего ИИ брал малозначимые, до которых математикам попросту не было большого дела. Но вот эта могла бы входить в «топ-10» его задач, и люди над ней реально бились.

2. Тут нет ситуации «человек так не мог бы». Если бы группа живых математиков поставила задачу опровергнуть гипотезу и потратила много времени, вероятно, они бы могли справиться. Но предполагалось, что она верна, а время математиков не бесконечное, поэтому его тратили на попытки доказать, а не опровергнуть. Так что ИИ помог с тем, на что у людей недостаточно ресурсов.

3. Решение полностью было найдено ИИ, но живые математики тут по-прежнему важны, потому что его недостаточно просто найти — например, важна ещё качественная публикация о нём, с которой оно помогает продвинуть науку в целом, а не просто существует в вакууме. С таким у людей пока заметно лучше.

+24

ИИ собрал рабочую ОС за 12 часов: представлена Gemini 3.5 Flash

phillennium May 19 at 18:34

Угу, такие новости без ссылки ощущаются почти бессмысленными: непонятно, произошло повышение способностей моделей или нет

Погуглил, нашёл только фрагмент презентации (по которому новость и написана), там немножко показывают «в действии» («смотрите, запустили Doom»), но по такому демо тоже немного поймёшь

xAI выпустили Grok Build — агентный CLI для разработчиков

phillennium May 15 at 08:48

Да, возможно. По твиттеру Илона Маска вообще бывает ощущение, что главный приоритет xAI — это генерация полураздетых женщин на радость самому Маску

xAI выпустили Grok Build — агентный CLI для разработчиков

phillennium May 15 at 08:07

Интересно, почему у них столько времени ушло: все основные конкуренты Grok ещё в прошлом году официальными CLI обзавелись

Думал, что это намеренная позиция, но теперь похоже, что просто тормозили

Дни «зеродеев» сочтены

phillennium Apr 22 at 08:05

Если правильно понимаю, пока что Anthropic дали Mozilla закрытый доступ к Mythos именно командам безопасности для поиска security bugs, а не всего остального. Так что возможно, что для других задач в Mozilla эту модель пока ещё и не применяли. Ну и вопросы вроде тормозов к другой части их команды — не к red team, про которую в этом посте.

Ядро Linux разрешит использование кода с поддержкой ИИ при соблюдении правил

phillennium Apr 13 at 06:30

Формулировка «код с поддержкой ИИ» странновато звучит. Сначала воспринял её как «текстовый редактор с поддержкой формата docx» — то есть как будто это код как-то поддерживает ИИ.

Понятнее, наверное, что-то вроде «код, созданный с помощью ИИ».

Первый опыт с Warp: медленный, но сообразительный помощник, который заставит вас глупеть

phillennium Mar 27 at 07:22

Когда нужно лазать в гугл, это создаёт стимул запоминать команды, чтобы в следующий раз лезть за ней уже не пришлось. А когда всё быстро и «можно просто писать естественным языком», стимул исчезает.

Первый опыт с Warp: медленный, но сообразительный помощник, который заставит вас глупеть

phillennium Mar 26 at 12:04

С «деградацией», по-моему, палка о двух концах.

С одной стороны, да, возникает соблазн делегировать подобному инструменту сложность.

Но с другой — в принципе-то с ним возможно и учиться. Например, есть CLI-инструменты с кучей параметров вроде ffmpeg, и люди порой сторонятся их, потому что «как это упомнишь, не проводить же в гугле полжизни». А если описывать задачу естественным языком и вдумчиво читать получившуюся команду, то можно и инструментом пользоваться, и понемногу что-то о нём узнавать-запоминать. И в итоге, если «внезапно отключат интернет», уметь вручную больше прежнего, а не меньше.

С плохим ИИ-кодом всё ясно, а как добиться хорошего?

phillennium Mar 26 at 10:56

Захотелось пересмотреть теперь твой доклад про DDD, возможно, он стал актуальнее прежнего)

Заменят ли роботы программистов?

phillennium Mar 24 at 00:14

Хмм, а неплохо вы за два года до релиза ChatGPT наводку дали

Иронии автоматизации

phillennium Feb 4 at 16:24

О, как раз недавно сам вспоминал этот свой хабрапост по причине «в 2026-м он ощущается ещё актуальнее, чем когда его публиковал».

Поэтому ваш комментарий перекликается с этими ощущениями.

А как вы сейчас на этот пост попали? Гуглили что-то, или ещё тогда его читали, а теперь вспомнили?

Астрономия и компьютеры

phillennium Apr 14 2025 at 16:50

Я редактор текста, приятно видеть, что кто-то читает его настолько внимательно :) Спасибо, исправил в части про Gaia «мс» на «микросекунд», чтобы стало вообще без сокращений и был минимальный шанс запутаться — так ок?

От Kotlin до кассовых чеков: как выглядит Java-разработка в SM Lab

phillennium Apr 2 2025 at 21:50

В серверной вполне используется. Мне стоило текст сформулировать так, чтобы это сразу же понятно было — но если вчитаться, то вещи вроде «решили писать на Kotlin + Spring 5» явно не про мобильную :)

Что будет на конференции по системному программированию sysconf?

phillennium Mar 17 2025 at 10:51

Всем участникам видео будет доступно сразу, а на YouTube со временем тоже окажется, но с ощутимой задержкой.

Оболочки MS-DOS: за пределами Norton Commander

phillennium Dec 25 2024 at 08:02

Да, исправили, спасибо

2 3 ...

159 160