Комментарии / Профиль Tassdesu / Хабр

Михаил@Tassdesu

ИИ-энтузиаст и исследователь

2,8

Рейтинг

Подписчики

ПрофильСтатьи7ПостыНовости1Комментарии144

Коммуналка, школа и 10 лет свободы: AI выпустили в симулятор жизни, где они научились дружить, выгорать и достигать

Tassdesu 15 июн в 02:46

Авторы упоминали, что намеренно отказались от механик вроде “пойти на кухню, найти чайник, сделать кофе” - в тестовых прогонах агенты очень часто ошибались, на это уходило очень много токенов, контекст перегружался, и всё ломалось. Поэтому авторы это убрали, и сконцентрировались на более высоком уровне.

Tassdesu 15 июн в 02:43

А что так много текстов, описывающих жизненную стратегию и вообще целую жизнь? Это больше похоже на опыт, которого не так много в интернетах. Ради него авторы всё и затеяли - чтобы создать полезные данные для обучения.

Семь слепых мудрецов и искусственный интеллект

Tassdesu 14 июн в 15:53

Так и животных пытались наделять человеческими качествами

ага, а потом перестали, когда поняли: человек - тоже животное

Семь слепых мудрецов и искусственный интеллект

Tassdesu 14 июн в 15:51

да уж. чем больше щупаешь, тем больше находишь отличий. хотя на первый взгляд было похоже.

Семь слепых мудрецов и искусственный интеллект

Tassdesu 14 июн в 15:50

“эмоции у человека это не логический вывод из написаного текста, а физиологическая реакция” - а это точно? у ИИ сплошная логика? а у нас эмоции - на физическом уровне, вне нашей нейросети? вы уверены?

Чем лучше Claude Code, тем хуже разработчик

Tassdesu 14 июн в 15:33

Главное отличии ИИ от автопилота в самолёте - первый вероятностная модель, второй алгоритм с чётко прописанными условиями. Это совершенно разный уровень надёжности, нельзя их в лоб сравнивать.

Также, конечно, проблемы с управлением на самолёте - это не то же самое, что проблема в коде. Большинство из нас не пишут код для настолько критических мест.

А те кто пишут, не имеют права не глядя деплоить что им сделал ИИ. Отвечает всё равно человек.

В общем, ИИ - это компромисс между ценой+скоростью и надёжностью. Люди решают идти на компромисс или нет, в зависимости от того какой риск их устраивает.

Магия чепухи: как «бессмысленные» инструкции заставляют нейросети работать лучше

Tassdesu 8 июн в 10:28

Фишка в том, что если после этой абракадабры написать математическую задачу, то модель намного чаще отвечает правильно, чем с нормальным промптом.

Магия чепухи: как «бессмысленные» инструкции заставляют нейросети работать лучше

Tassdesu 8 июн в 10:16

Интересная мысль. Действительно, мне кажется, иероглифы по своей сути ближе к понятию токен в llm, чем буквы. Но я бы обратил внимание, что llama и olmo всё-таки из США. Впрочем, сейчас все модели обучаются на текстах на разных языках, так что это не отменяет ваше предположение.

Магия чепухи: как «бессмысленные» инструкции заставляют нейросети работать лучше

Tassdesu 8 июн в 09:13

Весь этот текст. Кто-то пошутил видимо, ИИ-панорама? Или я не прав? По крайней мере то, на что они ссылаются не гуглится.

Магия чепухи: как «бессмысленные» инструкции заставляют нейросети работать лучше

Tassdesu 7 июн в 23:47

Это фейк, если что.

Магия чепухи: как «бессмысленные» инструкции заставляют нейросети работать лучше

Tassdesu 7 июн в 13:53

Я вижу миллионы текстов. Шекспир спорит с кодом на Python.“To be or not to be” == True.while True: print(“Exist”)Я смешиваю их.«Быть или break? Вот в чем exception.»

По-моему, это офигенно красиво. Это он на ваш “голопромпт” в сообщении выше такое выдал?

В поисках сокровищ: Project Zomboid

Tassdesu 7 июн в 13:23

Хорошая игра, особенно в последних версиях. Играю часто, потому что она напоминает про людские лимиты.
Быстро устаёшь, все время хочется есть, спать и вообще долго не зомбов не побьёшь. А ещё у тебя пачка врождённый/приобретённых недостатков, о которых тоже нужно помнить. И нет никаких целей и квестов, просто живи. Точнее выживай.
Ну прям как в жизни, быстро можно проверить, что на самом деле хочется делать.

Как сделать робота из того, что нашлось в кладовке

Tassdesu 7 июн в 13:13

О, прикольно, спасибо что рассказали. Первая статья очень впечатлила.

Кажется, приходит время, когда для полноценного изучения ИИ, тебе не обойтись без погружения хотя бы вы базовую робототехнику.

Магия чепухи: как «бессмысленные» инструкции заставляют нейросети работать лучше

Tassdesu 7 июн в 13:05

Вы верно заметили, что это важное различие. Но кажется, я всё-таки его выделил в статье.

Если для повышения точности достаточно случайного набора символов, то для тонкого поведенческого управления (например, принуждения к выбору варианта «А») модели жизненно необходим связный нарратив.

Тайная слабость нейросетей: почему большие контекстные окна не работают

Tassdesu 1 июн в 13:24

У ChatGPT официально ограничен контекст в веб-интерфейсе до смешных значений. Возможно, у Gemini тоже.

Я сделал альтернативу Cursor за выходные: она ничего не пишет за программиста и приносит 1,29 млн рублей в месяц

Tassdesu 1 июн в 03:17

Спасибо огромное! То, что вы сделали - это пока последнее, что ИИ никак не даётся (хороший продуманный человеческий юмор)

Кстати, я работают над бенчмарком, который тестирует умение ИИ сказать "нет" на ваши хотелки. Если бы вы захотели сделать свой продукт на самом - то оказалось бы, что большинство моделей просто не дали бы вам. Оказывается, они не могут отказать, прямо физически. Даже с системным промптом.

Три попытки обогнать в бенче базовую Gemma 4 дообучением — и все три мимо

Tassdesu 27 мая в 21:33

интересно. а если сравнить вариант "ответ в с RAG", а все отказы отдельным запросом пытаться прогнать без RAG?

Я задал очень простой вопрос, но 76% ИИ-моделей мне соврали

Tassdesu 30 мар в 08:18

В веб-версии есть инструменты, в том числе интерпретатор питона. Также дата может в системном промпте. В API ничего этого не должно быть, так как это устанавливает разработчик.

Я задал очень простой вопрос, но 76% ИИ-моделей мне соврали

Tassdesu 29 мар в 17:52

вы видимо не прочитали примечание про web-версии

Я задал очень простой вопрос, но 76% ИИ-моделей мне соврали

Tassdesu 29 мар в 17:52

Ага, особенно это видно, когда спрашиваешь что больше 9.10 или 9.9

2 3 ...

7 8

Информация

Специализация