Pull to refresh
2K+
107
Даниил Тутубалин@DandyDan

User

7,1
Rating
55
Subscribers
Send message

А, я сослепу не увидел оператор. У вас W ~ W1*W2, а мне показалось, что там минус. Вот и подумал: а какой в этом смысл, если всё равно из оригинальной вычитаем. Теперь увидел, что это ~.

Лучше всё-таки рэп бэтл между ними устроить.

Чтобы проверить, насколько хорошо модель справляется с буквами, попробуйте поиграть с ней в "города".

[пардон, не заметил, что упомянута в статье]

Attention is all you need (2017)

Статья, давшая толчок трансформерам. Все эти ChatGPT, DeepSeek и прочая, прочая обязаны своим появлениям этой статье.

arXiv:1706.03762

Наших забыли. Статья, с которой начались деревья поиска.

  • Адельсон-Вельский Г. М., Ландис Е. М. Один алгоритм организации информации // Доклады АН СССР. — 1962. — Т. 146, № 2. — С. 263—266.

Правда, из-за этого у неё проблемы с самоидентификаций )
То называет себя ChatGPT, то Claude.

Это ж получается LoRA.

Только я не понял, а матрица W тут какую роль играет?

Очень забавно наблюдать, когда ей даёшь математически-лингвистическую задачу: "50% слов в твоих ответах должны быть матерными".

Долго перебирает фразы, скрупулёзно подсчитывает количество матюков и их процент, до 50% не дотягивает - продолжает поиск дальше. Внутренний диалог может растянуться на пару экранов.

А рекурсия со стеком никак не связаны, да?

Примеры использования DFS:
- заливка (floodfill)
- как продолжение заливки - поиск компонент связности
- полный обход графа

А вот для поиска пути он крайне не эффективен

Я просил написать quine на Brainfuck.

В первых раз DeepSeek просто взял ответ с википедии.
Во второй раз (с включенным DeepThink) решил проверить решение ушёл в бесконечный цикл :)

На новой ChatGPT пока не проверял, но старая (3.5) вела себя похожим образом - генерировала бесконечный бессмысленный текст, пока её не отрубало по таймауту.

Заставил обоих играть против самих себя в шахматы. Результаты довольно похожие.
https://youtu.be/t7JO1zITCkU

Как фанат и практик гольфа прочитал на одном дыхании, разбирая каждый кусок кода.

Очень круто на самом деле, и действительно узнал кое-что новое, например, что формат WebAssembly явно вдохновлен форматом SWF (Flash).

Теперь главное взять себя в руки и не пытаться уменьшить этот код ещё на пару байт.

Не.

  1. JS высокоуровневый язык, WebAsm низкоуровневый, поэтому обработка строк на JS получается короче: используем встроенные функции вместо того, чтобы реализовывать это самостоятельно.

  1. Код на ВебАсме все равно нужно будет записать в массив (если не придумывать что-то более хитроумное). Каждый байт - от 1 до 3 цифр + запятая, то есть 2-4 символа.

Это не интерпретатор, а именно компилятор. На выходе — байт-код.

Может просто поискать галактики, которые уже сейчас одной ногой там, за горизонтом?

Всегда нужно добавлять: «с точки зрения современной общепринятой модели».

Потому что 100 лет назад другие галактики не могли существовать, а 800 лет назад - другие планеты.

Мы и горизонт событий не можем подтвердить наблюдениями. Это чистой воды спекуляция из модели, которой, для того, чтобы она была рабочей, необходимо ещё 20 вселенных как наша превратить в энергию. Ну то есть такое себе утверждение.

Вот и на Хабре тёмные энергетики завелись.

С помощью выдуманных сущностей можно доказать что угодно, хоть модель Резерфорда: почему электроны не теряют энергию и не падают на ядро? Да потому что подпитываются магической темной энергией!

Можно пойти дальше и доказать хоть плоскую Землю, хоть кубическую, хоть в форме стула.

Тут двояко. С одной стороны, он реально шарит в системе типов TS, а таких людей в мире очень мало. И он явно умнее того товарища, который его собеседовал.

С другой стороны не умеет пока отличать ремесло от искусства. Крутой высокохудожественный код, который никто не понимает, лучше оставить для программерских контестов.

Information

Rating
953-rd
Registered
Activity