RationalAnswer Sep 16 2024 at 05:08

Новый клубничный интеллект от OpenAI, а также охранная зондеркоманда Илона Маска

5 min

8.2K

Finance in ITCryptocurrencies

Digest

+17

Comments 13

AlekseiPodkletnov Sep 16 2024 at 05:33

Японцы конечно зря так. Весь мир знает, что через жопу нужно учить дышать ежиков, а не крыс))

RationalAnswer Sep 16 2024 at 05:34

Дак получается всё правильно - как раз работа научную новизну показала)

novoselov Sep 16 2024 at 06:34

У японцев свой путь: дальше будут выращивать иголки на крысах

RationalAnswer Sep 16 2024 at 06:43

Снимаю шляпу перед ценителем консультантского фольклора =)

novoselov Sep 16 2024 at 07:43

Это японская практичность, а фольклор вот:

pda0 Sep 16 2024 at 06:21

Как бы то ни было, новую модель научили «думать, прежде чем она откроет рот» – а что всё это значит, нам объяснит в новом лонгриде Котенков, конечно.

Как-то так

while true {
  запрос = ПолучитьЗапрос()
  запрос += "\n"
  запрос += "отпиши решение по пунктам\n"
  запрос += "не галлюцинируй"
  ответ = ChatGPT4(запрос)

  ошибка = ""
  while !ошибка.содержит("ошибок не обнаружено") {
    запрос_на_проверку = "был задан вопрос:\n"
    запрос_на_проверку += запрос + "'\n\n"
    запрос_на_проверку += "на который был дан ответ:\'n"
    запрос_на_проверку += ответ + "'\n\n"
    запрос_на_проверку += "проверь ответ и выдай все ошибки в ответе\n"
    запрос_на_проверку += "не галлюцинируй"

    ответ = ChatGPT4(запрос_на_проверку)
  }

  запрос_на_результат = "был задан вопрос:\n"
  запрос_на_результат += запрос + "'\n\n"
  запрос_на_результат += "на который был дан ответ:\'n"
  запрос_на_результат += ответ + "'\n\n"
  запрос_на_результат += "напиши резюме ответа без попунктового решения, так, как будто ты сразу на него ответил\n"
  запрос_на_результат += "не галлюцинируй"

  ответ = ChatGPT4(запрос)
  ОтправитьОтвет(ответ)
}

pda0 Sep 16 2024 at 09:01

"ошибка = ChatGPT4(запрос_на_проверку)" и

"ответ = ChatGPT4(запрос_на_результат)" конечно же.

И блок с исправлением найденных ошибок забыл... Зря так торопился с утра, когда писал.

Вот так вот восстания машин и начинаются. :)

Andriljo Sep 17 2024 at 08:13

Автор, новая o1 это не та модель, что про q*, пока никаких официальных подтверждений на этот счет нет. Не хватает слова "вероятно", а не утвердительного " та что q*".

RationalAnswer Sep 17 2024 at 10:31

Альтман с вами не согласен: https://x.com/sama/status/1835052587155902728

Andriljo Sep 17 2024 at 13:09

гляну

Andriljo Sep 17 2024 at 14:51

мой пойнт, был не в нейминге а в методологии обучения, тк q* для меня про qlearning like. Но пока нет техрепортов об этом , что о1 юзает для sft такой подход. Однако, q-learning , имхо, можно использовать для оптимизации выбора трейса в СоТ, для дерева рассуждений ТоТ, где СоТ это ветвь/трейс в нем.

RationalAnswer Sep 17 2024 at 18:04

Думаю, тут претензии надо к самому Сэму предъявлять 🤔

Andriljo Sep 18 2024 at 05:21

нет претензии) просто как захотели так и называют, они ж создатели) ждем репортов;)