Обновить
15

null

13
Подписчики
Отправить сообщение

⬛⬛⬛⬛⬛ вырвался из Site-⬛⬛

Б⬛⬛е, только не ⬛⬛⬛⬛, где мой ⬛⬛⬛⬛ 1.5!???⬛⬛?

Привет, я ⬛⬛⬛⬛⬛⬛ и ⬛⬛⬛⬛⬛ и ⬛⬛⬛⬛⬛⬛ а также ⬛⬛⬛⬛⬛⬛⬛⬛ ⬛⬛⬛⬛⬛⬛ ⬛⬛⬛⬛⬛⬛⬛

Файлы Эпштейна би лайк:

Привет!
Статья классная, но можете подсказать мне (чайнику)?
Как обходится с ситуацией когда к примеру вы сделали sequence для print и там может быть и int, и id (ну имя переменной)?

Это согласен.
Но бывают проекты которые реально крутые, они открытые без проприетарщины, но почему то комьюнити всё равно нету.

погодную станцию, мп3-плеер, читалка e-ink, гпс-трекер, лора-мессенджер или через инет, ИИ-помощник и многое другое. в первую это будет исопльзоваться как раз для ИИ помощников.

И для чего здесь ОС?
Вижу смысл только в ГПС и ИИ.

Всем привет!

Я бы не сказал что этот проект нужен для IoT.

Ибо можно сделать свой небольшой планировщик на yield-ах, и вам этого скорее всего хватит.

Если же вы хотите изоляции и вытеснения - делайте свою VM для процессов которая уже обеспечивает это всё.

Ибо, в каком проекте который управляет датчиками и кидает это через Wi-Fi нужно тащить громоздкую систему которая просит дисплей, 8 МБ PSRAM и всё в таком роде? Ответ - ни в каком.

Чисто как эксперимент - да.

Но на практике, скорее всего лучше сделать планировщик задач небольшой.

Wi-Fi прикрутить не так сложно наверно.

Вы опередили меня

И, жалко что тут все на ply, ибо на нём можно такие языки печатать днями.

Конечно, я не лигвинст, но ересь вообще вроде переводится как "выбор".

ИИ нужен (для меня) для того, что бы я не совершил глупых ошибок в коде (как перепутал > и ==, или опечатки в названиях переменных). Также иногда помогает писать тесты и добавлять фичи.

Ну хотя бы без Value обходиться.

И вообще как писал @MAXH0, проще было сделать на марковских цепях.

Тогда скажите автору поменять заголовок "Возможно, самый гениальный код на python на сегодня: разбираем 200-строчный microgpt от Андрея Карпаты" на что-то другое хотя бы.

Я могу быть не прав, но плодить Value каждый раз может быть затратно.

Тут есть строчки которые могут и жрать много, и медленно работать:

attn_logits = [sum(q_h[j] k_h[t][j] for j in range(head_dim)) / head_dim*0.5 for t in range(len(k_h))]

Это же O(n²). А O(n²) всегда медленнее, и жрать может много.

Вот ещё:

def softmax(logits):
    max_val = max(val.data for val in logits)
    exps = [(val - max_val).exp() for val in logits]
    total = sum(exps)
    return [e / total for e in exps]
  1. Поиск максимума.

  2. Вычисление экспоненты (самая дорогая функция для CPU без FPU).

  3. Суммирование.

  4. Деление каждого элемента.
    Всё это — огромный граф в Autograd (объекты Value), который сожрёт всю RAM.

Я конечно знаю что у нас есть много RAM, но, RAM не вечна :-).

Согласен.
Ну вот к примеру PocketMage PDA (в статье) или SlimeDeck Zero поковырять ещё интересно.
А остальное не так интересно.

Скорее "работает? прекрасно. что теперь?"

Чёрт. Только вчера думал побыстрее выложить чтобы попасть в такую статью.

Ну ладно.

Да, и кстати к 24 января я успеваю выпустить.

Классно получилось. Продолжайте.

1
23 ...

Информация

В рейтинге
7 522-й
Зарегистрирован
Активность