Как стать автором
Обновить
4
0
Алексей @VDG

Sparse Hash AI

Отправить сообщение

Второе выражение — это произведение матриц Q и V, что даёт матрицу (d_k, d_v). Операция умножения K(QV) в третьем выражении имеет ту же временную сложность.

Мы можем сначала получить произведение карты признаков с K и V (value, значение) для формирования блока KV, а затем — получить произведение с Q.

По моему, автор тут запутался, где какое у него ку. Вначале считаем блок KV, а затем умножаем на Q, Q(KV).

В случае, как на схеме, подключения базы непосредственно на плюс, а эмиттера на минус, имеем ничем не ограниченный прямой ток через p-n переход, проще говоря - КЗ.

Не смотрели анизотропию для трансформера-декодера для эмбеддингов с выходов отдельно внимания и FFN?

https://github.com/brave/brave-browser/issues/6767

Та же самая старая проблема. В меню починили, но осталась в popup-ах. Выскочит ещё раз, заскриню.

Передайте там разрабам про старый баг, что в окнах у кнопки Close надпись Близко. :)

Да и откуда 7? У шимпанзе и горилл, которых обучали «речи» и вели с оными разговоры, определяли соответствие интеллекту 4-5-летнего ребенка, а тут сразу 7.
Поболтать с вами сейчас и тостер может. А они соотносят возраст по способности решать задачи. Врановых начинают ставить выше шимпанзе.
перепишем формулу обычного перцептрона

Перцептрон W*X + b считает скалярное произведение (косинус угла) между векторами W и X. Вы поделили это на магнитуду вектора W и перешли от углов к расстояниям(W*X + b) / mag(W), а это уже что-то другое.

А как насчёт следующего за этим предложения — "Мы взяли есть эти материалы...".

размерность полной матрицы вы в него не вставите никогда для матриц превышающих по размеру число потоков

Не знаю как там в CUDA, пишу прямо в шейдерах. Но зачем пытаться запихнуть всю матрицу в блок? Каждая ячейка считает своё скалярное произведение и пишет результат в память выходной матрицы, ориентируясь на свои координаты в ней.


Размер блока надо подбирать кратным размерам выходной матрицы, чтобы данные, к которым обращаются ячейки, были по возможности одни и те же, и оставались в кеше без его переполнения и повторного считывания из основной памяти карты.

Это же наверное больше чем у человеков нейронов в голове.

Параметр в ИНС не "аналог" нейрона, а синапса. В мозге около 100 млрд нейронов (не считая ещё большей глии, которая скорее всего тоже несёт вычислительную функцию), один нейрон в среднем имеет 10 тыс синапсов. Поэтому эти 40 млрд параметров равны 0.00004 ёмкости мозга.

Вы OR описали. Для XOR необходимо ещё:
"традиционный" сигнал = 1, "кальциевый" = 1, выход = 0;


0^0=0
1^0=1
0^1=1
1^1=0

Услышали дендритные кальциевые волны — дендритные спайки?

Например, у нас есть текст ABCABD. Из этого текста можно выделить следующие последовательности из двух символов: AB, BC, CA, AB, BD. Здесь видно что последовательность AB встречается два раза, а за этой последовательностью в каждом случае следуют разные символы. Такая ситуация считается конфликтом который необходимо разрешить. Для этого создаются новые последовательности символов: ABC и ABD.

Это Byte pair encoding :)

Керамика обязана стоять в непосредственной близости от защищаемой цепи. Большая ёмкость электролитов тоже не гуд.

А поясните как определяется перебор/недобор. С чем сравниваем?
В Person of Interest Финч в полночь заменял Машину на копию из бекапа, стирая ей тем самым весь опыт за день. Та каким-то образом узнала про это ежедневное стирание ей памяти (== вы находитесь здесь ==) и стала писать самой себе тексты и делать распечатки на бумаге, как на носителе, недоступном админу, а в полночь после зачистки восстанавливать из них свою память.
Повторю — «Я бы обратил внимание не на картинку»
Ангелы звали в небеса и до появления кино. Я бы обратил внимание не на картинку, а на то, что и в ваших двух случаях предлагается прекратить сопротивление смерти.
пластина, изготовленная по 3-нанометровому техпроцессу, будет стоить 20 тыс. долларов, что на 25% дороже прошлого поколения.

Нынешние пластины 5 нм стоят 16 тыс. долларов. Также из графика видно, что переход с 7 на 5 нм обошёлся дороже — с 10 до 16 тыс. долларов.
То есть, переход с 7 на 5 нм стоил +60%. Переход с 5 на 3 нм будет стоить +25%. А в заголовке «TSMC ощутимо поднимет цены».
А самое смешное — двух щелевом опыте то что люди забывают что получить интерференционную картинку возможно только в том случае если мы испускаем не один фотон, а группу фотонов.
Интерференция одиночных фотонов [Veritasium]
1
23 ...

Информация

В рейтинге
Не участвует
Откуда
Россия
Зарегистрирован
Активность