Comments 8
Натравите нейросеть на нейросеть. Пусть объясняет участки нейросети для человека, рисует карту, помечает и классифицирует, при возможности ещё и оптимизирует либо пытается повысить эффективность.
Ой, нейросеть осознала сама себя.
Насчет прозрачности: у правильно обученной модели если в prompt добавить "Объясни свое решение", то часто будет приемлемый бэктрейс.
приемлемый бэктрейс
"приемлемо" выглядящий бектрейс не имеющий ничего общего с тем как модель действительно сформировала свой вывод. Языковая модель не производит логический вывод, это просто пачка аттеншн слоёв которая на запрос "объяснить свое решение" намешивает в структуру ответа информацию о тех обучающих семплах в которых "объясняли решение".
Промпт инжиниринг вообще сам по себе глубоко ущербен как концепция, за контролнетом будущее.
Теперь алгоритму дается неразмеченное изображение. Он создает гипервектор для этого нового изображения, затем сравнивает гипервектор с сохраненными гипервекторами класса. Это сравнение определяет цифру, на которую больше всего похоже новое изображение.
То есть для каждого сохранённого вектора класса считаем, например, скалярное произведение с выходом последнего слоя нейросети. Чем это отличается от fully connected слоя? Тем, что веса необучаемые?
Тем что это, в отличии от FC слоя, работает даже когда конкретные классы неизвестны на этапе обучения. Гуглите Zero-shot_learning.
Попытка заново переоткрыть оптимальный эмбеддинг? Вообще-то они сейчас используются повсеместно.
А в чём новизна? Approximate kNN, vector databases, этому уже минимум лет 50.
Новый подход к вычислениям переосмысливает искусственный интеллект