Комментарии 3
0 плюсов, зато 33 сохранения :)
Как тысячи лайков на Ютубе, при просмотрах исчисляемых лишь сотнями... Печально что читатели не плюсуют!
Мне вот интересно, какие фрагменты в этом векторном пространстве имеют выраженный семантический смысл? Будут ли лежать в одной плоскости, или на одной линии, или ещё как-то сгруппированы клички кошек или что-то подобное?
Ещё интересно, как происходит обучение и создаются общие эмбеддинги для мультимодальных моделей. Думаю, только когда слова будут представлены не только текстом, но и фонемами и как-то связаны на уровне эмбеддингов, будут решены различные языковые задачи. Например, написание стихов с правильным размером, ритмикой, рифмами, не заученными, а формирующимися по созвучию естественным образом. Будет намного более глубокое понимание языка. Туда же можно было бы добавить и привязку к внешнему виду букв. То, что в человеке идёт "из коробки".
Эмбеддинги для начинающих