bartov-e Jan 11 2024 at 17:57Краткий обзор методик обучения визуально-языковых (мультимодальных) моделейLevel of difficultyMediumReading time12 minViews4.6KMachine learning*Natural Language Processing*ReviewTranslationTotal votes 7: ↑7 and ↓0+7Add to bookmarks38Comments1
Andriljo Jan 11 2024 at 23:13Comment has been editedИнтересный обзор, но CLIP не является декодером текста, возможно что-то не понял в формулировке "CLIP как декодер".
Краткий обзор методик обучения визуально-языковых (мультимодальных) моделей