Cloud Video Intelligence API распознаёт не только существительные (тигр, животное, собака, цветок), но и некоторые глаголы (бежать, плавать, летать) в содержимом видеороликов. Здесь используются алгоритмы машинного обучения Google, созданные с использованием TensorFlow и других фремйворков
Если CVI API уже может распознавать действия (глаголы), то в не далёком будущем и распознавание состояния (прилагательных: красный, зелёный и т.п… А это, как мне видится, увеличит достоверность распознавания.
Если CVI API уже может распознавать действия (глаголы), то в не далёком будущем и распознавание состояния (прилагательных: красный, зелёный и т.п… А это, как мне видится, увеличит достоверность распознавания.