Комментарии 10
Это очень круто. После объединения текста с картинками (которое уже происходит постепенно), а потом и с видео, это вполне реальный способ добиться сильного ИИ.
Но как же хочется помечтать о графовом ИИ... Чтобы все эти объемы данных обрабатывались в форму графа с четкими правилами. Что с чем и как соотносится. Что-то вроде улучшенных деревьев решений. Очень жаль, что развитие ИИ не пошло по этому пути. С другой стороны, у биологического мозга логика появилась как надстройка над ассоциативным образным мышлением. Скорее всего нейросети просто повторят этот путь.
Различение смысла слов с несколькими значениями.Неужели поймет смысл и правильно сделает, напр, перевод на английский такое предложение с омонимами:
Девушка с косой на косе косила траву косой.
Гугло-переводчик (трансформер) нет.
A girl with a plait on her scythe scythed the grass with her scythe.
P.S.
Что за вбросы против сетей? Все время читаю. Не пойму, люди желания не имеют или гордость не позволяет ознакомиться, хотя-бы поверхносно, с тематикой?
Они работают — это факт. Безнес не интересует какие-то edge-cases с леопардовым диваном. Если ютубу нужно распознать нарушение авторских прав — сети это сделают. Если у Tesla есть необходимось безпилотных автомобилей — это работает. Image to Text, Text to Image, Text to Video, генерация кода по описанию и т.д. Все это работает.
Если не «мы», то я точно уже напрягаюсть смотря на развитие глубоких сетей.
А правильно было бы как-то так:
A girl with a plait on a spit mowed the grass with a scythe.
Это еще легкий вариант, вот расширенный:
За песчаной косой косой косой косой косой косой с косой косой косой косил прокос.
Перевод
За песчаным изогнутым берегом кривым орудием труда заяц с косоглазием и плохо уложенной в косу шерстью неаккуратный косил прокос.
Что за вбросы против сетей?Болею я за сети-то, ой как болею, и надеюсь на ИИ на их основе в перспективе, см., напр, этот комент, кот. решит назревающие проблемы. Поэтому и пишу про недостатки, напр, как им смысл искать не брутфорся статистику связей слов, а ближе к тому, как это делает человек, контекстно.
Но к сожалению пока никакой переводчик корректно эту фразу не переводит. Судя по описанию и сабж использует только статмодель языка. Значит будут промахи со смыслом в более сложных случаях, статистик кот. не было в обучающей выборке, или была не достаточной. Но ошибок будет меньше чем в пред. решениях. Посмотрим. А хотелось бы, чтобы ИИ смыслил лучше человека. И не напрягайтесь так, надеюсь скрепки производить этим ИИ еще пока не доверят)
стоимость NVIDIA Selene доходит до 85 млрд долларов
Все-таки, полагаю, миллионов, потому что 85 миллиардов - это в несколько раз больше годовой выручки Nvidia.
Microsoft и NVIDIA представили крупнейшую в мире генеративную языковую ИИ-модель