А руководитель Google добавил: «+1 к этому». Какие задачи стоят прямо сейчас перед ведущими разработчиками мира, и какую дорогу прокладывает искусственный интеллект в мире физическом. Разбираемся в новой статье.
Приветствую! Меня зовут Владимир Манеров, я исполнительный директор компании TEAMLY. Также я руковожу отделом разработки платформы. Не мне вам рассказывать, что ИИ начал активно проникать в нашу рабочую и личную жизнь. Мы тоже не устояли, внедрив прошлой осенью AI-ассистент в ТИМЛИ. Это текстовый помощник, который может из статьи в базе знаний сделать пост для соцсетей, напишет краткое содержание или составит список задач. Такой инструмент помогает сэкономить от 10 минут до пары часов работы с текстом. Вроде просто, но эффективно. Планируем, что скоро нейросеть будет выдавать ответы на основе информации из базы знаний. А в этой статье собрал тренды и направления в развитии ИИ в 2024 году от тех, кто ест этот хлеб.
В 2024 году сотрется грань текстовых и визуальных генеративных нейросетей. DALL-E и Midjourney уже сейчас могут делать не только изображения, но и видео. В дальнейшем скорость генерации будет только расти, а в итоге они сольются с текстовыми ботами вроде ChatGPT.
Такие чаты уже сейчас неплохо имитируют текст, но этого мало. Чтобы демонстрировать поведение, близкое человеческому, необходимо выйти за пределы текста. Например, обрабатывать и строить фотографии, видео, диаграммы, музыку и прочие медиафайлы.
Главную роль в последовательном развитии нейросетей играют IT-гиганты. Они располагают большими мощностями для обработки данных, которые необходимы для глубокого обучения искусственного интеллекта. Так что вполне ожидаемо, что крупные корпорации планируют в этом году передать системам обучения еще больше данных, чем «люди могут себе представить».
Зачем все это? Чтобы ИИ мог научиться решать все более сложные задачи для жизни в реальном мире. Это немного приблизит возможности ИИ к человеческому мозгу, но говорить о полной замене пока слишком рано. Получается, что это большой шаг для человечества, но маленький шаг для искусственного интеллекта.
Так чего ждем в этом году?
Мгновенные видео
Люди немного набаловались быстрой генерацией изображений разной степени упоротости. Можно мгновенно получить изображение капибары в баре или сатаны с котятами. Теперь очередь за качественным генеративным видео. Уже готовы прототипы инструментов, которые могут мгновенно создавать видео из коротких текстовых запросов.
Это просторное поле для технологий обучения, а также для медицины, проектировки. А для маркетинга вообще раздолье. OpenAI уже выкатили первые видео, сгенерированные их новой нейросетью Sora. Правда, реалистичность пока немного хромает, но дальше — больше.
Мультиканальные чат-боты
Сейчас каждый бот чат-бот имеет собственную специализацию.
Ну что ж, желание будет исполнено, но не сразу. В этом году все крупные разработчики AI анонсируют функцию обработки разных типов данных: текстов, изображений, видео, аудио и т.д.
И это еще не все. Системы, помимо обработки разных данных, изучают еще и взаимосвязи между ними. Так что предполагается, что они смогут заменять данные одного типа на другой.
Например, можно будет отдавать запрос на генерацию не текстом, а аудиосообщением. Или так: даешь нейросети изображение, а она в ответ отдает текст.
Работа над ошибками
Назначение искусственного интеллекта — разгрузить человека в решении сложных задач. И речь не столько про дизайнеров или копирайтеров. Задача всё же более глубокая, например, выявление алгоритмов развития заболеваний для ранней диагностики или создание инструкций ремонта космических аппаратов в условиях полета и т.д.
Цель здесь не просто написать гайды на все случаи жизни, но и научить алгоритм имитировать человеческое рассуждение. То есть создавать серию отдельных шагов, каждый из которых основывается на предыдущих. По мнению некоторых разработчиков именно в этом заключается суть человеческого рассуждения. Хотя это больше философский вопрос, и не все согласны с этой точкой зрения, заявляя, что ИИ-боты просто повторяют поведение, которое они видели сотни раз во время обучения нейросети. Где-то в мире, услышав этот конфликт, пишет новую книгу один Виктор Пелевин.
Агенты искусственного интеллекта
Оставим философские вопросы философам, и пока отметим, что гиганты вроде OpenAI сейчас заняты разработкой все более точной работы чат-ботов, чтобы минимизировать ошибки в рассуждениях. Результатом этого может стать такое явление, которое журналисты называют «Агенты ИИ».
Суть агентов искусственного интеллекта в том, чтобы разгрузить голову человека в рутинных вопросах.
Это усовершенствованный электронный ассистент, который не просто создаст событие в календаре и разошлет приглашения, но и организует более сложные дела, например, будет вести управленческий учет компании, настроит систему обучения новых сотрудников, проанализирует показатели. Главное – он выйдет за пределы себя самого и начнет пользоваться сторонними приложениями, которые сейчас в основном использует человек. Ожидается, что в дальнейшем вся утомительная рутинная работа на компьютере перейдет умным роботам.
Умные роботы
Сейчас роботы на производствах выполняют ограниченный функционал. Например, сборка коробок – в его электронных мозгах есть один набор действий, повторяющихся снова и снова. То же самое с бытовыми роботами: пылесосом, коробкой передач в машине, доставщиком. Это круто, но можно и лучше, – так считают разработчики искусственного интеллекта.
Они намерены обучить ИИ решать более сложные задачи, в том числе те, с которыми они сами никогда до этого не сталкивались.
Чат-боты уже научились предсказывать каждое следующее слово в предложении, анализируя предыдущий контекст. Этот принцип переносится на физический мир, где роботы будут учиться по видео с объектами, которые перемещают, перекатывают и поднимают.
Пока гиганты технологий работают над созданием гуманоидных роботов, бесчисленные стартапы берут идею на вооружение и готовят более прикладные в быту инструменты: механические руки для складывания рубашек, роботы-сортировщики мусора и т.д.
К чему все это приведет
Искусственный интеллект по по-прежнему пока не может заменить человеческий мозг. Но кое-какие задачи выполняет уже существенно лучше. И пока технари толкают прогресс вперед, гуманитариям приходится решать вполне земные вопросы:
Как противостоять дипфейкам? Коллеги выясняли в этой статье.
Как решаются юридические вопросы собственности и ответственности за происшествия, если один из участников – робот?
Как сохранить свое рабочее место, ведь очевидно, что некоторые профессии вполне осилит и машина?
И главный вопрос: как обществу массово уложить все происходящее в своей голове?
Спасибо, что дочитали статью!
По традиции, рекламная пауза
Приходите к нам в офис на митап! 29 февраля в 18:00 генеральный директор TEAMLY Виталий Чесноков расскажет про боли руководителя: масштабирование процессов и управление текучкой. А главное — как разобраться с ними с помощью знаний компании.
Надежда Сергеева, аналитик бизнес-процессов в компании ABCage, поделится факапами и выводами после внедрения базы знаний в компанию, которая выросла на маркетплейсах.
Больше информации и кнопка а регистрации здесь.