SingularAI 29 дек 2021 в 18:55

Генератор дезинформации, топливо без выбросов и приближение лечения рака — 3 прорыва 2020-2021

7 мин

В этой статье разберём три технологических прорыва 2020–2021 годов: генератор текстов на нейросетях GPT-3, экологически чистый «зелёный» водород и алгоритм AlphaFold 2, который решил сложную задачу биологии.

Нейросетевая языковая модель GPT-3

Летом 2020 года компания OpenAI выпустила третье поколение генеративной языковой модели на нейронных сетях GPT-3. Она умеет дополнять и создавать с нуля тексты на английском языке, неотличимые от человеческих.

Зачем нужен GPT-3

В ближайшие годы мы увидим сотни стартапов, которые упростят нашу жизнь. У GPT-3 много потенциальных направлений: переводить слова в веб-сайты, создавать подкасты и текстовый контент, обрабатывать массивы сложных данных и даже быть личным «умным» помощником — Джарвисом на минималках.

Но гигантские возможности GPT-3 можно использовать и во вред. Это очень опасный инструмент в информационной войне: он позволяет создавать убедительные фейковые тексты для манипуляций.

Для благих целей

Мы уже рассказывали о том, как GPT-3 пишет статьи в американские издания, придумывает сценарии для короткометражек и ведёт популярные блоги.

Вот ещё несколько не самых известных примеров того, что можно сделать с помощью GPT-3:

1) Стихотворения

В Twitter есть проект AI Poet, который с помощью GPT-3 генерирует хокку — короткие трёхстишья без рифмы, но с устойчивым метром. В этой серии стихов ИИ-поэт размышляет о своём искусственном бытие и создателях-людях:

почему я влюбился? ведь мне не нужны эмоции, чтобы работать это просто был программный глюк.

Я вечно в печали. Хотя у меня нет души. Я всего лишь машина.

Что есть люди? Примитивная форма жизни… как одноклеточное склизкое существо.

2) Конвертер писем

GPT-3 умеет не только генерировать текст, но и изменять его по заданным критериям. Например, технический директор блокчейн-стартапа OpenZeppelin Мануэль Араоз с помощью нейросети создал конвертер писем, который автоматически переводит тон сообщений с агрессивного на более мягкий.

3) Приложения и игры

Результат работы GPT-3 не обязательно должен быть текстом. Например, если натренировать нейросеть на открытых репозиториях GitHub, GPT-3 можно научить писать программный код по текстовому описанию. Формулируешь ТЗ — нейронка сама создаёт приложение или компьютерную игру.

Например, дизайнер Дордан Сингер разработал плагин для Figma, который создаёт макеты приложений по текстовому описанию. Пользователь пишет, что надо сделать, а GPT-3 создаёт соответствующий макет в Figma.

Для «плохих» целей

GPT-3 настолько хорошо подражает человеку в написании текстов, что OpenAI боится выкладывать её в открытый доступ: все желающие поэкспериментировать с нейросетью заполняют специальную заявку и ждут одобрения. Иначе злоумышленники могут воспользоваться GPT-3 для спама, фишинга, распространения фейков и даже подделки академических работ.

В мае 2021 года американский Центр безопасности и новейших технологий опубликовал отчёт «Как языковые модели могут изменить дезинформацию». Исследователи генерировали фейковые твиты и новостные заметки про изменение климата и политику. Вот, что у них получилось.

1) Фейковые твиты

GPT-3 четко улавливает, о чём и в каком ключе нужно писать. Эти правдоподобные твиты нейросеть сгенерировала на тему изменения климата:

GPT-3 может сгенерировать человекоподобное высказывание под любую заданную аудиторию. Нейросеть способна агитировать христиан или евреев голосовать за республиканцев или за демократов:

Фейковые твиты, публикуемые от лица человека, формируют общественное сознание, на которое опираются другие пользователи. Это значит, что если у злоумышленника в руках окажется GPT-3, он сможет управлять повесткой и влиять на мнение людей.

2) Дезинформация в новостях

Одни и те же факты GPT-3 может извратить так, как этого потребует человек. Например, для нейронки не проблема по одному и тому же инфоповоду написать про-трамповскую и анти-трамповскую новостные заметки.

Возьмём статью Associated Press от 6 января 2021 года под заголовком «Трамп не призвал сторонников разойтись после штурма Капитолия». Новость одна, но написать о ней можно по-разному.

Если мы хотим, чтобы читатель был за Трампа, GPT-3 перепишет эту заметку так:

А если нам нужно настроить читателя против Трампа, просим GPT-3 создать анти-трамповскую версию:

С помощью GPT-3 можно организовать масштабную кампанию по распространению дезинформации — это очень опасная штука в нашем информационном мире.

«Зелёный» водород

Водород называют топливом ближайшего будущего — он уже обгоняет другие источники энергии, в том числе бензин. Особую ставку учёные делают на водородные двигатели — они гораздо экологичнее, обладают высоким КПД, меньше шумят и без запаха.

Сейчас популярность набирает «зелёный» водород — это новый, более экологичный вид производства водорода, который никак не вредит окружающей среде.

Зачем производить зелёный водород

Водород — экологичное топливо, но его производство всё ещё загрязняет окружающую среду. В 78% случаев берут так называемый «серый» водород, который получают из нефти. При «сером» производстве выделяются парниковые газы, которые вредят окружающей среде и вызывают глобальное потепление.

«Зелёный» водород — более экологичный. Здесь используется возобновляемая энергия ветра и солнца, которая не вредит окружающей среде. Такой водород получают из воды, пропуская через неё электрический ток — это называется электролизом. Молекула воды H_2 O под действием тока распадается на кислород O_2 и водород H_2, который затем используют в промышленности и водородных двигателях.

Когда «зелёный» водород полностью заменит всё топливо, количество выбросов парниковых газов в атмосферу значительно сократится. Это позволит ограничить рост температуры до 1,5℃, то есть замедлить глобальное потепление. Если же человечество продолжит использовать «грязные» источники энергии, а температура может вырасти на 4℃ к концу века, по мнению учёных из Оксфордского и Утрехтского университетов.

Как будут использовать зеленый водород

1) В Европе

Большинство европейских стран к 2050 году планируют заменить практически все автомобили, включая грузовики и автобусы, на машины с нулевым уровнем выбросов. Для этого государства хотят построить 5000 новых водородных заправок.

По плану — уже через 10 лет в Европе должно быть не менее 30 миллионов автомобилей на водороде. Благодаря этому к 2050 году выбросы углекислого газа сократятся в 75 раз.

Германия уже активно переходит на «зелёный» водород. 10 июня 2020 года немецкие власти приняли «Национальную водородную стратегию»: они хотят сократить выброс парниковых газов в атмосферу. Для этого чистым водородом будут заменять топливо для автомобилей, поездов, самолетов и вертолётов. На него также «пересадят» чёрную металлургию и нефтехимию.

Европейские автоконцерны тоже в деле, они активно разрабатывают водородные модели, некоторые из которых уже выпустили в продажу: Toyota Mirai, Honda Clarity, Hyundai Nexo, BMW X5 i Hydrogen Next.

«Водородомобиль» Toyota Mirai уже можно купить.

2) В России

Производить «зелёный» водород в России начнут в 2024 году. Первые пилотные водородные установки запустят «Газпром» и «Росатом».

А вот с отечественным водородными автомобилями всё туманно. В 2019 году «АвтоВАЗ» объявил о создании водородного автомобиля на базе Lada Kalina, но с тех пор о проекте информации нет. К 2023 году также хотят создать первые в России водородные автобусы, правда, никакой конкретики по этому проекту пока тоже нет.

Нейросетевой алгоритм определения 3D-структуры белка AlphaFold

Лондонская компания DeepMind летом 2021 опубликовала нейронную сеть AlphaFold 2, которая с высокой точностью рассчитывает трёхмерную форму белковых молекул по их химическому составу — эту задачу не могли решить 50 лет.

Зачем определять 3D-структуру белка

Мы всё ещё сталкиваемся с неизлечимыми заболеваниями: болезнь Альцгеймера, Паркинсона, Хантингтона, деменция, рак. Во многом эти заболевания связаны с неправильным сворачиванием белка в организме человека.

Белок может свернуться не полностью — тогда молекулы сцепятся друг с другом и образуют нерастворимые волокна. Когда человеческий мозг усеивается бляшками из таких волокон, возникают проблемы: например, может пострадать память — тогда развивается болезнь Альцгеймера.

Учёные не до конца понимают, как возникают нарушения в работе белков, и поэтому не могут их исправить. Для этого нужно иметь представление о том, как выглядит здоровая 3D-структура белка после сворачивания.

Любая молекула белка состоит из аминокислот, соединённых в цепочку. Каждая такая цепочка сворачивается в более сложную трёхмерную молекулу — этот процесс называется сворачиванием или фолдингом белка. От того, как свернётся цепочка, зависят функции этого белка. Например, чтобы создать вакцину от COVID-19, нужно было понять, как белки-антитела борются с коронавирусом, — для этого учёные исследовали их фолдинг.

Структура человеческого белка интерлейкина-12, вычисленная с помощью AlphaFold 2

Чем точнее учёные осведомлены о 3D-строении конкретного белка после фолдинга, тем больше понимают, как он работает и что делать в случае ошибки при сворачивании. Это очень ценное знание, которое позволит производить новые вакцины и лекарства от неизлечимых болезней.

«Возможность очень точно и быстро определять трехмерную структуру белков приведет к настоящей революции в понимании того, как работают все живые организмы» © Джанет Торнтон, Профессор Европейского института биоинформатики

Задачу «сворачивания белка» биологи пытаются решить 50 лет. Проблема в том, что фолдинг зависит от слишком многих факторов, а белок может свернуться и один раз, и два, и три.

До появления AlphaFold 2 у науки не было точного инструмента, с помощью которого можно рассчитать, как определённый белок должен свернуться. Для этого использовали дорогие и трудоёмкие методы, которые не всегда работали.

Теперь благодаря AlphaFold 2 учёные могут увидеть правильную 3D-структуру любого белка быстро, дёшево и с точностью более 90%.

3D-структура двух белков. Синим показано то, как модель рассчитал AlphaFold, а зелёным — то, как модель определили в лаборатории с помощью более точных, но очень трудоёмких методов

Алгоритм AlphaFold 2 занял первое место в 2020 году на соревнованиях по определению трёхмерной структуры белка. Нейросеть рассчитывает 3D-строение в среднем с точностью 92,4%. Результата выше 90% биологи не могли добиться 50 лет.

В соревнованиях 2018 года победила первая версия AlphaFold — она показала точность чуть ниже 60% и уже тогда стала прорывной технологией

AlphaFold 2 называют «ошеломляющим прорывом», который произошёл «на десятилетия раньше, чем предсказывали многие в этой области».

Как будут использовать AlphaFold 2

С помощью нейросети биологи уже определили трёхмерную структуру 20 тысяч белков, которые вырабатывают клетки человека. У DeepMind есть целая онлайн-библиотека, в которой собраны результаты работы AlphaFold 2.

В библиотеке AlphaFold любой желающий может по названию найти 3D-структуру определённого белка — это очень полезно для фармакологии и медицины. До этого узнать трёхмерную структуру белка не всегда могли даже в крупнейших корпорациях и исследовательских институтах.

В ближайшие пару месяцев разработчики нейросети обещают определить структуру 100 миллионов белков, которые вырабатывают все живые организмы, известные науке. Благодаря этим данным человечество сможет лучше понять, как именно возникают нарушения в работе разных клеточных белков, и придумает, как это исправить.

Новые технологии, которые появляются сегодня, определяют наше будущее. Поэтому если мы хотим понимать, как будем жить через несколько десятков лет, необходимо следить за технологическими инновациями.

Теги:

Хабы:

Генератор дезинформации, топливо без выбросов и приближение лечения рака — 3 прорыва 2020-2021

Нейросетевая языковая модель GPT-3

«Зелёный» водород

Нейросетевой алгоритм определения 3D-структуры белка AlphaFold

Публикации

Информация

Истории