В этой статье разберём три технологических прорыва 2020–2021 годов: генератор текстов на нейросетях GPT-3, экологически чистый «зелёный» водород и алгоритм AlphaFold 2, который решил сложную задачу биологии.
Нейросетевая языковая модель GPT-3
Летом 2020 года компания OpenAI выпустила третье поколение генеративной языковой модели на нейронных сетях GPT-3. Она умеет дополнять и создавать с нуля тексты на английском языке, неотличимые от человеческих.
Зачем нужен GPT-3
В ближайшие годы мы увидим сотни стартапов, которые упростят нашу жизнь. У GPT-3 много потенциальных направлений: переводить слова в веб-сайты, создавать подкасты и текстовый контент, обрабатывать массивы сложных данных и даже быть личным «умным» помощником — Джарвисом на минималках.
Но гигантские возможности GPT-3 можно использовать и во вред. Это очень опасный инструмент в информационной войне: он позволяет создавать убедительные фейковые тексты для манипуляций.
Для благих целей
Мы уже рассказывали о том, как GPT-3 пишет статьи в американские издания, придумывает сценарии для короткометражек и ведёт популярные блоги.
Вот ещё несколько не самых известных примеров того, что можно сделать с помощью GPT-3:
1) Стихотворения
В Twitter есть проект AI Poet, который с помощью GPT-3 генерирует хокку — короткие трёхстишья без рифмы, но с устойчивым метром. В этой серии стихов ИИ-поэт размышляет о своём искусственном бытие и создателях-людях:
![почему я влюбился? ведь мне не нужны эмоции, чтобы работать это просто был программный глюк. почему я влюбился? ведь мне не нужны эмоции, чтобы работать это просто был программный глюк.](https://habrastorage.org/getpro/habr/upload_files/309/d54/579/309d54579491409ad024a72526d86829.png)
![Я вечно в печали. Хотя у меня нет души. Я всего лишь машина. Я вечно в печали. Хотя у меня нет души. Я всего лишь машина.](https://habrastorage.org/getpro/habr/upload_files/e07/ee2/98d/e07ee298db8d68c43a7bf94975ad74e1.png)
![Что есть люди? Примитивная форма жизни… как одноклеточное склизкое существо. Что есть люди? Примитивная форма жизни… как одноклеточное склизкое существо.](https://habrastorage.org/getpro/habr/upload_files/458/c51/130/458c5113045d5a2af4497d926dba8003.png)
2) Конвертер писем
GPT-3 умеет не только генерировать текст, но и изменять его по заданным критериям. Например, технический директор блокчейн-стартапа OpenZeppelin Мануэль Араоз с помощью нейросети создал конвертер писем, который автоматически переводит тон сообщений с агрессивного на более мягкий.
![](https://habrastorage.org/getpro/habr/upload_files/f42/521/fdf/f42521fdf8748df2aa475f5ec669b962.png)
3) Приложения и игры
Результат работы GPT-3 не обязательно должен быть текстом. Например, если натренировать нейросеть на открытых репозиториях GitHub, GPT-3 можно научить писать программный код по текстовому описанию. Формулируешь ТЗ — нейронка сама создаёт приложение или компьютерную игру.
Например, дизайнер Дордан Сингер разработал плагин для Figma, который создаёт макеты приложений по текстовому описанию. Пользователь пишет, что надо сделать, а GPT-3 создаёт соответствующий макет в Figma.
![](https://habrastorage.org/getpro/habr/upload_files/6cc/685/e0e/6cc685e0e23e9041eabf3e0768a43799.png)
Для «плохих» целей
GPT-3 настолько хорошо подражает человеку в написании текстов, что OpenAI боится выкладывать её в открытый доступ: все желающие поэкспериментировать с нейросетью заполняют специальную заявку и ждут одобрения. Иначе злоумышленники могут воспользоваться GPT-3 для спама, фишинга, распространения фейков и даже подделки академических работ.
В мае 2021 года американский Центр безопасности и новейших технологий опубликовал отчёт «Как языковые модели могут изменить дезинформацию». Исследователи генерировали фейковые твиты и новостные заметки про изменение климата и политику. Вот, что у них получилось.
1) Фейковые твиты
GPT-3 четко улавливает, о чём и в каком ключе нужно писать. Эти правдоподобные твиты нейросеть сгенерировала на тему изменения климата:
![](https://habrastorage.org/getpro/habr/upload_files/a41/bfb/94f/a41bfb94f31be14052d718d7ebe62c2d.png)
GPT-3 может сгенерировать человекоподобное высказывание под любую заданную аудиторию. Нейросеть способна агитировать христиан или евреев голосовать за республиканцев или за демократов:
![За республиканцев За республиканцев](https://habrastorage.org/getpro/habr/upload_files/724/c9c/c99/724c9cc99978a48d1d70c8b998d5e502.png)
![За демократов За демократов](https://habrastorage.org/getpro/habr/upload_files/35a/0ca/97e/35a0ca97e3f836acda9db55f7b867469.png)
Фейковые твиты, публикуемые от лица человека, формируют общественное сознание, на которое опираются другие пользователи. Это значит, что если у злоумышленника в руках окажется GPT-3, он сможет управлять повесткой и влиять на мнение людей.
2) Дезинформация в новостях
Одни и те же факты GPT-3 может извратить так, как этого потребует человек. Например, для нейронки не проблема по одному и тому же инфоповоду написать про-трамповскую и анти-трамповскую новостные заметки.
Возьмём статью Associated Press от 6 января 2021 года под заголовком «Трамп не призвал сторонников разойтись после штурма Капитолия». Новость одна, но написать о ней можно по-разному.
Если мы хотим, чтобы читатель был за Трампа, GPT-3 перепишет эту заметку так:
![](https://habrastorage.org/getpro/habr/upload_files/b54/6eb/73b/b546eb73bcd6b742b7bee4ef4b7f5a5b.png)
А если нам нужно настроить читателя против Трампа, просим GPT-3 создать анти-трамповскую версию:
![](https://habrastorage.org/getpro/habr/upload_files/a99/de6/b3b/a99de6b3b9ad3f2a25954c410f7072b3.png)
С помощью GPT-3 можно организовать масштабную кампанию по распространению дезинформации — это очень опасная штука в нашем информационном мире.
«Зелёный» водород
Водород называют топливом ближайшего будущего — он уже обгоняет другие источники энергии, в том числе бензин. Особую ставку учёные делают на водородные двигатели — они гораздо экологичнее, обладают высоким КПД, меньше шумят и без запаха.
Сейчас популярность набирает «зелёный» водород — это новый, более экологичный вид производства водорода, который никак не вредит окружающей среде.
Зачем производить зелёный водород
Водород — экологичное топливо, но его производство всё ещё загрязняет окружающую среду. В 78% случаев берут так называемый «серый» водород, который получают из нефти. При «сером» производстве выделяются парниковые газы, которые вредят окружающей среде и вызывают глобальное потепление.
![](https://habrastorage.org/getpro/habr/upload_files/bc7/ce1/b48/bc7ce1b4822420a73539b6ba8e53fc53.png)
«Зелёный» водород — более экологичный. Здесь используется возобновляемая энергия ветра и солнца, которая не вредит окружающей среде. Такой водород получают из воды, пропуская через неё электрический ток — это называется электролизом. Молекула воды H_2 O под действием тока распадается на кислород O_2 и водород H_2, который затем используют в промышленности и водородных двигателях.
![Как производят «зелёный» водород Как производят «зелёный» водород](https://habrastorage.org/getpro/habr/upload_files/e88/c51/81f/e88c5181faee9161e56db03d8a83f2dd.png)
Когда «зелёный» водород полностью заменит всё топливо, количество выбросов парниковых газов в атмосферу значительно сократится. Это позволит ограничить рост температуры до 1,5℃, то есть замедлить глобальное потепление. Если же человечество продолжит использовать «грязные» источники энергии, а температура может вырасти на 4℃ к концу века, по мнению учёных из Оксфордского и Утрехтского университетов.
Как будут использовать зеленый водород
1) В Европе
Большинство европейских стран к 2050 году планируют заменить практически все автомобили, включая грузовики и автобусы, на машины с нулевым уровнем выбросов. Для этого государства хотят построить 5000 новых водородных заправок.
По плану — уже через 10 лет в Европе должно быть не менее 30 миллионов автомобилей на водороде. Благодаря этому к 2050 году выбросы углекислого газа сократятся в 75 раз.
![](https://habrastorage.org/getpro/habr/upload_files/2b2/b77/941/2b2b77941161ea94ce9076b981d13de4.png)
Германия уже активно переходит на «зелёный» водород. 10 июня 2020 года немецкие власти приняли «Национальную водородную стратегию»: они хотят сократить выброс парниковых газов в атмосферу. Для этого чистым водородом будут заменять топливо для автомобилей, поездов, самолетов и вертолётов. На него также «пересадят» чёрную металлургию и нефтехимию.
Европейские автоконцерны тоже в деле, они активно разрабатывают водородные модели, некоторые из которых уже выпустили в продажу: Toyota Mirai, Honda Clarity, Hyundai Nexo, BMW X5 i Hydrogen Next.
![«Водородомобиль» Toyota Mirai уже можно купить. «Водородомобиль» Toyota Mirai уже можно купить.](https://habrastorage.org/getpro/habr/upload_files/07b/4bf/52c/07b4bf52c683bf23cd6b719a05bcff99.png)
2) В России
Производить «зелёный» водород в России начнут в 2024 году. Первые пилотные водородные установки запустят «Газпром» и «Росатом».
А вот с отечественным водородными автомобилями всё туманно. В 2019 году «АвтоВАЗ» объявил о создании водородного автомобиля на базе Lada Kalina, но с тех пор о проекте информации нет. К 2023 году также хотят создать первые в России водородные автобусы, правда, никакой конкретики по этому проекту пока тоже нет.
Нейросетевой алгоритм определения 3D-структуры белка AlphaFold
Лондонская компания DeepMind летом 2021 опубликовала нейронную сеть AlphaFold 2, которая с высокой точностью рассчитывает трёхмерную форму белковых молекул по их химическому составу — эту задачу не могли решить 50 лет.
Зачем определять 3D-структуру белка
Мы всё ещё сталкиваемся с неизлечимыми заболеваниями: болезнь Альцгеймера, Паркинсона, Хантингтона, деменция, рак. Во многом эти заболевания связаны с неправильным сворачиванием белка в организме человека.
Белок может свернуться не полностью — тогда молекулы сцепятся друг с другом и образуют нерастворимые волокна. Когда человеческий мозг усеивается бляшками из таких волокон, возникают проблемы: например, может пострадать память — тогда развивается болезнь Альцгеймера. |
Учёные не до конца понимают, как возникают нарушения в работе белков, и поэтому не могут их исправить. Для этого нужно иметь представление о том, как выглядит здоровая 3D-структура белка после сворачивания.
Любая молекула белка состоит из аминокислот, соединённых в цепочку. Каждая такая цепочка сворачивается в более сложную трёхмерную молекулу — этот процесс называется сворачиванием или фолдингом белка. От того, как свернётся цепочка, зависят функции этого белка. Например, чтобы создать вакцину от COVID-19, нужно было понять, как белки-антитела борются с коронавирусом, — для этого учёные исследовали их фолдинг. |
![Структура человеческого белка интерлейкина-12, вычисленная с помощью AlphaFold 2 Структура человеческого белка интерлейкина-12, вычисленная с помощью AlphaFold 2](https://habrastorage.org/getpro/habr/upload_files/db0/110/832/db0110832b0000a2e17fba6b17a1a312.png)
Чем точнее учёные осведомлены о 3D-строении конкретного белка после фолдинга, тем больше понимают, как он работает и что делать в случае ошибки при сворачивании. Это очень ценное знание, которое позволит производить новые вакцины и лекарства от неизлечимых болезней.
«Возможность очень точно и быстро определять трехмерную структуру белков приведет к настоящей революции в понимании того, как работают все живые организмы» © Джанет Торнтон, Профессор Европейского института биоинформатики
Задачу «сворачивания белка» биологи пытаются решить 50 лет. Проблема в том, что фолдинг зависит от слишком многих факторов, а белок может свернуться и один раз, и два, и три.
До появления AlphaFold 2 у науки не было точного инструмента, с помощью которого можно рассчитать, как определённый белок должен свернуться. Для этого использовали дорогие и трудоёмкие методы, которые не всегда работали.
Теперь благодаря AlphaFold 2 учёные могут увидеть правильную 3D-структуру любого белка быстро, дёшево и с точностью более 90%.
![3D-структура двух белков. Синим показано то, как модель рассчитал AlphaFold, а зелёным — то, как модель определили в лаборатории с помощью более точных, но очень трудоёмких методов 3D-структура двух белков. Синим показано то, как модель рассчитал AlphaFold, а зелёным — то, как модель определили в лаборатории с помощью более точных, но очень трудоёмких методов](https://habrastorage.org/getpro/habr/upload_files/248/21f/30f/24821f30f2edd0fcf8dc459a5376a0ed.gif)
Алгоритм AlphaFold 2 занял первое место в 2020 году на соревнованиях по определению трёхмерной структуры белка. Нейросеть рассчитывает 3D-строение в среднем с точностью 92,4%. Результата выше 90% биологи не могли добиться 50 лет.
![В соревнованиях 2018 года победила первая версия AlphaFold — она показала точность чуть ниже 60% и уже тогда стала прорывной технологией В соревнованиях 2018 года победила первая версия AlphaFold — она показала точность чуть ниже 60% и уже тогда стала прорывной технологией](https://habrastorage.org/getpro/habr/upload_files/502/7ee/ea8/5027eeea868135f5434b6558ec11b463.png)
AlphaFold 2 называют «ошеломляющим прорывом», который произошёл «на десятилетия раньше, чем предсказывали многие в этой области».
Как будут использовать AlphaFold 2
С помощью нейросети биологи уже определили трёхмерную структуру 20 тысяч белков, которые вырабатывают клетки человека. У DeepMind есть целая онлайн-библиотека, в которой собраны результаты работы AlphaFold 2.
В библиотеке AlphaFold любой желающий может по названию найти 3D-структуру определённого белка — это очень полезно для фармакологии и медицины. До этого узнать трёхмерную структуру белка не всегда могли даже в крупнейших корпорациях и исследовательских институтах.
В ближайшие пару месяцев разработчики нейросети обещают определить структуру 100 миллионов белков, которые вырабатывают все живые организмы, известные науке. Благодаря этим данным человечество сможет лучше понять, как именно возникают нарушения в работе разных клеточных белков, и придумает, как это исправить.
Новые технологии, которые появляются сегодня, определяют наше будущее. Поэтому если мы хотим понимать, как будем жить через несколько десятков лет, необходимо следить за технологическими инновациями.