Научная работа – в её современном виде – стала одним из изобретений, позволивших прогрессу развиваться. До того, как её форму разработали в XVII веке, результаты работ передавались частным образом в письмах, эфемерным образом в лекциях, или все скопом – в книгах. Не существовало мест для публичного обсуждения постепенных продвижений. Оставляя на своих страницах место для описания отдельных экспериментов или небольших технических продвижений, журналы творили хаос из разраставшейся науки. С той поры учёные стали походить на социальных насекомых: они постоянно двигали прогресс вперёд, с жужжанием, подобным стае пчёл.
Самые ранние из работ в каком-то смысле были более читаемыми, чем сегодняшние. Они были менее специализированными, более прямолинейными, короткими и не такими формальными. Матанализ изобрели лишь незадолго до этого. Весь набор данных по исследуемой теме мог уместиться в табличке на одной странице. Все расчёты, связанные с результатами, проводились от руки, и их можно было так же проверить.
Чем сложнее становится наука, тем тяжелее ей сообщать о своих результатах. Сегодняшние работы получаются длиннее, чем когда бы то ни было, и полны жаргона и разных символических обозначений. Они зависят от набора компьютерных программ, выдающих данные, подчищающих данные, строящих графики, обрабатывающих статистические модели. А эти программы иногда так небрежно написаны и так сконцентрированы на результате, что это тоже вносит свою лепту в кризис повторяемости – то есть, работа не справляется со своей основной задачей: сообщить о сделанном открытии достаточно просто, чтобы кто-то ещё мог тоже его сделать.
Возможно, стоит винить в этом привычку к бумаге, на которой печатают работы. Научные методы эволюционируют со скоростью софта; более всего от физиков, биологов, химиков, геологов, и даже антропологов и психологов требуется умение владеть языками программирования и пакетами "даталогических" программ. И при этом основной способ донесения научных результатов не менялся за последние 400 лет. Конечно, работы можно выкладывать в интернет – но это всё ещё текст и изображения, расположенные на странице.
Что бы получилось, если бы мы сегодня разрабатывали стандарт научной работы с нуля? Недавно я беседовал с Бретом Виктором, исследователем, работавшим в Apple над ранними прототипами пользовательского интерфейса для iPad, а сейчас руководящим собственной лабораторией в Окланде, Калифорния, изучающей будущее вычислительных систем. Виктор давно считает, что учёные до сих пор не пользуются всеми преимуществами компьютера. «Ситуация не сильно отличается от печатного станка и эволюции книг», — сказал он. После Гуттенберга печатные станки в основном использовались для воспроизведения каллиграфии библий. Почти 100 лет технических и концептуальных улучшений потребовалось для того, чтобы изобрести современную книгу. «Был целый период, во время которого у людей была новая технология печати, а они использовали её для воспроизведения старых носителей».
Виктор показал, чего можно достичь, когда он переделывал журнальную статью, написанную Дунакном Уоттсом и Стивеном Строгацем, «Коллективная динамика сетей малых миров». Он выбрал её потому, что это одна из самых часто цитируемых работ во всей науке, и потому что это модель чёткого представления информации. (Строгац более всего известен, как автор колонки «Элементы математики» в газете The New York Times).
Работа Уоттса-Строгаца описывала ключевые открытия так, как и большинство других – текстом, картинками, математическими символами. И, как у большинства работ, эти открытия очень сложно переварить, несмотря на понятное описание. Самыми сложными местами работы были те, что описывали процедуры или алгоритмы, поскольку читателю приходилось брать на себя «роль компьютера», как сказал Виктор – пытаться поддерживать в уме картину происходящего, проходя по шагам алгоритма.
После переработки Виктора пояснительный текст стал перемежаться интерактивными диаграммами, иллюстрировавшими каждый шаг. В этой версии можно было проследить работу алгоритма на примере. Можно было даже контролировать его.
Строгац восхитился вариантом Виктора. Позднее он сказал мне, что ему очень жаль, что в математике уже не одну сотню лет традицией является писать работы настолько строго и формально, насколько это возможно, часто даже опуская те самые визуальные подсказки, которые математики используют для совершения своих открытий.
Стогац изучает нелинейную динамику и хаос, системы, склонные к синхронизации или самоорганизации: мигание светлячков, тиканье метрономов, электрические импульсы клеток сердца. Ключ в том, что такие системы работают циклично, и Строгац визуализирует это через точки, идущие по кругу: когда точка возвращаетсяы на место старта – это моргание светлячка или срабатывание клетки сердца. «Почти 25 лет я делал небольшие компьютерные анимации точек, бегущих по кругу, с цветами, обозначавшими их частоту, — сказал он. – Красные – медленные ребята, фиолетовые – быстрые… На моём компьютере кружатся все эти точки, я этим весь день занимаюсь, — сказал он. Я гораздо лучше улавливаю закономерности в бегущих по экрану цветных точках, чем в 500 временных рядах. Подобным образом я мало что увижу, потому что на самом деле это выглядит совсем не так. Я изучаю динамические процессы, поэтому их представление тоже должно быть динамичным».
Программы – носитель динамический, а бумага – нет. В этом смысле кажется странным, что такие исследования, как у Строгаца, посвящённые динамическим системам, так часто распространяются на бумаге, не имея преимуществ в виде кружащихся точек – поскольку именно такие точки и помогли ему увидеть то, что он увидел, и могут помочь увидеть это и читателю.
В этом и состоит вся проблема научного общения: сегодня научные результаты очень часто находятся при помощи компьютеров. Идеи сложные, динамичные, их нелегко охватить внутренним взором. И при этом самым популярным инструментом для распространения результатов остаётся PDF – буквально симуляция листка бумаги. Вероятно, мы можем придумать что-то получше.
Стивен Вольфрам опубликовал свою первую научную работу в возрасте 15 лет. К концу обучения в институте он опубликовал уже 10 работ, а к 20 годам, в 1980-м, он уже закончил докторскую по физике частиц в Калифорнийском технологическом институте. Его супероружием было активное использование компьютера в те времена, когда самые серьёзные учёные считали вычислительную работу ниже своего достоинства. «К тому моменту, вероятно, я использовал компьютерную алгебру больше всех в мире, — рассказал он в интервью. Это было очень удобно, я так просто мог провести все расчёты на компьютере. Я развлекался, размещая особенно витиеватые формулы в моих научных работах».
С ростом амбициозности его исследований он всё чаще доводил существовавшее ПО до пределов возможностей. Для одного проекта ему приходилось использовать по полудюжине различных программных инструментов. «Я много времени проводил, связывая всё это вместе, — сказал он. – И я решил, что должен попробовать создать единую систему, которая бы делала всё, что мне надо – такую, которая могла бы расти вечно». И вместо продолжения академической деятельности, Вольфрам решил создать компанию Wolfram Research, и сделать идеальную вычислительную среду для учёных. Заголовок в Forbes от 18 апреля 1988 года гласил: «Physics Whiz Goes Into Biz» [Учёный-волшебник ударился в бизнес].
В центре системы Mathematica, как назвала компания свой главный продукт, находится «блокнот», в котором вы пишете команды на одной строке и видите результаты на другой. Напишите «1/6 + 2/5» и он выдаст вам «17/30». Попросите его перемножить многочлены, и он подчинится. Mathematica способна на матанализ, теорию чисел, геометрию, алгебру. У неё есть функции для подсчёта химических реакций и фильтрования генетических данных. В её базе данных есть все картины Рембрандта, и она может выдать вам диаграмму разброса его палитры по времени. В неё встроены модели орбитальной механики, и она сможет подсчитать, как далеко F/A-18 Hornet сможет спланировать, если его двигатели выключатся на высоте 10 000 км. Блокнот в Mathematica – не просто запись подсчётов пользователя, а расшифровка его беседы с всезнающим оракулом. Вольфрам называет тщательно написанные блокноты «вычислительными эссе».
Интерфейс блокнота был детищем Теодора Грэя, вдохновлённого работой со старым редактором кода для Apple. Большинство сред программирования позволяют вам выполнять код построчно или же сразу и целиком. Редактор Apple позволял вам выделить любую часть кода и выполнить только её. Грэй перенёс эти основные концепции в Mathematica, а помогал улучшать дизайн ему не кто иной, как сам Стив Джобс. Блокнот разработан для превращения научного программирования в интерактивное упражнение, в котором отдельные команды можно подправлять и перезапускать десятки и сотни раз, обучаясь на результатах вычислительных экспериментов, что позволяет приходить к более глубокому пониманию данных.
Особенно хорошо блокнот справляется со своими задачами благодаря способности рисовать графики, изображения и красивые математические формулы, при том, что всё это динамически реагирует на изменения в коде. В Mathematica можно ввести запись голоса, применить сложные математические фильтры к аудиозаписи, и визуализировать итоговую звуковую волную. Перетаскивая мышкой параметры, можно изменять её вид и смотреть, какие фильтры подходят лучше всего, играясь с ними. Возможность пакета легко обрабатывать так много различных вычислительных задач в одном простом интерфейсе является результатом «буквально человеко-веков работы», как говорит Грэй.
Видение, стоящее в основе работы, многократно повторено Вольфрамом в его лекциях, записях в блоге, презентациях и пресс-релизах. Не просто сделать хороший софт, но создать точку перегиба в самом занятии наукой. В середине XVII века Готфрид Лейбниц разработал систему записей интегралов и производных (знакомые ∫ и dx/dt), сделавшую сложные идеи матанализа механическими. Лейбниц считал, что схожие символы в более широком применении могли создать «алгебру мыслей». С тех пор логики и лингвисты мечтают об универсальном языке, который сможет устранить двусмысленность и превратить решение сложных задач в подобие матанализа.
Карьера Вольфрама заключается в постоянных попытках вобрать всё знание мира в пакет Mathematica, а позже — сделать его доступным через Wolfram Alpha, «движок вычислительных знаний» компании, стоящий за многими возможностями отвечать на вопросы у таких электронных помощников, как Siri и Alexa. Это попытка Вольфрама создать Interlingua, язык программирования, одинаково понятный и людям, и машинам – алгебру всего.
Задача характерно амбициозная. В 1990-х Вольфрам иногда поддразнивал общественность комментариями о том, что в процессе создания своей компании он работает над революционным научным проектом. Ожидание нарастало. Наконец, проект прибыл: огромная книга, толщиной со шлакоблок, и почти таким же весом, с вековечным названием: "Наука нового типа".
Это оказалось детальным исследованием, проведённым при помощи блокнотов Mathematica, удивительно сложных закономерностей, создаваемых простейшими вычислительными процессами – клеточными автоматами. Исследование проводилось как просто ради исследования, так и для того, чтобы понять, как простые правила способны порождать сложные явления природы – например, торнадо или рисунок раковины моллюска. Эти исследования, опубликованные Вольфрамом без независимой редактуры, сопровождались постоянными напоминаниями об их важности.
Чем больше вы сталкиваетесь с Вольфрамом, тем больше это походит на его стиль. В статье о нём от 1988 года в Forbes попытались докопаться до корней этого явления: «Как сказал Гарри Вульф, бывший директор престижного Института передовых исследований (в Принстоне), где Вольфрам в 23 года был одним из самых молодых старших научных сотрудников, — он обладал „культивируемыми трудностями в характере, поддерживаемыми ощущением одиночества, изоляции и уникальности“.
Когда один из ассистентов Вольфрама объявил о значительном математическом открытии на конференции, служившем ключевой частью „Науки нового типа“, Вольфрам пригрозил засудить его в случае публикации работу. „Ни в одной серьёзной исследовательской группе младшему исследователю не позволят говорить о том, чем занимается старший“, — сказал он в то время. Массивную книгу Вольфрама другие учёные критиковали за то, что она была основана на других работах, но при этом их не упоминала. „Он намекает на то, что является автором основных идей, бывших центральной идеей теории сложных систем последние 20 лет“, — один из исследователей рассказал журналу Times Higher Education в 2002.
Самовосхваление Вольфрама кажется тем удивительнее, поскольку оно совершенно необязательно. Его достижения говорят сами за себя – если бы он позволил бы им это делать. Mathematica достигла успеха практически сразу после запуска. Пользователи давно ждали такой продукт; в университетах программа стала настолько же распространённой, как Microsoft Word. Вольфрам же использовал стабильный доход для найма дополнительных инженеров и экспертов по разным отраслям, скармливая всё больше информации своей ненасытной программе. Сегодня Mathematica знает об анатомии ступни и законах физики, о музыке, систематике хвойных деревьев и основных сражениях Первой Мировой войны. Сам Вольфрам помогал обучать свою программу архаичной греческой записи цифр.
Все эти знания „вычисляемы“. Если хотите, можете обозначить через x местоположение битвы на Сомме, а через y – ежедневное выпадение осадков в 1916 в радиусе 50 км от этого места, и Mathematica вычислит, случалось ли больше смертей во время битв Первой Мировой в то время, когда шёл дождь.
»Я заметил интересную тенденцию, — писал Вольфрам в посте в блоге. – Выберем любую область X, от археологии до зоологии. Тогда с ней будет связана «вычислительная X», которая либо уже существует, либо только нарождается. И это считается будущим данной области". Вольфрам утверждает, что чем лучше специалисты в этих областях будут овладевать вычислительными методами, тем больше будет расширяться область открываемого. Блокнот в Mathematica может стать ускорителем науки, поскольку он может породить новый стиль мышления. «Интереснее всего наблюдать, — говорит он, — как происходит такой же переход, что имел место в XVII веке, когда люди получили возможность читать математические записи. Это становится формой общения, обладающей очень важной особенностью – возможностью запуска».
Идея в том, что «научная работа» такого рода сможет обладать таким же динамизмом, который хотели иметь Строгац и Виктор – интерактивные диаграммы, перемежающиеся текстом – с дополнительным преимуществом, благодаря которому весь код, генерирующий эти диаграммы, и все данные, будут доступны читателю, который сможет их рассмотреть и поиграться с ними. «Честно говоря, когда вы пишете что-то такое простое и понятное на языке Wolfram в блокноте, там не остаётся места для обмана. Есть то, что есть, и работает оно так, как работает. Нет возможности подогнать результат», — говорит Вольфрам.
Написать работу в блокноте Mathematica – значит, раскрыть и результаты и методы вашей работы; и научная работа, и всё, что вы сделали, чтобы её написать. А в результате читателям будет проще не только понять её, но и воспроизвести (или не воспроизвести). Когда миллионы учёных по всему миру делают свой вклад в науку постепенно, единственным способом превратить всю эту работу в нечто важное будет дать возможность другим надёжно строить что-то на основе этих вкладов. «Вот чего могут добиться научные работы, сделанные в виде вычислительных эссе», — сказал Вольфрам.
Вольфрам говорит, что удивлён тем, что вычислительные эссе не набрали популярности. Он вспоминает свою работу с Elsevier, гигантом научных публикаций, в начале 1980-х. «Elsevier наняла меня для консультаций по поводу чего-то вроде „как будет выглядеть будущее научных публикаций“. Это было ещё до появления блокнотов Mathematica, но он толкнул им речь примерно из той же области. „Несколько лет назад я снова беседовал с кем-то из руководства компании. И на той встрече я понял – о боже мой, я же говорил абсолютно то же самое 35 лет назад!“
Я пообщался с Теодором Грэем, ушедшим из Wolfram Research с тем, чтобы стать писателем. Он сказал, что его работа над блокнотом в частности была мотивирована его ощущениями, хорошо сформировавшимися уже к 1990-м, „что, очевидно, всё научное общение и все технические работы, в которых использовались какие-либо данные или математика или моделирование или графики или схемы или что-то вроде того, не нужно публиковать на бумаге. Это было совершенно очевидно уже к 1990“, — сказал он.
»Последние 29 лет с ужасом и удивлением воспринимается тот факт, что за исключением некоторых людей, понявших это, сообщество в целом не приняло такой подход, — сказал он. – Буквально невозможно подсчитать, сколько всего потеряно, сколько времени потрачено впустую, сколько результатов неправильно понято или неверно представлено".
В начале 2001 года Фернандо Перез понял, что находится примерно в том же положении, что и Вольфрам 20 лет назад. Он был аспирантом-физиком, доведшим свои инструменты до пределов их возможностей. Он использовал целый ворох систем, и Mathematica среди них, и, казалось, выполнение каждой задачи требует переключения от одного инструмента к другому. Он вспоминает, что на его столе лежало 6-7 различных книг по программированию. Ему хотелось создать объединённую среду для научных вычислений.
Но вместо того, чтобы начать открывать компанию, он нашёл двоих учёных, немецкого океанографа и аспиранта по информатике из Калтеха, думавших примерно в том же направлении. Они все влюбились в Python, язык программирования общего назначения с открытым исходным кодом, и независимо друг от друга начали создавать для него инструменты, призванные упростить работу с языком для учёных: инструменты, упрощавшие работу с наборами данных и построение графиков, поощрявшие более исследовательские стили программирования.
Перез свёл три проекта в один и взял над ним управление. С самого начала проект IPython (I значило интерактивный) имел открытый код. Программа не просто была бесплатной, любой мог изучить её код и подправить его, сделав свой вклад в общее дело. Это решение было принято намеренно. «Мне был интересен как этический аспект возможности поделиться своей работой с другими, — рассказал мне Перез, сам родом из Колумбии, где получить доступ к коммерческим программам было сложнее, — так и эпистемиологическая мотивация». Он считал, что если науке необходимо быть открытой, то и инструменты, используемые для работы с ней, должны быть открытыми. Коммерческое ПО, чей исходный код по закону нельзя было читать, было «антитезой идее науки», чьё предназначение состоит в том, чтобы открыть чёрный ящик природы.
Поэтому и использовался Python. Базовая версия языка не такая мощная, как Wolfram Language, на котором работает Mathematica. Но если Mathematica черпает свои возможности из работы армии программистов, костяк Python поддерживается массивной библиотекой дополнительных возможностей – по обработке изображений, созданию музыки, построению ИИ, анализу языка, построению графиков – созданных сообществом людей, бесплатно делающих вклад в открытый код. Python стал стандартом де-факто для научных вычислений, поскольку разработчики открытого кода, такие, как Перез, создали для него полезные инструменты; а разработчиков Python притягивал потому, что он был стандартом де-факто для научных вычислений. Сообщества языков программирования, как любая социальная сеть, процветают или умирают благодаря мощности этих петель обратной связи.
Идея интерфейса блокнота для IPython была взята у Mathematica. Перез восхищался тем, как блокноты в Mathematica поощряли исследовательский стиль работы. «Можно было что-то набросать, потому что именно так вы рассуждаете о задаче, так вы её понимаете». Вычислительные блокноты «выдвигают на первый план идею живого повествования. Можно продумать процесс и эффективно использовать компьютер как, если хотите, партнёра по размышлениям и по вычислениям».
Вместо того, чтобы разрабатывать специальное отдельное приложение, не говоря уже о том, чтобы тратить на него человеко-века, команда IPython – к Перезу присоединились Брайан Грейнджер, профессор физики из Калифорнийского политехнического университета в Сан-Луис-Обиспо и Мин Рейган-Келли, кандидат наук из Калифорнийского университета в Беркли, работающий в области вычислительной физики – сделала блокноты в виде простых веб-страниц. Интерфейсу не хватает красоты работ Стива Джобса и их сложности. Но, задействовав веб, IPython получил бесплатные дополнения: каждый раз, когда Google, Apple или случайный программист выпускали новый инструмент для построения графиков, или публиковали улучшенный математический код, это улучшение присоединяли к IPython. «Это всё прекрасно окупилось», — сказал Перез.
Работа, объявлявшая о первом подтверждённом обнаружении гравитационных волн, была опубликована традиционным способом, в виде PDF, но в комплекте с блокнотом IPython. В блокноте можно отследить всю работу, сгенерировавшую все графики для статьи. Каждый желающий может сам запустить код, подправлять его, как хочется, играться с вычислениями, чтобы лучше понять, как они работают. В определённом месте блокнота повествование доходит до той части, в которой сигнал, сгенерированный гравитационными волнами, превращается в звук – и его можно проиграть в браузере, услышать то, что первыми услышали учёные, бульк от двух сталкивающихся чёрных дыр.
«Думаю, научное сообщество приняло этот инструмент, и он уже считается универсальным, — говорит Теодор Грэй о группе Переза. – А такого принятия Mathematica пока ещё не достигла». На Github в публичном доступе выложено уже 1,3 млн таких блокнотов. Их используют в Google, Bloomberg и NASA; музыканты, учителя и исследователи ИИ; и «почти во всех странах Земли».
Каждый раз IPython выбирал путь развития, включавший в себя что-то ещё, и в итоге его уже не называют IPython. Проект в 2014-м переименовали в Jupyter, чтобы подчеркнуть, что он работает уже не только с Python. Jupyter notebook похож на блокнот Mathematica, только подходит для любого языка программирования. Можно сделать блокнот для Python, или C, или R, или Ruby, или JavaScript, или Julia. Любой может создать поддержку Jupyter для своего языка программирования. Сегодня его поддерживает уже более 100 языков.
Теодор Грэй, разрабатывавший интерфейс для оригинального блокнота Mathematica, сказал, что он однажды ради эксперимента попробовал сделать его поддержку для других языков программирования. «Из этого ничего не вышло, — сказал он мне. – Компании было не интересно это поддерживать. А если вам нужно поддерживать множество языков, вы не можете делать это так же тщательно».
Эссе Эрика Рэймонда от 1997 года под названием "Собор и Базар" в некотором смысле стало основным документом современного движения открытого кода. Оно отвергает мнение о том, что сложное ПО необходимо строить, как собор, «тщательно изготовленный отдельными волшебниками или небольшими командами магов, работающих в изоляции». Опыт Рэймонда как одного из управляющих разработкой ядра Linux научил его тому, что «огромный шумный базар с различными целями и подходами», определяющей проекты с исходным кодом, представляет собой преимущество. «То, что такой базарный стиль работает, и работает хорошо, явилось шоком», — писал он. Своим эссе он пытался пояснить, почему «мир Linux не только не разлетелся от непонимания, но, кажется, следует от одного сильного достижения до другого со скоростью, которую с трудом могут представить себе строители собора».
Mathematica была в разработке задолго до опыта Рэймонда с Linux, и разрабатывается с тех пор уже много лет. Это квинтэссенция собора, и его строители всё ещё скептически относятся к базару. «Там всегда есть место хаосу, — говорит Грэй по поводу систем с открытым кодом. – Количество движущихся частей огромно, и разные части контролируют разные группы. У вас ни за что не получится собрать их вместе в интегрированную систему так же, как это возможно в едином коммерческом продукте, с единственным, так сказать, маньяком в его середине».
Маньяком, естественно, выступает Стивен Вольфрам. Грэй отметил, что при Муссолини поезда ходили по расписанию. «Аналогия плохая», — сказал он, но всё же «я за наличие маньяка в середине». Блокнот Mathematica более связно разработанный, более отполированный продукт – по большей части потому, что каждое решение прошло через разум одного упрямого гения. «Я видел этих ребят из Jupyter, — сказал мне Вольфрам, — и они в среднем находятся на уровне того, что было у нас в 90-х». Он говорит, что они срезают углы. «А мы реально пытаемся сделать всё правильно».
Но научному сообществу тяжело рекламировать коммерческое ПО. Хотя Wolfram Research годами раздавал бесплатную программу для просмотра блокнота, и хотя большинство крупных университетов обладают лицензией, позволяющей их студентам и преподавателям свободно использовать Mathematica, возможно, будет слишком просить издателей отказаться от открытого формата PDF в пользу коммерческого продукта. «Пока что ситуация такая: если вы попытаетесь отправить в журнал блокнот из Mathematica, они будут жаловаться: у нас нет Mathematica, это очень дорогая программа, дайте нам что-то более стандартное».
Не помогает и тот факт, что Вольфрам – как человек, так и компания – назойливо расхваливает превосходство продукта, его необходимость, так, что даже Грэй сравнивает его с приверженцами кроссфита, которых невозможно заткнуть. Это ведь тот же самый Стивен Вольфрам, который назвал свою книгу, посвящённую своей работе над клеточными автоматами, «Наука нового типа». В его посте по поводу вычислительной науки он пишет: «В центре вычислительных эссе лежит идея выражения вычислительных мыслей при помощи Wolfram Language».
Возможно, это и так – возможно, вычислительные блокноты смогут прижиться, только если их будет поддерживать единый сверхъязык, или компания с глубокими карманами и существенно заинтересованная в их работе. Но, возможно, что верным будет противоположное. Интегрированные усилия, пусть и более хаотичные, могут оказаться и более надёжным, а также единственным способом завоевать доверие научного сообщества.
Вольфрам мало что замечает за пределами Wolfram, и, возможно, по этой причине блокнот Mathematica остаётся довольно непрозрачным, а его противник – пусть и вторичный и упрощённый, но открытый – судя по всему, завоёвывает мир.
Пройдёт какое-то время до того, как вычислительные блокноты заменят PDF в научных журналах, поскольку это будет означать смену побудительной структуры самой науки. До тех пор, пока журналы не начнут требовать у учёных присылать им блокноты, и до тех пор, пока свободная раздача своей работы и данных не станут способом завоевать престиж или получить финансирование, люди, скорее всего, будут делать всё так, как и раньше.
Я беседовал с нейробиологом, ставшим программистом и вносившим свой вклад в Jupyter, и он рассказал мне, что профессор, заведовавший лабораторией, где он раньше работал, изначально был электрофизиологом – измерял активность нейронов через имплантированные электроды. «Получение таких данных — настолько затратный и дорогой проект», сказал он, что ими никто никогда не будет делиться. «Вы собираете один срез данных и можете перерабатывать их до конца карьеры».
«На данном этапе ни один разумный человек не будет спорить с тем, что практика научных исследований испытывает сдвиг», — писал Перез, создатель Jupyter, в посте в блоге от 2013. Наука всё больше использует вычисления, и навыки, необходимые для того, чтобы стать хорошим учёным, становятся всё более привлекательными в индустрии. Университеты теряют лучших людей, организовывающих свои стартапы, а также уходящих в Google и Microsoft. «На моих глазах множество талантливых коллег за последнее десятилетие покидали академический мир, отчаявшись, — писал он, — и не могу припомнить ни одного из них, кто не был бы много лет спустя доволен этим».
Перез рассказывал мне истории об учёных, пожертвовавших академическими карьерами ради разработки ПО, поскольку в их области исследования разработку ПО ни в грош не ставили. Создатель matplotlib, вероятно, наиболее часто используемого инструмента для построения графиков в научных работах, был постдоком по нейробиологии, но ему пришлось покинуть академический мир ради индустрии. То же случилось с создателем NumPy, популярного сейчас инструмента числовых расчётов. Перез сказал: «Я получал недвусмысленные комментарии от множества коллег и старших товарищей, которые говорили: Прекращайте этим заниматься, вы тратите свою карьеру и свой талант». Они, не смущаясь, советовали мне «возвращаться к физике, к математике, к написанию статей».
Но те, кто остаются, достигают прогресса. Перез недавно получил место в статистическом департаменте в Беркли. Через день после нашей беседы он должен был обучать студентов старших курсов науке о данных, по программе, построенной полностью на блокнотах Python и Jupyter. «Версия этого курса для младшекурсников привлекла, по-моему, 1200 студентов, — сказал он. – Это был самый быстро растущий курс в истории Калифорнийского университета в Беркли. И всё это на основе инструментов с открытым кодом».
Те, кто стремятся улучшить практику научных занятий, мечтают и об улучшении их результатов. Запись Лейбница, позволившая проще записывать матанализ, расширила пространство мыслимого. Величайшие научные задачи сегодняшнего дня очень часто являются вычислительными загадками: как интегрировать миллиарды спаренных оснований в данных по геномам, и в 10 раз больше данных по протеомике, и исторические данные по пациентам, и результаты фармакологических исследований в связную базу того, как кто-то заболел и что нужно сделать, чтобы ему помочь? Как на практике подступиться к бесконечному потоку новых данных по температуре и осадкам, океанографии, вулканической и сейсмической активности? Как создавать и понимать карты нейронных связей думающего мозга? Если снабдить учёных вычислительными блокнотами или какими-то более совершенными их версиями, это, возможно, поможет поднять их разум до уровня проблем, сегодня недоступных.
В какой-то момент Перез рассказал мне, что проект Jupyter чествовал Галилея — возможно, первого учёного в современном смысле. Логотип Jupyter – абстрактная версия оригинальных рисунков Галилея, изображающих луны Юпитера. «Галилею некуда было пойти, чтобы купить телескоп, — сказал Перез. – Ему пришлось сделать свой собственный».
Самые ранние из работ в каком-то смысле были более читаемыми, чем сегодняшние. Они были менее специализированными, более прямолинейными, короткими и не такими формальными. Матанализ изобрели лишь незадолго до этого. Весь набор данных по исследуемой теме мог уместиться в табличке на одной странице. Все расчёты, связанные с результатами, проводились от руки, и их можно было так же проверить.
Чем сложнее становится наука, тем тяжелее ей сообщать о своих результатах. Сегодняшние работы получаются длиннее, чем когда бы то ни было, и полны жаргона и разных символических обозначений. Они зависят от набора компьютерных программ, выдающих данные, подчищающих данные, строящих графики, обрабатывающих статистические модели. А эти программы иногда так небрежно написаны и так сконцентрированы на результате, что это тоже вносит свою лепту в кризис повторяемости – то есть, работа не справляется со своей основной задачей: сообщить о сделанном открытии достаточно просто, чтобы кто-то ещё мог тоже его сделать.
Возможно, стоит винить в этом привычку к бумаге, на которой печатают работы. Научные методы эволюционируют со скоростью софта; более всего от физиков, биологов, химиков, геологов, и даже антропологов и психологов требуется умение владеть языками программирования и пакетами "даталогических" программ. И при этом основной способ донесения научных результатов не менялся за последние 400 лет. Конечно, работы можно выкладывать в интернет – но это всё ещё текст и изображения, расположенные на странице.
Что бы получилось, если бы мы сегодня разрабатывали стандарт научной работы с нуля? Недавно я беседовал с Бретом Виктором, исследователем, работавшим в Apple над ранними прототипами пользовательского интерфейса для iPad, а сейчас руководящим собственной лабораторией в Окланде, Калифорния, изучающей будущее вычислительных систем. Виктор давно считает, что учёные до сих пор не пользуются всеми преимуществами компьютера. «Ситуация не сильно отличается от печатного станка и эволюции книг», — сказал он. После Гуттенберга печатные станки в основном использовались для воспроизведения каллиграфии библий. Почти 100 лет технических и концептуальных улучшений потребовалось для того, чтобы изобрести современную книгу. «Был целый период, во время которого у людей была новая технология печати, а они использовали её для воспроизведения старых носителей».
Виктор показал, чего можно достичь, когда он переделывал журнальную статью, написанную Дунакном Уоттсом и Стивеном Строгацем, «Коллективная динамика сетей малых миров». Он выбрал её потому, что это одна из самых часто цитируемых работ во всей науке, и потому что это модель чёткого представления информации. (Строгац более всего известен, как автор колонки «Элементы математики» в газете The New York Times).
Работа Уоттса-Строгаца описывала ключевые открытия так, как и большинство других – текстом, картинками, математическими символами. И, как у большинства работ, эти открытия очень сложно переварить, несмотря на понятное описание. Самыми сложными местами работы были те, что описывали процедуры или алгоритмы, поскольку читателю приходилось брать на себя «роль компьютера», как сказал Виктор – пытаться поддерживать в уме картину происходящего, проходя по шагам алгоритма.
После переработки Виктора пояснительный текст стал перемежаться интерактивными диаграммами, иллюстрировавшими каждый шаг. В этой версии можно было проследить работу алгоритма на примере. Можно было даже контролировать его.
Строгац восхитился вариантом Виктора. Позднее он сказал мне, что ему очень жаль, что в математике уже не одну сотню лет традицией является писать работы настолько строго и формально, насколько это возможно, часто даже опуская те самые визуальные подсказки, которые математики используют для совершения своих открытий.
Стогац изучает нелинейную динамику и хаос, системы, склонные к синхронизации или самоорганизации: мигание светлячков, тиканье метрономов, электрические импульсы клеток сердца. Ключ в том, что такие системы работают циклично, и Строгац визуализирует это через точки, идущие по кругу: когда точка возвращаетсяы на место старта – это моргание светлячка или срабатывание клетки сердца. «Почти 25 лет я делал небольшие компьютерные анимации точек, бегущих по кругу, с цветами, обозначавшими их частоту, — сказал он. – Красные – медленные ребята, фиолетовые – быстрые… На моём компьютере кружатся все эти точки, я этим весь день занимаюсь, — сказал он. Я гораздо лучше улавливаю закономерности в бегущих по экрану цветных точках, чем в 500 временных рядах. Подобным образом я мало что увижу, потому что на самом деле это выглядит совсем не так. Я изучаю динамические процессы, поэтому их представление тоже должно быть динамичным».
Программы – носитель динамический, а бумага – нет. В этом смысле кажется странным, что такие исследования, как у Строгаца, посвящённые динамическим системам, так часто распространяются на бумаге, не имея преимуществ в виде кружащихся точек – поскольку именно такие точки и помогли ему увидеть то, что он увидел, и могут помочь увидеть это и читателю.
В этом и состоит вся проблема научного общения: сегодня научные результаты очень часто находятся при помощи компьютеров. Идеи сложные, динамичные, их нелегко охватить внутренним взором. И при этом самым популярным инструментом для распространения результатов остаётся PDF – буквально симуляция листка бумаги. Вероятно, мы можем придумать что-то получше.
Стивен Вольфрам опубликовал свою первую научную работу в возрасте 15 лет. К концу обучения в институте он опубликовал уже 10 работ, а к 20 годам, в 1980-м, он уже закончил докторскую по физике частиц в Калифорнийском технологическом институте. Его супероружием было активное использование компьютера в те времена, когда самые серьёзные учёные считали вычислительную работу ниже своего достоинства. «К тому моменту, вероятно, я использовал компьютерную алгебру больше всех в мире, — рассказал он в интервью. Это было очень удобно, я так просто мог провести все расчёты на компьютере. Я развлекался, размещая особенно витиеватые формулы в моих научных работах».
С ростом амбициозности его исследований он всё чаще доводил существовавшее ПО до пределов возможностей. Для одного проекта ему приходилось использовать по полудюжине различных программных инструментов. «Я много времени проводил, связывая всё это вместе, — сказал он. – И я решил, что должен попробовать создать единую систему, которая бы делала всё, что мне надо – такую, которая могла бы расти вечно». И вместо продолжения академической деятельности, Вольфрам решил создать компанию Wolfram Research, и сделать идеальную вычислительную среду для учёных. Заголовок в Forbes от 18 апреля 1988 года гласил: «Physics Whiz Goes Into Biz» [Учёный-волшебник ударился в бизнес].
В центре системы Mathematica, как назвала компания свой главный продукт, находится «блокнот», в котором вы пишете команды на одной строке и видите результаты на другой. Напишите «1/6 + 2/5» и он выдаст вам «17/30». Попросите его перемножить многочлены, и он подчинится. Mathematica способна на матанализ, теорию чисел, геометрию, алгебру. У неё есть функции для подсчёта химических реакций и фильтрования генетических данных. В её базе данных есть все картины Рембрандта, и она может выдать вам диаграмму разброса его палитры по времени. В неё встроены модели орбитальной механики, и она сможет подсчитать, как далеко F/A-18 Hornet сможет спланировать, если его двигатели выключатся на высоте 10 000 км. Блокнот в Mathematica – не просто запись подсчётов пользователя, а расшифровка его беседы с всезнающим оракулом. Вольфрам называет тщательно написанные блокноты «вычислительными эссе».
Интерфейс блокнота был детищем Теодора Грэя, вдохновлённого работой со старым редактором кода для Apple. Большинство сред программирования позволяют вам выполнять код построчно или же сразу и целиком. Редактор Apple позволял вам выделить любую часть кода и выполнить только её. Грэй перенёс эти основные концепции в Mathematica, а помогал улучшать дизайн ему не кто иной, как сам Стив Джобс. Блокнот разработан для превращения научного программирования в интерактивное упражнение, в котором отдельные команды можно подправлять и перезапускать десятки и сотни раз, обучаясь на результатах вычислительных экспериментов, что позволяет приходить к более глубокому пониманию данных.
Особенно хорошо блокнот справляется со своими задачами благодаря способности рисовать графики, изображения и красивые математические формулы, при том, что всё это динамически реагирует на изменения в коде. В Mathematica можно ввести запись голоса, применить сложные математические фильтры к аудиозаписи, и визуализировать итоговую звуковую волную. Перетаскивая мышкой параметры, можно изменять её вид и смотреть, какие фильтры подходят лучше всего, играясь с ними. Возможность пакета легко обрабатывать так много различных вычислительных задач в одном простом интерфейсе является результатом «буквально человеко-веков работы», как говорит Грэй.
Видение, стоящее в основе работы, многократно повторено Вольфрамом в его лекциях, записях в блоге, презентациях и пресс-релизах. Не просто сделать хороший софт, но создать точку перегиба в самом занятии наукой. В середине XVII века Готфрид Лейбниц разработал систему записей интегралов и производных (знакомые ∫ и dx/dt), сделавшую сложные идеи матанализа механическими. Лейбниц считал, что схожие символы в более широком применении могли создать «алгебру мыслей». С тех пор логики и лингвисты мечтают об универсальном языке, который сможет устранить двусмысленность и превратить решение сложных задач в подобие матанализа.
Карьера Вольфрама заключается в постоянных попытках вобрать всё знание мира в пакет Mathematica, а позже — сделать его доступным через Wolfram Alpha, «движок вычислительных знаний» компании, стоящий за многими возможностями отвечать на вопросы у таких электронных помощников, как Siri и Alexa. Это попытка Вольфрама создать Interlingua, язык программирования, одинаково понятный и людям, и машинам – алгебру всего.
Задача характерно амбициозная. В 1990-х Вольфрам иногда поддразнивал общественность комментариями о том, что в процессе создания своей компании он работает над революционным научным проектом. Ожидание нарастало. Наконец, проект прибыл: огромная книга, толщиной со шлакоблок, и почти таким же весом, с вековечным названием: "Наука нового типа".
Это оказалось детальным исследованием, проведённым при помощи блокнотов Mathematica, удивительно сложных закономерностей, создаваемых простейшими вычислительными процессами – клеточными автоматами. Исследование проводилось как просто ради исследования, так и для того, чтобы понять, как простые правила способны порождать сложные явления природы – например, торнадо или рисунок раковины моллюска. Эти исследования, опубликованные Вольфрамом без независимой редактуры, сопровождались постоянными напоминаниями об их важности.
Чем больше вы сталкиваетесь с Вольфрамом, тем больше это походит на его стиль. В статье о нём от 1988 года в Forbes попытались докопаться до корней этого явления: «Как сказал Гарри Вульф, бывший директор престижного Института передовых исследований (в Принстоне), где Вольфрам в 23 года был одним из самых молодых старших научных сотрудников, — он обладал „культивируемыми трудностями в характере, поддерживаемыми ощущением одиночества, изоляции и уникальности“.
Когда один из ассистентов Вольфрама объявил о значительном математическом открытии на конференции, служившем ключевой частью „Науки нового типа“, Вольфрам пригрозил засудить его в случае публикации работу. „Ни в одной серьёзной исследовательской группе младшему исследователю не позволят говорить о том, чем занимается старший“, — сказал он в то время. Массивную книгу Вольфрама другие учёные критиковали за то, что она была основана на других работах, но при этом их не упоминала. „Он намекает на то, что является автором основных идей, бывших центральной идеей теории сложных систем последние 20 лет“, — один из исследователей рассказал журналу Times Higher Education в 2002.
Самовосхваление Вольфрама кажется тем удивительнее, поскольку оно совершенно необязательно. Его достижения говорят сами за себя – если бы он позволил бы им это делать. Mathematica достигла успеха практически сразу после запуска. Пользователи давно ждали такой продукт; в университетах программа стала настолько же распространённой, как Microsoft Word. Вольфрам же использовал стабильный доход для найма дополнительных инженеров и экспертов по разным отраслям, скармливая всё больше информации своей ненасытной программе. Сегодня Mathematica знает об анатомии ступни и законах физики, о музыке, систематике хвойных деревьев и основных сражениях Первой Мировой войны. Сам Вольфрам помогал обучать свою программу архаичной греческой записи цифр.
Все эти знания „вычисляемы“. Если хотите, можете обозначить через x местоположение битвы на Сомме, а через y – ежедневное выпадение осадков в 1916 в радиусе 50 км от этого места, и Mathematica вычислит, случалось ли больше смертей во время битв Первой Мировой в то время, когда шёл дождь.
»Я заметил интересную тенденцию, — писал Вольфрам в посте в блоге. – Выберем любую область X, от археологии до зоологии. Тогда с ней будет связана «вычислительная X», которая либо уже существует, либо только нарождается. И это считается будущим данной области". Вольфрам утверждает, что чем лучше специалисты в этих областях будут овладевать вычислительными методами, тем больше будет расширяться область открываемого. Блокнот в Mathematica может стать ускорителем науки, поскольку он может породить новый стиль мышления. «Интереснее всего наблюдать, — говорит он, — как происходит такой же переход, что имел место в XVII веке, когда люди получили возможность читать математические записи. Это становится формой общения, обладающей очень важной особенностью – возможностью запуска».
Идея в том, что «научная работа» такого рода сможет обладать таким же динамизмом, который хотели иметь Строгац и Виктор – интерактивные диаграммы, перемежающиеся текстом – с дополнительным преимуществом, благодаря которому весь код, генерирующий эти диаграммы, и все данные, будут доступны читателю, который сможет их рассмотреть и поиграться с ними. «Честно говоря, когда вы пишете что-то такое простое и понятное на языке Wolfram в блокноте, там не остаётся места для обмана. Есть то, что есть, и работает оно так, как работает. Нет возможности подогнать результат», — говорит Вольфрам.
Написать работу в блокноте Mathematica – значит, раскрыть и результаты и методы вашей работы; и научная работа, и всё, что вы сделали, чтобы её написать. А в результате читателям будет проще не только понять её, но и воспроизвести (или не воспроизвести). Когда миллионы учёных по всему миру делают свой вклад в науку постепенно, единственным способом превратить всю эту работу в нечто важное будет дать возможность другим надёжно строить что-то на основе этих вкладов. «Вот чего могут добиться научные работы, сделанные в виде вычислительных эссе», — сказал Вольфрам.
Вольфрам говорит, что удивлён тем, что вычислительные эссе не набрали популярности. Он вспоминает свою работу с Elsevier, гигантом научных публикаций, в начале 1980-х. «Elsevier наняла меня для консультаций по поводу чего-то вроде „как будет выглядеть будущее научных публикаций“. Это было ещё до появления блокнотов Mathematica, но он толкнул им речь примерно из той же области. „Несколько лет назад я снова беседовал с кем-то из руководства компании. И на той встрече я понял – о боже мой, я же говорил абсолютно то же самое 35 лет назад!“
Я пообщался с Теодором Грэем, ушедшим из Wolfram Research с тем, чтобы стать писателем. Он сказал, что его работа над блокнотом в частности была мотивирована его ощущениями, хорошо сформировавшимися уже к 1990-м, „что, очевидно, всё научное общение и все технические работы, в которых использовались какие-либо данные или математика или моделирование или графики или схемы или что-то вроде того, не нужно публиковать на бумаге. Это было совершенно очевидно уже к 1990“, — сказал он.
»Последние 29 лет с ужасом и удивлением воспринимается тот факт, что за исключением некоторых людей, понявших это, сообщество в целом не приняло такой подход, — сказал он. – Буквально невозможно подсчитать, сколько всего потеряно, сколько времени потрачено впустую, сколько результатов неправильно понято или неверно представлено".
В начале 2001 года Фернандо Перез понял, что находится примерно в том же положении, что и Вольфрам 20 лет назад. Он был аспирантом-физиком, доведшим свои инструменты до пределов их возможностей. Он использовал целый ворох систем, и Mathematica среди них, и, казалось, выполнение каждой задачи требует переключения от одного инструмента к другому. Он вспоминает, что на его столе лежало 6-7 различных книг по программированию. Ему хотелось создать объединённую среду для научных вычислений.
Но вместо того, чтобы начать открывать компанию, он нашёл двоих учёных, немецкого океанографа и аспиранта по информатике из Калтеха, думавших примерно в том же направлении. Они все влюбились в Python, язык программирования общего назначения с открытым исходным кодом, и независимо друг от друга начали создавать для него инструменты, призванные упростить работу с языком для учёных: инструменты, упрощавшие работу с наборами данных и построение графиков, поощрявшие более исследовательские стили программирования.
Перез свёл три проекта в один и взял над ним управление. С самого начала проект IPython (I значило интерактивный) имел открытый код. Программа не просто была бесплатной, любой мог изучить её код и подправить его, сделав свой вклад в общее дело. Это решение было принято намеренно. «Мне был интересен как этический аспект возможности поделиться своей работой с другими, — рассказал мне Перез, сам родом из Колумбии, где получить доступ к коммерческим программам было сложнее, — так и эпистемиологическая мотивация». Он считал, что если науке необходимо быть открытой, то и инструменты, используемые для работы с ней, должны быть открытыми. Коммерческое ПО, чей исходный код по закону нельзя было читать, было «антитезой идее науки», чьё предназначение состоит в том, чтобы открыть чёрный ящик природы.
Поэтому и использовался Python. Базовая версия языка не такая мощная, как Wolfram Language, на котором работает Mathematica. Но если Mathematica черпает свои возможности из работы армии программистов, костяк Python поддерживается массивной библиотекой дополнительных возможностей – по обработке изображений, созданию музыки, построению ИИ, анализу языка, построению графиков – созданных сообществом людей, бесплатно делающих вклад в открытый код. Python стал стандартом де-факто для научных вычислений, поскольку разработчики открытого кода, такие, как Перез, создали для него полезные инструменты; а разработчиков Python притягивал потому, что он был стандартом де-факто для научных вычислений. Сообщества языков программирования, как любая социальная сеть, процветают или умирают благодаря мощности этих петель обратной связи.
Идея интерфейса блокнота для IPython была взята у Mathematica. Перез восхищался тем, как блокноты в Mathematica поощряли исследовательский стиль работы. «Можно было что-то набросать, потому что именно так вы рассуждаете о задаче, так вы её понимаете». Вычислительные блокноты «выдвигают на первый план идею живого повествования. Можно продумать процесс и эффективно использовать компьютер как, если хотите, партнёра по размышлениям и по вычислениям».
Вместо того, чтобы разрабатывать специальное отдельное приложение, не говоря уже о том, чтобы тратить на него человеко-века, команда IPython – к Перезу присоединились Брайан Грейнджер, профессор физики из Калифорнийского политехнического университета в Сан-Луис-Обиспо и Мин Рейган-Келли, кандидат наук из Калифорнийского университета в Беркли, работающий в области вычислительной физики – сделала блокноты в виде простых веб-страниц. Интерфейсу не хватает красоты работ Стива Джобса и их сложности. Но, задействовав веб, IPython получил бесплатные дополнения: каждый раз, когда Google, Apple или случайный программист выпускали новый инструмент для построения графиков, или публиковали улучшенный математический код, это улучшение присоединяли к IPython. «Это всё прекрасно окупилось», — сказал Перез.
Работа, объявлявшая о первом подтверждённом обнаружении гравитационных волн, была опубликована традиционным способом, в виде PDF, но в комплекте с блокнотом IPython. В блокноте можно отследить всю работу, сгенерировавшую все графики для статьи. Каждый желающий может сам запустить код, подправлять его, как хочется, играться с вычислениями, чтобы лучше понять, как они работают. В определённом месте блокнота повествование доходит до той части, в которой сигнал, сгенерированный гравитационными волнами, превращается в звук – и его можно проиграть в браузере, услышать то, что первыми услышали учёные, бульк от двух сталкивающихся чёрных дыр.
«Думаю, научное сообщество приняло этот инструмент, и он уже считается универсальным, — говорит Теодор Грэй о группе Переза. – А такого принятия Mathematica пока ещё не достигла». На Github в публичном доступе выложено уже 1,3 млн таких блокнотов. Их используют в Google, Bloomberg и NASA; музыканты, учителя и исследователи ИИ; и «почти во всех странах Земли».
Каждый раз IPython выбирал путь развития, включавший в себя что-то ещё, и в итоге его уже не называют IPython. Проект в 2014-м переименовали в Jupyter, чтобы подчеркнуть, что он работает уже не только с Python. Jupyter notebook похож на блокнот Mathematica, только подходит для любого языка программирования. Можно сделать блокнот для Python, или C, или R, или Ruby, или JavaScript, или Julia. Любой может создать поддержку Jupyter для своего языка программирования. Сегодня его поддерживает уже более 100 языков.
Теодор Грэй, разрабатывавший интерфейс для оригинального блокнота Mathematica, сказал, что он однажды ради эксперимента попробовал сделать его поддержку для других языков программирования. «Из этого ничего не вышло, — сказал он мне. – Компании было не интересно это поддерживать. А если вам нужно поддерживать множество языков, вы не можете делать это так же тщательно».
Эссе Эрика Рэймонда от 1997 года под названием "Собор и Базар" в некотором смысле стало основным документом современного движения открытого кода. Оно отвергает мнение о том, что сложное ПО необходимо строить, как собор, «тщательно изготовленный отдельными волшебниками или небольшими командами магов, работающих в изоляции». Опыт Рэймонда как одного из управляющих разработкой ядра Linux научил его тому, что «огромный шумный базар с различными целями и подходами», определяющей проекты с исходным кодом, представляет собой преимущество. «То, что такой базарный стиль работает, и работает хорошо, явилось шоком», — писал он. Своим эссе он пытался пояснить, почему «мир Linux не только не разлетелся от непонимания, но, кажется, следует от одного сильного достижения до другого со скоростью, которую с трудом могут представить себе строители собора».
Mathematica была в разработке задолго до опыта Рэймонда с Linux, и разрабатывается с тех пор уже много лет. Это квинтэссенция собора, и его строители всё ещё скептически относятся к базару. «Там всегда есть место хаосу, — говорит Грэй по поводу систем с открытым кодом. – Количество движущихся частей огромно, и разные части контролируют разные группы. У вас ни за что не получится собрать их вместе в интегрированную систему так же, как это возможно в едином коммерческом продукте, с единственным, так сказать, маньяком в его середине».
Маньяком, естественно, выступает Стивен Вольфрам. Грэй отметил, что при Муссолини поезда ходили по расписанию. «Аналогия плохая», — сказал он, но всё же «я за наличие маньяка в середине». Блокнот Mathematica более связно разработанный, более отполированный продукт – по большей части потому, что каждое решение прошло через разум одного упрямого гения. «Я видел этих ребят из Jupyter, — сказал мне Вольфрам, — и они в среднем находятся на уровне того, что было у нас в 90-х». Он говорит, что они срезают углы. «А мы реально пытаемся сделать всё правильно».
Но научному сообществу тяжело рекламировать коммерческое ПО. Хотя Wolfram Research годами раздавал бесплатную программу для просмотра блокнота, и хотя большинство крупных университетов обладают лицензией, позволяющей их студентам и преподавателям свободно использовать Mathematica, возможно, будет слишком просить издателей отказаться от открытого формата PDF в пользу коммерческого продукта. «Пока что ситуация такая: если вы попытаетесь отправить в журнал блокнот из Mathematica, они будут жаловаться: у нас нет Mathematica, это очень дорогая программа, дайте нам что-то более стандартное».
Не помогает и тот факт, что Вольфрам – как человек, так и компания – назойливо расхваливает превосходство продукта, его необходимость, так, что даже Грэй сравнивает его с приверженцами кроссфита, которых невозможно заткнуть. Это ведь тот же самый Стивен Вольфрам, который назвал свою книгу, посвящённую своей работе над клеточными автоматами, «Наука нового типа». В его посте по поводу вычислительной науки он пишет: «В центре вычислительных эссе лежит идея выражения вычислительных мыслей при помощи Wolfram Language».
Возможно, это и так – возможно, вычислительные блокноты смогут прижиться, только если их будет поддерживать единый сверхъязык, или компания с глубокими карманами и существенно заинтересованная в их работе. Но, возможно, что верным будет противоположное. Интегрированные усилия, пусть и более хаотичные, могут оказаться и более надёжным, а также единственным способом завоевать доверие научного сообщества.
Вольфрам мало что замечает за пределами Wolfram, и, возможно, по этой причине блокнот Mathematica остаётся довольно непрозрачным, а его противник – пусть и вторичный и упрощённый, но открытый – судя по всему, завоёвывает мир.
Пройдёт какое-то время до того, как вычислительные блокноты заменят PDF в научных журналах, поскольку это будет означать смену побудительной структуры самой науки. До тех пор, пока журналы не начнут требовать у учёных присылать им блокноты, и до тех пор, пока свободная раздача своей работы и данных не станут способом завоевать престиж или получить финансирование, люди, скорее всего, будут делать всё так, как и раньше.
Я беседовал с нейробиологом, ставшим программистом и вносившим свой вклад в Jupyter, и он рассказал мне, что профессор, заведовавший лабораторией, где он раньше работал, изначально был электрофизиологом – измерял активность нейронов через имплантированные электроды. «Получение таких данных — настолько затратный и дорогой проект», сказал он, что ими никто никогда не будет делиться. «Вы собираете один срез данных и можете перерабатывать их до конца карьеры».
«На данном этапе ни один разумный человек не будет спорить с тем, что практика научных исследований испытывает сдвиг», — писал Перез, создатель Jupyter, в посте в блоге от 2013. Наука всё больше использует вычисления, и навыки, необходимые для того, чтобы стать хорошим учёным, становятся всё более привлекательными в индустрии. Университеты теряют лучших людей, организовывающих свои стартапы, а также уходящих в Google и Microsoft. «На моих глазах множество талантливых коллег за последнее десятилетие покидали академический мир, отчаявшись, — писал он, — и не могу припомнить ни одного из них, кто не был бы много лет спустя доволен этим».
Перез рассказывал мне истории об учёных, пожертвовавших академическими карьерами ради разработки ПО, поскольку в их области исследования разработку ПО ни в грош не ставили. Создатель matplotlib, вероятно, наиболее часто используемого инструмента для построения графиков в научных работах, был постдоком по нейробиологии, но ему пришлось покинуть академический мир ради индустрии. То же случилось с создателем NumPy, популярного сейчас инструмента числовых расчётов. Перез сказал: «Я получал недвусмысленные комментарии от множества коллег и старших товарищей, которые говорили: Прекращайте этим заниматься, вы тратите свою карьеру и свой талант». Они, не смущаясь, советовали мне «возвращаться к физике, к математике, к написанию статей».
Но те, кто остаются, достигают прогресса. Перез недавно получил место в статистическом департаменте в Беркли. Через день после нашей беседы он должен был обучать студентов старших курсов науке о данных, по программе, построенной полностью на блокнотах Python и Jupyter. «Версия этого курса для младшекурсников привлекла, по-моему, 1200 студентов, — сказал он. – Это был самый быстро растущий курс в истории Калифорнийского университета в Беркли. И всё это на основе инструментов с открытым кодом».
Те, кто стремятся улучшить практику научных занятий, мечтают и об улучшении их результатов. Запись Лейбница, позволившая проще записывать матанализ, расширила пространство мыслимого. Величайшие научные задачи сегодняшнего дня очень часто являются вычислительными загадками: как интегрировать миллиарды спаренных оснований в данных по геномам, и в 10 раз больше данных по протеомике, и исторические данные по пациентам, и результаты фармакологических исследований в связную базу того, как кто-то заболел и что нужно сделать, чтобы ему помочь? Как на практике подступиться к бесконечному потоку новых данных по температуре и осадкам, океанографии, вулканической и сейсмической активности? Как создавать и понимать карты нейронных связей думающего мозга? Если снабдить учёных вычислительными блокнотами или какими-то более совершенными их версиями, это, возможно, поможет поднять их разум до уровня проблем, сегодня недоступных.
В какой-то момент Перез рассказал мне, что проект Jupyter чествовал Галилея — возможно, первого учёного в современном смысле. Логотип Jupyter – абстрактная версия оригинальных рисунков Галилея, изображающих луны Юпитера. «Галилею некуда было пойти, чтобы купить телескоп, — сказал Перез. – Ему пришлось сделать свой собственный».