[!]
Небольшое, но важное уточнение того, откуда этот исследовательский отчет.

Меня зовут Рустам Агамалиев, я учитель и исследователь, автор нескольких книг и некоторого множества публикаций. На данный момент моя работа происходит на стыке педагогики, когнитивистики, лингвистики и психологии; я в основном работаю с детьми и студентами.

Последние 7 лет занимаюсь развитием сообщества, посвященного управлению знаниями, заметковедению и переработке информации. Вот про эту часть своей деятельности я и хочу рассказать в исследовательском отчете ниже.

Цель проделанной работы — выявить шаблонные действия человека, который записывает свои мысли и занимается самообучением. Проведенный анализ "недокорпуса" языка я выполнял с помощью Python и Jupyter/Marimo notebooks, делал это впервые. Получившийся результат представлен ниже.

Профессионалы в области аналитики могут усмотреть в способе анализа недостатки и предложить иные варианты исполнения; с удовольствием почитаю.

Погнали ...

Где-то с месяц я вынашиваю план исследования, с помощью которого хочу оценить эффект практики заметковедения на профессиональную и личную деятельность человека. И каждый раз, как я подходил к этому «снаряду», люди, чье мнение имеет значение, задавали мне вопрос: а что такое заметковедение?

Всякая попытка объяснить разбивалась о стену непонимания. Мои собеседники своими вопросами и комментариями демонстрировали растерянность. В конечном итоге говорили, что им непонятно, и мне приходилось думать дальше. В попытке разобраться, что же такое заметковедение, я изучал свои записи, которых очень много в моей базе, спрашивал участников нашего сообщества, разговаривал с профессионалами из разных областей.

Каждый человек, когда я интересовался у него относительно того, как он ведет свои личные и профессиональные записи, отвечая, описывал технические особенности приложений и сервисов, или начинал душнить[^1], или говорил, что он записывает в приложении и «потом» разбирает, без уточнения, что значит «разбирает» и когда это «потом» наступает.

В общем, мне показалось, что имеется очевидная проблема с операционализацией понятия «заметковедение», как, собственно, и задачеделания, и творчества, и любого иного «сложного слова», требующего интерпретации. Тем не менее я не прекращал поиска определения заметковедению, однако найти формулировку, которая вбирала бы весь спектр заметковедческой деятельности, не получалось.

В какой-то момент мне подсказали, что можно сделать, а именно объяснили, как операционализировать понятие «заметковедение», спросив, что люди делают, когда им приходит идея, попросив описать то, как они «потом» разбирают свои записи, и что происходит при процессе «вдумчивого» обучения.

Как это сделать?

Стучаться всем в личку и спрашивать: «Что вы делаете, когда пишете заметки?» Я попробовал, честно — так себе идея оказалась. Получался прежний, не помогающий разобраться в понятии «заметковедение» бред, только теперь мне приходилось еще по несколько минут, а иногда и дней разговаривать в переписке. В общем, от идеи личного общения я отказался и немного приуныл, пока меня не познакомили с подходом «обоснованная теория».

Оказывается, что есть и такое.

В соответствии с этой теорией, при поиске ответа, что же такое заметковедение, мне следует начинать не с гипотезы, а с чистого листа. То есть с состояния, в котором я ничего не знаю о том, как работать с заметками. У меня нет никаких предположений о процессе. Я должен забыть, что знаком с работами Зонке, и не знаю, кто такой Луман. Вместо того, что я «знаю», я собираю свидетельства и изучаю то, что мне «говорят» данные, и от этого уже строю гипотезы и формирую мнение на основе увиденного/прочитанного.

Остался вопрос: как «увидеть» заметковедение другого человека?

В школе или университете с этим не возникло бы проблем: я бы поставил задачу детям, отошел бы в сторону и внимательно следил, записывал свои мысли относительно увиденного и фиксировал шаблонные действия. А тут как?

И в этот момент у меня на стол «упала» книга «Гарри Поттер и методы рационального мышления», которую притащил ребенок после «уборки» в своей комнате. «Вот оно!» — подумал я.

У Юдковского одним из персонажей была репортерша, которая оборачивалась в муху (или кого-то иного, но тоже маленького) и наблюдала в этой форме за всеми интересными ей событиями. Вот и я решил использовать этот образ — стать мухой.

И создал опросник с тремя характерными ситуативными вопросами:

[!] Вопрос о сборе информации
Представьте, что я призрак (или неназойливая муха), который следует за вами 24 часа. Вы находитесь вдали от своего рабочего стола — возможно, идете куда-то, сидите в кафе или разговариваете с другом — и вам приходит блестящая идея (как вам кажется).

Какие строго физические действия фиксирования этой идеи я, как призрак, стоящий за вашим плечом, увижу?

[!] Вопрос об обработке информации
Перенесемся вперед во времени. Вы вернулись к своему компьютеру или в место, где обычно думаете над своими задачами, идеями и проектами.

Что происходит с той «записью», которую вы сделали ранее, когда я за вами следил как призрак?

[!] Вопрос о системном обучении 
Когда вы целенаправленно изучаете что-то сложное (например, книгу или курс), есть ли у вас одна конкретная привычка, которая заставляет вас чувствовать себя «продуктивным»?

Проектируя вопросы, я старался создать контекст, в котором респондент вынужден будет описать то, как действует в разных условиях: быстро на ходу, у компа и когда учится, а не просто расскажет, как что-то записывает, а объяснит. Мне удалось собрать 185 ответов, теперь с ними предстояло «поработать».

Ключевая проблема, которую мне необходимо было решить, – это как в опечатках, разговорном сленге и неологизмах разобраться и прийти к каким-то выводам. Предстояла огромная, незнакомая мне работа по декодированию лингвистических конструкций, о ней и пойдет рассказ далее.

Архитектура исследования

При обработке данных я не занимался гаданием и не просил ИИ провести анализ за меня, а использовал комбинированный подход, при котором оценивал количественные и качественные параметры.

А начнем мы с того, как я извлекал данные. Повторюсь, я не скармливал ИИ ответы и не просил провести анализ. В таком сценарии результаты были бы для нас продуктом деятельности «черного ящика», а нам это не нужно. Вместо этого мы создали 4-этапный фильтр.

Нормализация

Естественный язык «грязный», компьютер не понимает, что войс, голосовуха и аудиосообщение являются одной сущностью, поэтому с помощью скрипта на Пайтоне мы создали карту регулярных выражений и унифицировали данные. Вот пример трансформации:

  • Входные данные: «Кидаю войс в телегу»

  • Трансформация: s/телег[а-я]*/телеграм/s/войс/голосовое_сообщение/

  • Чистые данные: «Кидаю голосовое_сообщение в телеграм»

  • Зачем нам это нужно: без подобной «чистки» подсчет глаголов и объектов действий (напомню, мы пытаемся понять, что такое заметковедение и с какими действиями оно ассоциируется) будет невозможным, мы просто размоем данные разговорными словечками и ничего не узнаем.

Токенизация (атомизация)

Далее мы атомизировали ВСЕ 185 ответов до отдельных слов (токенов). Составили список «стоп-слов», состоящий из предлогов, местоимений (хотя потом заметил, что не все местоимения «застопил»), изолировали глаголы и существительные. В результате у нас получилось 2000+ уникальных слов (токенов).

Для атомизации мы использовали морфологическую библиотеку Пайтон pymorphy2 — русскоговорящий «робот», который автоматически определяет корни всех слов и приводит слова к базовой форме. Мы «ручками» прогоняли слова через «робота», и если он видел, например, корень «пис», то автоматически классифицировал слова «писал», «пишу», «запись» как «пис». Наверное, можно было бы как-то более элегантно это сделать, но я не понимаю как.

Облака понятий и кластеризация

В этом месте мы и обратились к «обоснованной теории»: ничего сами не категоризировали, а просто наблюдали, какие слова, в каком контексте чаще остальных появлялись, анализировали соотношение глаголов и подлежащих, которые в нашей картине мира и этом конкретном опросе соотносились с инструментом/действием. Мы ручками «посмотрели» на контекст для первых десяти наиболее популярных понятий и создали «словарь»[^2], который соотносил синонимы. Но нам этого было недостаточно.

Нам еще нужно было как-то понять, какие слова к какому действию относятся, так родилась мысль об «архетипах» заметковедов. Например, группа слов [удалитьмусор и очистить] соответствовала архетипу «Чистильщик».

Всего мы типизировали 15 архетипов[^3]. Каждому типу характерно соответствующее поведение, отдельные действия, ключевые слова и базовое заметковедческое действие (которое мы используем в следующем исследовании, сейчас показывать не буду):

Этап

Архетип

Типичное Поведение

Ключевые слова (Маркеры)

ЗАХВАТ (Capture)

Сам-себе-Чат (Messenger)

Использует мессенджер как быстрый инбокс. Пересылает сообщения самому себе.

telegram, телеграм, тг, whatsapp, избранное, saved, личку, forward, чат

ЗАХВАТ (Capture)

Голосовой (Voice)

Предпочитает говорить, а не писать. Часто использует ИИ для расшифровки.

голосовое, войс, диктофон, надиктовать, siri, сири, voice, аудио

ЗАХВАТ (Capture)

Аналоговый (Analog)

Доверяет только физическим носителям. Игнорирует цифровые методы на ходу.

блокнот, бумаг, салфетк, ручк, тетрадь, стикер, лист, записываю рукой

ЗАХВАТ (Capture)

Архитектор (App Direct)

Сразу открывает конечное приложение. Не любит временные папки.

obsidian, notion, evernote, keep, заметк, notes, apple, google, bear

ЗАХВАТ (Capture)

Оптимист (Memory)

Полагается на память. Считает, что важное не забудется.

запомн, ничего, надеюсь, память, потом, голове, вспомн

ОБРАБОТКА (Process)

Чистильщик (Cleaner)

Цель — Inbox Zero. Удаляет шум, оставляет только 10% сути.

удаляю, разобрать, мусор, чистка, delete, trash, архив, ненужное, стираю

ОБРАБОТКА (Process)

Перевозчик (Mover)

Логистика данных. Просто перемещает заметку из Инбокса в Архив без изменений.

переношу, копирую, inbox, инбокс, move, transfer, obsidian, notion, скидываю

ОБРАБОТКА (Process)

Библиотекарь (Tagger)

Фокус на поиске. Добавляет метаданные, теги и папки для будущего.

теги, ссылка, папка, категория, tag, sort, структур, каталог, связ

ОБРАБОТКА (Process)

Редактор (Refiner)

Творческая переработка. Переписывает черновик в чистовик.

дописываю, редактирую, rewrite, edit, оформляю, своими словами, суть, переформулир

ОБРАБОТКА (Process)

Накопитель (Skipper)

Пропускает этап обработки. Заметки копятся "мертвым грузом".

ничего, остается, редко, никак, stay, leave, забываю, коплю, забиваю

ИЗУЧЕНИЕ (Study)

Картограф (Mapper)

Визуал. Понимает информацию, только когда нарисует связи между идеями.

карт, схем, рису, mind, map, canvas, граф, стрелочк, визуал, miro

ИЗУЧЕНИЕ (Study)

Коллекционер (Highlighter)

Собиратель. Выделяет важное цветом и сохраняет цитаты.

выделя, маркер, цвет, подчеркив, цитат, хайлайт, копир, сохран

ИЗУЧЕНИЕ (Study)

Переводчик (Translator)

Глубокая проработка. Переписывает текст автора своим языком.

своими словами, переписыва, конспект, суть, пересказ, понимание, объясн

ИЗУЧЕНИЕ (Study)

Структуралист (Structuralist)

Линейное мышление. Любит списки, буллиты и четкую иерархию.

структур, заголовк, план, оглавление, буллит, список, иерарх

ИЗУЧЕНИЕ (Study)

Экзаменатор (Tester)

Active Recall. Превращает заметки в вопросы для самопроверки.

вопрос, ответ, anki, карточк, тест, экзамен, провер, recall

При этом типы не уникальны, то есть у одного человека может присутствовать некоторое множество. Вот, для примера, как получилось у моего друга Димы Лаухина:

Q1_Capture

Q2_Process

Q3_Study

Q1_Архетип

Q1_Доказательство

Q1_Поведение

Q2_Архетип

Q2_Доказательство

Q2_Поведение

Q3_Архетип

Q3_Доказательство

Q3_Поведение

Достаю айфон, зажимаю Action Button, надиктовываю голосом, результат транскрибируется и отправляется в сегодняшнюю ежедневную заметку в Obsidian, сделал по этому алгоритму - https://second-brain.ru/ios-speech2text-obsidian

Я разбираю накопившиеся записи в ежедневной заметке, если они есть. Создаю на базе записанного новую заметку, или копирую в уже существующую, если считаю что информация не тянет на новую заметку и для нее уже есть место в базе знаний.

Единая заметка с конспектом курса, куда в формате аутлайна пишу все что откликнулось. Для книг - читаю в Zotero, после завершения чтения книги через Zotero Integration отправляю выделения в Obsidian используя шаблон

Архитектор (App Direct)

obsidian, заметк

Сразу открывает конечное приложение. Не любит временные папки.

Перевозчик (Mover)

копирую

Логистика данных. Просто перемещает заметку из Инбокса в Архив без изменений.

Переводчик (Translator)

конспект

Глубокая проработка. Переписывает текст автора своим языком.

В этом месте уместно сделать очень важное уточнение об ограничениях подобной типизации: робот, которого мы «собрали», видит только то, чему мы его научили видеть. Если кто-то будет записывать свои мысли нетипичным способом, например, маркером на предплечье, робот «пропустит» и отправит этого «заметковеда» в группу «неклассифицированные» (которых, кстати, было 88 человек, но мы с ними тоже разобрались и описали, не буду утомлять вас деталями).

Вторым недостатком такой типизации является слепота робота к контексту: он видит ключевые слова, а не намерение, он не может понять, что имелось в виду, когда Дима написал «копирую» на этапе обработки. Вот что сказал мне Дима, когда я показал ему табличку с архетипами:

[!]
Ну в целом да, справедливо все, но вот с переработкой — спорный вывод на основе слова "копирую" в ответе респондента, т.к. именно этот вывод у меня не бьется с практикой. Т.е. я не замечал за собой, что просто пересылаю из Инбокса в Архив без изменений. В ответе под "копирую" имелось в виду не целиком, а какие-то отдельные части исходной заметки в качестве основы для создания новой.

Весьма вероятно, что если кто-то в ответе напишет, что он ненавидит Obsidian, наш робот увидит только слово Obsidian и отнесет этого респондента в Архитекторы.

Я, конечно, ручками пробежался, тем не менее в таком объеме (около 2000+ слов), скорее всего, что-то пропустил, но это и неважно, потому что целью данного исследования было найти шаблонные действия, а не достичь высокой точности типизации.

Ну и заключительный риск связан с характером данных: мы не смотрели на то, что люди делают, а спросили. В этой ситуации человек, как правило, описывает «идеального» себя, то есть может думать, что он структуралист[^4], а на самом деле, если анализировать деятельность, — коллекционер[^5].

Тегирование

После того как мы создали словари под каждый архетип, мы запустили скрипт, который «просмотрел» и классифицировал все ответы. Сначала у нас было какое-то количество неклассифицированных, но мы «натянули сову на глобус», и каждый ответивший получил категорию.

Что дальше и что делать, если вы не верите мне на слово?

Чтобы «доказать», что все сказанное — не выдумка, ниже я приложу ссылки, как это делал уже [[Смартфоны негативно влияют на успеваемость ученика. Правда?|с прошлым исследованием]]. По ссылке вы сможете найти все исходники, команды, использованные в Пайтоне, чистые и грязные данные и т.д.

В качестве заключительного личного комментария: у меня есть ощущение, что благодаря этой работе мне удалось немного лучше понять, что такое заметковедение. Мне кажется, что я смог создать понятийную карту (так это называется в науке) того, что такое заметковедение. Ну и еще: на следующей неделе я запущу новый опрос.

Результатом проделанной выше работы стал список из полутора десятков утверждений[^6] (под каждый архетип), которые характеризуют нас как заметковедов. Мне очень интересно посмотреть, как описанные в утверждениях действия коррелируют с тем, как долго мы занимаемся заметковедением, нашей профессией, успехами и неудачами. Об этом и будет опрос на следующей неделе.

Ссылки, адреса, пароли и явки

Вот тут грязные данные со всеми ответами + каждый респондент типизирован под соответствующий архетип, можете найти себя (это было адресовано тем, кто проходил опрос, но можете сначала ответить на вопросы, а потом попробовать себя типизировать самостоятельно) и проверить, насколько справедливо вам присвоен архетип. А вот остальные данные[^7] — чтобы не заморачиваться с ссылками на отдельные файлы, предлагаю забрать их с моего облачного сервера.

ПОДПИСАТЬСЯ НА МОЙ ТЕЛЕГРАМ: https://t.me/zettelkasten_ch


Keywords:

Reference:

[^1]: За что этим людям огромное спасибо, без их душноты не получилось бы, то что вы сейчас читаете

[^2]: С помощью того же pymorphy2

[^3]: Можно было и меньше, я потом еще раз прошелся по всему алгоритму, но уже не в Jupyter Notebook, а в Marimo Notebook и там получилось собрать 11 архетипов, но в Маримо я работал “горизонтально”, то есть по процессу одного человека, а в Юпитер, про всему процессу, то есть по действиям в определенном контексте (захват, обработка, изучение) всех 185 респондентов. Последнее мне показалось более уместным, так как мы все-таки операционализируем деятельность

[^4]: Линейное мышление. Любит списки, буллиты и четкую иерархию

[^5]: Собиратель. Выделяет важное цветом и сохраняет цитаты.

[^6]: Я их умышленно не публикую в этом исследовательском отчете, чтобы не “настроить” предварительно тех, кто решится пройти следующий опрос

[^7]: Я не поставил SSL сертификат и сервер будет ругаться, “типа” на безопасность, нажмите “все равно продолжить” и вы попадете в мой nextcloud.