[!]
Небольшое, но важное уточнение того, откуда этот исследовательский отчет.Меня зовут Рустам Агамалиев, я учитель и исследователь, автор нескольких книг и некоторого множества публикаций. На данный момент моя работа происходит на стыке педагогики, когнитивистики, лингвистики и психологии; я в основном работаю с детьми и студентами.
Последние 7 лет занимаюсь развитием сообщества, посвященного управлению знаниями, заметковедению и переработке информации. Вот про эту часть своей деятельности я и хочу рассказать в исследовательском отчете ниже.
Цель проделанной работы — выявить шаблонные действия человека, который записывает свои мысли и занимается самообучением. Проведенный анализ "недокорпуса" языка я выполнял с помощью Python и Jupyter/Marimo notebooks, делал это впервые. Получившийся результат представлен ниже.
Профессионалы в области аналитики могут усмотреть в способе анализа недостатки и предложить иные варианты исполнения; с удовольствием почитаю.
Погнали ...
Где-то с месяц я вынашиваю план исследования, с помощью которого хочу оценить эффект практики заметковедения на профессиональную и личную деятельность человека. И каждый раз, как я подходил к этому «снаряду», люди, чье мнение имеет значение, задавали мне вопрос: а что такое заметковедение?
Всякая попытка объяснить разбивалась о стену непонимания. Мои собеседники своими вопросами и комментариями демонстрировали растерянность. В конечном итоге говорили, что им непонятно, и мне приходилось думать дальше. В попытке разобраться, что же такое заметковедение, я изучал свои записи, которых очень много в моей базе, спрашивал участников нашего сообщества, разговаривал с профессионалами из разных областей.
Каждый человек, когда я интересовался у него относительно того, как он ведет свои личные и профессиональные записи, отвечая, описывал технические особенности приложений и сервисов, или начинал душнить[^1], или говорил, что он записывает в приложении и «потом» разбирает, без уточнения, что значит «разбирает» и когда это «потом» наступает.
В общем, мне показалось, что имеется очевидная проблема с операционализацией понятия «заметковедение», как, собственно, и задачеделания, и творчества, и любого иного «сложного слова», требующего интерпретации. Тем не менее я не прекращал поиска определения заметковедению, однако найти формулировку, которая вбирала бы весь спектр заметковедческой деятельности, не получалось.
В какой-то момент мне подсказали, что можно сделать, а именно объяснили, как операционализировать понятие «заметковедение», спросив, что люди делают, когда им приходит идея, попросив описать то, как они «потом» разбирают свои записи, и что происходит при процессе «вдумчивого» обучения.
Как это сделать?
Стучаться всем в личку и спрашивать: «Что вы делаете, когда пишете заметки?» Я попробовал, честно — так себе идея оказалась. Получался прежний, не помогающий разобраться в понятии «заметковедение» бред, только теперь мне приходилось еще по несколько минут, а иногда и дней разговаривать в переписке. В общем, от идеи личного общения я отказался и немного приуныл, пока меня не познакомили с подходом «обоснованная теория».
Оказывается, что есть и такое.
В соответствии с этой теорией, при поиске ответа, что же такое заметковедение, мне следует начинать не с гипотезы, а с чистого листа. То есть с состояния, в котором я ничего не знаю о том, как работать с заметками. У меня нет никаких предположений о процессе. Я должен забыть, что знаком с работами Зонке, и не знаю, кто такой Луман. Вместо того, что я «знаю», я собираю свидетельства и изучаю то, что мне «говорят» данные, и от этого уже строю гипотезы и формирую мнение на основе увиденного/прочитанного.
Остался вопрос: как «увидеть» заметковедение другого человека?
В школе или университете с этим не возникло бы проблем: я бы поставил задачу детям, отошел бы в сторону и внимательно следил, записывал свои мысли относительно увиденного и фиксировал шаблонные действия. А тут как?
И в этот момент у меня на стол «упала» книга «Гарри Поттер и методы рационального мышления», которую притащил ребенок после «уборки» в своей комнате. «Вот оно!» — подумал я.
У Юдковского одним из персонажей была репортерша, которая оборачивалась в муху (или кого-то иного, но тоже маленького) и наблюдала в этой форме за всеми интересными ей событиями. Вот и я решил использовать этот образ — стать мухой.
И создал опросник с тремя характерными ситуативными вопросами:
[!] Вопрос о сборе информации
Представьте, что я призрак (или неназойливая муха), который следует за вами 24 часа. Вы находитесь вдали от своего рабочего стола — возможно, идете куда-то, сидите в кафе или разговариваете с другом — и вам приходит блестящая идея (как вам кажется).Какие строго физические действия фиксирования этой идеи я, как призрак, стоящий за вашим плечом, увижу?
[!] Вопрос об обработке информации
Перенесемся вперед во времени. Вы вернулись к своему компьютеру или в место, где обычно думаете над своими задачами, идеями и проектами.Что происходит с той «записью», которую вы сделали ранее, когда я за вами следил как призрак?
[!] Вопрос о системном обучении
Когда вы целенаправленно изучаете что-то сложное (например, книгу или курс), есть ли у вас одна конкретная привычка, которая заставляет вас чувствовать себя «продуктивным»?
Проектируя вопросы, я старался создать контекст, в котором респондент вынужден будет описать то, как действует в разных условиях: быстро на ходу, у компа и когда учится, а не просто расскажет, как что-то записывает, а объяснит. Мне удалось собрать 185 ответов, теперь с ними предстояло «поработать».
Ключевая проблема, которую мне необходимо было решить, – это как в опечатках, разговорном сленге и неологизмах разобраться и прийти к каким-то выводам. Предстояла огромная, незнакомая мне работа по декодированию лингвистических конструкций, о ней и пойдет рассказ далее.
Архитектура исследования
При обработке данных я не занимался гаданием и не просил ИИ провести анализ за меня, а использовал комбинированный подход, при котором оценивал количественные и качественные параметры.
А начнем мы с того, как я извлекал данные. Повторюсь, я не скармливал ИИ ответы и не просил провести анализ. В таком сценарии результаты были бы для нас продуктом деятельности «черного ящика», а нам это не нужно. Вместо этого мы создали 4-этапный фильтр.
Нормализация
Естественный язык «грязный», компьютер не понимает, что войс, голосовуха и аудиосообщение являются одной сущностью, поэтому с помощью скрипта на Пайтоне мы создали карту регулярных выражений и унифицировали данные. Вот пример трансформации:
Входные данные: «Кидаю войс в телегу»
Трансформация:
s/телег[а-я]*/телеграм/,s/войс/голосовое_сообщение/Чистые данные: «Кидаю голосовое_сообщение в телеграм»
Зачем нам это нужно: без подобной «чистки» подсчет глаголов и объектов действий (напомню, мы пытаемся понять, что такое заметковедение и с какими действиями оно ассоциируется) будет невозможным, мы просто размоем данные разговорными словечками и ничего не узнаем.
Токенизация (атомизация)
Далее мы атомизировали ВСЕ 185 ответов до отдельных слов (токенов). Составили список «стоп-слов», состоящий из предлогов, местоимений (хотя потом заметил, что не все местоимения «застопил»), изолировали глаголы и существительные. В результате у нас получилось 2000+ уникальных слов (токенов).
Для атомизации мы использовали морфологическую библиотеку Пайтон pymorphy2 — русскоговорящий «робот», который автоматически определяет корни всех слов и приводит слова к базовой форме. Мы «ручками» прогоняли слова через «робота», и если он видел, например, корень «пис», то автоматически классифицировал слова «писал», «пишу», «запись» как «пис». Наверное, можно было бы как-то более элегантно это сделать, но я не понимаю как.
Облака понятий и кластеризация

В этом месте мы и обратились к «обоснованной теории»: ничего сами не категоризировали, а просто наблюдали, какие слова, в каком контексте чаще остальных появлялись, анализировали соотношение глаголов и подлежащих, которые в нашей картине мира и этом конкретном опросе соотносились с инструментом/действием. Мы ручками «посмотрели» на контекст для первых десяти наиболее популярных понятий и создали «словарь»[^2], который соотносил синонимы. Но нам этого было недостаточно.
Нам еще нужно было как-то понять, какие слова к какому действию относятся, так родилась мысль об «архетипах» заметковедов. Например, группа слов [удалить, мусор и очистить] соответствовала архетипу «Чистильщик».
Всего мы типизировали 15 архетипов[^3]. Каждому типу характерно соответствующее поведение, отдельные действия, ключевые слова и базовое заметковедческое действие (которое мы используем в следующем исследовании, сейчас показывать не буду):
Этап | Архетип | Типичное Поведение | Ключевые слова (Маркеры) |
|---|---|---|---|
ЗАХВАТ (Capture) | Сам-себе-Чат (Messenger) | Использует мессенджер как быстрый инбокс. Пересылает сообщения самому себе. | telegram, телеграм, тг, whatsapp, избранное, saved, личку, forward, чат |
ЗАХВАТ (Capture) | Голосовой (Voice) | Предпочитает говорить, а не писать. Часто использует ИИ для расшифровки. | голосовое, войс, диктофон, надиктовать, siri, сири, voice, аудио |
ЗАХВАТ (Capture) | Аналоговый (Analog) | Доверяет только физическим носителям. Игнорирует цифровые методы на ходу. | блокнот, бумаг, салфетк, ручк, тетрадь, стикер, лист, записываю рукой |
ЗАХВАТ (Capture) | Архитектор (App Direct) | Сразу открывает конечное приложение. Не любит временные папки. | obsidian, notion, evernote, keep, заметк, notes, apple, google, bear |
ЗАХВАТ (Capture) | Оптимист (Memory) | Полагается на память. Считает, что важное не забудется. | запомн, ничего, надеюсь, память, потом, голове, вспомн |
ОБРАБОТКА (Process) | Чистильщик (Cleaner) | Цель — Inbox Zero. Удаляет шум, оставляет только 10% сути. | удаляю, разобрать, мусор, чистка, delete, trash, архив, ненужное, стираю |
ОБРАБОТКА (Process) | Перевозчик (Mover) | Логистика данных. Просто перемещает заметку из Инбокса в Архив без изменений. | переношу, копирую, inbox, инбокс, move, transfer, obsidian, notion, скидываю |
ОБРАБОТКА (Process) | Библиотекарь (Tagger) | Фокус на поиске. Добавляет метаданные, теги и папки для будущего. | теги, ссылка, папка, категория, tag, sort, структур, каталог, связ |
ОБРАБОТКА (Process) | Редактор (Refiner) | Творческая переработка. Переписывает черновик в чистовик. | дописываю, редактирую, rewrite, edit, оформляю, своими словами, суть, переформулир |
ОБРАБОТКА (Process) | Накопитель (Skipper) | Пропускает этап обработки. Заметки копятся "мертвым грузом". | ничего, остается, редко, никак, stay, leave, забываю, коплю, забиваю |
ИЗУЧЕНИЕ (Study) | Картограф (Mapper) | Визуал. Понимает информацию, только когда нарисует связи между идеями. | карт, схем, рису, mind, map, canvas, граф, стрелочк, визуал, miro |
ИЗУЧЕНИЕ (Study) | Коллекционер (Highlighter) | Собиратель. Выделяет важное цветом и сохраняет цитаты. | выделя, маркер, цвет, подчеркив, цитат, хайлайт, копир, сохран |
ИЗУЧЕНИЕ (Study) | Переводчик (Translator) | Глубокая проработка. Переписывает текст автора своим языком. | своими словами, переписыва, конспект, суть, пересказ, понимание, объясн |
ИЗУЧЕНИЕ (Study) | Структуралист (Structuralist) | Линейное мышление. Любит списки, буллиты и четкую иерархию. | структур, заголовк, план, оглавление, буллит, список, иерарх |
ИЗУЧЕНИЕ (Study) | Экзаменатор (Tester) | Active Recall. Превращает заметки в вопросы для самопроверки. | вопрос, ответ, anki, карточк, тест, экзамен, провер, recall |
При этом типы не уникальны, то есть у одного человека может присутствовать некоторое множество. Вот, для примера, как получилось у моего друга Димы Лаухина:
Q1_Capture | Q2_Process | Q3_Study | Q1_Архетип | Q1_Доказательство | Q1_Поведение | Q2_Архетип | Q2_Доказательство | Q2_Поведение | Q3_Архетип | Q3_Доказательство | Q3_Поведение |
Достаю айфон, зажимаю Action Button, надиктовываю голосом, результат транскрибируется и отправляется в сегодняшнюю ежедневную заметку в Obsidian, сделал по этому алгоритму - https://second-brain.ru/ios-speech2text-obsidian | Я разбираю накопившиеся записи в ежедневной заметке, если они есть. Создаю на базе записанного новую заметку, или копирую в уже существующую, если считаю что информация не тянет на новую заметку и для нее уже есть место в базе знаний. | Единая заметка с конспектом курса, куда в формате аутлайна пишу все что откликнулось. Для книг - читаю в Zotero, после завершения чтения книги через Zotero Integration отправляю выделения в Obsidian используя шаблон | Архитектор (App Direct) | obsidian, заметк | Сразу открывает конечное приложение. Не любит временные папки. | Перевозчик (Mover) | копирую | Логистика данных. Просто перемещает заметку из Инбокса в Архив без изменений. | Переводчик (Translator) | конспект | Глубокая проработка. Переписывает текст автора своим языком. |
В этом месте уместно сделать очень важное уточнение об ограничениях подобной типизации: робот, которого мы «собрали», видит только то, чему мы его научили видеть. Если кто-то будет записывать свои мысли нетипичным способом, например, маркером на предплечье, робот «пропустит» и отправит этого «заметковеда» в группу «неклассифицированные» (которых, кстати, было 88 человек, но мы с ними тоже разобрались и описали, не буду утомлять вас деталями).
Вторым недостатком такой типизации является слепота робота к контексту: он видит ключевые слова, а не намерение, он не может понять, что имелось в виду, когда Дима написал «копирую» на этапе обработки. Вот что сказал мне Дима, когда я показал ему табличку с архетипами:
[!]
Ну в целом да, справедливо все, но вот с переработкой — спорный вывод на основе слова "копирую" в ответе респондента, т.к. именно этот вывод у меня не бьется с практикой. Т.е. я не замечал за собой, что просто пересылаю из Инбокса в Архив без изменений. В ответе под "копирую" имелось в виду не целиком, а какие-то отдельные части исходной заметки в качестве основы для создания новой.
Весьма вероятно, что если кто-то в ответе напишет, что он ненавидит Obsidian, наш робот увидит только слово Obsidian и отнесет этого респондента в Архитекторы.
Я, конечно, ручками пробежался, тем не менее в таком объеме (около 2000+ слов), скорее всего, что-то пропустил, но это и неважно, потому что целью данного исследования было найти шаблонные действия, а не достичь высокой точности типизации.
Ну и заключительный риск связан с характером данных: мы не смотрели на то, что люди делают, а спросили. В этой ситуации человек, как правило, описывает «идеального» себя, то есть может думать, что он структуралист[^4], а на самом деле, если анализировать деятельность, — коллекционер[^5].
Тегирование
После того как мы создали словари под каждый архетип, мы запустили скрипт, который «просмотрел» и классифицировал все ответы. Сначала у нас было какое-то количество неклассифицированных, но мы «натянули сову на глобус», и каждый ответивший получил категорию.
Что дальше и что делать, если вы не верите мне на слово?
Чтобы «доказать», что все сказанное — не выдумка, ниже я приложу ссылки, как это делал уже [[Смартфоны негативно влияют на успеваемость ученика. Правда?|с прошлым исследованием]]. По ссылке вы сможете найти все исходники, команды, использованные в Пайтоне, чистые и грязные данные и т.д.
В качестве заключительного личного комментария: у меня есть ощущение, что благодаря этой работе мне удалось немного лучше понять, что такое заметковедение. Мне кажется, что я смог создать понятийную карту (так это называется в науке) того, что такое заметковедение. Ну и еще: на следующей неделе я запущу новый опрос.
Результатом проделанной выше работы стал список из полутора десятков утверждений[^6] (под каждый архетип), которые характеризуют нас как заметковедов. Мне очень интересно посмотреть, как описанные в утверждениях действия коррелируют с тем, как долго мы занимаемся заметковедением, нашей профессией, успехами и неудачами. Об этом и будет опрос на следующей неделе.
Ссылки, адреса, пароли и явки
Вот тут грязные данные со всеми ответами + каждый респондент типизирован под соответствующий архетип, можете найти себя (это было адресовано тем, кто проходил опрос, но можете сначала ответить на вопросы, а потом попробовать себя типизировать самостоятельно) и проверить, насколько справедливо вам присвоен архетип. А вот остальные данные[^7] — чтобы не заморачиваться с ссылками на отдельные файлы, предлагаю забрать их с моего облачного сервера.
ПОДПИСАТЬСЯ НА МОЙ ТЕЛЕГРАМ: https://t.me/zettelkasten_ch
Keywords:
Reference:
[^1]: За что этим людям огромное спасибо, без их душноты не получилось бы, то что вы сейчас читаете
[^2]: С помощью того же pymorphy2
[^3]: Можно было и меньше, я потом еще раз прошелся по всему алгоритму, но уже не в Jupyter Notebook, а в Marimo Notebook и там получилось собрать 11 архетипов, но в Маримо я работал “горизонтально”, то есть по процессу одного человека, а в Юпитер, про всему процессу, то есть по действиям в определенном контексте (захват, обработка, изучение) всех 185 респондентов. Последнее мне показалось более уместным, так как мы все-таки операционализируем деятельность
[^4]: Линейное мышление. Любит списки, буллиты и четкую иерархию
[^5]: Собиратель. Выделяет важное цветом и сохраняет цитаты.
[^6]: Я их умышленно не публикую в этом исследовательском отчете, чтобы не “настроить” предварительно тех, кто решится пройти следующий опрос
[^7]: Я не поставил SSL сертификат и сервер будет ругаться, “типа” на безопасность, нажмите “все равно продолжить” и вы попадете в мой nextcloud.