Поэтому я иногда мечтаю о простом языке описания системных требований на базе Markdown — с минимальной валидацией, автокомплитом и всем прочим.
Не совсем голый маркдаун, а ещё немного магии Obsidian Dataview. Я примерно это сделал для своей продуктовой команды. В пике трекали 390 требований. Мапили на них истории, критерии приемки и версии продукта.
Просто он офигенный. Плюс тема ведения заметок - довольно понятная и простая, поэтому написать про Обс может любой. А если попутно упомянуть Цеттелькастен и пнуть ящик Лумана - всё, ты в топе 😁
Здорово, что все делает один скрипт. Респект! У меня все по отдельности, и пока без диаризации.
Каждый день много встреч и, соответственно, масса входящей информации. Я пару лет пользуюсь Python-обёрткой над Whisper для пакетного распознавания файлов и восстановления пунктуации, которую сам сделал (лежит на GitHub).
Тема диаризации интересна, но на практике была не очень нужна, поэтому не занимался ею. Однако недавно стала нужна, так что разобрался c pyannote. Пока он выдает просто отдельный отчёт, но планирую скрестить с транскриптом и автоматически размечать в транскрипте, кто что сказал.
Для создания саммари пользуюсь отдельным скриптом, который работает в два этапа:
Извлекает из транскрипта список обсужденных вопросов.
По списку из п.1 и полному пранскрипту пишет протокол встречи.
Так получается стабильнее, чем в один этап (когда даже хорошая дорогая модель может упустить что-то важное). Если запись не конфиденциальная, использую Gemini 2.5 Flash. Если конфиденциальная - локальную Saiga YandexGPT 8B (быстро и качественно).
В Obsidian кладу саммари некоторых встреч. Для вопросов и ответов по протоколам использую AnythingLLM.
К тому же Обсидиану уже давно есть средства улучшенного поиска, включая RAG с использованием любых LLM. Это плагины Copilot, Omnisearch и ещё что-то сходу не помню.
Согласен на 100%. Кажется, автор статьи счёл избыточное усложнение заметочника обязательным, но оно опциональное.
Я тоже всё храню в Обсидиан, и для многих областей заметок это точно такое же дерево каталогов с мелкими заметками, работать с которыми через Обсидиан удобнее, чем через MC, FAR и т.п.
Для некоторых других областей это полу-бд с dataview, блоками кода, диаграммами plantuml, канвасами и т.п. Но это просто дополнительные удобства, когда они нужны, а не в коем случае не обязательное усложнение, которое мешает жить.
Разбор нужен далеко не всегда. Процедура записи включает в себя выражение мысли словами и мысленное проговаривание её по ходу записи. Это улучшает запоминание и имеет не меньшую пользу, чем сам факт записи.
Я, было, тоже порывался написать что-то подобное, т.к. админю несколько тг-групп. Но нашел lolsbotcatcherbot, и он решил мои проблемы со спамом почти полностью.
Почти - потому спамные картинки без текста все ещё прорываются.
У меня в новом компе светится блок питания (можно отключить кнопкой) и видюха (отключение геморройное). Я подумал и решил, что и хрен с ним, пусть горит 😁
На самом деле просто не исследовал другие варианты. Остановился на LGA 2011 и процессорах Xeon E5, потому что с ними был положительный опыт. А лучшее, как известно, враг хорошего.
Возможно, при следующем апгрейде посмотрю в сторону LGA 2066 или чего-то поновее, а пока так.
Если на производительность одного ядра смотреть - медленный. А все вместе - норм для своей стоимости.
По накопителям с Ali - много раз брал Asgard, все живы и здоровы. В этот раз ещё попробовал Netac. Не вижу проблем, если понимать, что покупаешь.
В целом конфигурация действительно не типовая. Она рассчитана на разработку, виртуалки и нейронки, с чем прекрасно справляется. Если видюху как самый дорогой элемент заменить на что-то бюджетное, то за 70-80К с полки любого сетевого магазина выбор будет довольно ограниченный и уж точно не из такого уровня компонентов.
Безусловно, все варианты имеют право на жизнь. Просто я хотел подсветить, что есть возможность собрать внешне новый и внутренне довольно мощный комп за недорого.
Так и есть: частоты невысокие, и проц довольно холодный, зато ядер много. Для браузеров, нейронов и виртуалок в сочетании с несколькими быстрыми m.2 - норм.
Боюсь, там будут какие-нибудь особенные серверные компоненты, с которыми если случись чего, замена может быть дорогой или просто будет не найти такого. Как у меня было с брендовыми б/у десктопами. Они, конечно, отработали своё сполна, но выкидывать комп целиком из-за сдохшего БП с уникальным разъемом было обидно.
А тут все компоненты популярные и доступные - как серверные, так и десктопные.
Плюс эстетически норм выглядит. Не представляю, как выглядел бы б/у 4U сервер на моем рабочем столе 😁
Даже несмотря на то, что комп - основное средство производства, цены на некоторые компоненты нынче заставляют шевелиться волосяной покров.
Я после безнадежно состарившегося ноута пожил пару лет на дешманском Xeon-е, мне понравилось соотношение цена/мощность, и на НГ 2025 я собрал более мощную версию стационарного компа также на б/у серверных компонентах.
Новое: мать на X99 (хотя чипсет б/у вроде, хз), кулер на проц, 2 х 1 TB m.2 с Али, корпус, пара корпусных вентиляторов, БП 1050 Вт
В итоге тачка - ураган по CPU, GPU и памяти. Под лайтовой нагрузкой потребляет 160Вт, при полной загрузке CPU нейронками - около 200 Вт. В игры не играю.
Посчитал затраты, итого ~140Т₽. Из них собственно комп стоит половину, а вторая половина - это стоимость GPU
Не совсем голый маркдаун, а ещё немного магии Obsidian Dataview. Я примерно это сделал для своей продуктовой команды. В пике трекали 390 требований. Мапили на них истории, критерии приемки и версии продукта.
https://github.com/dimonier/Obsidian-Requirements-Management
Просто он офигенный. Плюс тема ведения заметок - довольно понятная и простая, поэтому написать про Обс может любой. А если попутно упомянуть Цеттелькастен и пнуть ящик Лумана - всё, ты в топе 😁
Поискать приличные модели TTS на hugging face и попросить DeepSeek/qwen написать python-скрипт, который делает это
Спасибо, отличная статья!
Здорово, что все делает один скрипт. Респект! У меня все по отдельности, и пока без диаризации.
Каждый день много встреч и, соответственно, масса входящей информации. Я пару лет пользуюсь Python-обёрткой над Whisper для пакетного распознавания файлов и восстановления пунктуации, которую сам сделал (лежит на GitHub).
Тема диаризации интересна, но на практике была не очень нужна, поэтому не занимался ею. Однако недавно стала нужна, так что разобрался c pyannote. Пока он выдает просто отдельный отчёт, но планирую скрестить с транскриптом и автоматически размечать в транскрипте, кто что сказал.
Для создания саммари пользуюсь отдельным скриптом, который работает в два этапа:
Извлекает из транскрипта список обсужденных вопросов.
По списку из п.1 и полному пранскрипту пишет протокол встречи.
Так получается стабильнее, чем в один этап (когда даже хорошая дорогая модель может упустить что-то важное). Если запись не конфиденциальная, использую Gemini 2.5 Flash. Если конфиденциальная - локальную Saiga YandexGPT 8B (быстро и качественно).
В Obsidian кладу саммари некоторых встреч. Для вопросов и ответов по протоколам использую AnythingLLM.
Xeon 2680v4 + RTX 3090 24GB
Попробуйте для STT Whisper с моделью large-v3-turbo. Она очень быстрая, на CPU должна приемлемо работать.
А для суммаризации - Saiga YandexGPT light 8B. На GPU очень быстро работает, на CPU тоже должно быть приемлемо.
Тормоза и глюки обсидиан - это миф, поддерживаемый любителями обвешать его плагинами по самое не могу.
У меня с десятком плагинов на нескольких тысячах заметок работает прекрасно без всяких тормозов и глюков. И я далеко не один такой.
К тому же Обсидиану уже давно есть средства улучшенного поиска, включая RAG с использованием любых LLM. Это плагины Copilot, Omnisearch и ещё что-то сходу не помню.
Так что, как говорил Яндекс, найдется всё.
Ещё через полтора года избавитесь от большинства плагинов, и все придет в норму 😁
Согласен на 100%. Кажется, автор статьи счёл избыточное усложнение заметочника обязательным, но оно опциональное.
Я тоже всё храню в Обсидиан, и для многих областей заметок это точно такое же дерево каталогов с мелкими заметками, работать с которыми через Обсидиан удобнее, чем через MC, FAR и т.п.
Для некоторых других областей это полу-бд с dataview, блоками кода, диаграммами plantuml, канвасами и т.п. Но это просто дополнительные удобства, когда они нужны, а не в коем случае не обязательное усложнение, которое мешает жить.
Разбор нужен далеко не всегда. Процедура записи включает в себя выражение мысли словами и мысленное проговаривание её по ходу записи. Это улучшает запоминание и имеет не меньшую пользу, чем сам факт записи.
Спасибо, интересно.
Я, было, тоже порывался написать что-то подобное, т.к. админю несколько тг-групп. Но нашел lolsbotcatcherbot, и он решил мои проблемы со спамом почти полностью.
Почти - потому спамные картинки без текста все ещё прорываются.
А где результаты воплощения таких планов в жизнь?
То, что в чате с LLM можно написать запрос и получить ответ, уже и так известно, особенно на Хабре.
Свежеустановленная Windows 10 на насквозь китайском компе на Xeon E5 + x79 + m.2 грузилась около 5 секунд.
У меня в новом компе светится блок питания (можно отключить кнопкой) и видюха (отключение геморройное). Я подумал и решил, что и хрен с ним, пусть горит 😁
TDP 190 Вт и цена 25К₽
Однако!
Наверно, потому, что это в 2 раза дороже 😁
На самом деле просто не исследовал другие варианты. Остановился на LGA 2011 и процессорах Xeon E5, потому что с ними был положительный опыт. А лучшее, как известно, враг хорошего.
Возможно, при следующем апгрейде посмотрю в сторону LGA 2066 или чего-то поновее, а пока так.
Если на производительность одного ядра смотреть - медленный. А все вместе - норм для своей стоимости.
По накопителям с Ali - много раз брал Asgard, все живы и здоровы. В этот раз ещё попробовал Netac. Не вижу проблем, если понимать, что покупаешь.
В целом конфигурация действительно не типовая. Она рассчитана на разработку, виртуалки и нейронки, с чем прекрасно справляется. Если видюху как самый дорогой элемент заменить на что-то бюджетное, то за 70-80К с полки любого сетевого магазина выбор будет довольно ограниченный и уж точно не из такого уровня компонентов.
Безусловно, все варианты имеют право на жизнь. Просто я хотел подсветить, что есть возможность собрать внешне новый и внутренне довольно мощный комп за недорого.
Так и есть: частоты невысокие, и проц довольно холодный, зато ядер много. Для браузеров, нейронов и виртуалок в сочетании с несколькими быстрыми m.2 - норм.
Спасибо за совет!
Боюсь, там будут какие-нибудь особенные серверные компоненты, с которыми если случись чего, замена может быть дорогой или просто будет не найти такого. Как у меня было с брендовыми б/у десктопами. Они, конечно, отработали своё сполна, но выкидывать комп целиком из-за сдохшего БП с уникальным разъемом было обидно.
А тут все компоненты популярные и доступные - как серверные, так и десктопные.
Плюс эстетически норм выглядит. Не представляю, как выглядел бы б/у 4U сервер на моем рабочем столе 😁
Спасибо за интересный лонгрид!
Даже несмотря на то, что комп - основное средство производства, цены на некоторые компоненты нынче заставляют шевелиться волосяной покров.
Я после безнадежно состарившегося ноута пожил пару лет на дешманском Xeon-е, мне понравилось соотношение цена/мощность, и на НГ 2025 я собрал более мощную версию стационарного компа также на б/у серверных компонентах.
Б/у: проц Xeon E5 2680v4 14 ядер, 128ГБ ECC RAM, RTX 3090 24ГБ
Новое: мать на X99 (хотя чипсет б/у вроде, хз), кулер на проц, 2 х 1 TB m.2 с Али, корпус, пара корпусных вентиляторов, БП 1050 Вт
В итоге тачка - ураган по CPU, GPU и памяти. Под лайтовой нагрузкой потребляет 160Вт, при полной загрузке CPU нейронками - около 200 Вт. В игры не играю.
Посчитал затраты, итого ~140Т₽. Из них собственно комп стоит половину, а вторая половина - это стоимость GPU