All streams
Search
Write a publication
Pull to refresh
14
0
Дмитрий @dimonier

Архитектор в Т1

Send message

Поэтому я иногда мечтаю о простом языке описания системных требований на базе Markdown — с минимальной валидацией, автокомплитом и всем прочим.

Не совсем голый маркдаун, а ещё немного магии Obsidian Dataview. Я примерно это сделал для своей продуктовой команды. В пике трекали 390 требований. Мапили на них истории, критерии приемки и версии продукта.

https://github.com/dimonier/Obsidian-Requirements-Management

Просто он офигенный. Плюс тема ведения заметок - довольно понятная и простая, поэтому написать про Обс может любой. А если попутно упомянуть Цеттелькастен и пнуть ящик Лумана - всё, ты в топе 😁

Поискать приличные модели TTS на hugging face и попросить DeepSeek/qwen написать python-скрипт, который делает это

Спасибо, отличная статья!

Здорово, что все делает один скрипт. Респект! У меня все по отдельности, и пока без диаризации.

Каждый день много встреч и, соответственно, масса входящей информации. Я пару лет пользуюсь Python-обёрткой над Whisper для пакетного распознавания файлов и восстановления пунктуации, которую сам сделал (лежит на GitHub).

Тема диаризации интересна, но на практике была не очень нужна, поэтому не занимался ею. Однако недавно стала нужна, так что разобрался c pyannote. Пока он выдает просто отдельный отчёт, но планирую скрестить с транскриптом и автоматически размечать в транскрипте, кто что сказал.

Для создания саммари пользуюсь отдельным скриптом, который работает в два этапа:

  1. Извлекает из транскрипта список обсужденных вопросов.

  2. По списку из п.1 и полному пранскрипту пишет протокол встречи.

Так получается стабильнее, чем в один этап (когда даже хорошая дорогая модель может упустить что-то важное). Если запись не конфиденциальная, использую Gemini 2.5 Flash. Если конфиденциальная - локальную Saiga YandexGPT 8B (быстро и качественно).

В Obsidian кладу саммари некоторых встреч. Для вопросов и ответов по протоколам использую AnythingLLM.

Xeon 2680v4 + RTX 3090 24GB

Попробуйте для STT Whisper с моделью large-v3-turbo. Она очень быстрая, на CPU должна приемлемо работать.

А для суммаризации - Saiga YandexGPT light 8B. На GPU очень быстро работает, на CPU тоже должно быть приемлемо.

Тормоза и глюки обсидиан - это миф, поддерживаемый любителями обвешать его плагинами по самое не могу.

У меня с десятком плагинов на нескольких тысячах заметок работает прекрасно без всяких тормозов и глюков. И я далеко не один такой.

К тому же Обсидиану уже давно есть средства улучшенного поиска, включая RAG с использованием любых LLM. Это плагины Copilot, Omnisearch и ещё что-то сходу не помню.

Так что, как говорил Яндекс, найдется всё.

Ещё через полтора года избавитесь от большинства плагинов, и все придет в норму 😁

Согласен на 100%. Кажется, автор статьи счёл избыточное усложнение заметочника обязательным, но оно опциональное.

Я тоже всё храню в Обсидиан, и для многих областей заметок это точно такое же дерево каталогов с мелкими заметками, работать с которыми через Обсидиан удобнее, чем через MC, FAR и т.п.

Для некоторых других областей это полу-бд с dataview, блоками кода, диаграммами plantuml, канвасами и т.п. Но это просто дополнительные удобства, когда они нужны, а не в коем случае не обязательное усложнение, которое мешает жить.

Разбор нужен далеко не всегда. Процедура записи включает в себя выражение мысли словами и мысленное проговаривание её по ходу записи. Это улучшает запоминание и имеет не меньшую пользу, чем сам факт записи.

Спасибо, интересно.

Я, было, тоже порывался написать что-то подобное, т.к. админю несколько тг-групп. Но нашел lolsbotcatcherbot, и он решил мои проблемы со спамом почти полностью.

Почти - потому спамные картинки без текста все ещё прорываются.

А где результаты воплощения таких планов в жизнь?

То, что в чате с LLM можно написать запрос и получить ответ, уже и так известно, особенно на Хабре.

Свежеустановленная Windows 10 на насквозь китайском компе на Xeon E5 + x79 + m.2 грузилась около 5 секунд.

У меня в новом компе светится блок питания (можно отключить кнопкой) и видюха (отключение геморройное). Я подумал и решил, что и хрен с ним, пусть горит 😁

TDP 190 Вт и цена 25К₽

Однако!

Наверно, потому, что это в 2 раза дороже 😁

На самом деле просто не исследовал другие варианты. Остановился на LGA 2011 и процессорах Xeon E5, потому что с ними был положительный опыт. А лучшее, как известно, враг хорошего.

Возможно, при следующем апгрейде посмотрю в сторону LGA 2066 или чего-то поновее, а пока так.

Если на производительность одного ядра смотреть - медленный. А все вместе - норм для своей стоимости.

По накопителям с Ali - много раз брал Asgard, все живы и здоровы. В этот раз ещё попробовал Netac. Не вижу проблем, если понимать, что покупаешь.

В целом конфигурация действительно не типовая. Она рассчитана на разработку, виртуалки и нейронки, с чем прекрасно справляется. Если видюху как самый дорогой элемент заменить на что-то бюджетное, то за 70-80К с полки любого сетевого магазина выбор будет довольно ограниченный и уж точно не из такого уровня компонентов.

Безусловно, все варианты имеют право на жизнь. Просто я хотел подсветить, что есть возможность собрать внешне новый и внутренне довольно мощный комп за недорого.

Так и есть: частоты невысокие, и проц довольно холодный, зато ядер много. Для браузеров, нейронов и виртуалок в сочетании с несколькими быстрыми m.2 - норм.

Спасибо за совет!

Боюсь, там будут какие-нибудь особенные серверные компоненты, с которыми если случись чего, замена может быть дорогой или просто будет не найти такого. Как у меня было с брендовыми б/у десктопами. Они, конечно, отработали своё сполна, но выкидывать комп целиком из-за сдохшего БП с уникальным разъемом было обидно.

А тут все компоненты популярные и доступные - как серверные, так и десктопные.

Плюс эстетически норм выглядит. Не представляю, как выглядел бы б/у 4U сервер на моем рабочем столе 😁

Спасибо за интересный лонгрид!

Даже несмотря на то, что комп - основное средство производства, цены на некоторые компоненты нынче заставляют шевелиться волосяной покров.

Я после безнадежно состарившегося ноута пожил пару лет на дешманском Xeon-е, мне понравилось соотношение цена/мощность, и на НГ 2025 я собрал более мощную версию стационарного компа также на б/у серверных компонентах.

Б/у: проц Xeon E5 2680v4 14 ядер, 128ГБ ECC RAM, RTX 3090 24ГБ

Новое: мать на X99 (хотя чипсет б/у вроде, хз), кулер на проц, 2 х 1 TB m.2 с Али, корпус, пара корпусных вентиляторов, БП 1050 Вт

В итоге тачка - ураган по CPU, GPU и памяти. Под лайтовой нагрузкой потребляет 160Вт, при полной загрузке CPU нейронками - около 200 Вт. В игры не играю.

Посчитал затраты, итого ~140Т₽. Из них собственно комп стоит половину, а вторая половина - это стоимость GPU

Information

Rating
5,316-th
Location
Москва, Москва и Московская обл., Россия
Works in
Registered
Activity

Specialization

Backend Developer, Software Architect
Lead
Python
High-loaded systems
PostgreSQL
English
Spring Boot
Git