Денис @ur001
Пользователь
Информация
- В рейтинге
- Не участвует
- Откуда
- Москва, Москва и Московская обл., Россия
- Дата рождения
- Зарегистрирован
- Активность
Специализация
Backend Developer, Software Architect
Lead
Python
PostgreSQL
Redis
Celery
Django
Fastapi
Elasticsearch
Kubernetes
Clean Architecture
MySQL
На картинке счётчик постов, если приглядеться :)
Мне подход FRP очень понравился. В какой-то момент разных событий и промисов становится так много, что напрашивался какой-то новый подход.
P.S. Спасибо за библиотеки, отличная подборка!
С момента публикации вопроса ни одного ответа. Но за это время мне посоветовали перейти на ElasticSearch у которого конфиги на yaml/json, бинарник не требующий jre и другие плюшки.
Забавно, что к пониманию многих вещей меня подтолкнуло погружение в JavaScript, и, конкретно вот эта статья на Хбре. Знаю, в среде питонистов часто бытует религиозная ненависть к яваскрипту — абстрагируйтесь, почитайте, статья больше о понимании принципов чем о языке.
sociation.org/static/js/sociation/compare.js
Там основная функция принимает как аргумент функцию сравнения. Они идут ниже. Чем ниже тем новее и лучше :) Самый простой и эффективный пока — последний comporator11.
— 500 и 1000 упоминаний (разность — 500, в 2 раза популярнее)
— 100500 и 101000 (разность 500, отношение 1.0049, т.е. «почти одинаково»)
Насчёт 1 и 2 — чем меньше частота, тем больше погрешность. Но нас же низкочастотные слова вообще не очень интересуют?
Если вечером будете экспериментировать, скину позже несколько формул
Я когда рассуждал, придумал такую простую визуализацию. 2 оси, по одной — популярность слова в первом списке, по второй — во втором. Пусть они нормированы [0:1], тогда слова около «точки» 1,1 — это максимально популярные общие для 2-х ресурсов слова, 1,0 — характерные для 1-го, и 0,1 для второго ресурса. Вроде всё просто, нужно только правильно поделить плоскость на 3 группы (например популярные слова Хабра, Лепры и обоих одновременно). Остаётся вопрос — как именно это сделать наиболее правильным образом :)
Я просто несколько раз сталкивался с подобной задачей в общем виде (например сравнение ассоциаций к двум словам на Sociation), находил несколько удовлетворяющих меня решений, но все они какие-то «нестопудовые» и мало математически обоснованы.
Или вы просто взяли какой-то порог, типа меньше 5-и употреблений, значит его нет?
Хорошая идея с релевантными вопросами в сайдбаре, единственная проблема — большая конкуренция на этот блок. Чего там уже только нет.
Ещё и QA, на мой взгляд, не очень удобный дизайн собранный из элементов обычной публикации.
Подброшу вам в копилку идей. В бутстрапе всего 7 основных цветов, всё остальное — их вариации. Ну, ещё вероятно опция тёмный на светлом / светлый на тёмном для фона. Было бы здорово плясать от цветовой схемы (собственной, или с того же kuler и подобных). Тема перекрашивает весь бутстрап, а дальше уже можно кастомизировать отдельные элементы.
Из тех сервисов что я видел выделяются 2 полярных типа: либо почти полная кастомизация, либо готовые стили. Мне видится полезным именно какой-то промежуточный вариант. Несколько настроек меняющие весь стиль (например основные цвета, ч/б фон, шрифт, размер шрифта маленький/большой/средний, радиус скругления уголков), а дальше более глубокая кастомизация, если требуется.