Садовников Антон Петрович @Siddthartha
Developer
Information
- Rating
- Does not participate
- Location
- Луганск, Луганская обл., Украина
- Date of birth
- Registered
- Activity
Specialization
Specialist
Lead
From 10,800 $
PHP
OOP
Docker
Rust
Linux
Asynchronous programming
MQTT
Geoinformation systems
Machine learning
Computer Science
1. тэги пользователь вводит сам это раз.
2. они не составляються из текста сообщения автоматически.
3. у него они запоминаются и выпадают чуть шо, чтоб он не написал свой любимый тэг "бибисятина", как "ббсятиина"...
кроме того если это облако блога одного юзера - их фильтровать не надо - как есть так и подсчитывать популярность и соответственно размер.
но.
если облако мультиюзеровских текстов - тэги нужно сводить
"ВСЕ" (наклацанные пользователями) -> "унифицированные,разрешенные, семантически_сведенные".
что бы не было авто/тачка/бибика... сводить это нужно в полуавтоматическом (?) режиме объединяя очевидные синонимы в одно, для вывода в общем облаке...
и по количеству упоминаний они суммируются (синонимы).
я представляю себе это, как ненапряжную процедуру раз в недельку админ новые "промахнувшиеся мимо легальных" тэги или разрешает или запрещает или (чаще) кладет в синоним к какому-то разрешенному тэгу.
так?
типа угадывания предпочтений - что бы дефолтом (до вмешательства пользователя) выставлялись наиболее вероятные для данной связки юзер-новость оценки.
хотя это, конечно, уже представляет некую сложность алгоритмически...
по статье думаю можно раз и надолго решить для себя эту проблему и ту о которой сказал otaqsun тоже...