Комментарии 55
Отличная новость! Жаль только не все сайты с тегами внедряют подобные фичи =)
На самом деле теги вообще очень мало кто использует по-назначению. А, тем не менее, с ними можно делать кучу интересных вещей: возможность тежирования постов пользователями, как это реализовано на Last.FM, генерация списка схожих статей в блоке типа «читайте так же...» и т.д.
НЛО прилетело и опубликовало эту надпись здесь
Просто отлично! Казалось бы элементарная вещь, а как удобно!
«схлопывать» можно названия компаний, которые написаны как на русском, так и на английском языке
Спасибо. Действительно, полезно!
Спасибо. Действительно, полезно!
а по какому алгоритму делали? или планируете делать?
сначала ручками, это ладно. но потом то на автомат удобнее посадить, да чтобы ложных срабатываний почти небыло.
интересен алгоритм=)
сначала ручками, это ладно. но потом то на автомат удобнее посадить, да чтобы ложных срабатываний почти небыло.
интересен алгоритм=)
Пока без алгоритма. Я даже не уверен что это возможно полностью автоматизировать.
Сейчас изучаю статью blogs.sun.com/plamere/entry/determining_synonyms_from_tags
Самое простое — перевести название всех фирм в транслит и обратно.
Сейчас изучаю статью blogs.sun.com/plamere/entry/determining_synonyms_from_tags
Самое простое — перевести название всех фирм в транслит и обратно.
Замечательно! Стремимся к совершенству, товарищи ;)
побольше бы таких нововведений в сети.
спасибо
побольше бы таких нововведений в сети.
спасибо
НЛО прилетело и опубликовало эту надпись здесь
Наконец-то :)
Фактически, полезное применение семантический алгоритма.
Фактически, полезное применение семантический алгоритма.
НЛО прилетело и опубликовало эту надпись здесь
Очень эффектиным был бы нечеткий поиск строк (тот же Bitap algorithm) и фонетический (к последнему была хорошая хабрастатья).
Выявить «кандидатов» этими алгоритмами и связать нужные вручную или силами НЛО.
Выявить «кандидатов» этими алгоритмами и связать нужные вручную или силами НЛО.
Предлагаю объеденить «Хабрахабр» с «Google»! ))
Вот бы тогда дело получилось! ;))
А если серьёзно, то надо бы «SEO» и «поиск» под один таг помоему.
Вот бы тогда дело получилось! ;))
А если серьёзно, то надо бы «SEO» и «поиск» под один таг помоему.
Вот до такого объединение тегов никогда не должно доходить! И в этом-то основная проблема — слишком широки смыслы и области применения тегов-терминов-названий…
Sphinx — «поиск», но ни в коем случае не «SEO»!
Sphinx — «поиск», но ни в коем случае не «SEO»!
Конечно, ведь SEO — это поисковая оптимизация.
Кстати помимо связывания синонимов можно связывать включающие понятия. Например пост с тегом Яндекс или Гугл можно находить по запросу поисковик, а по запросу Яндекс выводить посты про Гугл не следует
Кстати помимо связывания синонимов можно связывать включающие понятия. Например пост с тегом Яндекс или Гугл можно находить по запросу поисковик, а по запросу Яндекс выводить посты про Гугл не следует
У ЭВМ, как правило, экстрасенсорных способностей нет, и что имелось под Google, к примеру, можно понять только из текста. А вот карта тегов…
Интересней будет, если у хабраграждан появится новая возможность ставить пользовательские теги при наличии, ну, там >100 кармы, маленький внутренний голос такой. :)
Интересней будет, если у хабраграждан появится новая возможность ставить пользовательские теги при наличии, ну, там >100 кармы, маленький внутренний голос такой. :)
Разве что только «поисковая оптимизация» и «SEO»
>>P.S. Предлагаю пофлеймить на тему что с чем следует, а с чем не следует объединять :)
Размышления Дмитрия Смирнова на эту тему: spectator.ru/technology/web-building/tags2null
Размышления Дмитрия Смирнова на эту тему: spectator.ru/technology/web-building/tags2null
Замечательно. Мы такую штуку тоже сейчас тестируем на своем проекте.
как же у меня облегчилась бы жизнь, если бы еще теги присутстовали в rss, и нормально кушались rss-ридерами… эх… мечты :)
пользуясь случаем хочу выразить отдельное спасибо за внедрение поддержки тегов с точкой, таких как «.net», раньше приходилось писать dotNet
кстати, вот вам кандидат на слияние: dotNet == .net
кстати, вот вам кандидат на слияние: dotNet == .net
logo = лого = логотип
А еще хорошо бы клеить слова единственном и множественном числе «стартапы» = «стартап».
А еще хорошо бы клеить слова единственном и множественном числе «стартапы» = «стартап».
Действительно, можно помочь разработчикам Хабра, предлагая свои варианты тегов для склеивания. Алгоритм — это хорошо, а реальные варианты от сформированного сообщества — еще лучше.
Начнем с меня (с):startup=стартап; хтмл=html; линукс=linux; фотошоп=photoshop; опенсорс=опенсоурс=оупенсорс=opensource; юзабилити=usability=ui.
Возможно, некоторое из этого уже учтено.
Начнем с меня (с):startup=стартап; хтмл=html; линукс=linux; фотошоп=photoshop; опенсорс=опенсоурс=оупенсорс=opensource; юзабилити=usability=ui.
Возможно, некоторое из этого уже учтено.
НЛО прилетело и опубликовало эту надпись здесь
Можно попробовать подстроить какой нибудь словарь. Автоматом найдёт кучу необходимых групп тэгов «на объединение», а вы их вручную отсортируете.
________________________________________________________________________
Не являюсь программистом (паскаль\маркапы не в счёт), так что объяснил так, как смог.
________________________________________________________________________
Не являюсь программистом (паскаль\маркапы не в счёт), так что объяснил так, как смог.
Еще бы при выборке по тегу можно было бы сразу несколько тегов выбрать. Например «WinXP» «Файловая система»
А почему в статистике две Москвы? ;)
Один из способов чуть-чуть автоматизировать процесс объединения — транслитерировать русские теги и прогонять их через soundex()/metaphone(), при совпадении результатов с латинскими тегами объединять.
На мой взгляд, отношение родитель-ребёнок здесь не совсем уместно. Теги должны быть равноправны, они же синонимы, а отношение родитель-ребёнок возможно в паре, скажем, «поисковик > google». Т.е. это на самом деле должно быть два разных вида связывания, которые должны работать в паре :)
Вот как-то так.
На мой взгляд, отношение родитель-ребёнок здесь не совсем уместно. Теги должны быть равноправны, они же синонимы, а отношение родитель-ребёнок возможно в паре, скажем, «поисковик > google». Т.е. это на самом деле должно быть два разных вида связывания, которые должны работать в паре :)
Вот как-то так.
А ещё жаль, что метки продолжают называть тегами.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Объединение тегов на Хабре