Комментарии / Профиль Trept / Хабр

Александр@Trept

Пользователь

ПрофильСтатьи6ПостыНовостиКомментарии357

Отчет Yandex: 25% контента в рунете — копипаст

Trept 10 мар 2011 в 12:21

Вроде бы Яндекс (да и Гугл) умеет распознавать контент-генераторы.

Нечёткий поиск в тексте и словаре

Trept 10 мар 2011 в 08:21

Думаю, нужно уточнить в разделе тестирования условия подборки тестового пула слов: какой объем пула, по какому принципу отбирались слова для тестирования (случайному?).

MinHash — выявляем похожие множества

Trept 9 мар 2011 в 16:05

Например, построим гистограмму, и оценим ее отклонения от равномерности.

MinHash — выявляем похожие множества

Trept 9 мар 2011 в 16:05

прошу прощения, не туда ответил

MinHash — выявляем похожие множества

Trept 9 мар 2011 в 16:05

Например, построим гистограмму, и оценим ее отклонения от равномерности.

MinHash — выявляем похожие множества

Trept 9 мар 2011 в 14:54

Для оценки равномерности распределения одной дисперсии маловато будет.
Не стоит ли оценить близость самого распределения, например, через обычную метрику скалярного произведения?

MinHash — выявляем похожие множества

Trept 9 мар 2011 в 13:44

Я об этом способе использования MinHash выше написал.
А Ваш пример мой не опровергает, присмотритесь повнимательнее.
Кстати, интересно, свойство равновероятности для MinHash, хотя бы на уровне ассимптоты доказано?

MinHash — выявляем похожие множества

Trept 9 мар 2011 в 12:58

Это — вопрос терминологии, не более того.
Поясню: кому-то точности MinHash будет вполне достаточно, да и вопрос коллизий не всегда определяющий. В этом случае метод будет вполне полноценно искать похожие множества.

MinHash — выявляем похожие множества

Trept 9 мар 2011 в 11:13

В данной реализации слово, отличное на 1 символ — полностью другое слово, так что все верно.

MinHash — выявляем похожие множества

Trept 9 мар 2011 в 11:10

Думаю, нужно добавить, что ошибка при вычислении метрики похожести по методу MinHash нефатальна, поскольку всегда возможно пересчитать оригинальную метрику для близких множеств, выявленных по MinHash.
Иначе говоря, MinHash здесь будет работать, как предварительный фильтр, снижающий вычислительные затраты.

С днём рождения, Пи!

Trept 4 мар 2011 в 15:00

Чисто журналистский прием.
Громкий заголовок, за которым оказывается совсем не такое эффектное содержание.
В принципе нестрашно, но хотелось бы от автора большей корректности, раз уж пишет о такой строгой до бескомпромиссности науке и пропагандирует пользу именно таких четких и доказательных исследований.

Генеральный директор ABBYY Сергей Андреев отвечает на вопросы читателей Хабра об участии компании в проекте Сколково

Trept 4 мар 2011 в 14:28

Все аналогии чем-то хромают.
Все-таки Хабр — не лавочка у подъезда, а Ваш бизнесмен (не ууу ворюга), вероятно, не брал денег у государства, то есть, у нас, как налогоплательщиков.
Лекарство для тех, кто хочет услышать в данном случае — прозрачность проекта, расходов, а также демонстрация достижений.
Ведь даже о сверхсекретных испытаниях «Булавы» и ПАКФА рассказывают, и не боятся сообщений о неудачах, что «бабки у подъезда» неправильно поймут.

Trept 4 мар 2011 в 13:10

В проекте слишком много неясного, а сумма выложена очень серьезная.
А история госвливаний с такими цифрами, мягко говоря, не слишком чистоплотная.
Так что реакция сообщества вполне понятная.
Очень хорошо, что Аби относительно быстро среагировали на предыдущие посты на Хабре, и хотят что-то объяснить (и плохо, что они не сделали этого раньше).
Вот будет информация, тогда и вопросы к проекту будут более корректными и по делу.

Беспилотные автомобили Google демонстрируют гоночный стиль вождения

Trept 4 мар 2011 в 11:12

Допустим, отладят технологию, и можно будет купить такое авто.
Вот интересно, а за нарушения ПДД на таком автомобиле Гугл будет отвечать?

+13

Trept 4 мар 2011 в 10:08

Сергей, насколько я знаю, проект разрабатывается уже около 10 лет.
О каких-либо публичных результатах я не знаю.
Не превратился ли он в долгострой с неясными перспективами?

Контент-фермы терпят убытки из-за смены поискового алгоритма Google

Trept 3 мар 2011 в 14:32

Свой пейджранк они постоянно переделывают, но Вы же не сомневаетесь, что много качественных ссылок — это хорошо.
Вот так же не превратятся в плохое и предпочтения пользователей.
Исходники же иметь, конечно, нелишне, но…
Анализ точной формулы без пояснений разработчиков, боюсь, и года не хватит даже для профессионала в области алгоритмов. А для любителя это вообще неподъемная задача.

Контент-фермы терпят убытки из-за смены поискового алгоритма Google

Trept 3 мар 2011 в 13:56

… в котором учитываются предпочтения пользователей.

Сравнение iPad 2, Motorola Xoom, HP TouchPad и BlackBerry PlayBook

Trept 3 мар 2011 в 10:39

Табличка хорошая, но минимум двух строчек явно не хватает:
— наличие GPS;
— и, обязательно, цена, желательно, в сравнимых конфигурациях.

+11

Google купил Zynamics — фирму с наработками в сфере безопасности

Trept 3 мар 2011 в 10:01

Для серьезного анализа одного факта маловато.
А в данном случае мне показалось, что такое ПО не слишком подходит для простенькой Chrome OS. А вот как инструментарий для серверных систем вполне годится.
Гугл уже выходил с продуктом для корпораций: готовый сервер со встроенным поиском. Но эта система не очень пошла.

-1

Брэдли Маннингу грозит смертная казнь

Trept 3 мар 2011 в 09:46

Конечно, обвинение с угрозой пожизненного не сравнится с очками и одеждой.

1 2 ...

10 11

13 14 ...

17 18