Comments / Profile of cactusinside / Habr

User

cactusinside Jun 5 2007 at 05:53

Немного почитал описание. Как я понял у вас предполагается что я буду постоянно добавлять через веб-форму понравившийся контент и оценивать его? Тогда это большая ошибка, все просто вломы этим заниматься. Я уже давно пытаюсь придумать способ, позволяющий оценивать контент прям при его чтении без перехода куда-то, да еще чтобы не нужно было нажимать каждый раз кнопку - "хочу оценить этот кусок". Нужен псевдо-ИИ, который просто анализируя поведение пользователя делает выводы. Как пример - скопировал пользователь кусок текста в clipboard - подняли оценку. Быстро пролистал - понизили. Долго читал - подняли. И т.д.

Фильтрация контента

cactusinside Jun 5 2007 at 05:48

Да, только потребуется алгоритм посложнее текущих. А вот его всем стартапам вломы реализовывать, поэтому и имеем только торчащие наружу RSS одинаковые для всех. Надо садиться и делать opensource библиотеку для всей этой кухни и пинать разработчиков сервисов ее использовать, тогда наступит вселенское счастье :)

Фильтрация контента

cactusinside Jun 5 2007 at 05:40

Не, гуглу я такую информацию не отдам. Он и так про меня уже слишком много знает.

Хорошие комментарии

cactusinside Jun 4 2007 at 06:31

Да, надо делать как на slashdot.org, там просто неоцененные комменатрии в сложенном состоянии, слабо оцененные и сильно оцененные отличаются немного размером шрифта.

Фильтрация контента

cactusinside Jun 4 2007 at 06:23

Т.е. приходим к выводу что база должна знать про все сайты, которые вы читаете(т.е. хранится как можно ближе к вам), но и одновременно быть доступна веб-сервисам типа Хабра для фильтрования. Лучше всего это делать в виде отдельного сервиса с внешним API, хранилищем баз и клиентским софтом для анализа посещаемых страниц.

Фильтрация контента

cactusinside Jun 4 2007 at 06:20

Проверка спам/неспам будет по времени занимать столько же.
Основной overhead будет на подгрузке, пересчете и загрузке обратно базы конкретного пользователя. Причем делать это параллельно для кучи народа.

Фильтрация контента

cactusinside Jun 4 2007 at 06:15

ну так либо у нас статика, которая быстро работает
либо динамика, которая удобна, но тормозит
можно еще добавить кеширование на динамику, тогда получится ваш вариант, но при большом разбросе галочек будет все арвн отормозить.

Фильтрация контента

cactusinside Jun 3 2007 at 08:10

у того спам фильтра одна баесовская база, в нашем случае их много и они часто меняются

Фильтрация контента

cactusinside Jun 3 2007 at 08:08

просто если галочек будет 100, то места на сервере под все RSS-ленты не хватит.

Фильтрация контента

cactusinside Jun 3 2007 at 08:06

Вы предлагаете отсекать "плохой", неинтересный контент. Минус тут очевидный - тяжело сообщить компьютеру что же вам конкретно не понравилось. Самый простой пример - интересно читать то, что не знаешь и в круге интересов. Но читать про тот же google gears одно и то же десятый раз скучно и не интересно, хочется свежих данных. Но компьютер не знает что вы уже знаете про gears, а что нет и не может оценить полезность, т.к. по баесу статьи будут одинаковы.

Можно пойти с другой стороны, предлагать искать хороший, который похож на встретившийся. Критерии похожести могут быть разными - по содержанию, по тегам, еще того же автора, ... Вот здесь как раз всякие "неточные логики" и Баесы можно применять.

Фильтрация контента

cactusinside Jun 3 2007 at 07:50

ну это не персонализированный как вы понимаете, просто стало больше лент. Если у вас 10 галочек, то вариантов уже 2 в десятой, т.е. 1024 ленты.

А вообще правильно делать это именно в виде отдельного веб-сервиса, который дает свое API во внешний мир, а сервисы типа Хабра его используют для настройки фильтров. Ну а поток этот сервис берет с того же Хабра сам один раз и фильтрует для всех пользователей в зависимости от настроек, которые переслал Хабр. Почему внешний? Потому что функция фильтрации нужна много где, а в данном случае для стартапа/развитого сервиса проще использовать уже готовое, чем свое городить. Да и все хорошо заоптимизировать можно будет, чтобы не тормозило.

Фильтрация контента

cactusinside Jun 3 2007 at 05:09

Сервер не загнется всем Байеза расчитывать?
Я даже про персонализированные RSS ленты еще не слышал(чтобы хотя бы по пользователю можно было отсекать, удобно для разных community), а вы уже таких наворотов захотели.
А вообще такая идея легко реализуется в виде локального RSS-прокси, все собираюсь для себя такой написать, да никак собраться не могу.

Спамеры начали использовать искусственный интеллект

cactusinside Jun 2 2007 at 09:51

Графический спам хоть и не ловится, но глазом определяется влет. А следовательно мне не нужно проглядывать письмо чтобы отправить его в корзину. Если бы спамеры все слали в картинках я был бы только рад.

Кстати, самый просто способ борьбы с этим явлением - в почтовиках встроить функцию затенения картинки(чтобы текст было не разобрать, но что за картинка было бы ясно) и растенения при наведении мышки или кнопке. Или просто показывать в виде thumbnail'ов маленьких.

2 изменения в Google Reader

cactusinside May 31 2007 at 08:43

По большей части online читалка нужна для синхронизации с несколькими компьютерами. Вот если бы они в GReader+Gears сделали возможность отдельно подгружать только статусы(read/flag/...), то вообще цены бы ему небыло. А так тянуть на комп тысячу сообщений чтобы прочитать из них только 100 - какой смысл?

Как лопнет пузырь Web 2.0

cactusinside May 18 2007 at 05:29

Вторым этапом будет не переход на денежные отношения, а появление виртуальных денег и возможность обменивать виртуальные деньги одного сервиса на виртуальные деньги другого на виртуальной же бирже(чтобы курс был саморегулирующимся). Тогда, например, можно будет написать реально хорошую статью, получить за нее денежек, пойти в какую-нибудь MMORPG, обменяв эти денежки на внутри-игровые денежки или купить себе отстров в той же SecondLife. Ну и будет возможность обмениваться на какие-нибудь WebMoney с пользователями, которым нужны виртуальные деньги для каких-либо целей. Чем больше сервисов будет вовлечено в этот процесс, тем больше вероятность со временем и реальные ден.знаки с этого получать.

Спамеры находят новые пути обхода фильтров

cactusinside Apr 29 2007 at 09:09

всегда отключаю загрузку внешних картинок и вам советую, ведь
загрузка картинки это лучший способ понять какие почтовые ящики реально читают, достаточно в каждом письме разместить ссылку на картинку вида http://imagehosting/Image1.jpg?UserEmail и потом собрать статистику какие картинки грузились.

Обобщенная идея гибридизации приложений

cactusinside Apr 28 2007 at 10:26

минусы то забыли написать
самый большой по моему будет обеспечение секурности при таком подходе

Гибридные приложения — конец войне «десктоп против веба»

cactusinside Apr 28 2007 at 10:18

в вашем случае нужно всего лишь вынести данные в online, для этого уже все сделали. Берете любой нормальный online storage и к нему устанавливаете софт, который показывает его как обычный локальный диск. После этого имеете доступный из любого места к своему файлу.
А вот текущая убогость online приложений пока удручает, я к переносу именно приложений пока отношусь скептически.

10 наиболее успешных Web 2.0 стартапов

cactusinside Apr 16 2007 at 07:16

Какой смысл писать про десятку тех, которые и так на слуху у всех? Лучше бы написали про вторую, а лучше третью десятку. И заметка бы получилась уникальной, а подобных этой в инете и так много...

1 2