Немного почитал описание. Как я понял у вас предполагается что я буду постоянно добавлять через веб-форму понравившийся контент и оценивать его? Тогда это большая ошибка, все просто вломы этим заниматься. Я уже давно пытаюсь придумать способ, позволяющий оценивать контент прям при его чтении без перехода куда-то, да еще чтобы не нужно было нажимать каждый раз кнопку - "хочу оценить этот кусок". Нужен псевдо-ИИ, который просто анализируя поведение пользователя делает выводы. Как пример - скопировал пользователь кусок текста в clipboard - подняли оценку. Быстро пролистал - понизили. Долго читал - подняли. И т.д.
Да, только потребуется алгоритм посложнее текущих. А вот его всем стартапам вломы реализовывать, поэтому и имеем только торчащие наружу RSS одинаковые для всех. Надо садиться и делать opensource библиотеку для всей этой кухни и пинать разработчиков сервисов ее использовать, тогда наступит вселенское счастье :)
Да, надо делать как на slashdot.org, там просто неоцененные комменатрии в сложенном состоянии, слабо оцененные и сильно оцененные отличаются немного размером шрифта.
Т.е. приходим к выводу что база должна знать про все сайты, которые вы читаете(т.е. хранится как можно ближе к вам), но и одновременно быть доступна веб-сервисам типа Хабра для фильтрования. Лучше всего это делать в виде отдельного сервиса с внешним API, хранилищем баз и клиентским софтом для анализа посещаемых страниц.
Проверка спам/неспам будет по времени занимать столько же.
Основной overhead будет на подгрузке, пересчете и загрузке обратно базы конкретного пользователя. Причем делать это параллельно для кучи народа.
ну так либо у нас статика, которая быстро работает
либо динамика, которая удобна, но тормозит
можно еще добавить кеширование на динамику, тогда получится ваш вариант, но при большом разбросе галочек будет все арвн отормозить.
Вы предлагаете отсекать "плохой", неинтересный контент. Минус тут очевидный - тяжело сообщить компьютеру что же вам конкретно не понравилось. Самый простой пример - интересно читать то, что не знаешь и в круге интересов. Но читать про тот же google gears одно и то же десятый раз скучно и не интересно, хочется свежих данных. Но компьютер не знает что вы уже знаете про gears, а что нет и не может оценить полезность, т.к. по баесу статьи будут одинаковы.
Можно пойти с другой стороны, предлагать искать хороший, который похож на встретившийся. Критерии похожести могут быть разными - по содержанию, по тегам, еще того же автора, ... Вот здесь как раз всякие "неточные логики" и Баесы можно применять.
ну это не персонализированный как вы понимаете, просто стало больше лент. Если у вас 10 галочек, то вариантов уже 2 в десятой, т.е. 1024 ленты.
А вообще правильно делать это именно в виде отдельного веб-сервиса, который дает свое API во внешний мир, а сервисы типа Хабра его используют для настройки фильтров. Ну а поток этот сервис берет с того же Хабра сам один раз и фильтрует для всех пользователей в зависимости от настроек, которые переслал Хабр. Почему внешний? Потому что функция фильтрации нужна много где, а в данном случае для стартапа/развитого сервиса проще использовать уже готовое, чем свое городить. Да и все хорошо заоптимизировать можно будет, чтобы не тормозило.
Сервер не загнется всем Байеза расчитывать?
Я даже про персонализированные RSS ленты еще не слышал(чтобы хотя бы по пользователю можно было отсекать, удобно для разных community), а вы уже таких наворотов захотели.
А вообще такая идея легко реализуется в виде локального RSS-прокси, все собираюсь для себя такой написать, да никак собраться не могу.
Графический спам хоть и не ловится, но глазом определяется влет. А следовательно мне не нужно проглядывать письмо чтобы отправить его в корзину. Если бы спамеры все слали в картинках я был бы только рад.
Кстати, самый просто способ борьбы с этим явлением - в почтовиках встроить функцию затенения картинки(чтобы текст было не разобрать, но что за картинка было бы ясно) и растенения при наведении мышки или кнопке. Или просто показывать в виде thumbnail'ов маленьких.
По большей части online читалка нужна для синхронизации с несколькими компьютерами. Вот если бы они в GReader+Gears сделали возможность отдельно подгружать только статусы(read/flag/...), то вообще цены бы ему небыло. А так тянуть на комп тысячу сообщений чтобы прочитать из них только 100 - какой смысл?
Вторым этапом будет не переход на денежные отношения, а появление виртуальных денег и возможность обменивать виртуальные деньги одного сервиса на виртуальные деньги другого на виртуальной же бирже(чтобы курс был саморегулирующимся). Тогда, например, можно будет написать реально хорошую статью, получить за нее денежек, пойти в какую-нибудь MMORPG, обменяв эти денежки на внутри-игровые денежки или купить себе отстров в той же SecondLife. Ну и будет возможность обмениваться на какие-нибудь WebMoney с пользователями, которым нужны виртуальные деньги для каких-либо целей. Чем больше сервисов будет вовлечено в этот процесс, тем больше вероятность со временем и реальные ден.знаки с этого получать.
всегда отключаю загрузку внешних картинок и вам советую, ведь
загрузка картинки это лучший способ понять какие почтовые ящики реально читают, достаточно в каждом письме разместить ссылку на картинку вида http://imagehosting/Image1.jpg?UserEmail и потом собрать статистику какие картинки грузились.
в вашем случае нужно всего лишь вынести данные в online, для этого уже все сделали. Берете любой нормальный online storage и к нему устанавливаете софт, который показывает его как обычный локальный диск. После этого имеете доступный из любого места к своему файлу.
А вот текущая убогость online приложений пока удручает, я к переносу именно приложений пока отношусь скептически.
Какой смысл писать про десятку тех, которые и так на слуху у всех? Лучше бы написали про вторую, а лучше третью десятку. И заметка бы получилась уникальной, а подобных этой в инете и так много...
Основной overhead будет на подгрузке, пересчете и загрузке обратно базы конкретного пользователя. Причем делать это параллельно для кучи народа.
либо динамика, которая удобна, но тормозит
можно еще добавить кеширование на динамику, тогда получится ваш вариант, но при большом разбросе галочек будет все арвн отормозить.
Можно пойти с другой стороны, предлагать искать хороший, который похож на встретившийся. Критерии похожести могут быть разными - по содержанию, по тегам, еще того же автора, ... Вот здесь как раз всякие "неточные логики" и Баесы можно применять.
А вообще правильно делать это именно в виде отдельного веб-сервиса, который дает свое API во внешний мир, а сервисы типа Хабра его используют для настройки фильтров. Ну а поток этот сервис берет с того же Хабра сам один раз и фильтрует для всех пользователей в зависимости от настроек, которые переслал Хабр. Почему внешний? Потому что функция фильтрации нужна много где, а в данном случае для стартапа/развитого сервиса проще использовать уже готовое, чем свое городить. Да и все хорошо заоптимизировать можно будет, чтобы не тормозило.
Я даже про персонализированные RSS ленты еще не слышал(чтобы хотя бы по пользователю можно было отсекать, удобно для разных community), а вы уже таких наворотов захотели.
А вообще такая идея легко реализуется в виде локального RSS-прокси, все собираюсь для себя такой написать, да никак собраться не могу.
Кстати, самый просто способ борьбы с этим явлением - в почтовиках встроить функцию затенения картинки(чтобы текст было не разобрать, но что за картинка было бы ясно) и растенения при наведении мышки или кнопке. Или просто показывать в виде thumbnail'ов маленьких.
загрузка картинки это лучший способ понять какие почтовые ящики реально читают, достаточно в каждом письме разместить ссылку на картинку вида http://imagehosting/Image1.jpg?UserEmail и потом собрать статистику какие картинки грузились.
самый большой по моему будет обеспечение секурности при таком подходе
А вот текущая убогость online приложений пока удручает, я к переносу именно приложений пока отношусь скептически.