All streams
Search
Write a publication
Pull to refresh
0
0
cactusinside @cactusinside

User

Send message
Немного почитал описание. Как я понял у вас предполагается что я буду постоянно добавлять через веб-форму понравившийся контент и оценивать его? Тогда это большая ошибка, все просто вломы этим заниматься. Я уже давно пытаюсь придумать способ, позволяющий оценивать контент прям при его чтении без перехода куда-то, да еще чтобы не нужно было нажимать каждый раз кнопку - "хочу оценить этот кусок". Нужен псевдо-ИИ, который просто анализируя поведение пользователя делает выводы. Как пример - скопировал пользователь кусок текста в clipboard - подняли оценку. Быстро пролистал - понизили. Долго читал - подняли. И т.д.
Да, только потребуется алгоритм посложнее текущих. А вот его всем стартапам вломы реализовывать, поэтому и имеем только торчащие наружу RSS одинаковые для всех. Надо садиться и делать opensource библиотеку для всей этой кухни и пинать разработчиков сервисов ее использовать, тогда наступит вселенское счастье :)
Не, гуглу я такую информацию не отдам. Он и так про меня уже слишком много знает.
Да, надо делать как на slashdot.org, там просто неоцененные комменатрии в сложенном состоянии, слабо оцененные и сильно оцененные отличаются немного размером шрифта.
Т.е. приходим к выводу что база должна знать про все сайты, которые вы читаете(т.е. хранится как можно ближе к вам), но и одновременно быть доступна веб-сервисам типа Хабра для фильтрования. Лучше всего это делать в виде отдельного сервиса с внешним API, хранилищем баз и клиентским софтом для анализа посещаемых страниц.
Проверка спам/неспам будет по времени занимать столько же.
Основной overhead будет на подгрузке, пересчете и загрузке обратно базы конкретного пользователя. Причем делать это параллельно для кучи народа.
ну так либо у нас статика, которая быстро работает
либо динамика, которая удобна, но тормозит
можно еще добавить кеширование на динамику, тогда получится ваш вариант, но при большом разбросе галочек будет все арвн отормозить.
у того спам фильтра одна баесовская база, в нашем случае их много и они часто меняются
просто если галочек будет 100, то места на сервере под все RSS-ленты не хватит.
Вы предлагаете отсекать "плохой", неинтересный контент. Минус тут очевидный - тяжело сообщить компьютеру что же вам конкретно не понравилось. Самый простой пример - интересно читать то, что не знаешь и в круге интересов. Но читать про тот же google gears одно и то же десятый раз скучно и не интересно, хочется свежих данных. Но компьютер не знает что вы уже знаете про gears, а что нет и не может оценить полезность, т.к. по баесу статьи будут одинаковы.

Можно пойти с другой стороны, предлагать искать хороший, который похож на встретившийся. Критерии похожести могут быть разными - по содержанию, по тегам, еще того же автора, ... Вот здесь как раз всякие "неточные логики" и Баесы можно применять.
ну это не персонализированный как вы понимаете, просто стало больше лент. Если у вас 10 галочек, то вариантов уже 2 в десятой, т.е. 1024 ленты.

А вообще правильно делать это именно в виде отдельного веб-сервиса, который дает свое API во внешний мир, а сервисы типа Хабра его используют для настройки фильтров. Ну а поток этот сервис берет с того же Хабра сам один раз и фильтрует для всех пользователей в зависимости от настроек, которые переслал Хабр. Почему внешний? Потому что функция фильтрации нужна много где, а в данном случае для стартапа/развитого сервиса проще использовать уже готовое, чем свое городить. Да и все хорошо заоптимизировать можно будет, чтобы не тормозило.
Сервер не загнется всем Байеза расчитывать?
Я даже про персонализированные RSS ленты еще не слышал(чтобы хотя бы по пользователю можно было отсекать, удобно для разных community), а вы уже таких наворотов захотели.
А вообще такая идея легко реализуется в виде локального RSS-прокси, все собираюсь для себя такой написать, да никак собраться не могу.
Графический спам хоть и не ловится, но глазом определяется влет. А следовательно мне не нужно проглядывать письмо чтобы отправить его в корзину. Если бы спамеры все слали в картинках я был бы только рад.

Кстати, самый просто способ борьбы с этим явлением - в почтовиках встроить функцию затенения картинки(чтобы текст было не разобрать, но что за картинка было бы ясно) и растенения при наведении мышки или кнопке. Или просто показывать в виде thumbnail'ов маленьких.
По большей части online читалка нужна для синхронизации с несколькими компьютерами. Вот если бы они в GReader+Gears сделали возможность отдельно подгружать только статусы(read/flag/...), то вообще цены бы ему небыло. А так тянуть на комп тысячу сообщений чтобы прочитать из них только 100 - какой смысл?
Вторым этапом будет не переход на денежные отношения, а появление виртуальных денег и возможность обменивать виртуальные деньги одного сервиса на виртуальные деньги другого на виртуальной же бирже(чтобы курс был саморегулирующимся). Тогда, например, можно будет написать реально хорошую статью, получить за нее денежек, пойти в какую-нибудь MMORPG, обменяв эти денежки на внутри-игровые денежки или купить себе отстров в той же SecondLife. Ну и будет возможность обмениваться на какие-нибудь WebMoney с пользователями, которым нужны виртуальные деньги для каких-либо целей. Чем больше сервисов будет вовлечено в этот процесс, тем больше вероятность со временем и реальные ден.знаки с этого получать.
всегда отключаю загрузку внешних картинок и вам советую, ведь
загрузка картинки это лучший способ понять какие почтовые ящики реально читают, достаточно в каждом письме разместить ссылку на картинку вида http://imagehosting/Image1.jpg?UserEmail и потом собрать статистику какие картинки грузились.
минусы то забыли написать
самый большой по моему будет обеспечение секурности при таком подходе
в вашем случае нужно всего лишь вынести данные в online, для этого уже все сделали. Берете любой нормальный online storage и к нему устанавливаете софт, который показывает его как обычный локальный диск. После этого имеете доступный из любого места к своему файлу.
А вот текущая убогость online приложений пока удручает, я к переносу именно приложений пока отношусь скептически.
Какой смысл писать про десятку тех, которые и так на слуху у всех? Лучше бы написали про вторую, а лучше третью десятку. И заметка бы получилась уникальной, а подобных этой в инете и так много...

Information

Rating
Does not participate
Registered
Activity