Как стать автором
Обновить
21
0

Пользователь

Отправить сообщение
На сайте фонда Vox Populi есть пресс-релизы по проведенным исследованиям тут. К сожалению, сами исследования открыты не все, но на те, которые открыты, есть ссылки в конце соответствующего пресс-релиза. Например, есть открытое полное исследование по упомянутой в статье акции «Всем миром».
А за окончание школы/ВУЗа какой возраст принимался?
Я не критикую, я любопытствую) А «Александры» — только уникальные учитывались?
Идеи витают в воздухе) Как раз собираемся обнародовать наши данные о возрасте активных авторов в соцсетях.
Мы пошли по прямому пути и взяли только открыто указанные в профиле даты рождения. Но для нашей сферы точность — принципиальна.
Опосредованное определение возраста пользователя (например, по возрасту друзей), мне кажется, чревато адскими искажениями результата: например, в результате такого определения возраста, судя по вашему исследованию, около 40% 10-11-летних пользователей состоят в браке ))
«Плывут» и другие результаты, которые привязаны к возрасту: резкое падение всех популярных имен к 2006 году, связано, вероятно и с тем, что пользователей с таким годом рождения сильно меньше?
То есть мы понимаем, что даже открытая дата рождения — далеко не гарантия истинности, а известна ли погрешность при использовании вашего метода?
спасибо за информацию!
спасибо за информацию!
Вещчь забавная, идея работы понятна: взять тот же стенфордский синтаксический парсер, строящий дерево зависимостей, разметить примеры и обучить нейросеть.

Но протестируем:
However, sales of its new Lumia phones, which run a Microsoft operating system, rose during the period. — нейтрально — со сложными предложениями не работает;
Nokia shares jumped 45% on news of the deal. — показывает негатив, вместо позитива — экономика в пролете;
Manchester United beat Liverpool 1-0 in an entertaining Capital One Cup tie. — позитив, но кому: Манчестеру или Ливерпулю (думаю, болельщики Ливерпуля не обрадуются)?
и т.д.

Выводы:
1) заточена под очень конкретную тему;
2) говорить о 85% точности — очень рано, а дообучить до 95% — привет фантастам;
3) главный недостаток этой игрушки (как и большинства движков по тональности) — нет привязки к объекту: тональность показывается для предложения в целом.

ИМХО: в практическом использовании такая штука не то, чтобы совершенно бесполезна, но очень узко применима.
Метод сбора действительно для каждого источника индивидуальный. Но количество источников ограниченно совсем не поэтому.
МеМо получает информацию от платформы iLook, количество источников которой можно оценить тут.
Количество источников в самом МеМо ограниченно для удобства пользователя, задача которого отслеживать информационное поле вокруг события или персоны не во всех социальных медиа, а опираясь только на сообщения авторитетных ресурсов/блоггеров и т.д.
нет, это не оно)
Пока существующая реализация заточена под конкретного заказчика (оптимизирована по набору источников и тд), поэтому публично мы её не демонстрируем (есть свои «политические» тонкости и секретности). Но в ближайших планах реализация открытого варианта, так что скоро будет можно )
Аналогично предыдущему ответу — это распространенное написание в зоне .kz в пользовательском контенте.
Ключевые слова работают на весь поток сообщений, поэтому все сообщения со словом «Сноуден» собираются по умолчанию, выделены просто такие нетипичные варианты написания по странам, как например «Сноувден», при чем они так же работают на весь поток
Цель данной статьи — не анализ обсуждений по Сноудену, а демонстрация возможностей по авто-определению языка и геолокации сообщений в реальном масштабе времени на больших объемах неструктурированных данных.
Если есть интерес к социологическим выкладкам по теме, то с ними можно ознакомиться в Коммерсанте, или на сайте наших партнеров — фонда «Vox Populi», в статье мы не приводили их намеренно, дабы не перегружать «лирикой» хабро-жителей)
Система собирает упоминания по ключевым словам, вариант с «Едвард» так же есть в ключевых словах, соответственно все сообщения с этим словом так же попали в тему. Поскольку анализируются сообщения соцмедиа, в запрос включены те варианты, которые чаще всего встречаются в пользовательском контенте, в том числе варианты с опечатками, жаргонизмы и т.п.
Что касается RSS-подписок, в поток будет попадать то, что источник отдает по RSS — полный текст, анонс или только заголовок. Можно будет сохранить новость путем добавления в «Избранное» для чтения офф-лайн, то сохраниться, конечно, полный текст.
Если подписка осуществлена не на RSSку, а с помощью поиска, то можно читать полные тексты.
в Flipboard из соцсетей только Твиттер и Фейсбук, на сколько я знаю. Это уже весьма существенное отличие, и для чтения, и для постинга. Кроме того, и количество ресурсов, по которым осуществляется поиск, весьма ограничено, особенно, что касается Рунета.
Хм) Предустановленный набор тематических подписок — это, на мой взгляд, просто разумно, как одна из функций, — многим пользователем их бывает более чем достаточно. Но если это единственная функция Google Media, то смысл нашего приложения совершенно другой, т.к. мы как раз предоставляем пользователю множество различных вариантов создания собственныхлент.
Что касается дизайна — пока только скриншоты Google Media глянула, не сказала бы, что сильно похожи…
Не могу ничего сказать про Google Media, честно говоря. А вы активный пользователь этого приложения? Не могли бы вы рассказать, какие там пряники?
Отличная идея, спасибо за наводку)
На первом этапе приложение будет бесплатным для пользователей. Позже появятся и платные версии, но различия будут не в функционале, а в количестве результатов поисковой выдачи, источников и подключенных аккаунтов соц. сетей
Да, можно сделать агрегацию нескольких rss в один поток, с правильным порядком сообщений по дате. Что касается обрезаний — приложение отдает ровно столько, сколько получает от источника, если это полный текст, значит полный. Если это анонс текста, или только заголовок, то и в ленте будет именно это. Единственное, если сохранить новость путем добавления в «Избранное» для чтения офф-лайн, то сохраниться, конечно, полный текст.

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность