Как стать автором
Обновить
  • по релевантности
  • по времени
  • по рейтингу

Государство соберёт персональные данные россиян везде, где можно, и будет хранить централизованно

Информационная безопасность*

Сайты, вахтёры и охранники обязаны будут закачивать собранные данные на специальный портал


В России собираются создать особый портал по контролю за распространением персональных данных. Идею обсуждает рабочая группа в администрации президента, которую возглавляет советник президента России Игорь Щеголев, пишут «Известия».

Сейчас паспорт человека проверяют в различных учреждениях: общежитиях, бизнес-центрах, школах и т.д. Каждый охранник/вахтёр вносит информацию во внутреннюю документацию — табель, журнал посещений и проч. Такая разрозненность информации — большая проблема, поскольку с неструктурированными данными очень сложно работать. «В итоге эти данные появляются не пойми где», — объясняет президент Фонда информационной демократии Илья Массух.
Читать дальше →
Всего голосов 14: ↑11 и ↓3+8
Просмотры17K
Комментарии 110

«Вымпелком» выполнит дата-майнинг своих абонентов по заказу любого клиента

Информационная безопасность*Data Mining*Big Data*Сотовая связь
«Вымпелком» запустил новый сервис, который позволяет компаниям получить демографические данные своих клиентов: возраст, доходы, интересы и многое другое. Это возможно путём дата-майнинга по базам, которые собирает «Вымпелком».

Соответствующую услугу предоставляет компания «Билайн бизнес», подразделение «Вымплекома». Сейчас сервис экспресс-аналитики Big Data в демонстрационных целях открыт бесплатно.
Читать дальше →
Всего голосов 15: ↑15 и ↓0+15
Просмотры7.4K
Комментарии 51

Во время пандемии COVID-19 в онлайн-магазинах снизились оценки ароматических свечей

Data Mining*Управление e-commerce*Статистика в ITЗдоровье

Сравнение средней оценки ароматических свечей (выделено цветом) и свечей без запаха на Amazon.com. Пунктирная вертикальная линия показывает первый выявленный случай COVID-19 на территории США. График Washington Post.

Основной нейрологический симптом новой коронавирусной инфекции — это аносмия. Исследования показывают, что потеря обоняния предсказывает заболевание лучше, чем другие известные симптомы, к примеру, кашель или повышенная температура тела. Как и всё связанное с заболеванием, механизм, который заставляет терять способность различать запахи, исследован лишь частично. Но уже известно, что коронавирусная инфекция в большинстве случаев затрагивает не нейроны обоняния, а вспомогательные клетки, поэтому поражение не долгосрочное. Это могут подтвердить и сами переболевшие, которые постепенно вновь начинают чувствовать запахи.
Читать дальше →
Всего голосов 4: ↑4 и ↓0+4
Просмотры3.2K
Комментарии 3

Дата-майнинг на службе у эйчара

GTD*Управление персоналом*
Отделы кадров крупнейших IT-компаний используют новейшие технологии для слежки за персоналом. Уже записывается не только почтовая переписка, но также IM-сообщения и SMS. Цель — составить из этих кусочков цельные поведенческие модели (в контенте выявляются эмоции, лидерские качества сотрудников, их усталость и мотивация) и тщательно профилировать каждого сотрудника, чтобы оценить его эффективность и полезность для фирмы.
Читать дальше →
Всего голосов 29: ↑20 и ↓9+11
Просмотры1.3K
Комментарии 51

Google применил алгоритмы на своих сотрудниках

GTD*Управление персоналом*
Обеспокоенная утечкой мозгов, компания Google применила для решения проблемы испытанное средство: алгоритм.

Недавно поисковый гигант создал специальную базу данных, в которой собрана вся информация о сотрудниках, включая их платёжную историю, отзывы и рекомендации, факты карьеры, ответы на собеседовании и т.д. На этой базе начали прогонять алгоритм, вычисляющий вероятность, с которой данный конкретный сотрудник захочет уйти из компании. То есть получается постоянно обновляющийся список «рискованных позиций». Соответственно, компания может заранее начать поиск сотрудников на эти вакансии или предложить имеющемуся сотруднику лучшие условия труда.
Читать дальше →
Всего голосов 82: ↑75 и ↓7+68
Просмотры1.1K
Комментарии 70

Алгоритм + толпа — этого недостаточно

Краудсорсинг
Перевод
В последнее десятилетие онлайновым миром управляли две родственные силы: Толпа и Алгоритм. Коллективные «пользователи» интернета (Толпа) создают контент, кликают и голосуют, в то время как математические уравнения привносят масштабируемость и возможность поиска по этому огромному массиву данных (Алгоритм).



Словно луна над океаном, взаимодействие этих двух сил создаёт волны популярности (и забвения) в интернете. Информация более доступна, полезна и эгалитарна, чем когда бы то ни было.

Но со временем (по крайней мере, мне) стали видны слабости системы «алгоритм+ краудсорсинг». Следующая революция кажется неотвратимой.
Читать дальше →
Всего голосов 50: ↑39 и ↓11+28
Просмотры1.1K
Комментарии 9

Дата-майнинг для информационной безопасности

Блог компании IBMИнформационная безопасность*Data Mining*Hadoop*


На Хабре много писали о суперкомпьютере IBM Watson. Предполагается, что такая машина должна служить людям: помогать ставить диагнозы и решать другие сложные проблемы путём анализа массивов структурированных и неструктурированных данных. Но можно ли систему дата-майнинга приспособить для нужд информационной безопасности компании?
Читать дальше →
Всего голосов 18: ↑14 и ↓4+10
Просмотры12K
Комментарии 43

Дата-майнинг помог заработать Пулитцеровскую премию

Data Mining*


Самую престижную награду в области журналистики в этом году получила газета Sun Sentinel из Южной Флориды за серию статей «Превыше закона: копы на высокой скорости».

Для расследования журналисты запросили из полицейских участков записи о прохождении патрульными машинами пропускных пунктов SunPass на платных дорогах. В каждой записи SunPass стоит отметка с точным временем прохождения пункта. Полиция предоставила информацию, не заподозрив подвоха.
Читать дальше →
Всего голосов 136: ↑126 и ↓10+116
Просмотры81K
Комментарии 170

Twitter передал шести университетам всю базу твитов с 2006 года

Информационная безопасность*Data Mining*Twitter API*


Каждый день в Twitter публикуется 500 млн сообщений. Такой массив информации с персональными данными — настоящая золотая жила для дата-майнинга. На базе твитов учёные изучают паттерны в человеческом поведении, социальные связи, распространение инфекционных болезней, факторы риска для организма человека и многое другое, пишет июньский выпуск журнала Scientific American.
Читать дальше →
Всего голосов 40: ↑35 и ↓5+30
Просмотры23K
Комментарии 35

Дата-майнинг делает научные открытия

Высокая производительность*Data Mining*


Интересная статья опубликована в журнале New Scientist о том, как дата-майнинг применяется для анализа большого объёма научной информации. Цель — поиск ценной информации в разрозненных научных статьях. Эти закономерности люди, вероятно, не способны обнаружить собственными силами, без автоматической обработки. Это неудивительно, ведь объём опубликованных научных документов в интернете только на английском языке уже превысил 100 миллионов документов. Это огромный информационный шум, из которого практически невозможно извлечь полезную информацию. То есть, невозможно извлечь человеческим умом.

Понятно, что без дата-майнинга в современной науке нельзя. Скажем, петабайты информации с Большого адронного коллайдера обрабатывают месяцами/годами, чтобы определить наличие или отсутствие эффектов, предполагаемых той или иной теорией. Но здесь речь идёт о более «тонком» анализе научных результатов от разных авторов для поиска скрытых закономерностей, совпадений.
Читать дальше →
Всего голосов 50: ↑35 и ↓15+20
Просмотры28K
Комментарии 11

Средняя температура по больнице, кластеры данных и принятие решений в проекте

Веб-аналитика*

0. Intro


Приятно видеть, как люди запускают множество сервисов и приложений. Кому-то везет и  успех к продукту приходит сам. Большинство же должно адекватно оценивать ситуацию на своем проекте и принимать правильные решения, ведущие к своему лунапарку с нардами и секретаршами.
Сейчас я предложу вам один из вариантов того, как правильно оценивать ситуацию с продуктом, принимать решения и не попасться на ошибку «средней температуры по больнице». Под капотом — немного датайманинга, больничных метафор и «стартаперских метрик».


Это птичка века и она поможет нам с сегодняшней статьей.

Читать
Всего голосов 7: ↑7 и ↓0+7
Просмотры3.6K
Комментарии 2

Data Science: Про любовь, имена и не только

Блог компании ОдноклассникиData Mining*Big Data*Машинное обучение*
Из песочницы
Что значит имя? Роза пахнет розой,
Хоть розой назови ее, хоть нет.

• Шекспир "Ромео и Джульетта" (пер. Пастернака)

Ромео и Джульетта


Данная статья не может служить поводом для выражения нетолерантности или дискриминации по какому-либо признаку.


В этой статье я расскажу о том, что несмотря на то, каким бы странным это не казалось для образованного человека, вероятность быть одинокой/одиноким зависит от имени. То есть, по сути, мы поговорим про любовь и отношения.


Это примерно все равно, что сказать: вероятность быть сбитым машиной, если тебя зовут Сережа, выше, чем если бы тебя звали Костя! Звучит довольно дико, не правда ли? Ну, как минимум, ненаучно. Однако социальные сети сделали возможным сравнительно просто проверить приведенное выше утверждение.


Подробно мы рассмотрим только девушек, а про мужчин поговорим в самом конце. Более того, я не ставлю своей целью установить причину происходящего или даже выдвинуть какую-то сколько угодно серьезную гипотезу, а хочу лишь рассказать о своих наблюдениях и фактах, которые можно измерить.

Читать дальше →
Всего голосов 75: ↑69 и ↓6+63
Просмотры27K
Комментарии 53

Зарабатываем с фитнес-трекером до $240 в год (если есть американская страховка)

ГаджетыКиберпанкНосимая электроникаЛайфхаки для гиковЗдоровье

Фитнес-трекер Misfit

Необычный альянс заключили американская страховая компания Oscar Health Insurance и производитель фитнес-трекеров Misfit. Начиная с января, каждый застрахованный клиент Oscar Health Insurance получает возможность зарабатывать по $20 в месяц ($240 в год), выполняя заданную для него норму по пройденной дистанции.

К сожалению, премию дают не наличными, а гифт-картами Amazon, да и такой доход не окупит стоимость страховки, но всё равно это довольно необычное и приятное предложение. По крайней мере, фитнес-трекер становится не игрушкой избалованного хипстера-дигерати, а источником получения реального дохода. Другими словами, с точки зрения финансового менеджмента, он мгновенно превращается из пассива в актив.
Читать дальше →
Всего голосов 16: ↑13 и ↓3+10
Просмотры6.2K
Комментарии 8

Нейросеть определяет тунеядцев по метаданным сотовой сети с вероятностью 70,4%

Научно-популярноеИскусственный интеллектСотовая связь

Индикаторы использования сотовой связи офисными сотрудниками, безработными, пенсионерами, учителями и студентами. Например, нейросеть определила для офисных сотрудников такой специфический индикатор, как большая длительность исходящих звонков

Благодаря социальным сетям и метаданным сотовой связи специалисты получили удобный и достаточно точный инструмент для изучения общества. Некоторую информацию люди публикуют в соцсетях сознательно, а часть важных данных выдают непроизвольно. Скажем, анализ анонимных метаданных сотовой связи показывает трафик на дорогах, скорость движения автомобилей, образование пробок, пассажиропотоки общественного транспорта. Это довольно логичные варианты дата-майнинга. А вот группа учёных из Telenor Group Research, MIT Media Lab, Flowminder Foundation и Стокгольмской школы экономики нашла весьма нестандартный вариант. Исследователи доказали, что по логам сотовой связи можно предсказывать… занятость. Довольно точно определяются безработные и представители ещё 17 родов занятий.

По информации учёных, это первое в мире исследование такого рода, когда безработных или профессию человека вычисляют на индивидуальном уровне с помощью глубинного обучения по логам сотовой сети. Раньше исследователи пытались предсказать только общий уровень безработицы по мобильным данным, но не профессии конкретных людей.
Читать дальше →
Всего голосов 40: ↑38 и ↓2+36
Просмотры46K
Комментарии 50

Предсказание массовых сборищ граждан по статистике мобильных звонков

Блог компании IBMСотовая связь


Вездесущность мобильных телефонов и тот факт, что метаданные о звонках населения легко доступны для обработки в реальном режиме времени, дают властям возможность держать руку на пульсе общества, чётко контролировать ситуацию и заблаговременно реагировать, предотвращая потенциально опасные явления.

Учёные из IBM Research (Ирландия) и Междисциплинарного центра по сетевым наукам и приложениям университета Нотр-Дама (США) в опубликованной научной работе показывают, что информация из сотовых сетей способна дать полезные знания о поведении городских жителей.
Читать дальше →
Всего голосов 12: ↑11 и ↓1+10
Просмотры7.7K
Комментарии 12

Банки присматриваются к телефонным звонкам кредитополучателей

Социальные сети и сообществаСотовая связь
Кому вы звоните, что пишете в Facebook, что ищете в Google, куда ходите по пятницам — всё это банки скоро начнут учитывать при выдаче кредита.

Финансовые учреждения весьма консервативны и пока не осознают ценность телефонных метаданных, а также другой информации, которую можно получить со смартфона и из социальных сетей. Но скоро ситуация изменится. Появился ряд финансовых ИТ-стартапов, которые разрабатывают технологии анализа метаданных, чтобы вычислить кредитный рейтинг пользователя и вероятность возврата им кредита.
Читать дальше →
Всего голосов 16: ↑13 и ↓3+10
Просмотры9.6K
Комментарии 8

Компьютеры обошли людей в вербальном тесте IQ

Искусственный интеллектIT-компании
Более ста лет назад немецкий психолог Уильям Штерн (William Stern) предложил тест оценки интеллекта человека, который получил название теста IQ. С тех пор тест IQ получил довольно широкое распространение как стандартная методика для оценки интеллекта детей при поступлении в школу, а также для оценки взрослых кандидатов на работу.

Тесты IQ обычно содержат три типа вопросов: 1) вопросы на логику, где нужно распознать шаблон в последовательности изображений; 2) математические вопросы, где нужно определить шаблон в последовательности чисел; 3) словесные задачи, основанные на аналогиях и классификациях, как синонимы и антонимы.

Исследователи из подразделения Microsoft Research в Пекине совместно с коллегами из университета науки и технологий Китая разработали технологию ИИ, способную решать третий тип задач из перечисленных выше (научная статья).
Читать дальше →
Всего голосов 17: ↑14 и ↓3+11
Просмотры8.6K
Комментарии 1

IBM Watson поможет выбрать игроков для виртуальной команды

Блог компании IBMКраудсорсингИскусственный интеллектИгры и игровые приставки


Многие любители футбола знают такую забаву как виртуальный футбольный менеджер. В одной из разновидностей игры вы набираете команду из настоящих игроков, и она получает очки в случае удачной игры этих игроков в офлайне за свои настоящие клубы. В виртуальной лиге ваши соперники — тысячи других менеджеров со своими уникальными командами.

В США популярны фэнтезийные лиги по игре в американский футбол. И фанатам этого вида спорта очень повезло: скоро они смогут воспользоваться помощью искусственного интеллекта, а точнее — компьютера IBM Watson.
Читать дальше →
Всего голосов 7: ↑6 и ↓1+5
Просмотры3K
Комментарии 2

Компьютерная программа совершила важное открытие в лечении спинного мозга

Научно-популярноеИскусственный интеллектЗдоровье


Доктора только что узнали кое-что новое о послеоперационном восстановлении спинного мозга при травмах позвоночника. Обнаружена связь между успехом долговременного восстановления и высоким артериальным давлением во время операции. Казалось бы, незначительная новость, но она может помочь быстрее встать на ноги миллионам пациентов. Самое интересное то, каким образом сделано это открытие. Его совершила компьютерная программа.
Читать дальше →
Всего голосов 26: ↑20 и ↓6+14
Просмотры20K
Комментарии 7

Twitter запретил спецслужбам США использовать сервис аналитики

Социальные сети и сообщества

Американские спецслужбы, как и российские коллеги, одержимы мониторингом социальных сетей




Twitter заблокировал разведывательным агентствам США доступ к аналитическому инструменту Dataminr для дата-майнинга твитов по геотагам в реальном времени, пишет WSJ. Этот сервис используется компаниями в финансовой индустрии, информационной безопасности, менеджменте, сфере управления рисками, медийными компаниями и т.д.
Читать дальше →
Всего голосов 13: ↑10 и ↓3+7
Просмотры11K
Комментарии 13
1