Search
Write a publication
Pull to refresh
14
0

User

Send message

Фракталы в простых числах

Reading time3 min
Views156K


Я обнаружил этот фрактал, когда разглядывал интерференцию волн на поверхности речки. Волна движется к берегу, отражается и накладывается сама на себя. Есть ли порядок в тех узорах, которые создаются волнами? Попробуем найти его. Рассмотрим не всю волну, а только вектор ее движения. «Берега» сделаем гладкими, для простоты эксперимента.

Эксперимент можно провести на обычном листке в клеточку из школьной тетради.
Читать дальше →

Статистические тесты в R. Часть 1: Бинарная классификация

Reading time5 min
Views25K
Доброго времени суток. Хочу поделиться своими знаниями о работе со статистикой в R.
Многим из нас приходится сталкиваться с различными данными на работе и в повседневной жизни. Качественно и правильно их обработать и проанализировать не так сложно. В этой серии статей я покажу применения некоторых статистических тестов.

Заинтересовались? Добро пожаловать под кат.
Читать дальше →

Статистические тесты в R. Часть 2: Тесты качественных данных

Reading time4 min
Views21K
Эта статья — продолжение первой части. В этой серии статей я рассматриваю применение набирающего популярность языка программирования R для решения распространенных статистических задач.

В данной и следующей статье я показываю как выбрать для обработки качественных и количественных данных правильные тесты и реализовать их в R. Данные методы позволяют получить реальное представление об объекте, процессе или явлении по какому-либо параметру, т.е. позволяют сказать «хорошо» или «плохо». Они не потребуют глубоких знаний программирования и статистики, и пригодятся людям различного рода деятельности.

Заинтересовались? Добро пожаловать под кат!
Читать дальше →

Статистические тесты в R. Часть 3: Тесты количественных данных

Reading time3 min
Views24K
Это третья статья в серии о применении R для статистического анализа данных, в которой будут разбираться представление и тестирование количественных данных. Вы узнаете как быстро и наглядно представить данные, а также как использовать t-тест в R.

Часть 1: Бинарная классифиация
Часть 2: Анализ качественных данных

Поехали!
Читать дальше →

Посты-рекордсмены. Продолжение

Reading time5 min
Views30K
Судя по реакции на предыдущий пост, тема парсинга Хабра и альтернативных топов интересна не только мне, поэтому продолжу.
Спасибо всем, кто голосовал и комментировал и отдельно тем, кто присылал идеи новых рейтингов и исследований.

В предыдущем посте (Посты-рекордсмены / Хабрахабр), я пробовал различные варианты сортировки постов Хабра, отличные от обычного рейтинга. В этом я буду сортировать по рейтингу, но не все посты, а отобранные по определённым критериям.
Читать дальше →

Алгоритм Х или что общего между деревянной головоломкой и танцующим Линком?

Reading time5 min
Views68K


Предисловие


Как-то в гостях мне в руки попалась головоломка, в которой из 25 одинаковых фигурок требовалось собрать куб. Я провозился с ней почти весь вечер, и как можно догадаться, абсолютно безрезультатно. Тем не менее, я не мог сдаться просто так.

Не можешь сам — заставь компьютер. Сказано — сделано. В результате написанному по наитию алгоритму пришлось работать всю ночь, чтобы найти все 4 уникальных решения. В процессе гугления решений для сравнения, я нашёл программу Burr Tools, которая справилась с этой задачей за 3 минуты на моём ноутбуке.

Такая разница в скорости заставила меня разобраться, как решается эта задача и ещё целый класс подобных.

Так как же решается эта задача и ещё целый класс подобных?

Померяемся языками, чей длиннее?

Reading time3 min
Views61K
Всем привет!

Мы в Alconost занимаемся локализацией программного обеспечения и игр на 60+ языков и часто видим, как разработчики сталкиваются с одной и той же проблемой: в разных языках для передачи одной и той же информации требуется разное количество знаков. В итоге в интерфейсе пользователя некоторые надписи “не влезают” и их приходится сокращать, либо изменять размеры контролов.

Известно, что, к примеру, немецкий язык “длиннее” английского, а китайский — “короче”. Однако вряд ли у кого-то получится сходу точно сказать на сколько один язык более “знакоёмкий”, чем другой.

Нам стало интересно, мы собрали статистику и получили вот такую табличку с коэффициентами для примерно двадцати языковых пар — под катом.


Читать дальше →

Понимание букв

Reading time2 min
Views52K
Для того, чтобы выбрать правильные шрифты для хорошей читабельности текста, необходимо понимать основные принципы типографики. Дьявол кроется в деталях, а главная составляющая типографики — буква.

Книга «Основы стиля в типографике» (The Elements of Typographic Style), которую стоит рекомендовать всем начинающим дизайнерам, начинается со слов:
Типографика существует, чтобы отдавать должное содержанию.

Если и можно уместить все знания о типографике в одну фразу, то это именно она. Контент может кричать или шептать. Так же и шрифты, могут быть «громкими» и «тихими». Буквы, и в частности глифы, их различия, позволяют придать тексту много оттенков.

Правильное сочетания букв позволяет максимально ярко передать настроение текста. А лучше всего это умеют делать дизайнеры логотипов!

Пожалуй, самый популярный логотип, который демонстрирует «владение буквами» — это логотип FedEx, разработанный Линдоном Лидером (Lindon Leader). На первый взгляд, это обычное применение Futura Bold. Однако если присмотреться, видно, как были изменены буквы «E» и «x», чтобы образовалась стрелка:
image
Читать дальше →

На какие языки переводить проект в первую очередь?

Reading time1 min
Views17K
Всем привет!

В Alconost мы занимаемся локализацией программного обеспечения, игр и сайтов на более чем 60 языков.

Клиенты часто спрашивают — на какие языки стоит локализовать продукт? В качестве ответа, мы подготовили немного интересной статистики по степени распространения языков в Интернете:
Читать дальше →

Доклад ОЭСР: интернет на пять порядков эффективнее телефонных сетей. Не нужно мешать ему развиваться!

Reading time2 min
Views23K
Последний доклад Организации экономического сотрудничества и развития (ОЭСР), посвящённый мировому рынку интернет-трафика, опубликованный 17 октября, состоит из 99 страниц, которые читаются, как увлекательный детектив. Он содержит подробные статистические данные об интернет провайдерах, точках обмена трафиком, росте пропускной способности интернета, механизмах самоорганизации, регулирующих всемирную сеть. Но я хочу остановиться на сравнении интернета и телефонных сетей, которое часто используется в докладе.

С момента своего появления интернет демонстрирует устойчивый экспоненциальный рост (сегодня 20 среднестатистических абонентов с широкополосным доступом генерируют столько же трафика, сколько весь интернет в 1995 году). Его пропускная способность намного превосходит возможности любых других глобальных систем связи. При этом цена трафика в международных точках обмена, в эквиваленте поминутной оплаты за голосовую связь, составляет 0.0000008 долларов в минуту — на пять порядков ниже, чем в телефонных сетях. Частично это объясняется технологическим превосходством сетей с коммутацией пакетов, но эта разница не настолько велика, тем более что телефонные сети уже давно используют пакетную коммутацию. Ключевое отличие в другом.
Читать дальше →

Социальные сети в России, лето-2013: цифры, тренды, прогнозы

Reading time4 min
Views44K
Привет, Хабр!

Наш проект растёт не по дням, а по часам и дорос-таки до создания целого корпоративного блога! За год нашего существования мы успели накопить серьезный опыт в области разработки систем класса OBD (Online Big Data) и рады поделиться им с вами. Поскольку наш блог представляет консорциум разно-индустриальных команд, то и темы публикаций будут весьма разнообразны — от разработки до лингвистики, от социологических исследований до системной инженерии, от аналитики до маркетинга.

А начать мы хотели бы со статьи о динамике проникновения социальных медиа в России и о наших прогнозах на ближайшее будущее соцмедиа, которые мы вместе сможем проверить уже через полгода. За первые 6 месяцев 2013 года количество публичных сообщений в русскоязычных соцмедиа, выросло в 1,5 раза и составило порядка 300 млн в месяц, а среднемесячное количество авторов публичных сообщений увеличилось на 4 млн человек.
Читать дальше →

Выступление Эдварда Йордона на RCC 2013: «Прошлое, настоящее и будущее»

Reading time12 min
Views9.4K


Как уже знает большинство из наших читателей, одним из спикеров недавно прошедшего финала Russian Code Cup был Эдвард Йордон (Edward Yourdon).
Скрытый текст
Пионер в разработке методологии программирования и автор метода Йордона, член Компьютерного зала славы и автор бестселлеров по практике программирования, в числе которых культовый «Путь камикадзе».

В этом посте мы хотели бы дать несколько вольное изложение основных идей, о которых господин Йордон говорил в своём выступлении на RCC.
Читать дальше →

Демография соц.сетей. Знай свою целевую аудиторию в лицо

Reading time10 min
Views68K
Краткое резюме исследования:

Facebook по прежнему смещен в сторону молодежи, но в аудитории от 45 до 54 лет наблюдается рост в 45% с конца 2012 года. Более 75% американских граждан выпускников колледжей пользуются Facebook; более 67% пользуются Facebook независимо от уровня образования.
Instagram: 68% пользователей Instagram составляют женщины, согласно данным Appdata.
Twitter обладает удивительно молодой аудиторией пользователей, как для большой социальной сети. Он пользуется популярностью среди одержимых новостями пользователей в урбанизированных районах.
LinkedIn является более международной сетью, смещенной в сторону мужской аудитории. 61% ее пользователей составляют мужчины, и 64% находятся за пределами США.
Google+ является наиболее ориентированной на мужчин социальной сетью. 70% пользователей — мужчины.
Pinterest: преобладают пользователи планшетов, и 84% американских пользователей — женщины.
Tumblr может похвастаться подростками и молодыми людьми, которые заинтересованы в самовыражении.



Под катом много диаграмм.
Читать дальше →

Анализ вовлеченности мобильных пользователей

Reading time2 min
Views6.5K
22 октября американская аналитическая компания Flurry выпустила очередной отчет, посвященный изучению пользовательской вовлеченности. На Хабре уже мелькал голый перевод статьи, но мы в компании решили его проанализировать и в этом посте поделимся результатами.

По данным, полученным при изучении более 230 000 приложений, зарегистрированных в системе, была построена «матрица вовлеченности»: все приложения разделены на категории и ротированы в зависимости от частоты использования в неделю и % пользователей, которые продолжают пользоваться приложением по истечении 90 дней.

image

Как видно из таблицы, наилучшими показателями вовлеченности обладают приложения, имеющие социальную составляющую (социальные сети и многопользовательские игры, знакомства и различные im-сервисы), что и неудивительно. В зависимости от типа приложений, американские аналитики даже рекомендуют оптимальный вид монетизации. Так для приложений с высокой частотой использования, но небольшим процентом возвращений (квадранты II и III) — это платные приложения и in-app purchase, а для приложений с высокой долей возвратов (I и IV) — рекламная модель.

Но даже больший интерес, на наш взгляд, представляют не сами эти данные, а сравнение их с аналогичным отчетом компании за 2009 год.
Читать дальше →

Число Данбара и пользователи ВКонтакте

Reading time3 min
Views131K
Robin Dunbar with a Neaderthal skullНедавно я наткнулся на такую удивительную штуку как число Данбара.
История такова. 20 с лишним лет назад, когда выражение «британские учёные» ещё не было мемом, антрополог Робин Данбар, изучая данные по человекообразным обезьянам, обнаружил, что численность их стаи подчиняется определённому закону. Есть максимальное количество членов стаи. Если стая разрастается и её численность превышает порог, она разделяется на две. Причём для разных видов этот предельный размер получается разным.
Читать дальше →

Получение 3D объекта по 1 фото

Reading time1 min
Views74K


На выставке SIGGRAPH ASIA 2013 (англ.), посвященной компьютерной графике и интерактивным технологиям, представлена разработка 3–Sweep, позволяющая лишь по одной фотографии получить трехмерный объект с текстурой. Хотя речь идет о объектах являющихся наборами примитивов и их растяжений по некоторому пути, но скорость и простота работы впечатляет! Также оценивается и дополняется то, что могло бы быть за объектом, после его вырезания из фотографии, хотя мы уже видели похожий инструмент от Adobe.
Читать дальше →

Как Яндекс распознаёт музыку с микрофона

Reading time10 min
Views161K
Поиск по каталогу музыки — это задача, которую можно решать разными путями, как с точки зрения пользователя, так и технологически. Яндекс уже довольно давно научился искать и по названиям композиций, и по текстам песен. На сказанные голосом запросы про музыку мы тоже умеем отвечать в Яндекс.Поиске под iOS и Android, сегодня же речь пойдёт о поиске по аудиосигналу, а если конкретно — по записанному с микрофона фрагменту музыкального произведения. Именно такая функция встроена в мобильное приложение Яндекс.Музыки:

image

В мире есть всего несколько специализированных компаний, которые профессионально занимаются распознаванием музыкальных треков. Насколько нам известно, из поисковых компаний Яндекс стал первым, кто стал помогать российскому пользователю в решении этой задачи. Несмотря на то, что нам предстоит ещё немало сделать, качество распознавания уже сопоставимо с лидерами в этой области. К тому же поиск музыки по аудиофрагменту не самая тривиальная и освещённая в Рунете тема; надеемся, что многим будет любопытно узнать подробности.
Читать дальше →

Общественное обсуждение проекта ГОСТ по компрессии оцифрованных аудиоданных

Reading time22 min
Views6.7K
Уважаемые Хабрапользователи!

Продолжая начатую недавно традицию публикации проектов стандартов, разрабатываемых нашей компанией в рамках деятельности технического комитета по стандартизации ТК-234 «Системы тревожной сигнализации и противокриминальной защиты», представляем вашему вниманию стандарт «Системы охранные телевизионные. Компрессия оцифрованных аудиоданных. Общие технические требования и методы оценки алгоритмов».

Будем крайне признательны за конструктивную критику проекта, а все ценные замечания и пожелания будут внесены в очередную редакцию стандарта. Текст стандарта под катом.
Читать дальше →

Жизненная позиция пользователей ВКонтакте в зависимости от пола и возраста

Reading time2 min
Views88K
В анализе Фейсбука, который провел Стивен Вольфрам, мне особенно понравились графики изменения интересов людей в зависимости от пола и возраста. Поэтому я решил посчитать нечто похожее для отечественной соцсети ВКонтакте. В анкете ВКонтакте есть любопытная группа полей — «Жизненная позиция», по значениям которых можно искать фактически в реляционном стиле. Поэтому от меня не требовалось разворачивать мощную data mining инфраструктуру, а лишь обработать результаты нескольких сотен GET-запросов.

Для начала — общее кол-во людей по возрастам:

Так как мужчины и женщины неодинаково активны в социальных сетях, а так же учитывая наличие фейков и ботов, я бы не стал делать из этого графика далеко идущие демографические выводы.
Больше графиков!

Жизненная позиция пользователей ВКонтакте. Бонус-трек. Корреляции

Reading time2 min
Views46K
Почти сразу после того, как я опубликовал пост Жизненная позиция пользователей ВКонтакте в зависимости от пола и возраста, появилась идея проверить, как зависит тот или иной аспект жизненной позиции от других. Как упоминалось в предыдущем посте, для этого опять-таки не нужно было делать сложных расчетов, всего лишь обратиться к поиску по профилям ВКонтакте.

Статистику по общему кол-ву людей разных возрастов см. в первой части. Напомню, что по горизонтали на всех графиках отложен возраст людей.

Вот как на жизненные ориентиры мужчин влияет пристрастие к спиртному:

Оправдывается очевидное предположение, что любители выпивки гораздо чаще трезвенников считают главным в жизни развлечения и отдых. Кроме того, положительно относящиеся к алкоголю мужчины больше сконцентрированы на красоте, искусстве, славе, карьере и деньгах, меньше — на саморазвитии, семье и детях.
Читать дальше →

Information

Rating
Does not participate
Registered
Activity