Pull to refresh
  • by relevance
  • by date
  • by rating

Портрет Хабра-tutorial

DM Labs corporate blogHabr
В наш век только бесполезные вещи и необходимы человеку. Оскар Уайльд, Портрет Дориана Грея (источник)

А вы никогда не задумывались, чем обычный пост на хабре (порошок обычныйTM) отличается от tutorial? И как это «отличается» вообще можно измерить? Есть ли здесь какие-то закономерности и можно ли по ним предсказать метку:

В данной статье мы обсудим так называемый exploratory data analysis или кратко EDA (исследовательский анализ данных) применительно к статьям Хабрахабра, а в частности уделим особое внимание tutorial. Прежде всего EDA направлен на детальное изучение данных, и необходим для понимания, с чем мы собственно работаем. Важной частью является сбор и очистка данных и сам выбор какие данные собирать. Особенность метода состоит в визуализации и поиске важных характеристик и тенденций.

Exploratory data analysis — это первый шаг в изучении и понимании данных, без него мы можем загнать себя в многочисленные ловушки, описанные ранее автором в статье: "Как правильно лгать с помощью статистики".

Как выглядит обычный хабра-tutorial


В качестве простой демонстрации рассмотрим простейшую картину из трех параметров: просмотры, избранное (favourites) и рейтинг (количество плюсов), для трех классов: все статьи вместе, обычный пост (не-tutorial) и tutorial.

Даже в столь упрощенной картине, заметна разница между классами. Наша интуиция и здравый смысл подсказывают нам, что tutorial в среднем чаще добавляют в избранное, но интуиция не говорит насколько чаще, и что они набирают меньше плюсов и просмотров. Эти и многие другие интересные вопросы мы рассмотрим далее в статье.

Структура статьи
  1. Как выглядит обычный хабра-tutorial
  2. Собираем данные
  3. Хабра-данные
  4. Исследуем tutorials
  5. Разбираем интересные примеры
  6. Предсказываем метку tutorial
  7. Как сделать набор данных лучше
  8. Заключение
  9. Дальнейшее чтение

Читать дальше →
Total votes 90: ↑81 and ↓9 +72
Views11.6K
Comments 5

35 полезных советов для участников Ludum Dare

Game development
image

Совсем недавно, 9 мая, завершился подсчет результатов Ludum Dare 35. Ludum Dare — международный игровой джем (по-простому — конкурс, на котором нужно за 48 или 72 часа полностью сделать игру). Мы участвовали в нем не единожды (для кое-кого из нас это уже 4ый LD подряд), но сейчас среди нас есть и новички. На волне энтузиазма от прошедшего события и была написана эта статья.

Завершив последний проект для Ludum Dare 35, мы хотели написать пост-мортем. Но в итоге получилось нечто вроде набора советов, основанных на собственном опыте, для тех кто хочет участвовать в этом конкурсе. Надеемся, что это будет полезно как новичкам, так и тем, кто уже не первый раз делает игры для джемов.

Многие из данных советов могут показаться очевидными, но каждый из них может оказаться для кого-то полезной каской от лишних граблей. Особенно для тех, кто еще не участвовал ни в чем подобном.
Читать дальше →
Total votes 11: ↑10 and ↓1 +9
Views9.1K
Comments 3

«Расстрелять» Александра Покровского — философские притчи для айтишников

Reading room


Симфония разработки программного обеспечения издалека выглядит величественно. Аналитики фиксируют точные, полные и непротиворечивые требования, вдохновленные дизайнеры создают прекрасный и удобный дизайн, разработчики пишут совершенный код, тестировщики героически бьются за качество. Но чем ближе ко всей этой красоте, тем все более заметными становятся встречающиеся в любой конторе абсурдные моменты, которые способны повредить психику отдельно взятого айтишника. В борьбе за психическое здоровье (а так же против профессионального выгорания, демотивации и удивления происходящему) есть много способов. И один из них — настроить себя на философский лад, чтобы не принимать происходящее слишком близко к сердцу и относиться к нему без лишней нервозности. В этом отлично помогает книга баек из жизни подводников «Расстрелять» Александра Покровского. Уже много лет на разных местах работы я рекомендую ее своим коллегам.
Читать дальше →
Total votes 21: ↑20 and ↓1 +19
Views18.4K
Comments 6

Граф цитирования статей Хабрахабра

Data MiningBig DataMathematicsData visualization

Однажды, мне стало интересно: насколько статьи на Хабре связаны между собой? Поэтому сегодня мы займемся исследованием связности статей, и конечно не только посчитаем численные метрики, но и увидим картину целиком.



(это не просто картинка для привлечения внимания, а граф цитирования статей внутри Хабрахабра, где размер вершин определяется числом входящих рёбер, i.e., "количеством цитат внутри Хабра")


Началось всё с того, что в комментариях к статье про Хабра-граф и карму Tiberius и Loriowar озвучили идею, фактически витающую в воздухе: а почему бы не взглянуть на граф цитирования статьёй внутри самого Хабра?




Вы спрашивали? Мы отвечаем. Для того чтобы рассказ не был размахиванием рук, конкретизируем разбираемые вопросы:


  • Q1: Как выглядит граф цитирования Хабрахабра и какие в нём хабы (hubs and authorities)?


  • Q2: Насколько связным является сообщество (граф цитирования) и какие в нём кластеры?


  • Q3: Как изменится граф, если из него убрать самоцитирование?

Под катом трафик. Все картинки кликабельны.

Читать дальше →
Total votes 62: ↑61 and ↓1 +60
Views20.8K
Comments 46

Особенности кэширования компонентов в Unity3D

Game developmentC#Unity3D
Tutorial
Большинство unity-разработчиков знают, что не стоит злоупотреблять дорогими для производительности операциями, такими как, например, получение компонентов. Для этого стоит использовать кэширование. Но и для такой простой оптимизации можно найти несколько различных подходов.
В этой статье будут рассмотрены разные варианты кэширования, их неочевидные особенности и производительность.


Читать дальше →
Total votes 22: ↑21 and ↓1 +20
Views31.1K
Comments 23

Эксперимент длиной в год или как я был в топе Хабра/GT

Lifehacks for geeks

КДПВ замечательного иллюстратора Рины З.

Когнитивное искажение «ошибка выжившего» и обилие «историй успеха» сомнительной полезности подрывают доверие к рассказам о своём опыте. В то же время, поделиться им хочется — а вдруг это кому-нибудь пригодится? Чуть меньше года назад меня увлекла идея писать научно-популярные публикации не в режиме когда удобно, а минимум по одной в неделю. Кроме популяризации космонавтики побочным эффектом ожидались какие-то наблюдения по GTD. Сейчас, после завершения эксперимента, предлагаю вам что-то вроде отчета с комментариями.
Читать дальше →
Total votes 90: ↑85 and ↓5 +80
Views19.2K
Comments 20

Как я в 2015 году космонавтику популяризовывал

Lifehacks for geeks


Одно из моих первых воспоминаний — в три года я искренне радуюсь, что наступает такой замечательный 1989 год. Сейчас Новый Год превратился в гильотину, которая отрезает последние дни года и ехидно ухмыляется «Не успел!» Что ж, хочешь, не хочешь, надо отчитываться за 2015 год. Может быть, кому-нибудь это будет полезно.
Читать дальше →
Total votes 43: ↑40 and ↓3 +37
Views11.2K
Comments 18

Ответы на незаданные вопросы или размышления популяризатора

Lifehacks for geeks
В 1978 году военный летчик Майк Маллейн проходил отбор в астронавты. И один из психологов спросил его: «В чем твоя уникальная сильная сторона?» Маллейн ответил: «Я всегда полностью выкладываюсь в том, что делаю». Когда я прочитал эту историю в мемуарах астронавта Майка Маллейна, то поневоле задумался, что бы я ответил на этот вопрос. Сказать то же самое не получится — в памяти хватает эпизодов, где выложиться можно было больше. Но, подумав, я все-таки нашел черту характера, которая документально подтверждается. Это оказалось упорство. В конце 2013 года, в качестве «компенсации» за замораживание римейка Race into Space я поставил себе задачу — писать минимум по одной публикации в неделю без учета новогодних каникул. И сейчас, в конце 2016, я с удивлением фиксирую, что еще год удалось проработать в этом режиме. Традиционно, под катом размышления о GTD и мотивации, статистика Geektimes по своим материалам, рассуждения об изменениях в ЖЖ и прочее.


Рисунок Рины Зенюк (там есть еще много очень милых синих котов)
Читать дальше →
Total votes 25: ↑22 and ↓3 +19
Views10.9K
Comments 32

Традиционный отчет за год

Statistics in IT
Для статистики необходима база — набор данных за достаточно длинный период. Время летит незаметно, и я уже в четвертый раз подвожу итоги популяризаторского блогогода. Под катом, как обычно, статистика публикаций на Geektimes и в ЖЖ, размышления о GTD и прочее.


Тут много синих котов Рины Зенюк
Читать дальше →
Total votes 44: ↑41 and ↓3 +38
Views13.7K
Comments 18

Маленький-маленький юбилей

Statistics in ITLifehacks for geeks
У Ильфа и Петрова есть фельетон о том, как писатели ходят по инстанциям и просят организовать юбилеи. Излишнее внимание к ним, действительно, штука смешная, но оглядываться назад полезно. Формально мой первый научно-популярный материал о космонавтике вышел летом 2013, но я предпочитаю отсчитывать от начала 2014 года, когда я перешел в режим регулярного создания контента. Таким образом сейчас получается наноюбилей в пять лет. А еще случайно вышло так, что в 2014 году из Хабрахабра выделили Гиктаймс, а в этом году влили обратно. И можно посмотреть на то, как менялись цифры, отражающие поведение пользователей. Также под катом традиционные размышления о GTD и отчет о прошедшем годе.


Автор: Рина Зенюк
Читать дальше →
Total votes 33: ↑32 and ↓1 +31
Views4.3K
Comments 14

Немного предновогодней рефлексии

GTDStatistics in ITLifehacks for geeks
Ну вот и заканчивается очередной год. Как обычно, считаю разнообразную статистику, размышляю о том, как успевать еще больше, и вспоминаю уже личные интересные события.


Рисунок Рины Зенюк
Читать дальше →
Total votes 37: ↑35 and ↓2 +33
Views6.3K
Comments 1

Как с помощью js и google sheets стать соседом Билла Гейтса по гольф клубу

JavaScriptAPIFinance in IT
🔥 Technotext 2020
Tutorial


В последнее время на хабре стали появляться статьи, начинающиеся с рассказов про свободное время на самоизоляции и, как итог, появившихся троллейбусов из буханки. Возможно, администрации стоит задуматься о добавлении нового хаба — Самоизоляция..


Вот и у меня появилось свободное время, которое я посвятил анализу своих сделок в Тинькофф Инвестициях. Есть 2 типа людей: одни прекрасно строят многомерные массивы у себя в голове, пробегаясь по ним for-циклом в IPython Notebook, другим же нравится "щупать" цифры, раскладывая их по полочкам в Excel. Себя я отношу ко второй категории, поэтому все свои сделки аккуратно заносил в Google Sheets.


Под катом я расскажу, как автоматизировал свою рутину при помощи Google Apps Script и API от Тинькофф Инвестиций.

Читать дальше →
Total votes 12: ↑9 and ↓3 +6
Views9.1K
Comments 8

Интернет-магазин «на минималках»

Website development*nixDevelopment for e-commerceE-commerce management

Написать эту статью меня побудила публикация «Интернет-магазин как черная дыра в бюджете». На мой личный взгляд, сумма, которая там выведена, отвечает только личным представлениям автора и произвольному набору допущений, озвученных в статье, поэтому решил поделиться своим опытом.

Работаем «вбелую»
Total votes 46: ↑37 and ↓9 +28
Views14K
Comments 43

Статистика по логированию жизни и годовой отчет

GTDStatistics in ITLifehacks for geeks
Летом 2019 года, любопытства ради, я стал логировать все свои действия — работу, сон, создание контента и т.п. Получился интересный результат — теперь я с цифрами в руках могу увидеть, насколько изменился мой режим дня после начала самоизоляции в марте и перехода на удаленку. Также под катом размышления об эффектах от логирования своей жизни и прочему GTD, а также традиционный годовой отчет.


Иллюстрация Рины Зенюк
Читать дальше →
Total votes 26: ↑25 and ↓1 +24
Views8.3K
Comments 17