Как стать автором

Cristobal H. Hunta @Shamus

Пользователь

Профиль Публикации Комментарии 5Закладки 206

nmivan 30 янв 2020 в 00:22

У меня нулевая текучка

9 мин

179K

Управление персоналом*Читальный зал

Технотекст 2020

Однажды на заводе, где я работал ИТ-директором, готовили отчетность к какому-то очередному мероприятию. Надо было рассчитать и предоставить показатели по выданному перечню, среди них затесалась текучесть кадров. И тут оказалось, что у меня она равна нулю.

Из руководителей я был такой один, тем самым привлек к себе внимание. Ну и сам удивился – оказывается, когда от тебя не уходят сотрудники, это странно и необычно.

В сумме я работал руководителем лет 7-10 (точно не знаю, какие периоды сюда включать), но нулевая текучка сохранилась. Никто никогда от меня не уходил, никого никогда я не выгонял. Только набирал.

Нулевая текучка, как показатель, никогда не была моей самоцелью. Но я стараюсь делать так, чтобы вложенные в людей усилия не пропадали даром. Сейчас расскажу примерно, как я руковожу так, что люди не уходят – вдруг что полезное для себя найдете. На полноту раскрытия темы не претендую, т.к. основываюсь только на личном опыте. Вполне возможно, что я всё делаю неправильно.

Читать дальше →

+249

makondo 11 янв 2020 в 01:16

Генеалогические исследования — метрические книги, переписи, архивы, открытые базы

13 мин

150K

Data Mining*Открытые данные*

Не один год я увлекаюсь генеалогией. Практической пользы в этом хобби нет, но интересного очень много. Здесь я хотел поделиться накопленным опытом, частью интересных сведений, не сильно погружаясь в персональные истории. Чтобы текст сильно не распухал, расскажу всего 2 кейса: поиск в военных архивах на основе данных онлайн-баз и продолжительный просмотр и анализ метрических книг одного села периода конца XIX — начала XX вв. вплоть до конца революции и гражданской войны.

Изучение метрических книг, запросы в далекие архивы обычной и электронной почтой, личные походы в архивы, исследование открытых баз в интернете и другие виды поисков дают богатый материал. Иногда поиск и находки похожи на настоящий детектив, только все события были далеко в прошлом.

Осознаю, что некоторым тема публикации может показаться далекой от IT, но в процессе у меня было и программирование, VBA-скриптинг, SQL, и впереди, надеюсь, ML\DS\AI.

Страница метрической книги, рождения в 1898 г. Еще в книгах записывались браки и смерти — до появления ЗАГСов в начале 1920х

Читать дальше →

+47

worker_sam 22 дек 2019 в 22:29

Использование сверточной нейронной сети для игры в «Жизнь» (на Keras)

10 мин

11K

Машинное обучение*

Из песочницы

Цель этой статьи — научить нейронную сеть играть в игру "Жизнь", не обучая ее правилам игры.

Привет, Хабр! Представляю вашему вниманию перевод статьи "Using a Convolutional Neural Network to Play Conway's Game of Life with Keras" автора kylewbanks.

Читать дальше →

+25

rishat_edison 16 дек 2019 в 16:18

52 датасета для тренировочных проектов

5 мин

115K

Python*Программирование*Машинное обучение*Блог компании EdisonУчебный процесс в IT

Перевод

Mall Customers Dataset — данные посетителей магазина: id, пол, возраст, доход, рейтинг трат. (Вариант применения: Customer Segmentation Project with Machine Learning)
Iris Dataset — датасет для новичков, содержащий размеры чашелистиков и лепестков для различных цветков.
MNIST Dataset — датасет рукописных цифр. 60 000 тренировочных изображений и 10 000 тестовых изображений.
The Boston Housing Dataset — популярный датасет для распознавания паттернов. Содержит информацию о домах в Бостоне: количество квартир, стоимость аренды, индекс преступлений.
Fake News Detection Dataset — содержит 7796 записей с разметкой новостей: правда или ложь. (Вариант применения с исходником на Python: Fake News Detection Python Project )
Wine quality dataset — содержит информацию о вине: 4898 записей с 14 параметрами.

Читать дальше →

+30

olegbunin 10 окт 2019 в 17:04

Самый мягкий и пушистый путь в Machine Learning и Deep Neural Networks

19 мин

46K

Веб-разработка*JavaScript*Блог компании Конференции Олега Бунина (Онтико)Машинное обучение*Блог компании AvitoTech

Современное машинное обучение позволяет делать невероятные вещи. Нейросети работают на пользу общества: находят преступников, распознают угрозы, помогают диагностировать болезни и принимать сложные решения. Алгоритмы могут переплюнуть человека и в творчестве: они рисуют картины, пишут песни и делают из обычных снимков шедевры. А те, кто разрабатывает эти алгоритмы, часто представляются карикатурным учеными.

Не все так страшно! Собрать нейронную сеть из базовых моделей может любой, кто сколько-то знаком с программированием. И даже не обязательно учить Python, всё можно сделать на родном JavaScript. Как легко начать и зачем машинное обучение фронтендерам, рассказал Алексей Охрименко (obenjiro) на FrontendConf, а мы переложили в текст — чтобы названия архитектур и полезные ссылки были под рукой.

Spoiler. Alert!

Этот рассказ:

Не для тех, кто «уже» работает с Machine Learning. Что-то интересное будет, но маловероятно, что под катом вас ждут открытия.
Не о Transfer Learning. Не будем говорить о том, как написать нейронную сеть на Python, а потом работать с ней из JavaScript. Никаких читов — будем писать глубокие нейронные сети именно на JS.
Не о всех деталях. Вообще все концепции в одну статью не поместятся, но необходимое, конечно, разберем.

+42

JetHabr 17 сен 2019 в 14:06

Кластеризуем лучше, чем «метод локтя»

4 мин

44K

Алгоритмы*Блог компании Инфосистемы ДжетМашинное обучение*

Перевод

Кластеризация — важная часть конвейера машинного обучения для решения научных и бизнес-задач. Она помогает идентифицировать совокупности тесно связанных (некой мерой расстояния) точек в облаке данных, определить которые другими средствами было бы трудно.

Однако процесс кластеризации по большей части относится к сфере машинного обучения без учителя, для которой характерен ряд сложностей. Здесь не существует ответов или подсказок, как оптимизировать процесс или оценить успешность обучения. Это неизведанная территория.

+24

VolodymyrGavrysh 1 сен 2019 в 17:31

Расчет нулевой гипотезы, на примере анализа зарплат украинских программистов

5 мин

20K

Python*Data Mining*Визуализация данных*Статистика в IT

Решил поделиться, да бы и самому не забывать, как можно использовать простые статистические инструменты для анализа данных. В качестве примера использовался анонимный опрос относительно зарплат, стажа и позиций украинских программистов за 2014 и 2019 год. (1)

Этапы анализа

Препроцессинг данных и предварительный анализ (кому интересно код тут)
Графическое представление данных. Функция плотности распределения.
Формулируем нулевую гипотезу (H0) (2)
Выбираем метрику для анализа
Используем метод bootstraping для формирования нового массива данных
Рассчитываем p-value (3) для подтверждения или опровержения гипотезы

Препроцессинг данных

После некоторых манипуляций (код тут), приводим данные в следующий вид:

# Строка здесь это отдельный результат опроса, колонки переменные.

display(data_14_1.head(), data_19_1.head())
print('Всего опрошенных программистов: \n \
      {} чел. в 14 году и {} в 19 году'.format(len(data_14_1), len(data_19_1)))

Читать дальше →

+19

hukenovs 18 июл 2019 в 08:15

Курс лекций «Основы цифровой обработки сигналов»

12 мин

188K

Open source*Python*Алгоритмы*Математика*Matlab*

Всем привет!

Часто ко мне обращаются люди с вопросами по задачам из области цифровой обработки сигналов (ЦОС). Я подробно рассказываю нюансы, подсказываю нужные источники информации. Но всем слушателям, как показало время, не хватает практических задач и примеров в процессе познания этой области. В связи с этим я решил написать краткий интерактивный курс по цифровой обработке сигналов и выложить его в открытый доступ.

Большая часть обучающего материала для наглядного и интерактивного представления реализована с использованием Jupyter Notebook. Предполагается, что читатель имеет базовые знания из области высшей математики, а также немного владеет языком программирования Python.

Читать дальше →

+100

Syurmakov 28 июн 2019 в 20:07

Лучшие дистрибутивы Linux для старых компьютеров

8 мин

502K

Настройка Linux*Программирование*Компьютерное железоНастольные компьютеры

Перевод

Привет!

Меня зовут Рушан, и я автор Telegram‑канала Нейрон. Не забудьте поделиться с коллегами или просто с теми, кому интересны такие статьи.

Вкратце: пока не бросайте свой старый компьютер — используйте легкий дистрибутив Linux, чтобы возродить его!

Что вы делаете со своим старым компьютером? Тот, который когда-то имел хорошую аппаратную конфигурацию, но теперь считается устаревшим. Почему бы не восстановить его вместе с Linux? Я собираюсь перечислить лучшие легкие дистрибутивы Linux, которые вы можете использовать на своем старом ПК.

Лучшие легкие дистрибутивы Linux для старых ноутбуков и десктопов

Я постараюсь упорядочить список в порядке убывания требований к оборудованию. Это означает, что легкому дистрибутиву Linux, занимающему первое место, потребуется минимальное аппаратное обеспечение.

10. Peppermint

Peppermint — это облачно-ориентированный дистрибутив Linux, не требующий мощного железа для запуска. Он основан на Lubuntu и использует окружение рабочего стола LXDE для более плавной работы.

Читать дальше →

+65

derprimus 28 мая 2019 в 19:18

Советские мечты о будущем

9 мин

93K

Блог компании MadrobotsНаучная фантастика

Помните очаровательного котика, которые чихал в заставке советского мультфильма? Мы помним, и нашли его — вместе с ворохом другой рисованной фантастики. В детстве она пугала и обескураживала, поскольку поднимала серьезные, взрослые темы. Настала пора пересмотреть старые мультфильмы, чтобы узнать, о каком будущем мечтали в той стране.

+134

Dmytro_Kikot 24 мая 2019 в 10:30

Вред во благо: иммунная система миноги в борьбе с раком головного мозга человека

11 мин

10K

Блог компании ua-hosting.companyНаучно-популярноеМозгЗдоровьеХимия

Наш мозг — это наше все. Нарушение работы этого важнейшего органа приводит к ужасным, а порой и фатальным последствиям. Сложность мозга и его нейронной организации колоссальна, что сильно усложняет процесс лечения того или иного заболевания. Как правило, когда мы что-то лечим, то пытаемся избавиться от дефектов, которые вызывает болезнь. Но, что если использовать эти дефекты для борьбы с тем, что их создает? Именно это и решили сделать авторы рассматриваемого нами сегодня исследования. Как ученые применили нарушение работы гемато-энцефалического барьера, зачем нужен доступ к внеклеточному матриксу мозга и какую роль в этом сыграла паразитирующая на рыбах минога? Об этом нам поведает доклад исследовательской группы. Поехали.

+23

Syurmakov 19 мая 2019 в 19:23

Подборка датасетов для машинного обучения

6 мин

150K

Python*Data Mining*Машинное обучение*Искусственный интеллект

Привет, читатель!

Меня зовут Рушан, и я автор Telegram‑канала Нейрон. Не забудьте поделиться с коллегами или просто с теми, кому интересны такие статьи.

Перед тобой статья-путеводитель по открытым наборам данных для машинного обучения. В ней я, для начала, соберу подборку интересных и свежих (относительно) датасетов. А бонусом, в конце статьи, прикреплю полезные ссылки по самостоятельному поиску датасетов.

Меньше слов, больше данных.

Подборка датасетов для машинного обучения:

Данные смертей и сражений из игры престолов — этот набор данных объединяет три источника данных, каждый из которых основан на информации из серии книг.
Глобальная база данных терроризма — Более 180 000 террористических атак по всему миру, 1970-2017.
Биткойн, исторические данные — данные биткойнов с интервалом в 1 минуту с избранных бирж, январь 2012 г. — март 2019 г.

Читать дальше →

+62

vladbalv 9 апр 2019 в 11:04

Предсказания от математиков. Разбираем основные методы обнаружения аномалий

15 мин

26K

Промышленное программирование*Машинное обучение*Блог компании ГК ЛАНИТИскусственный интеллект

За рубежом все большую популярность набирает использование искусственного интеллекта в промышленности для предиктивного обслуживания (predictive maintenance) различных систем. Цель этой методики — определение неполадок в работе системы на этапе эксплуатации до выхода её из строя для своевременного реагирования.

Насколько востребован такой подход у нас и на Западе? Вывод можно сделать, например, по статьям на Хабре и в Medium. На Хабре почти не встречается статей по решению задач предиктивного обслуживания. На Medium же есть целый набор. Вот здесь, ещё здесь и здесь хорошо описано, в чем цели и преимущества такого подхода.

Из этой статьи вы узнаете:

зачем нужна эта методика,
какие подходы машинного обучения чаще используются для предиктивного обслуживания,
как я опробовал один из приёмов на простом примере.

Источник

Читать дальше →

+75

vyahhi 29 мар 2019 в 12:41

От алгоритмов до рака: лекции со школы по биоинформатике

7 мин

5.6K

Учебный процесс в ITНаучно-популярноеБиотехнологии

XKCD 1217

Летом 2018 года под Петербургом прошла ежегодная летняя школа по биоинформатике, на которую приехали 100 студентов и аспирантов, чтобы изучить биоинформатику и узнать об её использовании в различных областях биологии и медицины.

Главный фокус этой школы был на исследованиях рака, но были лекции и по другим областям биоинформатики, начиная от эволюции и заканчивая анализом данных одноклеточного секвенирования. На протяжении недели ребята учились работать с данными секвенирования нового поколения, программировали на Python и R, применяли стандартные биоинформатические тулы и фреймворки, знакомились с методами системной биологии, популяционной генетики и моделированием лекарств при изучении опухолей, и изучали многое другое.

Ниже вы найдете видео 18 лекций, прочитанных на школе, с кратким описанием и слайдами. Помеченные звёздочкой «*» – достаточно базовые, их можно смотреть без предварительной подготовки.

Хочу всё знать!

+8

randall 27 мар 2019 в 15:06

Другой Github 2: машинное обучение, датасеты и Jupyter Notebooks

6 мин

19K

Блог компании VKВизуализация данных*GitHub*Машинное обучение*

Несмотря на то, что в интернете существует множество источников свободного программного обеспечения для машинного обучения, Github остается важным центром обмена информацией для всех типов инструментов с открытым исходным кодом, используемых в сообществе специалистов по машинному обучению и анализу данных.

В этой подборке собраны репозитории по машинному обучению, датасетам и Jupyter Notebooks, ранжированные по количеству звезд. В предыдущей части мы рассказывали о популярных репозиториях для изучения работ по визуализации данных и глубокому обучению.

Читать дальше →

+43

PatientZero 12 мар 2019 в 11:14

Модульные боты-муравьи с памятью

15 мин

19K

Разработка игр*Искусственный интеллект

Перевод

Одним из проектов, которые я долго мечтал реализовать, были модульные боты задач с памятью. Конечная цель проекта заключалась в создании мира с существами, способными действовать независимо и коллективно.

Раньше я уже программировал генераторы миров, поэтому хотел заселить мир простыми ботами, использующими ИИ, определяющим их поведение и взаимодействия. Таким образом, благодаря влиянию акторов на мир можно было увеличить его детализацию.

Я уже реализовал базовую систему конвейера задач на Javascript (потому что это упростило мою жизнь), но мне хотелось чего-то более надёжного и масштабируемого, поэтому этот проект я написал на C++. На это меня сподвиг конкурс по реализации процедурного сада в сабреддите /r/proceduralgeneration (отсюда и соответствующая тема).

В моей системе симуляция состоит из трёх компонентов: мира, населения и связывающих их набора действий. Следовательно, мне нужно было создать три модели, о которых я расскажу в этой статье.

Для увеличения сложности я хотел, чтобы акторы сохраняли информацию о предыдущем опыте взаимодействия с миром и использовали знания об этих взаимодействиях в будущих действиях.

Читать дальше →

+53

aik 25 фев 2019 в 13:49

Есть ли жизнь под Windows 98, часть вторая — про софт

8 мин

67K

Старое железо

Я довольно сильно затянул с продолжением. Частично из-за работы, частично из-за лени, частично из-за того, что задача несколько более объёмной оказалась. Но рассказывать про все поиски не буду, приведу только результаты.

Хотя для начала надо определить, что понимать под жизнью :-)

Обычно ретро-компьютеры собираются для ретро-игр. С ними, как правило, нет особых проблем (ну, кроме актуальных для той эпохи). Потому считать это «жизнью» не стоит. Я на жизнь смотрел с более повседневной точки зрения — посидеть в интернете, набрать текст, послушать музыку, посмотреть кино. Хотя, конечно, последнее зависит не столько от ОС, сколько от используемого железа. Моего туалатина должно без проблем хватать на ДВД и divx, а вот с х264 и более поздними кодеками он уже может и не справиться.

Читать дальше →

+70

nmivan 13 фев 2019 в 22:15

Карьерные стероиды. Базовый алгоритм

12 мин

30K

Управление проектами*Управление персоналом*Карьера в IT-индустрии

Статья про быстрый карьерный рост внутри одной компании. Именно внутри одной, т.к. скачок при переходе — это другая методика, к ней нужно иначе готовиться (там больше комплект увольнения подходит).

Сразу скажу: я не считаю, что строить карьеру — это правильно, без этого никак и кто не строит — валенок. При этом я и не считаю, что не строить карьеру — правильно.

В карьере нет ничего плохого или хорошего. Так же, как нет ничего плохого или хорошего в изучении ERP, ремонте своей квартиры или прохождении курса «100 отжиманий». Карьера — это проект с определенной целью, в который человек сознательно вступает, чтобы чего-то получить. Взамен он должен потратить больше ресурсов, чем расходовал до этого — времени, нервов, денег.

Мне кажется, будет здорово, если дальше вы будете читать именно с таким отношением: карьера — это такой проект. Если я им займусь, то эта информация может мне помочь.

Если вы не планируете строить карьеру — не вопрос. Я тоже не планирую, например, никогда внедрять ERP, поэтому не читаю о нем статей. Хотя мог бы читать и писать в комментах все, что я думаю о ERP и авторах статей о ней — только зачем?

Надеюсь, мы договорились. Возвращаемся к карьере.

Читать дальше →

+35

JanisV 9 фев 2019 в 13:55

Опыт разработки свободного приложения для коллекционеров OpenNumismat

5 мин

14K

Из песочницы

Хочу поделиться своим опытом разработки настольного приложения для коллекционеров с открытым исходным кодом.

По роду своей основной деятельности я разрабатываю ПО для встраиваемых систем и редко пересекаюсь с конечными пользователями. Поэтому речь пойдет об особенностях, с которыми я столкнулся при разработке некоммерческого приложения для широкого круга пользователей, которые стали для меня открытием.

Читать дальше →

+74

Batin 4 фев 2019 в 14:11

Внеклеточная ДНК, как биомаркер старения и различных патологий

17 мин

10K

Научно-популярноеЗдоровье

Мы уже рассказывали вам про циркулирующую микроРНК, но есть еще одна не менее крутая штука — внеклеточная циркулирующая ДНК (англ. cell-free DNA, circulating DNA). Открыта она была ещё 1948 году. Сейчас к ней усилился интерес, и вот в чём, собственно, дело.

Внеклеточная ДНК (вкДНК) обнаруживается в нескольких жидкостях организма: в плазме и сыворотке крови, моче, слюне, синовиальной, перитонеальной и спинномозговой жидкости.
Мы с вами рассмотрим особенности вкДНК в двух жидкостях: крови и моче. Понятно дело, что так удобней для диагностики.

Читать дальше →

+26

3

4 5 ...