Как стать автором
Обновить
0
@Aurymread⁠-⁠only

Пользователь

Отправить сообщение

Каких мы ищем разработчиков для разработки платформы 1С: Предприятие

Время на прочтение18 мин
Количество просмотров19K
Наша мечта — делать лучший в мире инструментарий для разработки бизнес-приложений. У нас очень много отличных идей, реализация которых позволяет нам эту мечту осуществлять, развивать наши инструменты, чтобы оставаться лучшими. Ну а чтобы воплощать эти идеи на должном уровне, нам нужны классные программисты.

Если коротко ищем тех, кто:

  • любит (или готов полюбить) делать тиражируемые фреймворки
  • хочет делать продукт, которым пользуются миллионы людей

Чтобы показать детальнее, каких разработчиков мы ищем и как, мы взяли короткие интервью у нанимающих менеджеров нашей компании. Вопросы в ходе интервью задавались такие:

  • Какие вам нужны разработчики?
  • Что спрашиваете на интервью?
  • Какие вопросы предпочитаете на интервью – теоретические или практические?
  • Должен ли программист писать тесты?
  • Задаете ли вопросы не из профессиональной сферы деятельности?
  • Задаете ли логические задачи на сообразительность, не связанные непосредственно с программированием? Типа задачи про шарик с гелием в машине:


В каких областях у нас могут работать программисты в разработке платформы? Ну например:
Всего голосов 47: ↑15 и ↓32-17
Комментарии124

Доклад Римского клуба 2018, Глава 1: «Устойчивое развитие — фигня»

Время на прочтение17 мин
Количество просмотров46K
Предлагаю самим разобраться с докладом «мирового правительства», а заодно и помочь перевести первоисточник.

image


Предисловие


Начиная с основания Римского клуба в 1968 г. для него было подготовлено более 40 докладов. Первый доклад «Пределы роста» привлек к Римскому клубу международное внимание. Книга вызвала шок в мире, ранее не обращавшем внимание на долгосрочные перспективы продолжающегося роста населения, которые сегодня принято называть человеческим следом в экологии. Основатель и позже президент Римского Клуба Ауре́лио Печче́и (Aurelio Peccei) понимал необходимость обсуждения проблем, перед которыми стоит мир, вызовов человечеству, но и для него было неожиданностью узнать из упомянутого доклада, что все они связаны с человеческим стремлением к бесконечному росту на конечной территории нашей планеты. То послание молодой смелой команды Массачусетского технологического института заключалось в том, что если рост продолжится в том же неослабевающем темпе, то сокращающиеся ресурсы и серьезное загрязнение неизбежно приведут к коллапсу существующего миропорядка.

Конечно, сегодняшние компьютерные модели намного более продвинутые, чем модель World3, подготовленная командой в 1972 году. Некоторые аспекты экономического роста последних пятидесяти лет не были полностью учтены, например, инновации. Но основная мысль «Пределов» актуальна сегодня так же, как и в 1972 году. Сегодня мир стоит перед лицом многих трудностей, о которых предупреждали в 1970-х гг.: изменение климата, дефицит плодородных земель и массовое исчезновение видов. Более того, социальная обстановка в мире остается крайне неудовлетворительной: около 4 млрд. человек живет в очень скудных экономических условиях, им грозят тяготы природных бедствий или войн. По последним оценкам более 50 млн. людей каждый год вынуждены покидать свои дома и эмигрировать. Куда им деваться? В 2017 г. беженцев в мире насчитывалось уже 60 млн. человек!
Читать дальше →
Всего голосов 22: ↑20 и ↓2+18
Комментарии20

Студента китайского вуза чуть не отчислили из-за низкого «социального рейтинга» его отца

Время на прочтение3 мин
Количество просмотров65K

Прогулял школу — потерял несколько очков социального рейтинга

Вот уже несколько лет Китай внедряет систему оценки граждан по степени их благонадежности (не обязательно политической, речь идет о кредитоспособности, нарушениях общественного порядка и т.п.). Цель правительства — создать единый социальный рейтинг для абсолютно всех граждан. И от этого рейтинга будет напрямую зависеть жизнь китайцев. Если рейтинг будет низким — то могут не дать кредит на учебу или даже не выпустить подозрительного гражданина из страны.

В 2016 году сообщалось, что инициаторы проекта создали пока лишь концепцию проекта, которая, тем не менее, постепенно развивается и реализовывается. Уже тогда, в 2016 году в ряде регионов Китая тестировались различные варианты этой системы. Ну а сейчас, похоже, есть уже и некоторые результаты. Так, одного из студентов известного китайского вуза едва не отчислили из-за того, что у его отца низкий социальный рейтинг.
Читать дальше →
Всего голосов 88: ↑84 и ↓4+80
Комментарии444

R и большие данные: использование Replyr

Время на прочтение8 мин
Количество просмотров5K
replyr — сокращение от REmote PLYing of big data for R (удаленная обработка больших данных в R).

Почему стоит попробовать replyr? Потому что он позволяет применять стандартные рабочие подходы к удаленным данным (базы данных или Spark).

Можно работать так же, как и с локальным data.frame. replyr предоставляет такие возможности:

  • Обобщение данных: replyr_summary().
  • Объединение таблиц: replyr_union_all().
  • Связывание таблиц по строкам: replyr_bind_rows().
  • Использование функций разделения, объединения, комбинирования (dplyr::do()): replyr_split(), replyr::gapply().
  • Аггрегирование/распределение: replyr_moveValuesToRows() / replyr_moveValuesToColumns().
  • Отслеживание промежуточных результатов.
  • Контроллер объединений.

Скорее всего, вы всё это делаете с данными локально, поэтому такие возможности сделают работу со Spark и sparklyr гораздо легче.

replyr — продукт коллективного опыта использования R в прикладных решениях для многих клиентов, сбора обратной связи и исправления недостатков.

Примеры ниже.
Читать дальше →
Всего голосов 11: ↑11 и ↓0+11
Комментарии0

Быстрая генерация массивов случайных чисел для задач имитационного моделирования, статистического оценивания и создания повторной выборки

Время на прочтение9 мин
Количество просмотров17K
Имитационное моделирование с использованием методов Монте-Карло в наше время используется практически во всех областях операционной деятельности, где требуется многократное принятие решений по итогам анализа поступающих из внешнего мира данных. При этом важную роль начинает играть качество, производительность и доступность генераторов случайных чисел, использующихся для придания абстрактному методу черт реальной задачи, решаемой специалистом. Как я недавно выяснил, этот вопрос начинает играть решающее значение при переходе к параллельному программированию… Вы тоже столкнулись с этой проблемой, и хотите знать, как в Windows можно быстро получить массивы случайных чисел с нужным распределением?
Читать дальше →
Всего голосов 20: ↑18 и ↓2+16
Комментарии2

Расширяем возможности MS Excel 2010 c помощью R

Время на прочтение5 мин
Количество просмотров17K
Добрый день, уважаемые читатели.
Сегодня я хочу показать как можно связать возможности языка R и офисного пакета MS Excel 2010. Ниже я расскажу о том, как можно расширить функционал встроенного языка VBA с помощью функций R, а поможет мне в этом надстройка RExcel. Инструкцию по его установке можно без проблем найти в сети или на офф. сайте.

Читать дальше →
Всего голосов 25: ↑22 и ↓3+19
Комментарии4

Ускоряем работу VBA в Excel

Время на прочтение4 мин
Количество просмотров130K
image

Предисловие


Так уж сложилось, что на сегодняшний день много кому приходится работать(писать макросы) на VBA в Excel. Некоторые макросы содержат сотни строк кода, которые приходится выполнять каждый день (неделю, месяц, квартал и так далее) и, при этом, они занимают изрядное количество времени. Вроде бы и и процесс автоматизирован и человеческого вмешательства не нужно, но время, занимаемое выполнением макроса, может охватывать десятки минут, а то и несколько часов. Время, как говориться, — деньги и в этом посте я постараюсь значительно ускорить время выполнения Вашего макроса и, возможно, это положительно скажется на ваших делах, а в итоге и деньгах.
Читать дальше →
Всего голосов 37: ↑23 и ↓14+9
Комментарии9

Терминал сбора данных для ЕГАИС, или иллюзия обмана

Время на прочтение6 мин
Количество просмотров20K
В этой статье мы продолжим развенчивание мифов о редких ЕГАИС-девайсах, которые кем-то там рекомендованы на основании каких-то там эксклюзивных характеристик. Простой предприниматель и так поседеет, если начнет самостоятельно разбираться в руководствах регулирующих органов по подбору техники, а тут еще вся эта маркетинговая превдо-правда от продавцов оборудования по всему интернету разбрызгана. Итак, давайте разберёмся, что такое ТСД для ЕГАИС.

ТСД для ЕГАИС Honeywell EDA50K с 2D сканером
Читать дальше →
Всего голосов 25: ↑24 и ↓1+23
Комментарии19

Анализ данных в спорте: взаимодействие учёных, клубов и федераций. Лекция в Яндексе

Время на прочтение9 мин
Количество просмотров15K
Мы проводим мероприятия не только по темам, которыми занимаемся сами. В феврале мы собрали специалистов по использованию машинного обучения в спорте. Удивительно, как много процессов связывают эти две сферы — анализ данных и спорт — и какое количество нерешенных проблем возникает на стыке между ними. Перед вами доклад Дмитрия Дагаева — заместителя проректора НИУ ВШЭ.


— Сегодня я постараюсь коротко рассказать о задачах, которые уже решаются с помощью анализа данных в спорте. Мы увидим, что именно взаимодействие агентов является ключевым фактором, который позволяет решать эти задачи.
Всего голосов 33: ↑32 и ↓1+31
Комментарии2

Как программист машину покупал. Часть II

Время на прочтение11 мин
Количество просмотров39K
В предыдущей статье на примере покупки Mercedes-Benz E-klasse не старше 2010 года выпуска стоимостью до 1.5 млн рублей в Москве была рассмотрена задача поиска выгодных автомобилей. Под выгодными следует понимать предложения, цена которых ниже рыночной в текущий момент среди объявлений, собранных со всех наиболее авторитетных сайтов по продаже б/у автомобилей в РФ.

На первом этапе в качестве метода машинного обучения была выбрана множественная линейная регрессия, были рассмотрены правомерность ее использования, а также плюсы и минусы. Простая линейная регрессия была выбрана в качестве ознакомительного алгоритма. Очевидно, что существует еще много методов машинного обучения для решения поставленной задачи регрессии. В этой статье я хотел бы рассказать вам, как именно я выбирал наиболее оптимальный алгоритм машинного обучения для исследуемой модели, который в настоящее время используется в реализованном мною сервисе — robasta.ru.


Читать дальше →
Всего голосов 67: ↑54 и ↓13+41
Комментарии48

Разработка на R: тайны циклов

Время на прочтение8 мин
Количество просмотров20K

Меньше недели назад в журнале Хакер вышла авторская версия материала, посвященного фичам при использовании циклов при разработке на R. По согласованию с Хакером, мы делимся полной версией первой статьи. Вы узнаете о том, как правильно писать циклы при обработке больших объемов данных.


Читать дальше →
Всего голосов 27: ↑27 и ↓0+27
Комментарии9

Быстрая загрузка данных из файлов в R

Время на прочтение3 мин
Количество просмотров9.9K
Недавно мы писали приложение на Shiny, где нужно было использовать очень большой блок данных (dataframe). Это непосредственно влияло на время запуска приложения, поэтому пришлось рассмотреть ряд способов чтения данных из файлов в R (в нашем случае это были csv-файлы, предоставленные заказчиком) и определить лучший.

Цель этой заметки — сравнить:

  1. read.csv из utils — стандартный способ чтения csv-файлов в R
  2. read_csv из readr, который в RStudio заменил предыдущий метод
  3. load и readRDS из base, и
  4. read_feather из feather и fread из data.table.
Читать дальше →
Всего голосов 19: ↑17 и ↓2+15
Комментарии5

ggplot2: как легко совместить несколько графиков в одном, часть 3

Время на прочтение6 мин
Количество просмотров21K
Эта статья шаг за шагом покажет, как совместить несколько ggplot-графиков на одной или нескольких иллюстрациях, с помощью вспомогательных функций, доступных в пакетах R ggpubr, cowplot и gridExtra. Также опишем, как экспортировать полученные графики в файл.
Первая часть
Вторая часть
Читать дальше →
Всего голосов 18: ↑18 и ↓0+18
Комментарии5

Как определить размер выборки?

Время на прочтение4 мин
Количество просмотров63K
Статистика знает все. И Ильф и Е. Петров, «12 Стульев»

Представьте себе, что вы строите крупный торговый центр и желаете оценить автомобильный поток въезда на территорию парковки. Нет, давайте другой пример… они все равно этого никогда не будут делать. Вам необходимо оценить вкусовые предпочтения посетителей вашего портала, для чего необходимо провести среди них опрос. Как увязать количество данных и возможную погрешность? Ничего сложного — чем больше ваша выборка, тем меньше погрешность. Однако и здесь есть нюансы.


Графики

Читать дальше →
Всего голосов 18: ↑18 и ↓0+18
Комментарии16

Добыча данных в R

Время на прочтение14 мин
Количество просмотров19K
Этот пост — перевод трех частей серии Data acquisition in R из моего англоязычного блога. Исходная серия задумана в четырех частях, три из которых легли в основу данного поста: Использование подготовленных наборов данных; Доступ к популярным статистическим БД; Демографические данные; Демографические данные. В еще не написанной заключительной части речь пойдет об использовании пространственных данных.




R заточен под воспроизводимость результатов. Существует множество прекрасных решений, обеспечивающих сопоставимость версий системы и пакетов, помогающих применять принципы literate programming… Я же хочу показать, как можно легко и эффективно находить/скачивать/добывать данные, используя собственно R и документируя каждый шаг, что обеспечивает полную воспроизводимость всего процесса. Разумеется, я не ставлю перед собой задачи перечислить все возможные источники данных и фокусирую внимание в основном на демографических данных. Если ваши интересы лежат вне сферы статистики населения, стоит посмотреть в сторону великолепного проекта Open Data Task View.


Для иллюстрации использования каждого из источников информации я привожу пример визуализации полученных данных. Каждый пример кода задуман как самостоятельная единица — копируйте и воспроизводите. Разумеется, сперва необходимо установить требуемые пакеты. Весь код целиком лежит тут.

Читать дальше →
Всего голосов 21: ↑21 и ↓0+21
Комментарии7

Как построить географическую панель наблюдения с данными в реальном времени

Время на прочтение3 мин
Количество просмотров9.2K
В этом посте покажу, как построить интерактивную географическую панель наблюдения с Displayr, Plotly и R. Особенно интересно, что она отслеживает позицию военных самолетов в реальном времени. Для этого я собираюсь взять данные из двух разных источников (регионы на основании размера ВВС и отслеживание позиции самолетов в реальном времени). Панель наблюдения отображает динамические данные двумя способами: оттенок региона (чтобы показать численность ВВС в стране) и точки-маркеры (для позиций самолетов). Потом я построю карту, чтобы аккуратно и красиво отобразить все эти данные.
Читать дальше →
Всего голосов 14: ↑14 и ↓0+14
Комментарии0

Оформление базовой графики R

Время на прочтение3 мин
Количество просмотров18K

Базовая графика в R плоха для печати (если честно, можно было получше выбрать значения по умолчанию). В целом, эти функции для некоторых — признак заката эры R. Думаю, большинство людей согласится, что есть в R графические функции и получше (например, ggplot2). Но иногда бывет целесообразно сделать график именно с помощью базовых функций. Например, если графика в вашей публикации должна быть воспроизводима даже спустя пять лет.

В этом посте рассмотрим методы, позволяющие кардинально изменить внешний вид базовой графики в R. С некоторыми (окей, иногда большими) усилиями можно изменить все параметры графика именно так, как вам нужно.
Читать дальше →
Всего голосов 17: ↑17 и ↓0+17
Комментарии4

Копирование данных с веб-сайта с помощью R и библиотеки rvest

Время на прочтение6 мин
Количество просмотров7K

Чтобы проводить анализ данных, необходимо сначала эти данные собрать. Для этой цели есть много разных методов. В этой статье мы будем говорить о копировании данных непосредственно с веб-сайта, или о скрейпинге (scraping). На Хабре есть несколько статей о том, как сделать копирование с помощью Python. Мы будем использовать язык R (вер.3.4.2) и его библиотеку rvest. В качестве примера рассмотрим копирование данных с Google Scholar (GS).

Читать дальше →
Всего голосов 15: ↑15 и ↓0+15
Комментарии3

Введение в параллельные вычисления в R

Время на прочтение5 мин
Количество просмотров17K
   Эта статья посвящена языку R. Он не так широко распространен на территории ex-USSR, как Matlab и тем более Python, но, безусловно, заслуживает внимания. Нельзя не отметить, что R — фактически стандарт для Data Science (хотя тут хорошо написано, что не R единым живут data scientists). Богатый синтаксис, совместимость с legacy кодом (что весьма важно в научных приложениях), удобная среда разработки RStudio и наличие огромного числа библиотек в CRAN делают R таковым.
Читать дальше →
Всего голосов 29: ↑27 и ↓2+25
Комментарии11
1

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность