Как стать автором
Обновить
0
0
Koguro @Koguro

Пользователь

Отправить сообщение

Маленький код для больших данных или Apache Spark за 3 дня

Время на прочтение7 мин
Количество просмотров12K
Пусть Жираф был не прав,
Но виновен не Жираф,
А тот, кто крикнул из ветвей:
«Жираф большой — ему видней!» (с)


Потребовалось оперативно разобраться с технологией Apache Spark заточенную для использования Big Data. В процессе выяснения активно использовал habrahabr, так что попробую вернуть информационный должок, поделившись приобретенным опытом.

А именно: установкой системы с нуля, настройкой и собственно программированием кода решающего задачу обработки данных для создания модели, вычисляющей вероятность банкротства клиента банка по набору таких признаков как сумма кредита, ставка и т.д.

Больших данных вроде как должно быть много, но почему-то не просто найти то злачное место, где их все щупают. Сначала попробовал вариант с ambari, но на моей Window7 валились ошибки настроек сетевого моста. В итоге прокатил вариант с преднастроенной виртуальной машиной от Cloudera (CDH). Просто устанавливаем VirtualBox, запускаем скачанный файл, указываем основные параметры (память, место) и через 5 минут достопочтенный джин Apache Hadoop жаждет ваших указаний.

Несколько слов, почему именно Spark. Насколько я понимаю, ключевые отличия от изначальной MapReduce в том, что данные удерживаются в памяти, вместо сброса на диск, что дает ускорение во много раз. Но, пожалуй, более важны реализации целого ряда статистических функций и удобным интерфейсом для загрузки/обработки данных.

Дальше собственно код для решения следующей задачи. Есть реально большие данные (ибо рука очень устает скролить эти 2000 строк) в формате:



Есть предположение, что дефолт как-то связан с остальными параметрами (кроме первого, к уважаемым Ивановым1…N претензий нет) и нужно построить модель линейной регрессии. Прежде чем начать, стоит оговориться, что это мой первый код на Java, сам я работаю аналитиком и вообще это мой первый запуск Eclipse, настройка Maven и т.д. Так что не стоит ждать изысканных чудес, ниже решение задачи в лоб тем способом, который почему-то заработал. Поехали:
Читать дальше →
Всего голосов 20: ↑19 и ↓1+18
Комментарии9

8 лекций, которые помогут разобраться в машинном обучении и нейросетях

Время на прочтение2 мин
Количество просмотров84K



Мы собрали интересные лекции, которые помогут понять, как работает машинное обучение, какие задачи решает и что нам в ближайшем будущем ждать от машин, умеющих учиться. Первая лекция рассчитана скорее на тех, кто вообще не понимает, как работает machine learning, в остальных много интересных кейсов.
Читать дальше →
Всего голосов 47: ↑45 и ↓2+43
Комментарии5

Реакторы на быстрых нейтронах — вот надежда человечества!

Время на прочтение7 мин
Количество просмотров210K
В предыдущих статьях — мы выяснили, что ни солнечная энергетика не сможет удовлетворить потребности человечества (из-за быстрого выхода из строя аккумуляторов и их стоимости), ни термоядерная (т.к. даже после достижения на экспериментальных реакторах положительного выхода энергии — остается фантастическое количество проблем на пути коммерческого использования). Что же остается?

Уже не первую сотню лет, не смотря на весь прогресс человечества, основной объем электроэнергии получается от банального сжигания угля (который до сих пор является источником энергии для 40.7% генерирующих мощностей в мире), газа (21.2%), нефтепродуктов (5.5%) и гидроэнергетики (еще 16.2%, в сумме все это — 83.5% по данным на 2008 год).

Остается — ядерная энергетика, с обычными реакторами на тепловых нейтронах (требующих редкий и дорогой U-235) и с реакторами на быстрых нейтронах (которые могут перерабатывать природный U-238 и торий в «замкнутом топливном цикле»).

Что это за мифический «замкнутый топливный цикл», в чем отличия реакторов на быстрых и тепловых нейтронах, какие существуют конструкции, когда нам от всего этого ждать счастья и конечно — вопрос безопасности — под катом.
Читать дальше →
Всего голосов 151: ↑145 и ↓6+139
Комментарии75

Выбираем онлайн-хранилище файлов

Время на прочтение5 мин
Количество просмотров8.3K
Персональные онлайн-хранилища файлов Не знаю как у вас, но у меня периодически возникает потребовать в онлайн-хранилище данных. Всегда есть файлы, которые могут потребоваться мне как на работе, так и дома – документация, фрагменты кода (snippets), наброски статей и т.д. Впрочем, иные документы, такие как карты, описания туристических маршрутов, материалы по истории городов и достопримечательностей могут понадобиться и вдалеке от родины. В первом случае можно обойтись синхронизацией данных домашнего и офисного компьютеров (что, кстати, не гарантирует вам отсутствие «головной боли»).
Читать дальше →
Всего голосов 59: ↑58 и ↓1+57
Комментарии71

Список сервисов 2.0 для взрослых

Время на прочтение1 мин
Количество просмотров39K
Представляю вашему вниманию просто список сервисов, которые могут оказаться полезными и приятными любому. Многие, кстати, сделаны по следам уже существующих популярных сервисов не adult-тематики.
Читать дальше →
Всего голосов 40: ↑33 и ↓7+26
Комментарии53

Как получать доход с Google Play на расчётный счёт ООО

Время на прочтение3 мин
Количество просмотров55K
Эта статья будет интересна российским компаниям, которые продают приложения через Google Play. У меня такая компания, и на своём опыте расскажу, как мы настроили денежные потоки с GP, чтобы они были легальными. Если вы не белые и не пушистые, т.е. считаете, что налоги можно не платить, то смело закрывайте эту статью.

Проблема:
Доходы с Google Play – такие же доходы, с них нужно платить налоги. Не все разработчики знают, как настроить получение доходов так, чтобы удовлетворять требованиям НК РФ.

Решение:
Получать доход на ИП либо на ООО и официально платить подоходный.
Если интересно про ИП читайте здесь и здесь.
В этой статье про получение доходов на счёт ООО.

Исходные данные
У вас есть аккаунт разработчика на Google Play – как его создать, читайте здесь
У вас есть приложение, которое генерирует доход – как его создать, одним линком не отделаешься.
У вас есть ООО.

Настройка
Google Play ведёт расчёты в USD, поэтому вам понадобится валютный расчётный счёт. Открыть валютный счёт можно в любом нормальном банке. Позвоните туда, Вам объяснят процедуру. Открыть счёт обойдётся в 2-3 т.р.
Когда Вам откроют валютный счёт, Вы получите реквизиты счёта. Вам понадобятся:
1. Название банка по-английски
2. БИК
3. Номер открытого счёта
4. BIC банка (или ещё его называют SWIFT)
Читать дальше →
Всего голосов 34: ↑32 и ↓2+30
Комментарии15

Google Navigation работает во всем мире… благодаря небольшому хаку ;-)

Время на прочтение2 мин
Количество просмотров3.1K
Многие из Вас слышали, что пару недель назад Google представил свою программу для Навигации.
Кто не видел- вот ссылка на видео
Но с этой программой была одна проблема… Она работала только в США.
Вероятно, лицензии на карты, купленные Google не позовляли использовать навигацию в других странах
(в США у Гугла уже свои карты ;-) )
Но, как мы знаем, мир не без добрых людей: Благодаря их стараниям, Навигация работает во всем мире, в том числе и в наших странах- сам только что катался с ней по Киеву:
image image
Под катом- как этого добиться на Вашем телефоне под OS Android
P.S. Оригинал этого руководства взят с форума xda-developers
Читать дальше →
Всего голосов 123: ↑119 и ↓4+115
Комментарии52

Манускрипт Войнича

Время на прочтение16 мин
Количество просмотров14K
Рукопись Войнича (англ. Voynich Manuscript) — таинственная книга, написанная около 500 лет назад неизвестным автором, на неизвестном языке, с использованием неизвестного алфавита.

Рукопись Войнича пытались расшифровать множество раз, но до сих пор без всякого успеха. Она стала Святым Граалем криптографии, но совсем не исключено, что рукопись есть лишь мистификация, бессвязный набор знаков.

Книга названа в честь американского книготорговца литовского происхождения Вилфрида Войнича (мужа известной писательницы Этель Лилиан Войнич, автора «Овода»), который приобрёл её в 1912 году. Сейчас она хранится в Библиотеке редких книг Байнеке (Beinecke Rare Book And Manuscript Library) Йельского университета.

Описание

В книге около 240 страниц тонкого пергамента. На обложке нет никаких надписей или рисунков. Размеры страницы — 15 на 23 см, толщина книги — меньше 3 см. Пробелы в нумерации страниц (которая, видимо, моложе самой книги) указывают на то, что некоторые страницы были утеряны ко времени обретения книги Вилфридом Войничем. Текст написан птичьим пером, им же выполнены иллюстрации. Иллюстрации грубовато раскрашены цветными красками, возможно, уже после написания книги.
Читать дальше →
Всего голосов 2: ↑2 и ↓0+2
Комментарии119

Немного из опыта покупок на E-Bay-в основном для москвичей

Время на прочтение8 мин
Количество просмотров24K
Итак, вдохновленный успехом топика – kovalevvalery.habrahabr.ru/blog/43607.html
и многочисленными просьбами тех, кому интересно услышать об опыте покупок на E-bay решил написать данный «материал». Ну заодно и блог одноименный завел…

Сразу оговорюсь, материал не будет претендовать на идеальную полноту изучения вопроса. А только лишь может быть обратит внимание на неявные нюансы, не описанные в многочисленных хэлпах E-bay, или просто вкратце изложит суть вопроса.
Читать дальше →
Всего голосов 124: ↑121 и ↓3+118
Комментарии133

Opera Mini для ASUS Eee PC

Время на прочтение1 мин
Количество просмотров4.7K
Примечание: обновился файл устройства. Теперь для версии 2.0.2 можно изменять размер экрана (Resizable) и вводить как английские, так и русские буквы.
ASUS Eee PC относится к таким устройствам, которые чаще используются там, где нет «нормальных» условий. Нормальные условия — это хоть какой-нибудь быстрый интернет (Ethernet или Wi-Fi).
Я же чаще пользуюсь обычным GPRS на Eee PC (подключил телефон через Bluetooth), поэтому сидеть в Jabber/ICQ ещё можно, а вот полноценно ходить по сайтам — дорого. А что мы используем на телефонах? Opera Mini!
Opera Mini можно запустить и на Eee PC:
Opera Mini на Eee PC

— это несложно. Всё можно сделать в три шага.

Читать далее →
Всего голосов 62: ↑58 и ↓4+54
Комментарии54

Как смотреть ролики на YouTube более высокого качества?

Время на прочтение1 мин
Количество просмотров18K
Ролики на YouTube представлены в паршивом качестве. Более того, если вы загрузите ролик высокого качества, сервис все равно его ухудшит. Почему так происходит? Забота о пользователях, у которых невысокая скорость в Интернете? Или боятся, что это создаст повышенную нагрузку на каналы YouTube?
Как оказалось, есть трюк, который позволяет смотреть видео с более качественной картинкой. Для этого надо в адресной строке добавить &fmt=6.
Читать дальше →
Всего голосов 120: ↑117 и ↓3+114
Комментарии95

Shortcuts for Windows. Продолжение…

Время на прочтение5 мин
Количество просмотров3.3K
Shotrcut
    Прочитав статью FrodoFrodo ― Shortcuts в windows, я решил дополнить её другими комбинациями клавиш и не только горячими. Привожу полный список того было в предыдущем топике со своими дополнениями.
Читать дальше →
Всего голосов 54: ↑54 и ↓0+54
Комментарии87

Советы и рецепты начинающему Android программисту

Время на прочтение12 мин
Количество просмотров78K
Добрый день, уважаемые хабраюзеры.

В данной статье я хочу поделиться своим опытом разработки под Android.
Требования к функционалу разрабатываемого продукта породили различные технические задачи, среди которых были как тривиальные, разжеванные во множестве блогов, так и крайне неоднозначные, с неочевидным решением. Я столкнулся с массой вещей, незнакомых мне, как .NET разработчику. Узнал о существовании инструментов, которые значительно упрощают жизнь. Думаю, что каждый начинающий андроидовец проходит похожий путь. Я мог бы сэкономить до трети времени, потраченного на разработку, поиск и эксперименты, имея такую статью.

Поэтому в данном посте я предлагаю вашему вниманию сборник рецептов и советов, которые помогут быстрей и правильней создать Ваше приложение.
В бой!
Всего голосов 46: ↑35 и ↓11+24
Комментарии60

Программа курса «Multicore programming in Java»

Время на прочтение3 мин
Количество просмотров52K
Добрый день.
Меня зовут Головач Иван, я руковожу небольшой образовательной компанией. Мы занимаемся онлайн курсами программирования.

Также я веду курс «Scala for Java Developers» на платформе для онлайн-образования udemy.com (аналог Coursera/EdX).

Хотелось бы услышать мнение сообщества по поводу
  1. программы курса «Multicore programming in Java»
  2. литературы к курсу

Кратко о курсе: стартует 28 апреля (в связи с майскими праздниками старт перенесен на 15 мая), ведется в режиме вебинаров дважды в неделю в 19.00-22.00, состоит из 16 лекций по 2.5 часа (=40 лекционных часов), к каждой лекции дается расширенное задание, рассчитан на Java Junior/Middle.
Читать дальше →
Всего голосов 37: ↑28 и ↓9+19
Комментарии45

Радиоуправляемый выключатель своими руками. Часть 1 — Hardware

Время на прочтение10 мин
Количество просмотров279K
Этот пост — первая часть из серии рассказов о том, как можно относительно несложно сделать своими руками радиоуправляемый выключатель полезной нагрузки.
Пост ориентирован на новичков, для остальных, думаю, это будет «повторение пройденного».


Примерный план (посмотрим по ходу действия) ожидается следующий:
  1. Hardware выключателя
  2. Тестирование и подготовка
  3. Software выключателя
  4. «Центр управления»

Приступим.
Всего голосов 86: ↑82 и ↓4+78
Комментарии116

Контроллер центральный домашний, всемогущий КЦД-В-2-12

Время на прочтение48 мин
Количество просмотров165K
История появления на свет центрального домашнего контроллера довольно запутанна. Мне кажется, если на секунду отвлечься и представить его в виде зимнего леса (вид сверху), то можно будет увидеть беспорядочные тропинки, плохо замаскированные ямы и, возможно, бродящего где-то в глуши И. Сусанина.

Функционал наращивался постепенно: сначала подключил беспроводные розетки, потом замахнулся на выключатели света. Аппетиты росли — датчики протечки, задымления, дверей, метеодатчики, радиореле и управление AV-техникой. Мастерство росло не так быстро. Поэтому получилось то, что получилось: вещь, бесконечно далекая от гайдлайнов по программированию и устройству электронных схем, но вполне работоспособная.

И знаете что? Меня это устраивает.
Читать дальше →
Всего голосов 80: ↑76 и ↓4+72
Комментарии46

Анализ популярных теорий игровой зависимости

Время на прочтение15 мин
Количество просмотров89K
Просмотрев пару другую статей на этом сайте по игровой зависимости, я решил их показать специалисту с 30 летним практическим опытом лечения разного рода зависимостей психотерапевту наркологу А.Г. Данилину.
Из его беседы мы решили подготовить статью.




Взгляды на компьютерную зависимость современных психологов и психиатров, с моей точки зрения, разделяются на три типа.
В отечественной психиатрии и наркологии принято смотреть на компьютерную зависимость так же, как и на зависимость от психоактивных веществ – как на болезнь.

В качестве лечения предлагается запрет на компьютерные игры и «заместительная терапия» психотропными препаратами.
Второй взгляд – трактовка зависимости от виртуальных игр через примитивную биологическую систему. Создатели компьютерных игр… играют на человеческих слабостях и формируют у игрока рефлекторное поведение. В этой логике геймер – нечто вроде «собаки Павлова» за компьютером.
Читать дальше →
Всего голосов 114: ↑86 и ↓28+58
Комментарии146

Мой удобный дом

Время на прочтение14 мин
Количество просмотров309K
Относительно недавно здесь был текст про домашнюю автоматику, а в комментариях один товарищ высказал идею, о которой я тоже думаю очень-очень давно. Суть в том, что автоматика должна работать так, чтобы этого, по возможности, вообще не было заметно.

То есть, умный дом — это дом, который может все. А удобный дом — это дом, который все, что может, делает сам.

Давайте сначала я просто похвастаюсь тем, что умеет мой дом сейчас, а вы решите, имеет ли смысл читать про мой местами горький (а местами очень даже ничего) опыт дальше, ок?
Читать дальше →
Всего голосов 161: ↑160 и ↓1+159
Комментарии97

Пишем, собираем и запускаем HelloWorld для Android в блокноте

Время на прочтение10 мин
Количество просмотров128K


Когда я начал изучать Android, захотелось полностью написать и скомпилировать Android-приложение вручную — без использования IDE. Однако эта задача оказалась непростой и заняла у меня довольно много времени. Но как оказалось — такой подход принёс большую пользу и прояснил многие тонкости, которые скрывают IDE.

По-сути эта статья является переводом и переработкой статьи Building Android programs on the command line под современные на данный момент JDK (7) и Android SDK (API level 19). Кроме того, я многое упростил и добавил кое-что от себя.

Используя только блокнот, мы напишем совсем маленькое учебное Android-приложение. А затем скомпилируем его, соберём и запустим на устройстве — и всё через командную строку. Заинтересовало? Тогда прошу.
Читать дальше →
Всего голосов 108: ↑97 и ↓11+86
Комментарии42

Разработка виджета под Android

Время на прочтение6 мин
Количество просмотров43K
На Хабре уже достаточно статей о том, как разработать «hello world»-виджет для устройств на базе Android. Еще больше об этом можно почитать в сети, в том числе и на сайте Google для разработчиков, StackOverflow и других ресурсах. Казалось бы, все подробно разжевано, есть сотни примеров — зачем же писать очередную статью, когда вокруг и так достаточно информации?
Однако, когда мы начали разработку виджета, нам пришлось потратить несколько недель на то, чтобы разобраться с нюансами и реализовать проект так, как мы задумали его изначально.
Надеемся, наш опыт поможет сэкономить время на реализацию вашего виджета.
Читать дальше →
Всего голосов 53: ↑49 и ↓4+45
Комментарии20
1

Информация

В рейтинге
Не участвует
Откуда
Москва и Московская обл., Россия
Дата рождения
Зарегистрирован
Активность