Articles / Bookmarks / Profile of snipsnap / Habr

How to become an author

Сергей Новоградцев @snipsnap

Java разработчик

ProfileArticles9PostsNewsComments158

tin-iven May 13 2015 at 16:14

Верификация аккаунтов на фриланс-биржах

4 min

18K

FreelanceLegislation in IT

Вчера получил от freelansim.ru «письмо счастья» – с новостью о том, что появилась новая возможность — «Верификация учетной записи». Зачем это нужно, почему это хорошо, и как это работает – хочу рассказать в этой статье.

Читать дальше →

+14

SLY_G May 13 2015 at 23:25

Введение в функциональное программирование на Python

10 min

154K

Python*Programming*Functional Programming*

Translation

Рассуждая о функциональном программировании, люди часто начинают выдавать кучу «функциональных» характеристик. Неизменяемые данные, функции первого класса и оптимизация хвостовой рекурсии. Это свойства языка, помогающие писать функциональные программы. Они упоминают мапирование, каррирование и использование функций высшего порядка. Это приёмы программирования, использующиеся для написания функционального кода. Они упоминают распараллеливание, ленивые вычисления и детерменизм. Это преимущества функциональных программ.

Забейте. Функциональный код отличается одним свойством: отсутствием побочных эффектов. Он не полагается на данные вне текущей функции, и не меняет данные, находящиеся вне функции. Все остальные «свойства» можно вывести из этого.

Нефункциональная функция:

a = 0
def increment1():
    global a
    a += 1

Функциональная функция:

def increment2(a):
    return a + 1

Вместо проходов по списку используйте map и reduce

Читать дальше →

+27

evgeny_boger May 14 2015 at 18:07

Wiren Board 4 — контроллер для автоматизации

4 min

60K

Бесконтактные устройства corporate blog

Год назад мы выпустили контроллер Wiren Board Smart Home. Благодаря невысокой цене и широким возможностям он имел успех среди энтузиастов.

Поэтому мы решили не останавливаться и выпустили новую версию — контроллер для автоматизации Wiren Board 4, к которому написали и новый софт.

Несмотря на название, покупатели часто использовали Wiren Board Smart Home и для совсем не “домашних” задач: сбора климатических параметров, опроса счётчиков и датчиков, удалённого контроля оборудования — то есть в качестве универсального логического контроллера.

Wiren Board 4 (как в железе, так и в ПО) лучше приспособлен для таких задач. Домашних пользователей это тоже коснулось — контроллер стал надёжнее.

Читать дальше →

+44

pportnoy May 15 2015 at 04:46

Разработка для Microsoft SQL Server (и не только): контроль версий, непрерывная интеграция и процедуры — как это делаем мы

10 min

23K

Website development*Version control systems*Microsoft SQL Server*

Доброго времени суток, уважаемые Хабровчане.

     В качестве краткой предыстории: год назад, придя на новое место работы в качестве руководителя отдела разработки БД (на базе Microsoft SQL Server), я испытал глубочайший шок от увиденного. Крупная компания, сложное веб-приложение, многомиллионные контракты, а разработка ведется на production-БД, баг-репорты поступают и обрабатываются по методике «кто громче крикнет» или «надо сделать прям вчера». Естественно ни о системе контроля версий, continuous integration, процедурах и workflow речи и не шло.

     Сегодня ситуация сильно изменилась (хотя, кого я обманываю — только начинает меняться) и я хотел бы поделиться как техническими, так и процедурными деталями решений, которые мы используем сейчас. Технические детали на 90% касаются непосредственно разработки для Microsoft SQL Server, а вот процедурные изменения у нас коснулись и веб-девелоперов, и инженеров, и аналитиков, и тестеров.

     Сразу оговорюсь, я не являюсь представителем компаний/рекламщиком программных продуктов, которые я буду упоминать в статье. Выбор используемого софта лучше всего подходил для наших задач по функционалу, цене, а также удовлетворял моим личным предпочтениям.

     Кому интересны подробности — добро пожаловать под кат.
Warning: очень много текста, описания процедур и процессов (которые, может, никому и не интересны).

Читать дальше →

+7

1cloud May 18 2015 at 14:09

AI, Big Data и дезинформация технологий

3 min

29K

1cloud.ru corporate blogBig Data*Development for e-commerce*Machine learning*IOT

/ фото KamiPhuc CC

Обычно в нашем блоге мы рассказываем об облачных сервисах, хостинге и соответствующих технологиях. Сегодня мы поговорим о сложностях развития технологий в целом, искусственном интеллекте, больших данных и Майкле Джордане (не баскетболисте).

Читать дальше →

+22

Durham May 18 2015 at 20:31

Создание своей модели для извлечения информации из текста с помощью web-API от Meanotek

8 min

17K

MeanoTek corporate blogSemantics*Machine learning*.NET*Website development*

Сейчас есть много сервисов, которые позволяют извлекать некоторую информацию из текстов, например именованные сущности, такие как имена людей, названия организаций, названия мест, даты, что позволяет решать некоторые интересные задачи. Но намного больше интересных задач остается за скобками.

Что если нужны названия товаров, причем не всех, а каких-то определенных? Или мы хотим интерпретировать команды для мобильного приложения? Разделить адрес на название улицы, дома, города? Как насчет выделить важные факты из обращения клиента в службу поддержки: «Я возмущен качеством обслуживания в вашей компании. Не так давно, я заказывал ноутбук, но менеджер разговаривал некорректно и сказал, что товар закончился». Сегодня я расскажу о новом сервисе позволяющим решать широкий круг задач извлечения информации из текста. Этот сервис мы только что открыли для публичного доступа.

Читать дальше →

+7

philipto May 18 2015 at 12:32

Новый PyCharm 4.5 собрал вместе все инструменты для работы с Python

2 min

43K

JetBrains corporate blogDjango*Python*

Всем привет! Мы выпустили новый PyCharm 4.5, который уже доступен для скачивания.

С момента предыдущего релиза PyCharm 4.0 прошло ровно полгода. За это время PyCharm получил ряд новых полезных инструментов для Python, Django и веб-разработки, которые, как всегда, тесно интегрированы и эффективно работают друг с другом. Сегодня мы рады рассказать, что же интересного и важного появилось в новой версии PyCharm.

Читать дальше →

+55

dkosolobov May 18 2015 at 15:03

Простое суффиксное дерево

12 min

77K

Algorithms*Programming*

Tutorial

Дерево

Суффиксное дерево – мощная структура, позволяющая неожиданно эффективно решать мириады сложных поисковых задач на неструктурированных массивах данных. К сожалению, известные алгоритмы построения суффиксного дерева (главным образом алгоритм, предложенный Эско Укконеном (Esko Ukkonen)) достаточно сложны для понимания и трудоёмки в реализации. Лишь относительно недавно, в 2011 году, стараниями Дэни Бреслауэра (Dany Breslauer) и Джузеппе Италиано (Giuseppe Italiano) был придуман сравнительно несложный метод построения, который фактически является упрощённым вариантом алгоритма Питера Вейнера (Peter Weiner) – человека, придумавшего суффиксные деревья в 1973 году. Если вы не знаете, что такое суффиксное дерево или всегда его боялись, то это ваш шанс изучить его и заодно овладеть относительно простым способом построения.

Читать дальше →

+39

Moscow_Exchange May 6 2015 at 17:38

Аналитический обзор рынка Big Data

24 min

116K

MOEX corporate blogBig Data*

«Big Data» — тема, которая активно обсуждается технологическими компаниями. Некоторые из них успели разочароваться в больших данных, другие — напротив, максимально используют их для бизнеса… Свежий аналитический обзор отечественного и мирового рынка «Big Data», подготовленный Московской Биржей совместно с аналитиками «IPOboard», показывает, какие тренды наиболее актуальны сейчас на рынке. Надеемся, информация будет интересной и полезной.

Читать полностью...

+11

warlog May 12 2015 at 10:34

Такое не забывается — Oracle Database In-Memory

11 min

67K

Oracle corporate blogOracle*

Объемы баз данных и сложность запросов к ним всегда росли быстрее, чем скорость их обработки. Поэтому лучшие умы человечества много лет думали о том, что произойдет, когда оперативной памяти станет столько, что можно будет всю базу данных взять и поместить в кэш оперативной памяти.

В последние годы логический момент для этого, казалось бы, настал. Стоимость оперативной памяти падала, падала, и упала совсем. Еще в начале века казалось, что 256 МБ памяти для сервера — это нормально, и даже много. Сегодня нас не удивишь параметром 256 ГБ оперативной памяти на сервере начального уровня, а с промышленными серверами вообще настал полный коммунизм, любой благородный дон может набрать хоть терабайт оперативной памяти на сервере, если захочет.

Читать дальше →

+20

acmag May 6 2015 at 07:31

Новое исследование Гарвардского университета обнаружило забавный способ стать успешнее

7 min

56K

MBA Consult corporate blogGTD*

Translation

Мы все хотим достичь успеха. Но прочитанные вами советы, вероятно, сводятся к пожеланию «больше работать». В этой статье мы расскажем, почему не успех приносит счастье, а счастье является причиной успеха.

Читать дальше →

+29

Olga_Volodko May 7 2015 at 13:42

Записки на полях Big Data Week Moscow

4 min

9.6K

New Professions Lab corporate blogMachine learning*Data Mining*Big Data*

В продолжение к нашему предыдущему посту с презентациями с Big Data Week Moscow, мы собрали несколько заявлений российских и международных спикеров, которые нам особенно запомнились и показались заслуживающими внимания.

Читать дальше →

+12

marks May 3 2015 at 10:01

Фотографии с самой длительной выдержкой

1 min

30K

Photographic equipmentPhysics

Один из приемов фотографов — увеличенная выдержка. Фотографируя звездное небо, при помощи увеличенной выдержи можно запечатлеть большее количество звезд, чем при небольшой выдержке. Кроме этого, увеличенная выдержка позволяет добавить на фотографию ряд интересных эффектов.

Один из них показан на анонсной фотографии. Она больше похожа на рисунок художника, но на самом деле это фотография с 6-месячной экспозицией. Белые полосы — это Солнце, прохождение его по небосводу. Хорошо видны изменения положения Солнца над горизонтом за эти полгода. Самое интересное, что эта фотография — совсем не рекордсмен по экспозиции.

Читать дальше →

+28

Fi1osof May 2 2015 at 14:21

Фабрика сайтов (Ф.CMS) проиграла суд

3 min

75K

Website development*Open source*MODX*CMS*

Наверняка многие активные MODX-разработчики слышали про «Фабрику сайтов». Это такие ребята, которые сделали копию движка MODX Revolution, назвали ее Ф.CMS и клепают на ней сайты, выдавая за собственный движок. Но помимо того, что они взяли сторонний опенсурс-движок, они еще и «позаимствовали» различные модули сторонних разработчиков, так же переименовали их и продают как свои, не указывая никакого авторства. Среди пострадавших — andchir и bezumkin. Последний писал про эту ситуацию довольно давно и подробно.

В прошлом году мне пришлось столкнуться с парой клиентов, чьи сайты долго и безнадежно разрабатывались в Фабрике. Один из сайтов был мной переделан и по результатам был написан подробный топик, где я разбирал качество выполненной работы указанной компании. И да, переданный мне сайт был разработан на Ф.CMS, действительно очень сильно напоминающую MODX Revolution, и да, в качестве модуля интернет-магазина использовался ShopKeeper by Andchir.

Читать дальше →

+106

ph_piter May 4 2015 at 12:43

Hadoop: быть или не быть?

7 min

48K

Издательский дом «Питер» corporate blogBig Data*Hadoop*

Translation

Здравствуйте, уважаемые читатели!

Некоторое время назад у нас вышел перевод фундаментальной орейлевской книги о фреймворке Hadoop:

В настоящее время редакция оказалась перед непростым выбором, перевести ли новое 4-е издание этой книги, либо допечатать уже имеющееся.

Поэтому мы решили опубликовать перевод статьи Ананда Кришнасвами, появившейся в блоге Thoughtworks еще в 2013 году, где автор пытается проанализировать, в каких случаях уместно использовать Hadoop, а в каких — излишне.

Надеемся, что материал покажется интересным, вызовет полемику, а Вы поделитесь Вашими впечатлениями о работе с Hadoop и поучаствуете в опросе.

Читать дальше →

+14

0decca Apr 27 2015 at 18:33

Не очень большие данные и определение тональности текста

2 min

7.7K

Machine learning*Programming*Semantics*

Всякая идея имеет простое, понятное и неправильное решение.
Одно из таких решений я и опишу в этой статье.
Не пытайтесь повторить эти эксперименты дома.
А если попытаетесь — то претензии по сгоревшим процессорам не принимаются.

Читать дальше →

+10

Irokez Aug 14 2012 at 22:23

Обучаем компьютер чувствам (sentiment analysis по-русски)

12 min

85K

Natural Language Processing*Python*Algorithms*

Sentiment analysis (по-русски, анализ тональности) — это область компьютерной лингвистики, которая занимается изучением мнений и эмоций в текстовых документах. Недавно на хабре появилась статья про использование машинного обучения для анализа тональности, однако, она была настолько плохо составлена, что я решил написать свою версию. Итак, в этой статье я постараюсь доступно объяснить, что такое анализ тональности, и как реализовать подобную систему для русского языка.

Читать дальше →

+80

Durham Apr 25 2015 at 10:53

Классификация предложений с помощью нейронных сетей без предварительной обработки

6 min

72K

MeanoTek corporate blogAlgorithms*Machine learning*Programming*Semantics*

Довольно часто встречается задача классификации текстов — например, определение тональности (выражает ли текст позитивное мнение или отрицательное о чем-либо), или разнесения текста по тематикам. На Хабре уже есть хорошие статьи с введением в данный вопрос.

Сегодня я хочу поговорить о проблеме классификации отдельных предложений. Решение этой задачи позволяет делать много интересного, например, выделять положительные и отрицательные моменты из длинных текстов, определять тональность твитов, является компонентом многих систем отвечающих на естественно-языковые вопросы (классификация типа вопроса), помогает сегментировать веб-страницы на смысловые блоки и многое другое. Однако, классификация отдельных предложений значительно сложнее классификации больших блоков текста — в одном предложении значительно меньше полезных признаков, и велико влияние порядка слов. Например: «как положено фильму ужасов, этот фильм был ну очень жутким» — содержит негативные слова («ужас», «жуткий»), но выражает положительное мнение о фильме, «все было ужасно красиво», или даже «отличный фильм, ничего не скажешь, только зря деньги потратили».

Читать дальше →

+22

tolikmg Apr 22 2015 at 18:26

Осознанные сновидения, фаза быстрого сна и маска Remee — можно ли управлять своими снами

12 min

48K

Medgadgets corporate blogHealthMedical gadgetsGadgets

На ночь глядя я познакомлю вас с историей изучения осознанных сновидений, расскажу о ключевых фигурах в науке, которые стояли у истоков открытия быстрой фазы сна, или REM, а также коротко поделюсь своим опытом «осознанных снов» с маской Remee

Добрый вечер!

Читать дальше →

+14

polybook Apr 22 2015 at 00:28

Машинное обучение — 4: Скользящее среднее

3 min

34K

Нерепетитор.ру corporate blogMathematics*Machine learning*

Tutorial

Принято считать, что две базовые операции «машинного обучения» — это регрессия и классификация. Регрессия — это не только инструмент для выявления параметров зависимости y(x) между рядами данных x и y (чему я уже посвятил несколько статей), но и частный случай техники их сглаживания. В этом примере мы пойдем чуть дальше и рассмотрим, как можно проводить сглаживание, когда вид зависимости y(x) заранее неизвестен, а также, как можно отфильтровать данные, которые контролируются разными эффектами с существенно разными временными характеристиками.

Один из самых популярных алгоритмов сглаживания, применяемый, в частности, в биржевой торговле — это скользящее усреднение (включаю его в цикл статей по машинному обучению с некоторой натяжкой). Рассмотрим скользящее усреднение на примере колебаний курса доллара на протяжении нескольких последних недель (опять-таки в качестве инструмента исследования используя Mathcad). Сами расчеты лежат здесь.

Читать дальше →

+9

1 2 ...

48

49 50 ...