• Az.js: JavaScript-библиотека для обработки текстов на русском языке

      Как чуден и глубок русский курлык
      Генератор постов

      Обработка естественного языка (natural language processing, NLP) — тема, на мой взгляд, очень интересная. Во-первых, задачи тут чисто алгоритмические: на вход принимаем совершенно примитивный объект, строчку, а извлечь пытаемся вложенный в него смысл (ну или хотя бы частичку смысла). Во-вторых, необязательно быть профессиональным лингвистом, чтобы решать эти задачи: достаточно знать родной язык на более-менее приличном уровне и любить его.

      А ещё с небольшими затратами можно сделать какого-нибудь бестолкового чат-бота — или, как вот я, генератор постов на основе того, что вы писали на своей страничке в соцсети. Возможно, кто-то из вас уже видел это приложение — оно довольно глупое, чаще всего выдает бессмысленный и бессвязный текст, но изредка всё же дает повод улыбнуться.

      Бессвязность текстов в нынешней версии «Генератора» вызвана тем, что на самом деле никакого анализа он производить не умеет. Просто в одних случаях «предсказывает» продолжение предложения по собранным биграммам, а в других — заменяет в готовом предложении некоторые слова на другие, которые заканчиваются похоже. Вот и вся начинка.

      Конечно, хочется сделать что-нибудь поинтереснее. Беда в том, что модные сейчас нейросети не очень-то применимы здесь: им нужно много ресурсов, большую обучающую выборку, а в браузере у пользователя соцсети всего этого нет. Поэтому я решил изучить вопрос работы с текстами с помощью алгоритмов. К сожалению, готовых инструментов для работы с русским языком на JavaScript найти не удалось, и я решил сделать свой маленький велосипед.
      Читать дальше →
    • Два по сто: самые читаемые статьи и авторы Хабра и ГТ

        Если кто не знает, на Хабре, как и Гиктаймсе, всегда можно посмотреть все самые рейтинговые статьи за всё время. Но по просмотрам ни статьи, ни авторы никак не сортируются. Список ниже отражает почти полную правду о самых читаемых статьях «Хабра» и «Гиктаймса» за всё время. Почти — потому что, к сожалению, публичный счётчик был включён только 27 сентября 2012 года (примерная дата), поэтому если вам кажется, что какие-то ваши любимые тексты эпохи, когда Хабр был более торт, недосчитались просмотров — может, вы и правы. Впрочем, отчасти фактор неработавшего ранее счётчика нивелируется мощным хвостом в виде поискового траффика, так что действительно сильные тексты в любом случае должны были получить то, что им причитается — но об этом позже.

        Итак, самые топ-100 самых читаемых постов за всё время на Хабре и ГТ в сумме. Megamozg included by default, т.к. данные собраны 21 мая, уже после обратного слияния с «Хабром»:

        1. «Скрытые смайлы в Skype», G0rDi — 1599K (2009)
        2. «Взломать Wi-Fi за… 3 секунды», ushanov90 — 1511K (2012)
        3. «Взломать Wi-Fi за 10 часов», gorl — 1181K (2012)
        4. «300 потрясающих бесплатных сервисов», shimapa23 — 1052K (2015)
        5. «Пишем своё первое приложение на Android», Hoorsh — 997K (2010)
        6. «Обновление с Windows 7/8.1 до Windows 10 TP через Windows Update», akibkalo — 840K (2015)
        7. «Простая стратегия игры 2048», WhatIsGTO — 820K (2014)
        8. «Откровенные фото Дженнифер Лоуренс и еще десятков знаменитостей утекли через iCloud», Akr0n — 795K (2014)
        9. «Подарок от Skype на новый год», gmikhail94 — 781K (2013)
        10. «Wi-Fi: неочевидные нюансы (на примере домашней сети)», apcsb — 757K (2012)

        Читать дальше →
      • How-to: Правила вёрстки email-писем

        • Translation


        Электронная почта — отличный инструмент коммуникации, который позволяет компаниям доставлять аудитории контент удобным для нее способом. При этом читать письма в формате plain text не всегда удобно, поэтому в современных новостных рассылках используются различные графические элементы.

        Вёрстка HTML для электронной почты — интересная и довольно сложная задача. Письма должны одинаково хорошо отображаться на старых устройствах и версиях программных клиентов.

        В сегодняшней статье мы поговорим о том, как создавать email-письма, которые хорошо выглядят на любых устройствах, а также рассмотрим способы адаптации HTML-кода уже существующих рассылок для их отображения на телефонах и планшетах.

        Примечание переводчика: Представленный ниже материал содержит значительное количество технических терминов, при переводе которых могут возникнуть неточности. Если вы заметили опечатку, ошибку или неточность перевода — напишите нам, и мы оперативно всё исправим.
        Читать дальше →
      • Приятная сборка frontend проекта

        • Tutorial
        В этой статье мы подробно разберем процесс сборки фронтенд проекта, который прижился в моей повседневной работе и очень облегчил рутину.

        Статья не претендует на истину в последней инстанции, так как сегодня существует большое количество различных сборщиков и подходов к сборке, и каждый выбирает по вкусу. Я лишь поделюсь своими мыслями по этой теме и покажу свой workflow.

        UPD (13 марта 2015): Заменил несколько плагинов на более актуальные + решил проблему с импортом CSS файлов внутрь SCSS

        Читать дальше →
      • Верстка email рассылок от А до Я для чайников

        Уже 3 с лишним года занимаюсь дизайном и версткой почтовых рассылок, которые ориентированы на англоязычных пользователей. За время работы перелопатили огромную кучу информации, перепробовали много вариантов верстки, набили достаточное количество шишек. Были найдены и исправлены типичные баги, которые в той или иной мере повторялись во всех почтовых клиентах. Также нашлись проблемы с некоторыми CSS свойствами — различные почтовые клиенты интерпретировали их по разному. Каждое письмо тестировалось на самых популярных почтовых клиентах: Gmail, Outlook, Yahoo, Android, iOS, MozillaThunderbird, Microsoft Outlook, The Bat. Рассылки ходят на сотни миллионов пользователей и приносят очень хорошие результаты. Итак, приступим к изучению.
        Читать дальше →
      • 15 советов и хитростей инструментов разработчика Chrome, которые вы обязаны знать

        • Translation
        Сегодня Google Chrome является самым популярным браузером среди веб разработчиков. С быстрым, шести недельным, циклом релизов и мощным набором постоянно расширяющихся инструментов разработчика, превратившим браузер в инструмент, который вы обязаны иметь. Большинство из вас, вероятно, знакомы со многими его функциями, такими как «живое» редактирование CSS, используя консоль и отладчик. В этой статье мы с вами рассмотрим 15 захватывающих советов и хитростей, которые позволят улучшить вашу производительность еще больше.
        Читать дальше →
      • 50+ лучших дополнений к Bootstrap



          Благодаря популярности CSS фреймворка Bootstrap, для него разработали массу различных дополнений. Даже сейчас вы можете использовать Bootstrap практически для любой задачи при разработке и оформлении вебсайта.

          Для статьи я подобрал наиболее полезные дополнения «на все случаи жизни».
          Читать дальше →
        • Как вернуть деньги со счета мобильного, если вы не подключали сторонних услуг

            Если вдруг однажды вы заметите, что с вашего счета начнут утекать деньги в непонятном направлении, эта статья поможет вам разобраться в причинах и, самое главное, вернуть эти деньги.

            Disclaimer: хабр не является жалобной книгой, поэтому из статьи был выкинут личный пример «попадания» на описываемое.

            Как вообще можно подписать на услугу без моего ведома?


            У сотовых операторов есть «партнеры», оказывающие разного рода услуги (например, купить картинку-подарок в «Контакте»). Смысл подобных услуг заключается в следующем:
            1. Вы вводите номер телефона.
            2. Вам присылают код подтверждения.
            3. Вы вводите этот код.
            4. С этого моменты вы считаетесь официально подписанным на какую-то услугу (будь то одноразовую или нет).


            Подвох заключается в том, что легитимность подключения какой-либо услуги операторы запрашивают у самих компаний, которые эту услугу подключают (эти компании именуются партнерами сотовых операторов). Более того, отправление уведомления и подтверждения подключения какой-либо услуги лежит полностью на совести партнеров операторов (контент-провайдеров). Интересным также является тот момент, что в биллинге у некоторых сотовых операторов (например, у «Билайна») нет информации по поводу входящих смс, т. е. если вам будут говорить, что вам пришла смс с подверждением, вам не смогут это доказать.

            Всё это делает возможным, например, следующую схему:
            1. 1-го января в семь утра вводят ваш номер телефона.
            2. Оператору присылают уведомление, что вы бессрочно подписались на такую-то услугу и подтвердили эту услугу.
            3. С вашего счета начинают списывать 40 р. каждый день, пока не кончатся деньги или вы не заметите их утечку (если вы платите за телефон раз в месяц, то легко можете потерять тысячу рублей).

            Читать дальше →
          • Береги зрение, используй f.lux

              Почти четыре года прошло с момента упоминания на Хабре программы f.lux, настоящего лекарства для тех, у кого устают глаза из-за монитора.



              Программа изменяет цветовой профиль монитора, в зависимости от времени суток. Ночью глаза меньше устают от тёплых цветовых тонов (3400 K), днём — от холодных (6500 K), которые больше соответствуют дневному свету.
              Читать дальше →
            • Как не потерять деньги, желая сэкономить. Правила интернет покупок из-за рубежа

                    Давно собирался написать эту статью, но все не находил на это время. Последней каплей, подтолкнувшей меня к изложению аккумулированного за шесть лет опыта покупок за рубежом стали две статьи о массовом разводе дешевыми Киндлами, изложенные на хабре. Случай, когда такое количество человек попало на обычный для Ебея развод показал, что эта тема освещена недостаточно и людям не хватает базовых знаний в вопросе безопасности покупок.
                    Ниже, я попытаюсь изложить то, что почерпнул за годы покупок как на своем опыте, так и из жалостливых писем с мольбами о помощи от коллег покупателей на профильных форумах. Все нижеизложенное я считаю тем минимумом, который необходимо усвоить ДО того, как пытаться что либо купить за рубежом. Более тонкие вещи можно почерпнуть на соответствующих тематических форумах.

                Итак, начнем. Заранее прошу прощения за большое количество текста и излишнее словоблудие.
                Читать дальше →
              • Ликвидаторы безграмотности

                  Думаю, что каждый из вас сталкивался с небольшими сайтами, которые не смотря на размер, делают очень важное дело — учат чему-то. При этом всё происходит настолько просто и легко, что после закрытия страницы, ощущаешь приятный зуд в пятках. Я хочу поделиться с вами огромным списком ссылок, но это невозможно, потому как знаю я лишь три подобных сайта.1 Из-за этого я предлагаю вам вступить в диалог и составить реальный список ликвидаторов безграмотности.

                  UPD: Цель поста — сконденсировать адреса, которые и себе пригодятся и другим можно кинуть вместо фразы «на гугле забанили?»

                  То, о чём известно мне.
                • Крик души: давайте писать грамотно!

                    Буквально каждый день я получаю письма и документы со множеством опечаток и ошибок. Это разного рода деловая переписка — договоры, акты, технические задания, сметы, а также письма от клиентов, партнеров и коллег. К сожалению, не обращать внимания на такие «мелочи» постепенно становится нормой.

                    Отсутствие ошибок правописания в документах — часть делового этикета. И, похоже, самая сложная. Очень непросто добиться беспрекословно грамотного письма, но не допускать элементарные распространенные ошибки в своей «менеджерской лексике» — уже заметный шаг на этом пути.

                    Читать дальше →
                  • Строение двигателей

                      Недавно наткнулся на прекрасный сайт (англ.), который по полочкам размусоливает и показывает строение большинства типов двигателей. Попытаюсь вольно и сжато пересказать самое на мой взгляд главное, совсем по пальцам и как для самых маленьких. Конечно можно было бы позаимствовать точные определения из авторитетных источников, но такой любительский перевод обещает быть единственным в своем роде :)

                      А можете ли Вы сходу объяснить Вашей девушке, в чем отличие бензинового двигателя от дизельного? Четырёхтактного и двухтактного движков? Нет? Тогда приглашаю под кат.

                      Читать дальше →
                    • Учет затрат на автомобиль в бортовых журналах Drivernotes.net

                        Привет, Хабрасообщество.

                        Хочу рассказать вам о нашем онлайн-сервисе бортовых журналов для автомобилей – DriverNotes.net. Надеюсь, что описание нашего ресурса получится не просто в стиле «Я пиарюсь», но и наведет на какие-то мысли людей, только собирающихся создать что-то свое. В любом случае буду рад ответить на все интересующие вас вопросы.

                        image


                        Читать дальше
                      • Развитие Интернета: от урезанного dial-up до свободного WiFi


                        Когда-то Интернет влезал в одну дискету


                        Все мы являемся свидетелями и участниками стремительного развития этого глобального явления. Удивительно, что почти каждый может вспомнить тот момент в своей жизни, когда впервые столкнулся с ним, но не может представить, как можно без него жить, учиться, работать или отдыхать. Думаю, что многие со мной согласятся – Интернет стал частью нашей жизни. Что его ждёт впереди? Для того, чтобы представить будущее, необходимо заглянуть в прошлое и сравнить его с настоящим.

                        Вспомним, что было всего два десятка лет назад… Мало кто тогда знал об Интернете, если быть точнее — об Internet, так как в русском языке такого слова тогда еще не существовало. Не смотря на то, что уже несколько десятилетий развивались технологии электронной почты, доски объявлений, новостные группы, чаты и т.д., Интернет фактически был «закрытой» для обычных пользователей сетью, развернутой между американскими университетами и военными ведомствами. Сам Интернет не оказывал никакого непосредственного влияния на жизнь людей, и являлся сугубо научной разработкой с военным уклоном. Ни о каком массовом распространении Интернета до появления способов недорогого и универсального доступа в сеть не могло быть и речи.

                        Ситуация кардинально изменилась с развитием самого распространенного на тот момент коммутируемого удаленного доступа dial-up. Количество тех, кто получил возможность выхода в Интернет начало измеряться десятками миллионов, а ежегодные темпы роста числа новых пользователей увеличились на порядок и, вплоть до сегодняшнего дня, измеряются десятками процентов ежегодно.
                        Читать дальше →
                      • Вышел релиз популярного магазина OpenCart v1.5.0 RC1

                          Один из самых популярных и динамично развивающихся OpenSource проектов для электронной коммерции — OpenCart выпустил новую версию v1.5.0 RC1 для финального тестирования. Я беглым взглядом пробежался по меню настройки и выделил изменения по сравнению с версией 1.4.x.
                          Читать дальше →
                        • Мой опыт восстановления зрения

                          • Tutorial
                             Этим летом я был на некоторое время предоставлен сам себе – всех своих я отправил подальше от дыма, а сам, недолго думая, решил немного подтянуть здоровье. Не просто записаться в тренажерный зал и накачать «квадратиков» для пляжа, а именно обследоваться у некоторых врачей, чтобы выработать для себя вектор дальнейших действий, дабы совсем не превратиться в «овоща».

                          image

                             Расскажу лишь про свой опыт восстановления зрения – именно оно больше всего подвержено риску у любого «компьютерного» человека.
                          Читать дальше →
                        • Двадцать лет тюрьмы и миллион рублей штрафа за нелицензионный файл!…

                            Нынешнее сообщение является естественным продолжением вчерашнего, так что сперва напомню известные со вчерашнего дня факты.

                            Вчера Novikov в своём блоге подметил, что Московская городская дума готова была предложить (26 августа, устами своего депутата Милявского) попрать все идеалы внутренней свободы, а вместо того поклониться одновременно демону тоталитаризма и золотому тельцу правоторговли, то есть составить чёрный список сайтов, предлагающих нелицензионные файлы, и за любое посещение такого сайта штрафовать каждого гражданина на сумму от 2000 до 5000 рублей.

                            Это прискорбно.
                            В частности, Новиков тотчас постиг и сокрушался о том, какие небывалые и коррупционные бездны произвола правоохранительных структур откроются во всяком таком случае, когда какой-нибудь сетевой червь понаоткрывает запретные сайты без ведома пользователей, или если другой сайт поставит невидимый <iframe> или прозрачный пиксел запретного сайта. Опять же и для цензуры возможности какие богатейшие.
                            Там же в комментариях MSVGePard без малейшего промедления открыл, что упомянутый Милявский имеет еврейское расовое происхождение и даже гражданство Государства Израиль ([1], [2]), и притом далеко не совершенно чужд и сам нелицензионщине: в прессе не раз упоминалося, что Милявский миллионы нажил, создав свой рынок «Горбушкин двор». Ум останавливается перед потугою истолковать эту деталь биографии: не то Милявский зачищает интернетовских конкурентов своего оффлайнового бизнеса, не то обратился к чрезмерному и небывалому ещё покаянию? Да не в том ли всё и дело, что «Горбушкин двор» недавно намерены были остановить?
                            Подробнее эту тему раскрыл в LiveJournal блоггер martellus. В комментариях он упоминает также, что Указом Президента В. В. Путина в 2003 году Александр Милявский был награждён медалью ордена «За заслуги перед Отечеством» II степени. Видим, стало быть, что заслуженный единоросс этот и впрямь может выступить с некоторой законодательной инициативою и быть услышанным с нею в самых верхах и недрах «Единой России» преблагосклоннейше.
                            Увы, личный блог Новикова не транслируется на заглавную страницу Хабахабра — и оттого не все заметили эту новость, несмотря на двузначный рейтинг его блогозаписи.

                            А между тем вышеупомянутые события не остановилися 26 августа, а развивались и далее: сообщение Новикова можно дополнить известием о том, что на нынешней неделе (в понедельник 30 августа) в «Ведомостях» вышла статья «Штраф за пиратство». К сожалению, сама по себе эта статья не очень полезна нам, будучи не более чем собранием разноречивых мнений, более или менее экспертных и (или) официальных. Зато к ней прилагаются для скачивания собственно документы законопроекта Милявского. Их два: проект Федерального закона «Об охране авторских и смежных прав в сети Интернет и о внесении изменений в отдельные законодательные акты Российской Федерации», а с ним сборник поправок, предлагаемых ко внесению в Уголовный кодекс и в Кодекс об административных правонарушениях.

                            Эти поправки сегодня утром подверг сравнительному анализу LJ-блоггер i_contester и открыл такие подробности, от которых волосы должны буквально становиться дыбом на голове. Вы уж лучше присядьте, прежде чем читать о них:

                            Читать дальше →
                          • Инвентаризация в компании: Установка GLPI

                              image



                              Пришло время и в нашей компании провести учет компьютерной техники. Компания растет, расширяется, и памяти IT отдела плюс нескольких XLS-файлов уже не хватает для быстрого и достоверного ответа что у нас и где находится.

                              Читать дальше →