Search
Write a publication
Pull to refresh
0
0
auth @auth

User

Send message

PHP: Определение языка текста с помощью N-грамм. Часть 1

Reading time10 min
Views4K
Примечание: я не смог по какой-то причине восстановить свой перевод, за который получил инвайт и он куда-то пропал. Поэтому публикую его снова.

Обычно, когда мы смотрим на текст, мы разбиваем его на слова и используем эти слова для определения языка, на котором он написан. Однако существует достаточно много способов сделать это, сравнивая другие единицы текста. Например, буквенные n-граммы.

N-граммы — это просто n-буквенные последовательности, извлеченные из документа. Например, слово «констебль», разложенное в триграммы (трехбуквенные последовательности) будет выглядеть так: {«кон», «онс», «нст», «сте», «теб», «ебл», «бль»}. Существует большое количество способов извлечения таких последовательностей. Более-менее очевидный приведен ниже. С помощью этой функции можно извлекать n-граммы из входной строки. По умолчанию извлекаются триграммы.

Читать дальше →

Генератор прелоадеров (индикаторов загрузки)

Reading time1 min
Views5K
Проблема: создать анимированный прелоадер с оригинальным дизайном и неоходимым цветовым решением.
Решение: есть специальный ресурс для генерации прелоадеров http://www.ajaxload.info/. Выбираем из списка тип индикатора загрузки (доступно более 20 вариантов). Далее — цвет бекграунда (можно сделать прозрачный прелоадер) и цвет самого индикатора. Жмем GENERATE. Смотрим. Если результат подходит — жмем DOWNLOAD и сохраняем полученный прелоадер.

О других полезных утилитах и приемах Вы можете почитать на блоге www.bontonweb.com

Программист и ошибки — актуально во все времена

Reading time6 min
Views9.2K
Годы бегут, компьютеры становятся мощнее, листинги программ длиннее, а программисты всё ещё допускают те же самые ошибки (или же сталкиваются с ними)… Предлагаю разобраться с основными типами ошибок и причинами, по которым они происходят

Чтобы максимально раскрыть смысл фразы "актуально во все времена", в качестве иллюстрирующих примеров будут приведены сведения времён старой доброй DOS :), поэтому материал рекомендуется к прочтению любителям ностальгии
Какие же бывают типы ошибок?

LightSleeper: Лучшее изобретение после подушки

Reading time1 min
Views1.7K
LightSleeper умное устройство, которое проецирует успокаивающий свет на потолок. Который движется по кругу перед глазами. Вы просто следите за светом в течение нескольких минут, и незаметно для себя проваливаетесь в сон.
image
Читать дальше →

Опыт бесплатной смены тарифа в «Билайне»

Reading time3 min
Views24K
В своем недавнем топике Тариф_с_подчеркиванием я писала про хорошо законспирированные манипуляции с тарифами, провернутые «Билайном», в результате которых мы с родными были тихо переведены с посекундной тарификации на поминутную, хотя на сайте в описании тарифа все выглядело вроде бы по-прежнему замечательно.

Я тогда, конечно, понегодовала, но за неимением более выгодных вариантов, все-таки перешла на обновленный посекундный тариф «Семья_2009», заплатив 90 рублей за переход. Но моего мужа такой расклад не устроил.

Он решил действовать по-другому.

Скорость загрузки страниц повлияет на ранжирование

Reading time1 min
Views2.5K
Вполне вероятно, что уже в следующем году Google модифицирует алгоритмы ранжирования таким образом, что будет учитывать не только релевантность контента и PR, но также и скорость загрузки каждой страницы, сказал один из ведущих программистов компании Мэтт Каттс (Matt Cutts) в интервью WebProNews.com.

Это будет очередной мерой, которые предпринимает Google для всеобщего «ускорения интернета», наряду с разработкой протокола SPDY и других инновационных технологий. Для веб-мастеров недавно открыт раздел Site Speed со списком справочных ресурсов и инструментов для оптимизации производительности сайта. Некоторые из этих инструментов (Page Speed и Closure) созданы самой компанией Google, а другие от сторонних разработчиков.
Читать дальше →

Мухи, математика… Роботы?

Reading time3 min
Views4.4K
image

Формализуя активность клеток мозга мухи, задействованных в зрительных процессах, ученые нашли новый способ извлечения траекторий движения из необработанных визуальных данных.
Читать дальше →

Трагическая история. Алгоритм RSA

Reading time2 min
Views6K
В 1982 году была создана RSA Data Security Inc. тремя парнями Рональдом Ривестом, Ади Шамиром и Леонардом Адлеманом, которые в 1977 году опубликовали свою идею алгоритма. В результате обороты продаж этой компании составили $900 миллионов, принеся создателям и огромные деньги, и признание мировой общественности. Но были и другие люди…
Читать дальше →

Google Developer Day. Complete

Reading time2 min
Views603
Доброй ночи, %username%.
Хочу поведать о прошедшей конференции Google Developer Day 2009 Moscow.
Для большинства посетителей этот день начался очень рано, потому что до восьми утра у входа в кинотеатр Октябрь собралось уже около 30 человек, Google оказались очень пунктуальными и никого раньше не пускали. Пришлось померзнуть, зато это компенсировалось быстрой регистрацией (Те кто пришел позже, еще час где то регистрировались). Меньше всех повезло людям у кого фамилия начиналась на «К», больше всех эта секция регистрации была заполнена, «А»-«З» вначале практически пустовала.


В этот раз сразу выдали ручку, анкету и бэджик соответственно. Далее можно было под паспорт или водительские права взять приемник перевода с английского. Далее как поднялись на второй этаж очень порадовало то, что были накрыты столы всякими вкусностями, чаем, кофе, соком и т.д. (после улицы, это просто сказка).


Когда основная масса зарегистрировалась всех пригласили в главный зал и провели обзор того, что будет на текущей конференции (очень порадовало видео, пока ожидали начало, что они с «хромом» только не делали). Смотря на выступающих из зарубежных офисов Google, казалось, что пригласили шоуменов, наши пока далеки от них по качеству подачи информации.

Далее всем предложили посетить интересующие их секции, с учетом того что первые две будут сняты на видео и выложены на YouTube(пока еще не выложили). Кстати, секции были названы как фильмы, что удачно сочеталось с кинотеатром (Матрица, Пятый элемент, Люди в черном, Послезавтра, Звездные войны). Последние две были постоянно переполнены, некоторым приходилось слушать их в проходе (в принципе места были, но до них было сложно добраться).

Как мне показалось, что все лекции были для начинающих, лишь некоторые моменты показались новыми. Выступающие с удовольствием отвечали на вопросы обменивались контактами, атмосфера была очень дружественная и приятная. Chewy особенно выделялся среди всех, постоянно шутил и заинтересовывал зал, но переводчики зачастую не успевали за его скоростью речи :) По сути, я заметил всего одного переводчика который был «в теме», остальные просто слабо были знакомы с вебом и технологиями, поэтому перевод получался иногда как у «Промта» :)
Читать дальше →

За деньги можно всё… или…

Reading time1 min
Views2K
Вот наткнулся на статейку на таком ресурсе как Фишки.Там в одной из новостей фигурирует информация о том, что Дворец Главы Газпрома который он строит себе в стиле XVIII века стоимостью $50 млн пропал с карт Гугла!
Читать дальше →

Кастомные переменные Google Analytics, или новые возможности для сегментирования вашего трафика

Reading time4 min
Views11K
Как Вы, вероятно, уже знаете не так давно произошло обновление Google Analytics. Данное обновление было освещено и здесь, на хабре, — Грандиозное обновление Google Analytics

В частности изменения коснулись:
  • Увеличено количество целей до 20 (4 набора по 5 целей в каждом)
  • Появились цели новых типов (время проведенное на сайте и кол-во просмотренных страниц)
  • Веб-аналитика мобильных сайтов. Статистика с приложений на платформах Android и IPhone также как для веб-сайтав
  • Адаптация кода Analytics под выбранную платформу
  • Появление Pivot таблиц в отчетах — то чего очень не хватало многим, и из-за чего приходилось использовать Excel
  • Фильтрация данных в отчетах на лету
  • Добавлена новая метрика — уникальные посетители
  • Расширена возможность работы с событиями
  • Полностью изменены принципы работы с пользовательскими переменными


На последнем я бы и хотел остановить свое внимание.
Читать дальше →

Разрабатываем в облаках (WPF, ASP.NET, PHP)

Reading time2 min
Views1.1K
ss1 Много всего сейчас говорится об облачных вычислениях. О том, как удобно все хранить и обрабатывать где-то там — в облаках. У нас есть Google Docs для создания документации, скоро будет Microsoft Office Web 2010 Apps (на самом деле и сейчас уже можно пользоваться Excel и PowerPoint на live.com), так же мы уже можем хранить документы в облаках, вести контакты, календари, ну в общем все что только можно захотеть (или почти все?). И более того, на глаза мне недавно попался CodeRun – Web IDE.
Читать дальше →

Алгоритм робота Маришко

Reading time3 min
Views17K
6 лет своей жизни я потратил на изучение искусственного интеллекта. Результат моих исследований выразился в незаконченном проекте marishko.com. Я пытался разработать систему человеческого общения, не требующую специально обученного учителя, а способную обучаться автономно как маленький ребёнок.

В этой статье я хочу поделиться некоторыми используемыми мною алгоритмами и идеями.

Сразу скажу, что в своих исследованиях я больше опирался на природу интуиции как основу интеллекта, поэтому мои мысли далеки от математических алгоритмов.

image

Читать дальше →

Артем Геллер отвечает на вопросы о создании kremlin.ru

Reading time1 min
Views3K
Артем Геллер — учредитель и креативный директор Опытного Креативного Бюро. Опыт работы Артема составляет 10 лет в области веб-разработок в качестве дизайнера и арт-директора.

Главным проектом Артема и их бюро стал проект kremlin.ru — официальный сайт Президента Российской Федерации. Этот проект включает в себя Информационный ресурс о деятельности главы государства «События», институты при Президенте «Государство», версия портала Президента РФ для «Слабовидящих», «Мобильная Версия» информационного ресурса о деятельности Президента РФ, сервис отправки обращений «Письма Президенту».

Совсем недавно Артем принял участие в фестивале веб-разработчиков 404fest, где выступил с докладом о работе над этим важным проектом.

В рамках еженедельных он-лайн конференций 404ok мы решили дать возможность всем желающим узнать об этом проекте больше. Артем будет рад рассказать о том как рождались идеи, как велась работа с гоcударственными органами и о многом другом. Вы можете поучаствовать в конференции, задав интересующий вас вопрос.

Задать вопрос

Запасаемся на зиму

Reading time1 min
Views22K
Книги — пища для мозгов программиста. А художественные — десерт. Хорошая книга — как вкусное блюдо, которое хочется дочитать растянув удовольствие, испробовать снова и снова. Но есть куча книг, которые мы еще не нюхали и, возможно, никогда не попробуем, потому что нам их не посоветовали несколько человек.

У каждого есть одна-две любимые книги, которые могут понравится другим, поделитесь пожалуйста, заразите. Думаю многим будет интересно поставить в очередь «к прочтению» несколько новых. Давайте устроим «дегустацию» книг в формате: одна книга — один комментарий. Чтобы другие могли добавить в избранное (и оценить, и обсудить) каждую книгу по отдельности.

Читать дальше →

Google наконец-то выпустил в свет свой корпоративный javascript-фреймворк

Reading time1 min
Views3.6K
Похоже, не все поняли, что произошло: вместо того, чтобы говорить о фреймворке от Google, народ обратил внимание на вторичную вещь — компрессор javascript-кода Closure Compiler.

А ведь Closure Library есть ни что иное, как внутренний javascript framework Гугла, компоненты которого использованы в Gmail, Google Docs и прочих веб-приложениях от Г. И это замечательно, друзья мои! Ведь это фреймворк от непревзойдённых профессионалов разработки популярных вебприложений. Что подразумевает собой качество, стабильность и оптимальность кода, единообразность разных частей фреймворка.

До сих пор подобных фреймворков была только одна штука — это YUI, корпоративный фреймворк Yahoo. Безусловно, YUI радует единообразием, отличной документацией, компонентами, удобными для создания вебприложений. Однако мне всегда казалось странным, что Yahoo, далеко не лидер в области rich internet applications, опубликовала свои библиотеки, а Google, та самая компания, которая своими Maps и Gmail просто заставила разработчиков браузеров поддержать всё то, благодаря чему мы сейчас имеем кучу 2.0 сервисов, не обнародавала свои javascript-библиотеки на пользу простым разработчикам.

И вот это произошло. Ура, товарищи!

Оптимизация Javascript с помощью Google Closure Compiler

Reading time1 min
Views47K
image
Google открыла исходные коды нескольких инструментов, которые использовались их сотрудниками при разработке таких проектов как Google Docs, Google Maps и GMail.

В числе этих инструментов имеется достаточно интересная штука, называемая Google Closure Compiler. Данная утилита минимизирует и оптимизирует javascript-код, за счет чего он начинает работать и загружаться быстрее.
Читать дальше →

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Date of birth
Registered
Activity