Search
Write a publication
Pull to refresh
21
0
Антон Аникин @ColorPrint

User

Send message

8 полезных регэкспов с наглядным разбором

Reading time2 min
Views274K
О мощи и гибкости регулярных выражений написано много, и их использование давно уже является стандартом для различного рода операций над текстом. Пожалуй, чаще всего регэкспы работают при валидации вводимых данных — здесь им практически нет альтернативы, если не считать громоздкий циклический разбор с кучей неочевидных проверок. Начнём с самого простого:

1. Часть ЧПУ (человекопонятный URL)


По сути, слово с дефисами.

Паттерн: /^[a-z0-9-]+$/
short_url

Примеры посерьёзнее

Алгоритмы на графах — Часть 2: Сортировка сетей

Reading time5 min
Views23K

Пролог

В продолжение опубликованной на выходных статьи.

Компиляторы — пожалуй одна из самых интересных тем системного программирования.
Эта статья не расскажет как написать идеальный, или, хотя бы, работающий компилятор, но она поможет прояснить пару аспектов его работы, при помощи метода топологической сортировки сети.
Читать дальше →

Стабильное вещание IPTV через VLC

Reading time8 min
Views61K
С IPTV пришлось познакомиться поближе, когда в компании интернет-провайдера где я работал, решили организовать вещание IPTV. Выяснилось, что вещание осуществляется в linux и программой vlc, которая по слухам единственная в своем роде. Была установлена тарелка и DVB-карта SkyStar2, которая предположительно должна была без проблем заработать в linux'e. Так и было со всеми новыми машинами, где была установлена ubuntu server. На Debian заработало только после обновления ядра. Настройка прошла относительно легко, благо на то время уже было несколько статей на эту тему и документация к vlc была тоже очень полезна. После запуска начались некоторые проблемы с пропаданием звука и видео на каналах и другие проблемы, описанные ниже. После их появления были написаны скрипты, устраняющие эти проблемы. Сейчас на них работает 3 сервера с 5 dvb-картами в общей сложности и вещается 23 канала с 3х спутников. Под катом — перечисление проблем, которые могут появиться после запуска вещания IPTV через VLC в Linux и то как с ними бороться. Бороться будем с помощью bash.
Читать дальше →

Java по-русски. Часть первая: Книги

Reading time2 min
Views497K
Не так давно я проводил опрос «Какие материалы о Java вас интересуют на русском языке?» среди посетителей Хабра. Вторым этапом моего исследования будет обзор существующих русско-язычных ресурсов.

Книги


За 2009 на Ozon.ru можно найти 8 книг по Java (всего за последние 3 года их вышло 22 — примерно по 7 в год, на books.ru набор примерно такой же, так что наша выборка довольно репрезентативна). Посмотрим, что это за книги?
Читать дальше →

Многомерные кубы, OLAP и MDX

Reading time5 min
Views120K
OLAP Довольно давно являюсь обитателем Хабра, но так и не доводилось читать статьи на тему многомерных кубов, OLAP и MDX, хотя тема очень интересная и с каждым днем становится все более актуальной.
Не секрет, что за тот небольшой промежуток времени развития баз данных, электронного учета и онлайн систем, самих данных накопилось очень много. Теперь же интерес также представляет полноценный анализ архивов, а возможно и попытка прогнозирования ситуаций для подобных моделей в будущем.
С другой стороны, большие компании даже за несколько лет, месяцев или даже недель могут накапливать настолько большие массивы данных, что даже их элементарный анализ требует неординарных подходов и жестких аппаратных требований. Такими могут быть системы обработки банковских транзакций, биржевые агенты, телефонные операторы и т.д.
Думаю, всем хорошо известны 2 разных подхода построения дизайна баз данных: OLTP и OLAP. Первый подход (Online Transaction Processing — обработка транзакций в реальном времени) рассчитан на эффективный сбор данных в реальном времени, второй же (Online Analytical Processing – аналитическая обработка в реальном времени) нацелен именно на выборку и обработку данных максимально эффективным способом.

Давайте рассмотрим основные возможности современных OLAP кубов, и какие задачи они решают (за основу взяты Analysis Services 2005/2008):
  • быстрый доступ к данным
  • преагрегация
  • иерархии
  • работа с временем
  • язык доступа к многомерным данным
  • KPI (Key Performance Indicators)
  • дата майнинг
  • многоуровневое кэширование
  • поддержка мультиязычности

Читать дальше →

Установить время выполнения консольной команды

Reading time3 min
Views4.5K
Довелось однажды писать скрипт, который в процессе своей работы пробегал по списку видео файлов и для каждого запускал ffmpeg с ключом, позволяющим получить информацию о файле. Мне собственно требовалось время воспроизведения.

Все бы хорошо, да вот на одном файле ffmpeg подвисал и не думал завершаться, а в момент завершения отваливался и php скрипт без видимых на то причин.

После долгих поисков решения данной проблемы, был найден код, который после небольшой переделки я готов представить на ваш суд :)

подробности

Автоматизация работы *nix системного администратора

Reading time3 min
Views2.7K
О ssh и системных администраторах:

С давних пор *nix системные администраторы используют ssh для удаленного управления серверами.
Некоторые из них делают себе готовые наборы скриптов для обновлений софта, раскладки из репозитория, и так далее.
До определенных размахов бедствия можно обходить парк машин одну за одной. Однако рано или поздно парк машин вырастет до вполне себе солидных размеров и тогда простейшая раскладка по фронтэндам новых скриптов становится головной болью нескольких часов.

Вот здесь вот и начинается самое интересно:
одни системные администраторы запускают свои скрипты в несколько потоков, другие придумывают как отмазаться от части машин.

Однако теперь есть универсальное решение

Поиск нечетких дубликатов. Алгоритм шинглов для веб-документов

Reading time4 min
Views45K
Ранее я показал элементарную реализацию алгоритма шинглов, позволяющую определять, являются ли два документа почти дубликатами или нет. В этот раз я поясню реализацию алгоритма, описанную Зеленковым  Ю. Г. и Сегаловичем И.В. в публикации «Сравнительный анализ методов определения нечетких дубликатов для Web-документов».
Этим я начинаю серию из трех теоретических статей, в которых постараюсь доступным языком описать принцип алгоритмов шинглов, супершинглов и мегашинглов для сравнение веб-документов.
Читать дальше →

Тестируем UI с помощью Coded UI Test

Reading time2 min
Views10K
image
В жизни любого серьезного проекта всегда уделяется большое внимание и много времени тестированию. Процесс тестированию может продолжаться несколько часов, а может занять и целые недели, все зависит от размеров вашего проекта. Существует множество вариантов тестирования вашего  решения. В Visual Studio 2010 появился новый способ тестрования, позволяющий с легкостью находить недоработки в графическом интерфейсе.
Читать дальше →

Установка PhotoShop CS4 под Ubuntu 9.04 Jaunty

Reading time4 min
Views5.3K
Уважаемые коллеги, позвольте предложить вам мой первый пост на хабре — перевод публикации по установке Adobe PhotoShop CS4 под Ubuntu 9.04 Jaunty.

Немалое количество пользователей используют Adobe PhotoShop, и, похоже, CS4 работает (под Ubuntu — прим. пер.). Однако установка его нетривиальна, и требует выполнения некоторых действий: Нам потребуется скомпилировать пропатченную сборку Wine 1.1.25, после чего добавить еще связку утилит в систему.
Также не лишним будет напомнить, что вам потребуется легальная (либо триальная :) — прим. пер.) версия Adobe PhotoShop CS4.
Эта инструкция предназначена только для Ubuntu Jaunty (она может сработать и для других сборок, но я в этом сомневаюсь)
Читать дальше →

DNS Tunneling via iodine: сыр действительно бесплатный

Reading time3 min
Views26K
Есть:
— отключенный за неуплату интернет (adsl, lan, etc)
или
— нешифрованная wi-fi сеть c закрытым интернетом, но работающим dns
или
— очень строгий firewall с открытым dns

Хочется:
полноценный интернет, пусть даже очень медленно
Как?

Краткий обзор движков таблиц MySQL

Reading time3 min
Views79K
Цель этой статьи — дать краткий, очень сжатый обзор движков, для того, чтобы статьей можно было пользоваться при выборе движка на этапе проектирования \ создания \ оптимизации таблицы. Предполагается, что читатель знает суть вопроса по крайней мере поверхностно и способен сам отыскать всю дополнительную информацию (вопросы в комментах можно задавать всегда :) )
Читать дальше →

Google gears успешно скомпилировался для Firefox 3.5 под Linux

Reading time1 min
Views867
Гугл пока не выложил обновления, но в svn сорс уже собирается, после некоторых танцев и небольшого патча. Выкладываю версию-0.5.25.0 для Linux 64 и 32. и патч. Проверено работает на opensuse 11.1 с фоксом проинсталленым из репозиторев.

Для x86_64:
uploaded.ivlis.com/gears-linux-x86_64-opt-0.5.25.0.xpi
(md5: 6d517d64e8ca4408b2d75572f501c3e1)

Для i386:
uploaded.ivlis.com/gears-linux-opt-0.5.25.0_0.xpi
(md5: 9da04e7e04ea9bbb41c52f9d3d7b57eb)

Для osX (Спасибо kovpas):
kovpas.ru/ggears/gears-osx-opt-0.5.25.0.xpi

Как собирать:

Средства создания горячих BackUp`ов MySQL

Reading time3 min
Views33K
Доброго времени суток. Недавно я задался вопросом о том, как делать горячие BackUp`ы MySQL-серверов — ниже компиляция из прочитанного. Заранее хочу сказать, что данный пост является скорее большой заметкой, чем полноценной статьёй. Я намеренно уклоняюсь от описания синтаксиса — на эту тему уже немало написано — я же ставил перед собой другую цель — составить краткий обзор основных методов с характерными особенностями:
далее

Linux: Установка программ не входящих в дистрибутив при помощи менеджера xstow

Reading time3 min
Views116K
Введение


Современные дистрибутивы Linux имеют в своем составе очень много софта. Проблемы с установкой/удалением/обновлением такого софта решены, можно сказать, идеально. Всем занимается менеджер пакетов. Выбрали нужный пакет, менеджер пакетов установит его. Нужно удалить — менеджер пакетов удалит и аккуратно все почистит. Но, иногда хочется, или нужно, установить программное обеспечение, не входящее в дистрибутив, или распространяющееся в исходниках, или даже в бинарниках. Как поступать в таких случаях?
Читать дальше →

InfoVis Toolkit

Reading time1 min
Views2.3K
InfoVis Toolkit — предоставляет инструменты для создания интерактивных представлений данных в Веб с помощью JavaScript. Распространяется с открытым исходным кодом под лицензией BSD. Поддерживаются основные браузеры: IE6+, Firefox2+, Safari3+, Opera9.5+
Читать дальше →

Своя веб-студия: от идеи до реализации

Reading time4 min
Views13K
Последнее время на хабре стали появляться истории об организации собственного бизнеса. Решил написать аналогичную историю нашей студии создания сайтов «Web++».
Как мы начинали свою деятельность, являясь студентами, откуда брали первые заказы и деньги? К вашему вниманию: краткий рассказ о формировании собственной студии создания сайтов.
Читать дальше →

Не устраивает качество хостинга? Напишите жалобу!

Reading time2 min
Views5K
Хостеров нынче много. Хороших хостеров мало. Бывают ситуации, когда ваша площадка лежит по несколько часов, а хостер не отвечает по тикетам/icq/телефону. Пинать хостеров в направлении улучшения качества услуг можно и нужно. Вкратце расскажу, как можно воздействовать на них оставаясь в правовом поле:
Вы можете обратиться в Роскомнадзор, с просьбой проверить качество телематических услуг которые хостер предоставляет вам. Желательно чтобы у вас был подписанный договор с хостером или хотя бы распечатанная с сайта оферта. Множество хостеров работают без лицензий и без разрешений на эксплуатацию – проверка из Роскомнадзора, для них вызовет множество проблем.
Читать дальше →

Information

Rating
9,034-th
Location
Волгоград, Волгоградская обл., Россия
Date of birth
Registered
Activity