Pull to refresh

Nokia Bell Labs передала сообществу все права на операционную систему Plan 9

Reading time 3 min
Views 4.5K
ITSumma corporate blog Open source *System Programming *History of IT
Компания Nokia, которой сейчас принадлежит подразделение Bell Labs, передала сообществу все права и копирайты на ОС — и переопубликовала под свободной лицензией MIT все четыре редакции и финальный релиз Plan 9.

Таким образом, пользователи могут распространять код системы и/или модифицировать его по своему желанию, в соответствии с условиями соглашения MIT. Поддержкой и продвижением системы займётся общественная организация Plan 9 Foundation.

Plan 9 писали с нуля, чтобы элегантно решить принципиальные задачи по работы в распределённой среде. Хотя эта система не получила такого широкого распространения, как Unix, но она по факту оказала большое влияние, породив несколько концепций, которые сегодня являются краеугольными камнями распределённых вычислений.
Total votes 23: ↑23 and ↓0 +23
Comments 4

Encoding

Reading time 1 min
Views 913
Lumber room
После того, как я отказалась от использования Microsoft Windows XP в пользу Mac OS X, у меня осталась едиственная просьба к дяде Биллу: сделайте в своей ОС дефолтом кодировку UTF-8, как во всех остальных системах, и претензий у меня к вам больше не останется! Ибо ничто не дает лучше понять людям друг друга в сети, как единство кодировки.

PS: Плюсом для всех будут конечно мелочи по тегированию песен, и, например, кодировок на ftp-серверах. В остальном вин меня не очень интересует.
Total votes 14: ↑12 and ↓2 +10
Comments 42

Два бага в блогах и RSS-фидах

Reading time 1 min
Views 459
Lumber room
1. Пытаюсь написать в блог Ошибки на сайте, пишет «Дорогой хабрачеловек, присоединись, типа, к этому блогу и сможешь написать» — ну присоединился… а не могу написать ничего.

Говорите правду, что после присоединения я тоже не смогу ничего написать.

Пишу сюда.

2. При вставке RSS-фида «Моё!» в блог на wordpress.com фид выдается без указания кодировки (я в данном вопросе не особо компетентен, но то что результат смахивает на ISO 8851, вижу хорошо).

Как бы мне указать кодировку фида или, еще лучше, выдать в utf-8?..
Total votes 4: ↑1 and ↓3 -2
Comments 0

Кодировки must die

Reading time 1 min
Views 1.4K
Lumber room
йНДХПНБЙХ ОПЕДЯРЮБКЧР ЯНАНИ НДМН ХГ МЮХЛЕПГЕИЬХУ НПСФХИ АНПЭАШ Я ПСМЕРНЛ.

«KOI8», — подумал Штирлиц.

Как подсказал Яндекс, в самом полном словаре иероглифов корейского языка, подготовленном около тысячи лет назад, было учтено около 53 тысяч знаков. Тяжело им, наверно, корейцам. В русском же языке другая проблема: всего 33 буквы, но зато кодировок… кто-то их считал? Я нет. В опере 4, файерфокс предлагает на выбор 7.
Читать дальше →
Total votes 27: ↑22 and ↓5 +17
Comments 123

UTF-8 — оплот международного терроризма

Reading time 1 min
Views 746
Lumber room
В понедельник 4-го июня 2007 года американский госсекретарь Кондолиза Райс выступила с обличительной речью в адрес IT-индустрии, которая по её словам способствует безнаказанному распространению информации и договорённостей о планируемых террактах на территории США посредством электронных форумов, расположенных на территории России и прочих стран с неокрепшей демократией.
Читать дальше →
Total votes 75: ↑62 and ↓13 +49
Comments 274

помогите разобраться с utf-8

Reading time 1 min
Views 666
Lumber room
Хабралюди! помогите разобраться с этой кодировкой! Вместо слов вылезают одни вопросы! Мне на одной странице надо совместить португальский и русский язык, никак не получается
Total votes 7: ↑3 and ↓4 -1
Comments 16

Unicode наконец-то обогнал ASCII

Reading time 1 min
Views 1.9K
Website development *
Согласно статистике от Google, Unicode опередил ASCII и теперь стал самой популярной системой кодирования символов в интернете. Как видно на графике, за последние два года число сайтов на UTF-8 резко выросло, так что в течение всего десяти дней в декабре Unicode опередил сразу двух прежних лидеров: ASCII и западноевропейскую кодировку 8859-1/1252 (это та же ASCII с добавлением нескольких символов).

Специалисты Google отмечают, что это вполне закономерный процесс, хотя, по их словам, вызывает удивление та ошеломляющая скорость, с которой произошла «революция кодировок» в интернете.


Читать дальше →
Total votes 61: ↑59 and ↓2 +57
Comments 86

AJAX, IE и CP1251

Reading time 1 min
Views 761
Lumber room
Делал я тут как-то пое-чего на аяксе, передавал данные в JSON'е, кодировка всего на сайтине — cp1251. Дабы не изобретать велосипед использовал jQuery.
Все отлично работало пока я не решил протестить все в IE. IE у меня седьмой версии, в других не проверял пока, но по-моему там та же фича.
Так вот, ничего не работало безовсяких ошибок (видимых). Покопавшись выяснил что jQuery возвращает parsererror. Покопавшись глубже выяснил что транспорт выпадает с эксепшеном при доступе к полю responseText а поле responseXML содержит пустой документ (что естественно, данные передаются текстом).
Поработав лобзиком и гуглем с полчаса методом тыка выяснил что:
  1. ежели кодировка с заголовках стоит не utf-8 IE отказывается работать абсолютно;
    тип контента application/ajax и application/x-javascript тоже не рулят.

    В общем в конце концов стал выдавать заголовок Content-type: text/plain; charset=utf-8 и перекодировать все в utf-8 (благо с iconv это вышло тремя строчками).
    Нет, я конечно читал что IE не дружит с виндовой же кодировкой cp1251 но пока разобрался ;)
    Люди! Не повторяйте чужих ошибок :)

    UPD


    Мда, посыпаю голову пеплом. Оказалось, что все довольно неплохо исправляется заменой кодировки cp1251 на windows-1251 :) Спасибо за совет.
Total votes 12: ↑8 and ↓4 +4
Comments 8

PHP, PREG и UTF-8

Reading time 6 min
Views 16K
PHP *
В этом посте речь пойдет о работе РНР5 с multibyte строками посредством preg_*() функций.

Заметил интересное положение дел, вобщем-то давным давно описанное в интернете, но актуальное и по сей день (вопрос всплыл всвязи с недавним постом про trim()).
Читать дальше →
Total votes 43: ↑39 and ↓4 +35
Comments 17

phpDocumentor и UTF-8 исходники

Reading time 1 min
Views 2.6K
Lumber room
Как заставить phpDocumentator понимать русский текст в исходниках на UTF-8:

1. нужно править файл Setup.inc.php. В нем есть метод createDocs, где нужно исправить следующее
- if (stristr($ret, "utf-8") !== "")
+ if (stristr($ret, "utf-8") === false)
{
$ret = utf8_decode($ret);
}


2. Пройтись глобальной заменой по всем (*.*) файлам документатора и заменить
charset=iso-8859-1'/>
на
charset=utf-8'/>

3. Необязательный (у меня и без этого заработало, но возможно это имеет значение при выводе мануала в XML)
Пройтись глобальной заменой по всем (*.*) файлам документатора и заменить
<?xml version="1.0" encoding="iso-8859-1"?>
на
<?xml version="1.0" encoding="utf-8"?>

P.S. Тестировалось на теме HTML:frames:default

Ну и на закуску, готовый плагин для Zend Studio for Eclipse
Total votes 5: ↑4 and ↓1 +3
Comments 2

Пара слов про UTF-8

Reading time 6 min
Views 44K
Perl *
Perl долгое время ничего не знал про кодировки. Строка была просто последовательностью байтов, каждый держал там все что хотел, и лишь изредка приходилось задумываться о том, какая же все-таки кодировка у этих данных. Времена изменились, появился UTF; поддержать его пришлось и перлистам. Как это обычно бывает, in a perl way. Я надеюсь, что эта статья сбережет немного здоровья тем, кто до сих пор пребывает в неведении относительно реализации UTF-8 в Perl.
Читать дальше →
Total votes 52: ↑48 and ↓4 +44
Comments 53

Патчим UTF-8 Collation под FreeBSD

Reading time 2 min
Views 5.5K
*nix *
Итак, сегодня я постараюсь ответить на популярную проблему как пропатчить KDE UTF-8 под FreeBSD.

В один прекрасный момент переноса базы данных с тестового сервера на продакшн для подготовки бета версии я больно стукнулся головой об проблему с UTF-8 строками в PostgreSQL. А точнее, натолкнулся на полное нежелание PostgreSQL выдавать на запрос SELECT upper('суслик') положенного по штату "СУСЛИК"а. В результате поиска баги я был в шоке, так как совсем не ожидал от современной операционки таких, совсем уже детских, ляпов!
Читать дальше →
Total votes 10: ↑8 and ↓2 +6
Comments 21

Проблема с отображением шрифта Verdana на сайтах с кодировкой UTF-8

Reading time 2 min
Views 1.1K
Lumber room
На днях нашел занятный баг в Internet Explorer в некоторых версия Windows. Скорее здесь больше виновата винда, нежели IE.

Если вы используете на сайте кодировку UTF-8 (возможность этот глюк может всплыть еще в каких-то кодировках), то IE ее не отображает, и находит ближайшую ей замену — например, Arial.

Поискав в интернете решение данной проблемы убедился что проблема распространенная, но на Хабре вроде как никто не писал о ней.

Итак, решение было найдено:
Читать дальше →
Total votes 5: ↑2 and ↓3 -1
Comments 8

SQLite и полноценный UNICODE

Reading time 2 min
Views 30K
SQL *SQLite *
Наверно многим известна embed база данных SQLite. SQLite полностью поддерживает кодировки UTF-8 и UTF-16. Но есть один нюанс, для строковых и текстовых полей, символы которых выходят за пределы ASCII таблицы, не работает нечувствительный к регистру LIKE и ORDER BY.
Например:
sqlite> SELECT "ы" LIKE "Ы";
0
в то время как
sqlite> SELECT "s" LIKE "S";
1
Давайте разберемся как же это исправить.
Читать дальше →
Total votes 23: ↑23 and ↓0 +23
Comments 22

UTF-8 + FreeBSD 8

Reading time 1 min
Views 8.2K
*nix *
Начиная с 8.0-RELEASE, FreeBSD будет поддерживать юникод в консоли.
Уже сейчас в восьмой ветке можно подключить UTF-8, проделав следующие шаги:
  1. Добавить в конфигурацию ядра строки options TEKEN_UTF8 и options TEKEN_XTERM
  2. Заменить 'cons25' на 'xterm' в /etc/ttys
freebsd-vt-unicode.png
Total votes 28: ↑23 and ↓5 +18
Comments 39

Скрипт автоматического преобразования m3u в m3u8

Reading time 3 min
Views 7.7K
Configuring Linux *
Относительно недавно переехал на GNU/Linux. Преобразовывая плей-листы от foobar2000 в .m3u, заметил, что бывают еще .m3u8. Оказывается, это тот же .m3u, но в кодировке UTF-8. Непорядок, подумал я, и решил привести всё в кошерный вид, т.е. перевести списки .m3u в .m3u8, т.к. все файлы храню в UTF-8. Этих самых плей-листов у меня довольно много (более 100), пэтому решил написать скрипт на баше.
Читать дальше →
Total votes 32: ↑18 and ↓14 +4
Comments 22

Язык Go с точки зрения PHP-разработчика

Reading time 4 min
Views 17K
Website development *
Go — это язык, придуманный Робертом Гризмером (Robert Griesemer), Робом Пайком и Кеном Томпсоном, который был анонсирован в ноябре 2009 с версиями под Linux и Mac OS X. Сейчас разработчики работают в Google, но и задолго до этого были очень известными и уважаемыми людьми (к примеру, кодировка UTF-8 была изобретена Томпсоном и Пайком для использования в качестве основной кодировки в Plan 9).

Лично я решил посмотреть, что это за язык после того, как тут опубликовали вот это видео выступления Роба Пайка. Я изучаю Go не очень долго, но даже за те две недели, что я потратил на его изучение, я успел сделать несколько проектов на нём, например backend для библиотеки JsHttpRequest (JsHttpRequest; мой backend на Go). Я до сих пор использую JsHttpRequest из-за её удобства (как со стороны JS, так и со стороны PHP). В статье я хочу рассказать исключительно о моих ощущениях после программирования на PHP и JavaScript, практически без примеров кода.
Читать дальше →
Total votes 91: ↑57 and ↓34 +23
Comments 107

Проблема UTF-8 Byte Order Mark или кириллица в крякозябах

Reading time 2 min
Views 2.3K
Zend Framework *
Столкнулся с проблемой некорректного отображения кириллических шрифтов в браузере, а точнее браузер неправильно определял кодировку. Краткий анализ показал, что данное неудобство проявляется только при включении плагина ZF debug. Кинув взгляд на исходный код страницы увидел, что стили и скрипты свои плагин подключает сразу же после открывающего тега <head>, то есть до метатега с информацией о кодировке страницы, что, видимо, не совсем правильно.

Читать дальше →
Total votes 1: ↑1 and ↓0 +1
Comments 1