@alizar May 6 2008 at 13:14

Unicode наконец-то обогнал ASCII

1 min

2.1K

Website development *

+57

Comments 86

UFO landed and left these words here

@Heath May 6 2008 at 13:43

Почему же 8? Рост — экспоненциальный.

@coldFlame May 6 2008 at 13:45

да не 50/50, а 25/75 пока... но все равно приятно

@ashofthedream May 6 2008 at 13:45

у юникода доля всего лишь 50%

@coldFlame May 6 2008 at 13:58

какие 50%? посмотрите на шкалу

@ashofthedream May 6 2008 at 14:02

25! там 25! Да. 25 против 75. Ошибся, хотел вот поправеть человека, а ошибся сам... бывает

UFO landed and left these words here

@zaka May 6 2008 at 15:05

не расстраивайтесь, с кем не бывает...

@kivsiak May 6 2008 at 13:43

А что насчет русскоязычных кодировок?

@Stepanow May 6 2008 at 13:49

На фронте русских кодировок CP1251 одерживает безоговорочную победу над KOI8-R, а с запада движутся войска союзников (UTF8), но до наступательного порыва CP1251 им пока далеко (хотя лично я на UTF8 уже вовсю перехожу где есть такая возможность).

@dharbari May 6 2008 at 13:50

А зачем, если не секрет?

@Stepanow May 6 2008 at 13:54

текст, содержащий расширенные символы можно прекрасно использовать без преобразований в html-мнемоники.

@kivsiak May 6 2008 at 13:54

Затем чтобы вопрос о кодировках не приходил в голову вообще.

@Svetlyak May 6 2008 at 13:59

Эээ, по моему, глупее вопроса не придумаешь.

Сегодня вашим проектом пользуются только русские, а завтра придут китайцы, напишут «Привет», и всё сломается нах! :)

@khim May 6 2008 at 14:02

А вы не видели на хабре порезанных комментариев с ругательствами в адрес Хабра, который не принимает то λ, то ℏ а то и Å. На всех ресурсах, на которых разрешено пользователям что-то вводить Unicode небесполезен, а много ли сейчас других?

@dharbari May 6 2008 at 15:27

Нет, не видел.

@Pono May 6 2008 at 15:59

что видел? я их писАл :(
Хабр обрезает в комменте все, что идет после ударения :(

@nooze May 6 2008 at 13:47

Ну можно только порадоваться, глобализация гордо шагает по web'у

@nekufa May 6 2008 at 13:47

Вскоре, планируют ввести поддержку русского в Unicode :)

@Stepanow May 6 2008 at 13:50

Что за бред? Русский уже есть в UTF-8.

@vovchikk May 6 2008 at 14:42

Это вроде nekufa шутку пошутил

@Stepanow May 8 2008 at 05:55

Шутники блин. Писать на информационном ресурсе неверную информацию, надеясь что все смогут различить в ней тонкий юмор - это странно и наивно. Я Некуфа не минусовал, на кой ляд меня-то минусуют и в карму срут? Или кто-то считает что русского в UTF-8 нету?

@3al May 6 2008 at 13:51

Это как? У меня на домашней системе кодировка — юникод (UTF-8), с русским проблем нет. Что еще вводить?

@nekufa May 6 2008 at 13:58

<irony>

@iljava May 6 2008 at 21:09

вот и пошутили :)

@nekufa May 7 2008 at 11:55

угу, блин.. (:

@serzik May 6 2008 at 13:48

а чему тут удивляться?
график роста совпадает с началом развития социальных сетей и других проектов web20

UFO landed and left these words here

@popov May 6 2008 at 14:10

Почему самое противное, если не секрет? В программировании не так уж и сложно перелетать, к примеру, из ASCII в ANSI. Самому процедуру просто сделать, да к тому же есть готовые в библиотеках. С автоопределением кодировок у броузеров тоже проблемы в начале века кончились.

UFO landed and left these words here

@rg_software May 6 2008 at 14:14

Например, если у Вас используется на одной странице два языка, ни один из которых не английский. Попробуйте без уникода сочинить страничку, где приводятся примеры перевода, скажем, чешских текстов на русский язык. Если даже это можно (в чём сомневаюсь), три языка без уникода уж точно не потянуть.

@popov May 6 2008 at 14:45

Спасибо. Понял.

@alex_blank May 6 2008 at 19:45

>> С автоопределением кодировок у броузеров тоже проблемы в начале века кончились.

то-то у меня в Safari каждый второй сайт с cp1251 отображается кракозябрами..

это не в браузерах дело, а в разработчиках этих корявых сайтов

@popov May 7 2008 at 13:04

Хоть у меня и Windows, мне тоже Safari не нравится (версию для этой ОС можно на их сайте скачать). Явно что-то не то со стандартами.

@foo May 6 2008 at 14:09

новость не может не радовать. Скорей бы уже утф победно прошёлся и по территории бссср.

@malaka May 6 2008 at 14:12

уникод - пожалуй, одна из очень немногих светлых сторон глобализации. только клинопись да узелковая письменность за бортом оказались.

UFO landed and left these words here

@malaka May 6 2008 at 15:10

имхо глобализация в том, что при использовании уникода в рамках одного хтмл-документа/одной страницы/одной базы данных возможна публикация на разных языках. таким образом, создание, например, корпоративного сайта с многими языковыми версиями предельно упрощается.

@khim May 6 2008 at 17:12

Что значить "остались за бортом" ? Там есть и клинопись есть и не одна, а вот о каком узелковом письме речь идёт и кто его применял - я не знаю даже...

UFO landed and left these words here

@Frosty May 6 2008 at 15:54

Сначала обчитался и подумал, что простой Хабр в юникоде, ан-нет, зло**учий cp1251 :/ Даешь СуперХабр как можно быстрее!

UFO landed and left these words here

@macsyk May 7 2008 at 08:37

У вас логотип выпадает из общего дизайна.

@acy May 6 2008 at 14:16

одна беда: в юникоде страница в два раза тяжелее становится, чем в win-1251(

@hellt May 6 2008 at 14:19

если страница на англ, то тяжелее не станет.
А вообще это в браузерах с автоопределением все ок, а вот в той же Thunderbird я до сих пор ловлю письма в koi-8r с subject ????.??.??

UFO landed and left these words here

@hellt May 7 2008 at 10:30

Да, Вы правы, забыл уточнить, что Utf8. страница будет отличаться от ascii в случае наличия символов, выходящих за пределы 0-127 ASCII

@3al May 7 2008 at 11:29

Покажите страницы с юникодом не в UTF-8.

@3al May 6 2008 at 14:22

Вызывающе неверная информация. Страница наполовину состоит из ascii-символов стандартной части, которые в UTF8 (о чем и сабж) кодируются ровно одним байтом. Да и мнемоники html весят больше, чем юникодный символ, который они заменяют.

UFO landed and left these words here

@Busla May 7 2008 at 04:45

"взрослые" БД уже давно юникодные по умолчанию.

UFO landed and left these words here

@q_styler May 7 2008 at 06:48

А теперь расскажите это нашим хостерам =(

@Busla May 7 2008 at 11:00

а MySQL это вообще не БД, а сплошное недоразумение :P

@david_mz Aug 11 2009 at 07:10

Use gzip-compression Luke. Компрессия вывода — вообще хороший тон, а UTF-8 она сжимает очень хорошо, поскольку старшие байты символов почти одинаковые.

@Rpsl May 6 2008 at 14:17

Какая замечательная новость. )

@foomer May 6 2008 at 14:25

Ура Юникоду!

@moscow_beast May 6 2008 at 14:26

А мы уже. 100% проектов за 1,5 года в UTF-8 (переходим где можно и где нельзя)

@GarretUA May 6 2008 at 14:50

Статистика не может не радовать :)

@Aloner May 6 2008 at 14:53

Когда уже ФАР выйдет в юникоде...

@ProRunner May 6 2008 at 15:12

Без Рошала ФАРу поплохело. Я уже и не надеюсь.

@Aloner May 6 2008 at 15:19

Рошал отошел от дел 8 лет назад. Всё это время FAR Team справлялся с разработкой кое-как, бету довели до релиза, сколько багфиксов было сделано. Боюсь только, что опенсорсом его сделали потому, что больше никто не хочет им заниматься... =\

@ProRunner May 6 2008 at 15:36

Оперсорс похоже, тоже не поможет.
P.S. Кошмар, 8 лет, как летит время!

@khim May 6 2008 at 17:14

Ну ды берите и собирайте - кто мешает?

@Aloner May 7 2008 at 11:59

А насколько она рабочая? Я не девелопер, и дописать вряд ли что-то смогу. Если нужно просто скомпилить и получаешь такой же 1.70, только с поддержкой юникода, то это круто.

@maximw May 6 2008 at 14:57

Делал сайт с анлийским, русским, французским, испанским, арабским, фарси, вьетнамским, турецким, японским, немецким, хорватским и португальским вариантами перевода. Еще и китайский в базе недопереведенный лежал. Без utf8 я бы повесился все это в БД хранить и в браузер выдавать, учитывая что два языка вообще с письмом справа налево.
Как замечательно что utf все больше распространяется!