Pull to refresh
  • by relevance
  • by date
  • by rating

Облако — сортировка

Habr
Хотел спросить… по какому критерию сортируюсть метки в облаке?
Считаю, что гораздо удобнее, привычнее было бы отсортировать их по алфавиту.
Люди которые постоянно следят за сайтом, а соответственно за изменениями в облаке уже привыкли видет его таким и запомнили в какой части облака находиться необходимая метка.
А вот новый человек теряеться( — чтоб найти ту метку, которая ему интересна, он должен пробежать по всему облаку, причем напрягаться, читая то мелкий то крупный шрифт.
Гораздно логичнее было бы разместить метки в алфавитном порядке, не правда ли?
Total votes 7: ↑6 and ↓1 +5
Views 736
Comments 6

Сортировка в разделе «Работа»

Habr
Хотелось бы иметь возможность:
1. Отсортировать или отфильтровать вакансии/резюме по региону.
2. Искать по ключевому слову в названии вакансии.
3. Иметь фильтр по зарплате.
4. Сортировать по дате.
Total votes 16: ↑15 and ↓1 +14
Views 475
Comments 9

Сортировка комментариев

Habr
Прекрасно было бы сортировать ветки комментариев не по времени, а по рейтингу.

Это бы избавило от поиска интересных веток обсуждения среди большого количества комментариев. Так же, исчез бы смысл оставлять комментарий самым первымнах. А на бред и флуд было бы достаточно потратить один минус, и для дела оставалось бы больше голосов.

Да, были бы мы в сказке, то комментарий с положительным рейтингом влиял бы на рейтинг и позицию родительских комментариев, а то и на рейтинг хабратопика. Но тогда бы появилась личная заинтересованность ставить плюсы комментариям и ответам адресованных к Вам. Так что учитывать общий вес положительных дочерних комментариев для сортировки не пойдёт.
Total votes 11: ↑8 and ↓3 +5
Views 898
Comments 9

Сортировка по регионам в «Работа»

Habr
Итак, о чем хотел сказать. Думаю, что не плохо было бы добавить в Вакансии/Работа/Хабархабр возможность группировки вакансий не только по рубрикам, но и по регионам. Чтобы в самом начале показывались вакансии доступные в том регионе, в котором находится хаброчеловек. С моей точки зрения, это будет гораздо удобнее, нежели сейчас.
Total votes 7: ↑6 and ↓1 +5
Views 622
Comments 2

Консольные раскопки

Lumber room
Дело было давно. Писал в консольке всякие скрипты, но некоторые могут вполне понадобиться и в PHP системных вызовах. Очень актуально на больших и очень больших текстовых файлах.

1. Замена символов в файле
2. Уберание windows-like переносов
3. Быстрый подсчёт строк
4. Вырезать столбцы из CSV-like файла
5. Сортировка файла по столбцам
6. Разбор базы на основе ini-файла

Я использую в п. 4,6 awk. Если кто не знает, то это специализированный с-подобный язык (кстати, напоминает очень пхп) для обработки текстовых данных. Работает очень и очень быстро.

Читать дальше →
Total votes 5: ↑5 and ↓0 +5
Views 427
Comments 0

django-voting сортировка по рейтингу

Django *
Думаю, многие знакомы с этим расширением, но всё же:
django-voting позволяет ввести оценку любой сущности по digg-принципу (+1/-1) максимум за 30 минут (с учётом включения асинхронных запросов JS).
Сайт проекта: django-voting.googlecode.com
Но есть одна плохая особенность: отсутствие возможности сортировать сущности по рейтингу стандартными средствами ORM. Далее опишу как это реализовал я.
Читать дальше →
Total votes 21: ↑19 and ↓2 +17
Views 1.8K
Comments 15

Анимированое сравнение алгоритмов сортировки

Algorithms *
На днях наткнулся на интересную страничку, позволяющую наглядно оценить различные алгоритмы сортировки на разных наборах данных.

(картинка Кликабельна)
Небольшое описание под катом...
Total votes 95: ↑90 and ↓5 +85
Views 9.2K
Comments 25

Сортировка петабайта данных заняла 6 часов 2 минуты.

IT-companies
image

Компания Google провела эксперимент по сортировке 1 ПБ данных при помощи фреймворка MapReduce. Данные были представлены в виде 10 триллионов записей, каждая длиной 100 байт. Для сортировки были задействованы 4000 компьютеров. Этот беспрецедентный для такого типа задач объем данных удалось отсортировать за 6 часов 2 минуты.

В ходе эксперимента сотрудникам Google пришлось решать проблему с размещением 1 ПБ данных. Дело в том, что при каждом новом запуске сортировки, выходил из строя хотя бы один из 48 000 используемых жестких дисков. В итоге, было решено дать Google File System команду хранить по три копии каждого файла на разных жестких дисках.

Сортировка меньшего объема данных в 1 ТБ на 1000 компьютерах заняла 68 секунд. Этим самым в Google побили предыдущий рекорд по сортировке аналогичного объема данных, составляющий 209 секунд на 910 компьютерах.

Для сравнения, общий объем фотографий, хранимых в Facebook, составляет 1 ПБ, Большой Адронный Коллайдер будет производить 15 ПБ данных в год, а Google обрабатывает около 20 ПБ данных в день.
Total votes 70: ↑69 and ↓1 +68
Views 1.8K
Comments 63

К вопросу о языках программирования…

Programming *
Так как голосование не позволяет оставлять комментарии, то оформлю комментарии отдельной статьёй.

Особо интересует мнение людей, которые считают что у них такого случиться не может (предпоследний пункт в опросе). Почему?

Под катом — законченный пример на одном из распространённых языков программирования.
Читать дальше →
Total votes 25: ↑10 and ↓15 -5
Views 2K
Comments 128

Сортировка миллиона 32-битных int'ов в 2 мегабайтах памяти на Питоне

Python *
Мой перевод статьи Гвидо ван Россума:

Меня тут в шутку спросили: смогу ли я отсортировать миллион 32-битных int'ов в 2 мегабайтах памяти на Питоне. Во время размышления, мне пришло в голову задействовать механизм ввода-вывода с использованием буферной памяти.

Вообще, это именно шуточный вопрос — одни только данные займут 4 мегабайта, при условии бинарного представления! Правда, можно пойти на хитрость — взять файл, содержащий миллион 32-битных int'ов. Как же отсортировать их, используя минимальное количество памяти? Это должна быть какая-то разновидность сортировки слиянием, в которой небольшие куски данных сортируются и записываются во временный файл, после чего происходит слияние временных файлов для получения окончательного результата.

Вот мое решение:
Читать дальше →
Total votes 84: ↑79 and ↓5 +74
Views 7.6K
Comments 60

Сортировка больших объёмов данных, реализация на Java

Java *
Недавно на Хабре была статья Сортировка миллиона 32-битных int'ов в 2 мегабайтах памяти на Питоне. Заинтересовался, попробовал реализовать на Java.

Конечно, 32 строчки не получилось. Получилось 235.
Но мне показалось, что результат вполне можно использовать в качестве первого поста — не судите строго ;)
Читать дальше →
Total votes 14: ↑9 and ↓5 +4
Views 14K
Comments 14

Быстрая сортировка массива байт в Java

Lumber room
Для текущих задач потребовалось сортировать большие массивы байт, как знаковых (signed), так и беззнаковых (unsigned). Размер массива в моем случае был около 10 мегабайт, это не так уж и много, то есть, можно использовать сортировку в памяти.

Поначалу стал использовать java.util.Arrays.sort(byte[])… К сожалению, это решение оказалось неприемлемым, так как:
— Arrays.sort позволяет сортировать только signed значения… весьма странно что разработчики JDK этим ограничились;
— Arrays.sort использует универсальный метод (подтюненный qsort), но для ряда задач, как например для текущей, это не оптимально.

В результате обратил внимание на так называемую сортировку подсчетом, которая в данном случае будет оптимальной. Реализация также получилась весьма простой.

Читать дальше →
Total votes 11: ↑7 and ↓4 +3
Views 1.3K
Comments 10

На сколько велик и разнообразен наш IT мир !/?

Lumber room
После тяжелого рабочего дня в офисе, кишащим офисным же планктоном, в голову пришла странная идея.
Захотелось наглядно представить картину мира IT.
Осуществил сею, не шибко умную, затею при помощи майндмепа сделанного в Xmind.
В меру своей «умности и осведомленности» о технологиях и категорииях в информационных технологиях, вышла следующая «картина маслом»:

Кликабельно
IT world thumbnail

UPD: Обновил картинку. Спасибо коментирующим за поправки и добавки :). По какойто причине не смог залить майндмеп на сайт. Будет вечером.
Прошу вас писать в коментах что стоит исправить или добавить.
Нужен человек который поможет развить категорию програмирования.
А также помощь по категории для разработки, верстки, может и компьютерной графики. не хочется обходить фотошоп стороной :)
Стоит ли создать подкатегорию Войс Овер Айпи в категории сетевых технологий?

Читать дальше →
Total votes 29: ↑17 and ↓12 +5
Views 771
Comments 23

Автоматическая сортировка строк с вспомогательным порядковым столбцом — средствами MySQL

MySQL *
sort
Недавно пришлось выполнить махинацию с БД которая, как кажется на первый взгляд, совершенно невыполнима средствами MySQL. Перед глазами у меня была таблица товаров, сортировка которых осуществляется вспомогательным столбцом `order_num` ('порядковый номер'): она позволяет задавать ручную сортировку товаров.
Но вот потребовалось автоматически заполнить этот столбец так, чтобы товары оказались отсортированы по названию: то есть, с рядом ограничений, изменить столбец `order_num` во всей таблице. Очень хотелось обойтись средствами MySQL без привлечения каких-либо дополнительных инструментов, и задача была решена :)

Сложность задачи также в том, что MySQL не умеет делать UPDATE таблицы и одновременно читать из неё: в MyISAM таблица эксклюзивно блокируется при записи и нет возможности произвести чтение в подзапросе.

Читать дальше →
Total votes 33: ↑25 and ↓8 +17
Views 6.4K
Comments 31

У Microsoft не получается предлагать браузеры в случайном порядке

Development for Windows *
На хабре уже писали о модуле выбора браузера для европейских пользователей: «Модуль выбора браузеров появляется в качестве обновлений Windows. Сразу показывается пять самых популярных (Apple Safari, Google Chrome, Microsoft Internet Explorer, Mozilla Firefox и Opera). Причем в случайном порядке.»

Как выяснили ребята со словацкого сайта DSL.sk, у модуля большие проблемы именно со случайным порядком вывода браузеров. Страница, с помощью которой предпологается выполнять требования Евросоюза, не выводит список браузеров в случайном порядке, как предполагалось. Вместо общепринятых алгоритмов используется наихудший вариант реализации перемешивания списка браузеров через сортировку массива с функцией сравнения, возвращающей случайный результат. Из-за этого вместо равновероятного размещения браузеров в списке получается смещённое. Таким образом, для IE вероятность оказаться на последнем месте первой страницы почему-то оказалась наибольшей (~50%)! Однако при этом он всегда показывается изначально на первом месте, и только после окончания «перемешивания» меняет своё местоположение. Что интересно, указанный выше алгоритм выдаётся первым при поиске по «javascript randomize array» как в google, так и в bing :)

image

Технические подробности расследования (на английском).

P.S.: Как подсказал naum код на странице поправили.
Total votes 107: ↑74 and ↓33 +41
Views 802
Comments 65

Апрельские азбучные истины в «Smashing Magazine»

Website development *
Вот и подходит к концу весенний месяц апрель. За этот месяц в «Smashing Magazine» появились две небезынтересные статьи, полные истин более или менее азбучных. И так как иногда хочется перечитывать и азы, чтобы не упустить из вида и сознания ничего существенного, то я вам эти статьи порекомендую.

«Seven JavaScript Things I Wish I Knew Much Earlier In My Career» — статья о том, как сочинять код джаваскриптов, чтобы как можно менее утруждать себя. Вместо конструкторов Object() и Array() использовать краткую запись, вместо условий записывать тернарный оператор «a? b: c», по возможности пользоваться встроенной сортировкою и обработкою вместо своей самописной, применять JSON и делегировать события, и так далее. Всё это — с примерами кода.

«Maps In Modern Web Design: Showcase and Examples» — статья об употреблении географических карт на сайтах. Никакого кода, зато масса красивых иллюстраций картографического и геоинформационного характера с подтекстом: делайте так, и сайт ваш будет красив и удобен.
Вы видели когда-нибудь, как выглядит карта покрытия 2G на сайте «Билайна» в Краснодарском крае и Адыгее? Уверен: если бы создатели этого сайта читали «Smashing Magazine», то у них бы получилось чуточку лучше. (Я уж не говорю про их же страницу сети 3G, где вообще нельзя ничего понять о покрытии.)
Total votes 10: ↑6 and ↓4 +2
Views 777
Comments 2

Сортировка неструктурированного потока данных

Lumber room
В прошлой статье Я писал как мы на YPAG.RU сортируем компании по разделам с помощью нейронной сети.
Многие просили описать алгоритм. Я опишу универсальный подход для сортировки данных.

1. Нужно проанализировать добавленный текст и определить в нем ключевые слова. Есть много алгоритмов для определения ключевых слов, Я использовал законы Зипфа, кстати по этой теме мне пришлось писать дипломный проект.

2. После определению ключевых слов нужно сделать релевантный поиск по этим ключевым словам по базе уже структурированных документов.

3. Отбираются 20 самых релевантных документов и строится по ним рейтинг разделов. После этого отбираются самые популярные разделы из этой выборки. Этот порог настраивается сугубо индивидуально, у нас стоит порог – больше 5.

4 У нас на YPAG.RU еще назначается позиция документа в разделе. Позиция вычисляется следующим образом: определяются позиции найденных документов раздела и вычисляется средняя позиция. Если компания интересует посетителей – позиция постепенно растет.

Таким образом можно эффективно структурировать данные. Погрешность составляет 3-5%.
Основные проблемы возникают, если текст ни точно сформулирован. Например: оптовые закупки. Ни понятно что, как.
Total votes 11: ↑7 and ↓4 +3
Views 574
Comments 9

Сортировка топиков в блоге

Habr
Ситуация: человек читает хабр не очень давно (как я, например) и натыкается на блог по интересующей его тематике. Но в этом блоге оказывается довольно большое количество топиков (в «Я умный» их 2355, поди найди ещё действительно хорошие!), и человек несколько теряется.
Предложение: добавить кнопку «Отсортировать по рейтингу». Нажал — и вот тебе лучшее в данном блоге. Для новоприбывших и просто желающих почитать было бы очень полезно, я думаю.
Total votes 34: ↑33 and ↓1 +32
Views 556
Comments 5