Comments / Profile of miami / Habr

Sergei Miami@miami

Subscribers

ProfileArticles4PostsNewsComments57

Ограбление Луны по-китайски

miami Nov 23 2020 at 18:40

Видео под статьей не «лайв».
Можно поменять например на youtu.be/K40_xSpRREM или youtu.be/Ix55rt97PwU

Защита Linux-сервера. Что сделать в первую очередь

miami Oct 22 2020 at 21:02

Какие есть варианты по последнему пункту?

Яндекс выкатил бету самостоятельной Ауры — aura.top. Топ ли?

miami Mar 4 2020 at 14:14

+1

Мне обещали позвонить и не позвонили.

Регистратор REG.RU лишил партнёра доступа к 70 тысячам доменов и забрал их обслуживание себе

miami May 15 2019 at 12:35

Видимо раз в год reg.ru производят такую чистку. Вот, только что mnogodomenov.biz обесчестили и зависли в ожидании ответа сервера…

Сайты воскресают и клонируются

miami Jul 17 2010 at 23:38

«Да-будет здрав, и полонсил великий Наш изык!»
— Сколько я допустил здесь опечаток?

Сайты воскресают и клонируются

miami Jul 17 2010 at 23:29

Тогда уж и «местоимение» писать слитно, Жень ;)

Finder component: найдите ваши файлы

miami May 9 2010 at 13:14

Единственным исключением есть метод in() ...

По-моему с методом in всё в порядке, возвращает Symfony\Components\Finder

public function in($dirs) 
{
 ....
 return $this;
}

Flance.ru — весь фриланс рунета

miami Apr 30 2010 at 12:07

Поиска по сайту нет, или я не заметил?

Организуем релевантный поиск по разнородным данным с помощью Sphinx

miami Nov 18 2009 at 12:09

Такая же история ;) И класс sfSphinxClient толком наследовать не получается, потому как private $res, а чужой код мы стараемся не изменять ;)
С вашей версией обёртки ознакомиться где-нибудь можно?

Алгоритмы на графах — Часть 0: Базовые понятия

miami Jul 25 2009 at 18:04

Заинтересовался, спасибо.

Ускоряем выборку произвольных записей MySQL

miami Apr 1 2009 at 11:53

EXPLAIN SELECT * FROM `a` WHERE `f` = число ORDER BY RAND() LIMIT 10;
здесь ORDER BY RAND() происходит только среди 164 рядов (всего было 163712),
от лишних мы избавились с помошью WHERE на индексированной колонке. В этом и есть основная мысль этого поста.

Ускоряем выборку произвольных записей MySQL

miami Apr 1 2009 at 07:27

Случайный офсет не помогает сократить пробег по таблице. Это объясняет
EXPLAIN SELECT * FROM `test` LIMIT 1 OFFSET 1234

И даже это звучит как-то не внушительно:
EXPLAIN SELECT `id` FROM `test` LIMIT 1 OFFSET 1234

Но за ваш вариант спасибо… )

Ускоряем выборку произвольных записей MySQL

miami Mar 31 2009 at 14:21

Вы имеете ввиду индекс?
Ну да, для получения одного приходится жертвовать другим…

Ускоряем выборку произвольных записей MySQL

miami Mar 31 2009 at 08:05

Экспериментировал…: Р

Ускоряем выборку произвольных записей MySQL

miami Mar 30 2009 at 19:21

На всё той же своей таблице тестирую метод TimTowdy, тот же комп, те же мощности софт- и хардвара.

SELECT r1.`id`, `md5` FROM a AS r1 JOIN (SELECT (RAND() * (SELECT MAX(`id`) FROM `a`)) AS `id` ) AS r2 WHERE r1.id >= r2.id ORDER BY r1.id ASC LIMIT 1; -> (1 rows total, Query took 0.0318 sec)

Таких выборок должно быть 10. Проверив выборку через EXPLAIN SELECT узнаю что скан идёт по 15000 рядам. Мда, ну ладно пусть так. Думается, что быстрее всего получится запустить это 10 раз одной командой, объединяя результат командой UNION. Возможны другие способы, увы, в голову не приходят (если что кидайте, проверим). Итак:

(SELECT r1.`id`, `md5` FROM a AS r1 JOIN (SELECT (RAND() * (SELECT MAX(`id`) FROM `a`)) AS `id` ) AS r2 WHERE r1.id >= r2.id ORDER BY r1.id ASC LIMIT 1) UNION (SELECT r1.`id`, `md5` FROM a AS ... и так 10 раз подряд-> (10 rows total, Query took 0.3303 sec)

Вызов полученного много-много раз дал самое быстрое — 0.0959 sec, среднее 0.2900. О качестве рандома судить сложно… Испробовал что будет если удалить из середины большой кусок записей и вставить их, например, в конец таблицы…

DELETE FROM `a` WHERE `id` > 1000 LIMIT 3000; INSERT INTO `a` (md5) SELECT md5 FROM `a` LIMIT 3000;

Случайные выборки по-прежнему от 0.3 до 0.1 секунды.
Теперь самое интересное — удваиваю оъём таблицы.

INSERT INTO `a` (md5) SELECT md5 FROM `a`; UPDATE `a` SET md5 = MD5(`id`), f = RAND()*2000;

Сначала с f-индексом, затем методом TimTowdy:

SET @rnd = RAND()*2000; SELECT * FROM `a` WHERE `f` = @rnd ORDER BY RAND() LIMIT 10; -> 0.0021 sec - 0.0023 sec - 0.0133 sec (SELECT r1.`id`, `md5` FROM a AS r1 JOIN (SELECT (RAND() * (SELECT MAX(`id`) FROM `a`)) AS `id` ) AS r2 WHERE r1.id >= r2.id ORDER BY r1.id ASC LIMIT 1) UNION (SELECT r1.`id`, `md5` FROM a AS ... -> 0.0927 sec - 0.1218 sec - 0.3964 sec.

Согласен, неплохой результат для выборки без лишней колонки и лишнего индекса. Экономным must use, а тем кто предпочитает иметь скорость и контролировать её понравится индекс. Я понимаю что у всех нас разные требования к приложениям, от этого и количество вариантов и я лично за! За то, чтобы усовершенствование продолжалось, чтобы мысль в эту сторону направлена была, чтобы мы не забывали полюбившуюся нам базу данных и учились для себя из неё-родимой выжимать максимум )

Воруют пароли от гуглопочты?

miami Mar 30 2009 at 17:55

В письме под стрелочкой «Ответить» есть «Сообщить о фишинге» ) На будущее. Удачи )

Ускоряем выборку произвольных записей MySQL

miami Mar 30 2009 at 16:47

Имеется 1000 (максимальный f) абсолютно непересекающихся «рандомов» которые в свою очередь перетасовываются ORDER BY RAND(), а из полученного уже берётся 10 верхних записей. Если перегенеривать значения колонки f каждые, скажем 1000 запросов… или 100… то где здесь псевдослучайность? ;) Если вам не нравится функция RAND() можете использовать посложнее:

UPDATE `a` SET `f` = HEX(MID(MD5(RAND()),3,2)); -> 163072 row(s) affected. ( Query took 4.5446 sec )

Проверяем качество разброса:

SELECT `f`, COUNT(1) C FROM `a` GROUP BY `f` LIMIT 10; ->

Имеем примерно по 650 записей на каждый f, всего 255 вариантов f. Для быборок будет чуть сложнее генерить f, но псевдослучайность мы убили, думается, на корню ;)

SET @rnd = HEX(MID(MD5(RAND()),3,2)); SELECT * FROM `a` WHERE `f` = @rnd ORDER BY RAND() LIMIT 10;

Ускоряем выборку произвольных записей MySQL

miami Mar 30 2009 at 16:19

Значение f — это не критерий поиска, это всего лишь ускорение прохода по таблице. Смысл не в том, чтобы выбрать из различных f ;))) Хотя да, эсли внезапно понадобилось более 10 случайных результатов, а индекс перестраивать не хочется, то подойдёт такой вариант:
SELECT * FROM `a` WHERE `f` IN (100,500,x5,x25,... ) ORDER BY RAND() LIMIT 10;

Ускоряем выборку произвольных записей MySQL

miami Mar 30 2009 at 06:57

К сожалению это запустит смену `f` на каждом новом ряду. Увы, не верное решение, но рад что вы стали мыслить вместе со мной )

Контроль потерянного времени: учимся блюсти баланс

miami Nov 29 2008 at 01:20

Класная идея купить такие часики. Попробую найти где в нашей месности можно их приобрести. Спасибо автору статьи.
Представляю как удивлённые владельцы всяческих часовых магазинов чешу репят — чего это все на шахматные часы так налетели? ;)

2 3