Pull to refresh

Comments 140

Юля, к черту Sphinx, лучше бросьте линк на свою анкету!
Ладно, поставим вопрос иначе — не согласитесь ли вы преподать парочку уроков ошеломительного поиска по аттрибутам с помощью Sphinx в каком-нибудь приятном месте за чашкой горячего шоколада?
Мои индексы с нетерпением ждут ответа. ^_^
Анкету Юлии найти совсем не сложно — www.facebook.com/yulia.gryzunova :)
Вот только ее содержимое вызывает сомнения в положительном ответе не ваше предложение :)
Я думаю, что даже в случае положительного успеха дальше комментов на хабре дело не зашло бы)
И это говорит человек, которого я взахлеб слушал на Девконфе… Фу на вас, Павел!
Ох… общий знакомый с ней… ох…
Женись! Для меня это решило все проблемы с девушками.
UFO landed and left these words here
А для меня только усугубило…
первая реакция на камент
А какой у вас получается размер индекса?
~500 бит на одну анкету при индексации по всем полям, поисковых анкет (за вычетом скрытых из поиска) порядка 7М, итого один индекс занимает порядка 500 Мб. Дополнительные индексы ещё порядка 150-200 Мб.

Но при этом в памяти хранится несколько поколений индекса, чтобы при навигации по страницам не было «перепрыгиваний» из-за меняющегося результата.
Чего-то у меня не сходится: индекс 500Мб, full-scan, скорость линейного чтения на хорошем железе пусть будет 15Гб/сек. Меньше 33мс никак не получается вроде? И кстати, что с сортировкой-релевантностью потом делать?
неприлично такое у девушки спрашивать вообще-то)
Не все на глаз могут точно определить размер индекса =)
Ниже ответили про девушку, что:

>>> Ситуация, когда общение от лица компании ведётся с одного официального аккаунта, довольно типична. Мне кажется, что очевидно, что пост написан техническим отделом.

Там жирный, бородатый мужик сидит
image
UFO landed and left these words here
Слышали много хороших отзывов про Sphinx для задачи поиска по атрибутам, поэтому решили сравнивать с ним.
А не подскажете какие-нибудь альтернативы со схожими возможностями?
UFO landed and left these words here
Только у меня такое ощущение, что вместо «нано» в названии поста должно быть «микро» :-)?
Ну чёрт возьми: (
Спасибо, исправили. Нам просто очень нравится слово «нано».
Мне нравиться слово «балалайка», забавное такое. Можно исправить на «балалайкосекунд»?
UFO landed and left these words here
> и несколько удивились полученным результатам.

А чего удивляться-то? При поиске без ключевых слов по атрибутам там того, полный перебор:

The SPH_MATCH_FULLSCAN mode will be automatically activated in place of the specified matching mode when the following conditions are met: 1) The query string is empty (ie. its length is zero), 2) docinfo storage is set to extern.

То есть сравнение, извините, из разряда «мы жахнули SELECT * по таблице MySQL без индексов и несколько удивились результатам» :)

Нужно наиболее селективное условие (навскидку возраст) проиндексировать как ключевое слово и его искать, тогда скорость несколько улучшится. Sphinx все равно проиграет, конечно. Специализированные решения всегда рулят. Привет anight-у ;)
Так там в любом случае полный перебор.
И у сфинкса, и у специализированного решения.

В анкете десятки полей, у каждого от 2 до сотни значений и в запросе может быть любое их сочетание.
Получается, что индексы пришлось бы строить по любой комбинации полей. Не 2^100 индексов, конечно, но тоже вполне астрономическое сочетание.
Да нет, не пришлось бы. Типично достаточно пары-тройки отдельных.

Построить индексы (в базе, в Сфинксе, итп) по нескольким наиболее частым отдельным (!) полям таки значительно лучше для производительности, чем не использовать никакие индексы совсем, правда? Вот я ровно об этом.

Ну и перебор в спецрешении как раз не совершенно полный, а поколоночный. В чем как раз немалая часть выигрыша.
Можете считать меня занудой. Но вот так можно пиарить ресурс, тематика которого с трудом вписывается в тематику хабра. Конечно мaмбa и так уже распиаренная по уши. Но тем не менее и заголовок «Кaк нaйти девyшky», выбран по моему тоже не случайно, мaмбы по этим запросам нет ни в яндексе ни в гугле.
Топик хороший, интересный. При всех «недостатках» мамбы — это highload проект, который интересен к изучению с точки зрения программирования и, наверняка, их программистам есть что рассказать.
Если побочный результат статьи — пиар мамбы, то и пусть. Ничего страшного
Для себя интересного ничего не вынес, решения ускорения производительности довольно банальны. Судя по комментариям у читателей больше интереса вызывает девушка которая которая опубликовала этот пост. Но писала то его видимо не она, хоть и маскируется. Я понимаю на хабре любят защищать девушек, но я и не нападал. Просто не нравится когда мне морочат голову. Все естественно IMHO.

Юлия Грызунова работал в Mamba — Dating Service (Связи с общественностью), училась в Государственный Университет Управления и живет в Москва.
Есть много людей, которые не занимались HL, им интересно почитать, как там всё устроено.
К девушке привязалась одна ветка + один коммент — не так и много.

Итого, комменты:
0. Оффтоп по поводу девушки
1. Технический вопрос про размер индекса
2. Придирка к названию
3. Техническая критика
4. Занудство
5. Вопрос на смежную тематику

Вполне в духе хабра
В этом решении запрос компилируется в машинный код налету, освобождая процессор от условных джампов и, как следствие, от сброса конвейера процессора.
А какие открытые решения имеют подобные оптимизации? Ну чтоб не со сфинксом сравнивать?
«Красота в глазах смотрящего»
Человек, который специально для комментария проверил позиции в поисковиках и у которого в профиле ссылки на СЕО-блог, каталог пиццерий и ещё на десяток каких-то хреней, обвиняет нас в СЕО. Классненько. Но нет: мы не преследовали цели затащить аудиторию Хабра на Мамбу, и не преследовали каких-либо СЕО-целей.

> Но писала то его видимо не она, хоть и маскируется.

Ситуация, когда общение от лица компании ведётся с одного официального аккаунта, довольно типична. Мне кажется, что очевидно, что пост написан техническим отделом.

> решения ускорения производительности довольно банальны.

Извините, я вам не верю. Довольно банальные решения «мемкэш это кэшировнаие» и «нгинкс лучше апача», а вот решений, где пришедший запрос компилируется в машинный код и запускается на выполнение, я не видел, я не видел и посвященных этому выступлений на конференциях. Я даже постов об этом не видел.
Скажите честно, вы даже не прочитали статью, а ограничились заголовком?
Вот это, я считаю надо явно объявлять а не заделываться девушкой с техническими знаниями, а еще лучше, чтобы это был человек который сам это и написал.

Ситуация, когда общение от лица компании ведётся с одного официального аккаунта, довольно типична. Мне кажется, что очевидно, что пост написан техническим отделом.
Кто с чем не согласен? Мамба это ты ???
Хорошо хором сливать! Правда? ;))

Но меня этим не успокоить :) Карма циферки меня мало интересуют :)
На хабре появилась качественная техническая статья, полная полезной информации об организации поиска в нагруженном проекте. Несмотря на то, что вам все это кажется банальным и простым — для многих не-специалистов это не так. Пусть даже это будет азбучными истинами, но они описаны понятно, подробно и грамотно — так что это именно тот материал, который заслуживает внимания и публикации тут. И поэтому (а не из-за каких-то выдуманных вами «мамбовцев») он вполне справедливо одобряется сообществом.

Вас же интересует только тематика упомянутого сервиса да автор самого текста, и в связи с этим вы плодите никому не нужные комментарии да еще и удивляетесь, что их молча минусуют — хотя это именно та реакция, которая и должна следовать в ответ на бесполезный информационный шум.
Меня совершенно не интересует тематика этого ресурса. Автор текста меня так же не волнует. Вы плохо читали, то что я написал! но отвечаете. Вот то, что вы сказали и есть бесполезный информационный шум. Зачем это вы сделали? То, что вы сказали мне уже сказали несколько раз. Если вам нравится желтизна и когда вам морочат голову текстами от имени девушки, ешьте дальше. Мне это не нравится. Я об этом сказал. Но вызвал бурю негодования у мамбаботов которые думают, что если убавят мне зеленую циферку с названием карма, это как-то изменит мое мнение или заставит замолчать. Я не понимаю зачем все это. Воспитали мартышек, которые даже не понимают, что играют по чужим правилам. Собственно и хабр, всего лишь одна из сотен закладок в моем браузере (далеко не самая лучшая).
Дмитрий, ну зачем так нервничать?
Конечно, я опечалена, что совсем вас не волную. Но смирюсь, переживу ))
Я нервничаю? :)) отнюдь. Вам показалось.
Первый раз на хабре ко мне обращаются по имени.
Хорошо учились :)
Да неплохо вроде. Спасибо за комплимент =)
Я вот была Вами взволнована и пошла специально посмотреть, как Вас зовут.
Зачем это вы сделали?

Чтобы ответить на ваш вопрос. Не хотите, чтобы на него отвечали — не беснуйтесь тут по поводу «молчаливых минусаторов» (особенно если вам эти минусы так безразличны, как вы изображаете).

То, что вы сказали мне уже сказали несколько раз.

Но вы же продолжаете это игнорировать, упорно гнете свою линию про «желтизну» и «маскировку». Беспокоят эти вещи тут только вас.

Нет здесь никаких «мамбаботов». Есть люди, которые не разделяют ваших взглядов. Постарайтесь смириться с этим, а не обвинять их в неадекватности.

Собственно и хабр, всего лишь одна из сотен закладок в моем браузере

В таком случае, боюсь представить вашу активность на остальных 99 сайтах, если вы столько времени уделяете склокам тут.
Чтобы ответить на ваш вопрос. Не хотите, чтобы на него отвечали — не беснуйтесь тут по поводу «молчаливых минусаторов» (особенно если вам эти минусы так безразличны, как вы изображаете).

Где я беснуюсь можно посмотреть?

Но вы же продолжаете это игнорировать, упорно гнете свою линию про «желтизну» и «маскировку». Беспокоят эти вещи тут только вас.

Нет здесь никаких «мамбаботов». Есть люди, которые не разделяют ваших взглядов. Постарайтесь смириться с этим, а не обвинять их в неадекватности.


Как это нету, конечно есть, мне это довольно очевидно. Есть и те которые меня поддерживают, но не высказываются.

В таком случае, боюсь представить вашу активность на остальных 99 сайтах, если вы столько времени уделяете склокам тут.

Бояться не надо, я дружелюбный человек :))
Ну и если быть честным, мне не интересно отвечать на ваши сообщения и развивать этот разговор. Тем более вы уже и так все «знаете».
Короче, лет ми спик фром май харт.

Я не мамбабот. Мне безразличен пол опа, мне плевать на тематику ресурса, про который пишут — я пришёл почитать про хайлод и прочие интересные вещи. Писали бы про то, как изнутри организован Демоноид — было бы то же самое.

Ваши комментарии — не про хайлод, а про срач и якобы скупленных юзеров, поэтому я их минусую. Наверное, поэтому их минусуют и другие.
В таком духе иди разговаривай со своими друзьями ясно?
Иди минусуй дальше, если тебе становится от этого легче. Больной человек.
> вот решений, где пришедший запрос компилируется в машинный код и запускается на выполнение, я не видел, я не видел и посвященных этому выступлений на конференциях. Я даже постов об этом не видел.

Я в свое время делал примитивный прототип, когда приделывал поддержку вычислялки выражений в Сфинкс. С удивлением обнаружил, что доводить до продакшна смысла особого нет, тк. в среднем ускорение получается сильно маргинальное. Все остальные оверхеды слишком высокие. Пост про сравнение вариантов реализации вычислялок самих по себе впрочем можно написать. Стоит заняться на досуге, интересно?
О, я и не думал, что у нас столько человек работает в мамбе. Я не хотел вас обидеть.
Здорово, что вы сделали такую оптимизацию, это очень клево. Разбить атрибуты на биты и использовать скомпилированные запросы это хорошо, но давайте не будем спорить, что это довольно простые вещи которые можно использовать для оптимизации серверной части. А что девушка это публичный аккаунт, такой информации я нигде не нашел.
Не обижайтесь :).
Я не имею отношения к Мамбе, но ваша позиция у меня вызывает категорическое осуждение.
В ГУУ училась? оО а на кого, если не секрет?
Спросите у нее, ее аккаунт fb легко находится в гугле.
Здесь не спрашивайте, здесь за нее отвечает технический отдел :))
Хотя они может тоже знают.
Несчастные люди видимо эти мамбовцы, если их так легко обидеть.
UFO landed and left these words here
Слушай иди давай советы своим друзьям. Меня очень забавляет реакция отчаянных идиотов.
UFO landed and left these words here
Вас минусуют не из-за мамбы, а из-за того, что гоните пургу какую-то. Если бы вы писали здесь «каштаны — это фигня, потому что гладиолусы летают», то вас бы тоже минусовали, не потому что каштаны лучше гладиолусов, а потому что вы фигню какую-то пишите.
Меня минусуют может не из-за а из нее :)). В каком месте написана пурга?
Ну тогда разговор с вами окончен, по причине вашей неадекватности.
Как вы легко обвиняете всех в неадекватности… Может стоит задуматься?
Может стоит задуматься, стоит ли вообще тратить свое время на чтение подобной херни.
Вы пишите не информативные комментарии (начиная отсюда), отсюда и минусы, я так думаю
Ну согласен информативность низкая, только это своеобразное общение с анонимными онанистами.
А вы батенька, под тролля закосить пытаетесь?
Училась на инженера-менеджера. По идее должна знать, как станки конструировать ))
Если честно, мне не совсем понятно ваше недовольство.
Вам не нравится, что текст добавила я? Или то, что транслирую технические комментарии от своего имени?
И объясните, пожалуйста, что значит «хоть и маскируется»? =))
Маскируется, это значит пишет от своего имени чужие тексты.
Я добавила его в официальный блог компании, администратором которого являюсь. По-моему, никакой маскировки тут не было.
Было, что еще сказать. Спросите у читателей, я уверен, что они в своем большинстве думают, что текст написан вами и комментарии тоже писали вы.
SЕО'шник на Хабре? Нет пути!
Я сеошник? Не смешите мои тапочки.
вопрос ребром.
когда на мамбе апи откроют?
UFO landed and left these words here
хм… видимо давно туда не ходил.
Спасибо за тык носом :)
А что у вас такое по ночам происходит, что там такой сильный разброс времени среднего отклика?
Нет, не бэкапы.

Дисперсия времени ответа увеличивается не только ночью, но и на серверах, на которых сильно снижена нагрузка (т.е. если оставить на сервере 1% от обычной нагрузки, то время ответа начнёт «скакать»). Вероятнее всего, это какие-то засыпания из-за энергосбережения, либо из процессорных кэшей вытесняется (из-за неактивности) код и данные демона.
Мы не раскапывали эту проблему (только проверили, что speedstep и вообще управление частотой CPU отключены), поскольку она происходит в моменты сниженной нагрузки и поэтому несущественна. И заметна только на графиках.
ох. прочитал «как найти двушку» и зашел в топик. ан нет, ищут то не то
UFO landed and left these words here
Мне вот либо не везет, либо мамба уже не та…

Пытаюсь найти девушку, просто выбираю возраст от и до, ну и конечно же с фотографией — все анкеты розовенькие… хммм… говорю «скрывать предложения интим услуг» — все анкеты вроде черненькие, открываю первый десяток — сссылка на сайт с путанами, либо «мой часик стоит 1800».

Я молчу про лидеров или как там их — что ни девушка, так сразу встретиться с щедрым мужчиной, ну я щедрый, но платить за «любовь» я не хочу.

За 250 микросекунд мамба может предложить отличный выбор девушек легкого поведения, на любой вкус, любых возрастов. Дальше только готовьте денежки и вперед, искать на мамбе любовь придется долго.
Конечно, я понимаю, что сейчас глупо спрашивать, какие цели знакомств отмечены у вас в анкете, так как в любом случае ответ будет про серьезные отношение и т.п.
Система у нас устроена таким образом, что люди ищут друг друга по интересам в отношениях. То есть те, кто ищет «секс на один два раза» не видят пользователей, которые не отметили данный пункт. И наоборот, соответственно.
Тем более, если в лидерах вы видите такие предложения, то, извините, но это то, что вы отметили в целях поиска.
Попробуйте изменить цели и будет счастье вам.
Надеюсь, что никого не обидела.
Это правда жизни и надо принять ее такой, какая она есть ))
Я вполне себе живой, в меру упитанный мужчина с хорошим чувством юмора — в моей анкете отмечены все возможные пункты в качестве цели знакомства:
— Дружба и общение (это нормальный пункт)
— Переписка (а почему бы и нет?)
— Любовь, романтические отношения (все мы ищем любовь и романтические отношения)
— Секс на один-два раза (ну если не сошлись, то 1-2 раза)
— Групповой секс (ну всякое бывает)
— Занятия спортом (я в меру упитанный, поэтому спорт мне не повредит)
Зачем мне менять эти самые цели?
потому что надо думать. секс на один два раза — в 90% равно сексу за деньги. попробуйте убрать, если вы ищите нормальное знакомство. или вы думаете, девушка без этого пункта согласна только после свадьба?
В очередной раз, уходя из клуба с прекрасной девушкой, я как-то даже не задумывался, что тот секс, который будет у меня с ней 1-2 раза, а может быть еще и после завтрака, не говоря о продолжении, в 90% равен сексу за деньги…

Если что, то я ниже писал, почему я не хочу исключать этот пункт. Я допускаю любую цель знакомства, и я не хочу терять тех девушек, которых в моем случае может интересовать только секс со мной на 1-2 раза. Этот пункт как раз таки дает понять противоположному полу тот факт, что со мной можно.
У нас в кратком поиске сейчас нет флажка «скрывать предложения интим услуг» (он скрыт и установлен) и нет флажка «с фотографией» (тоже установлен).
Если у вас серьёзные намерения, выберите в «цель знакомства» значение «любовь».
Если у меня серьезные намерения, то это не значит, что я не планирую заниматься сексом с противоположным полом. Ей богу, детский сад, буду ходить с девушкой за ручку и не буду пытаться затащить ее в постель даже на 30-ом свидании.
Мне кажется, вы впадаете в крайности. Когда вы ищите в гугле цену на билеты, вы ведь не пишете: «Гугл, скажи мне, пожалуйста, по чём билеты на поезд из Киева в Москву?».

Я о том, что если хотите найти долгосрочные отношения, то желательно убрать в поиске «секс на 1-2 раза», а выбрать категорию «любовь». Это не значит, что вы обязуетесь «ходить с девушкой за ручку и не буду пытаться затащить ее в постель даже на 30-ом свидании», а только то, что вы хотите строить долгосрочные отношения. По-моему, вполне логично.
Вполне возможно, что на мамбе есть особь женского пола, которая, увидев меня, возжелала, но не увидев в моей анкете цели знакомства: Секс на один-два раза — сильно расстроилась, т.к. большего ей и не нужно было в конкретно тот момент. А вот случился секс на 1-2 раза, и мы оба поняли, что жить друг без друга не можем — длительные и серьезные отношения.

Еще пример, сегодня я хочу пойти позаниматься спортом, и даже очень буду рад, если это мероприятие пройдет в обществе прекрасного пола — я не планирую длительных и серьезных отношений, но они возможны, хотя изначальная цель была — спорт.

Я к тому, что я не вижу смысла менять цели знакомства в анкете, т.к. я еще раз повторю, что для меня они все реальны, к тому же, в моей голове, цель знакомства в анкете и цель знакомства при поиске — это несколько разные вещи.

Ну и наконец самое главное — будете искать долгосрочные отношения — никогда их не найдете, а будете заниматься сопутствующими делами — случайно окажетесь рядом с той, с которой захочется иметь долгосрочные и перспективные отношения.
гыгы, вы правы на 100%
но в некоторых случаях нужно говорить девушке не то что нужно, а то что она хочет услышать :)
хотя в контексте этого случая я не знаю как это реализовать.
Забыл добавить, что цену на билеты на поезд из Киева в Москву я ищу на сайте ticket.rzd.ru
Покупает сеошник билет на поезд, самолет, машину, автомобиль, аренда машин, вертолетный прогулки в москве и области.
еще бы научить девушек не искать альтернативу, после первого года совместной жизни с парнями…
Альтернативу ищут те, кто чем-то недоволен — выводы делайте сами.
они вечно не довольны и им всего мало. сказку Пушкина про золотую рыбку читали?
и ждать не хотят, давай вот все сразу, и машину и квартиру. лучше уж суррогатную мать нанять для продолжения рода, чем с этим возится. дешевле и надежнее.
Это просто не Ваш тип. Можно найти красивую, умную, но она не будет подходить под тот тип девушек, с которым лично Вы привыкли общаться. Можно найти ту, которая будет «в рот заглядывать», пылинки с Вас сдувать, деньги в подареную Вам же квартиру на личном автомобиле с шофером привозить, но это не тот тип девушек, с которым привык общаться я.

А вобще, как ни крути, исторически (это природой заложено) мужчина должен обеспечивать семью, а женщина ищет того, кто сможет обеспечивать ее и ее потомство (опять же природа, мать ее).

Ну и всегда есть исключения в виде матриархата и равноправия полов.
никто и не спорит с природой, но границы разумного должны же быть. наши родители не из-за денег же выбирали пару, а по более классическим показателям, таким как — честность, искренность, доброта, интеллект и т.д.
Получается, макака с баксами, конечно, хороший вариант для природного подхода, но тогда человечество выродится. Интеллектуальные гены не смогут передаться через поколения.
Макака баксы каким образом заработала? Видимо думалка у макаки позволяет ей зарабатывать баксы?

Можно долго и упорно доказывать, что мы лучше чем тот чувак с баксами, но нужно быть реалистами — у того чувака есть баксы, а значит у него есть возможность их где-то получать, если это он это делает самостоятельно, т.е. зарабатывает, то значит он уже только по этому показателю превосходит нас, а значит нам есть к чему стремиться.

Можно сидеть на месте и ждать принцессу (принца), а можно выйти на улицу, осмотреться, поставить цель и двигаться к ней.
Есть такая замечательная фраза: «Парень ищет девушку, когда у него нет девушки; девушка ищет парня, когда ей становится скучно».
Совет, который я вам дам, противен мужской природе и ублюдочен в целом, но… с большинством девушек вы ничего не добьётесь одними только положительными действиями — как ни странно, для того, чтобы им не стало скучно с вами, стоит разнообразить совместную жизнь скандалами и истериками. В меру — иначе станет слишком «нескучно» %)
Это не по-мужски, это гнусно, но это работает. И для большинства девушек это необходимый фактор для стабильности отношений, так как без этого вас просто не будут ценить и уважать, как ни странно.
Впрочем, у самого меня никогда не получалось так действовать — что-то внутри говорит: «Мужик ты или нет? Будь мужиком, блеать!»
Все еще проще: эмоции бывают разные, нужно лишь уловить от девушки запрос на определенные эмоции и дать ей это. Хочется ей цветов и ухаживаний — значит нужно дать ей цветы и ухаживания; хочется ей периодически получать люлей под разными соусами — значит нужно периодически ей отвешивать (не можешь отвешивать в обычной жизни — отвешивай в постели, там можно даже мужику); ей нужен экстрим — устрой экстрим; ей нужна излишняя забота и усиленная безопасность — стань для нее этой самой заботой и безопасностью; она не может жить без измен со стороны мужика и хочет чувствовать себя постоянно униженной — ну что же, придется тебе все это для нее организовывать. От всего этого они, так же как и мы, получают(ем) необходимые эмоции. Ну а чем больше правильных эмоций — тем приятнее жить.
Да, это так. Я о том, что практически всем бывает необходима игра на контрастах, иначе чувства притупляются.
UFO landed and left these words here
На самом деле эмоции — это фактически основа, которые реализовать куда сложнее, чем материальное благополучие (лексус и мальдивы). Можно быть при куче бабла, обеспечивать свою девочку лексусами и отдыхом на Бали или Мальдивах, но при этом реально делить ее с каким-нибудь студентом, который трахает еезанимается с ней сексом в то время, когда ты ждешь ее в ресторане торгового комплекса, куда вы приехали, что бы она смогла в очередной раз потратить на шмотки некоторую кучу твоих же денег. И эта девочка не покинет богатого тебя, но при этом и не будет полностью с тобой.

Кстати, для бедного студента, который способен на периодические походы в недорогое кафе, но при этом способен давать необходимые эмоции, ситуация будет противоположной — девочка будет с ним и полностью его даже при отсутствии материальной обеспеченности, по крайней мере тут все будет честно. Но, естественно, она, как и любая другая, будет рассчитывать на себя и на перспективу, будет рассчитывать на то, что этот студент через некоторое время все-таки станет специалистом, а потом и вовсе начнет зарабатывать средства, достаточные для того, что бы периодически летать на белоснежные пляжи в Автралии и ездить на приличных машинах.

Ну и всегда и везде есть исключения.
UFO landed and left these words here
Никто и не говорит об одних эмоциях, тот же студент должен через некоторое время вырасти и начать обеспечивать себя и свою семью — это все логично.

В самом начале знакомства не сильно важно сколько у тебя бабла, достаточно просто выглядеть опрятно и быть уверенным в себе, ну и вести себя адекватно (хотя бывают исключения). А вот дальше нужно думать.

Если читать выше, то речь ведь идет о том, что девушка после первого года жизни с парнем, начинает искать альтернативу. Вполне возможно, точнее крайне вероятно, что девушка развивается, а парень сидит на месте, ну или она развивается быстрее, чем парень. Ее состояние вполне понятно — парень не дотягивает до ее уровня, она ищет другого. В каких вопросах парень не дотягивает до ее уровня? Это может быть материальный вопрос, а может быть ей просто стало с ним скучно — это задача парня, нужно было предпринимать действия.

Пример из ИТ:
У вас есть клевый сайт, посетителям на нем интересно, проходит год. Посетителей стало дофига, сайт периодически (регулярно и даже очень часто) валится с ошибкой 500, при этом вы так же не занимались развитием сайта, за исключением, пожалуй, того, что вы активно занимались рекламой своего ресурса. Что имеем в итоге? Постепенно посетители сваливают и не возвращаются по разным причинам, кого-то достали тормоза, кто-то нашел более интересные ресурсы той же тематики.

Ключевые моменты: требовались вложения (материальные, интеллектуальные) для оптимизации сайта, оптимизации использования железа, приобретения дополнительных мощностей, возможно монетизации проекта, развития проекта.

С девушкой будет то же самое — если вы год не вкладывались в девушку (материально, эмоционально), или вкладывались не туда (каждый день ходили в тренажерный зал и качали бицепц на левой руке), то девушка через некоторое время уйдет.
вот он четко описанный хау-ту для женщин.
вообще это все вызвано обилием коммуникаций, вконтаков с фейсбуками, на которых фифы выкладывают фотки с пляжей Австралии, типа смотрите какая я такая рас такая, и тогда обычные нормальные девочки начинают им завидовать. тоже хотят. только не в дамек им, что деньги делают человека животным, а вот из животного деньгами человека не сделаешь. остается лишь единственное решение — узаконить связь много — ко — многим. по крайней мере все тогда будет честно.
Эт крайности какие-то.

Дело в том, что она «такая рас такая» может быть потому что во время учебы в институте поглядывала на Лешку за соседней партой, вместо того, что бы вместе с подружками носиться по ночным клубам в поисках «спонсоров». А лешка — просто парень «из деревни». В тот период она завидовала своим подружкам, которые студентками ездили за счет «спонсоров» в Турцию или Египет, ну а теперь Лешка «вырос», занимает должность заместителя одного из ТОП менеджеров в крупной известной компании, а она, как его жена, развивается в интересном для нее направлении. Им вместе хорошо, они регулярно ездят на бали, где он ее фоткает на белом\голубом песке или в волнах, а она выкладывает эти фотки вконтакте, где подружки завидно пишут как ей повезло с мужем. Хотя, по факту, это Лешке повезло с женой.

История вполне реальная.
Вопрос к Юле, как к представителю Мамбы:

Скажите пож-та почему в последнее время на Вашем сервисе стало огромнейшее число липовых анкет с откровенной рекламой мошеннических платных сайтов знак-в? Кол-во данных анкет растет ежедневно по всем городам геометрической прогрессией во всех категориях поиска.

Более того, жалобы на подобные анкеты либо обрабатываются со значительной задержкой либо просто игнорируются («жалоба уже поступала, но не обработана модератором»).

А теперь собственно ближе к ИТ-тематике данного ресурса(Хабра):

Скажите неужели программисты Мамба не в состоянии отфильтровать абсолютно идентичную рекламу в поле «О себе» в огромном кол-ве анкет? Там даже базовых знаний хватило бы.

Я как-то смотрел Ваш проходной тест на квалификацию вебразработчика с год назад, судя по всему вы строго подходите к данному вопросу — так в чем же дело?

Мое обращение в Реформал было просто удалено/не одобрено…
Наводит на мысли, что сама мамба поощряет подобное злоупотребление ее же сервисами.

PS Решите сначала элементарную проблему с предварительным фильтром информации «о себе» «кого ищу» и т.п., а лучше всего премодерацию их содержимого как уже делают многие аналогичные сервисы, коли фильтры «мышей не ловят», а потом уже будем слушать о высоких технологиях.

PPS При необходимости все, что знаю по данному вопросу отвечу в личку(сами фишсайты какие попадались), если это уже не известно конечно же…
Мы постоянно модернизируем систему модерации и защиты от спама. Конечно, спамеры становятся все более изощренными, но мы успеваем отслеживать уровень их изобретательности и вовремя на него реагировать. Наша система состоит из технических и социальных инструментов. Все анкеты проходят автоматическую модерацию, а затем ручную. У каждого пользователя есть возможность моментально отправить жалобу на любого участника системы. Плюс у нас есть сервис «народный агент» (это пользователи, которые подтвердили свою сознательность и отвечают требованиям для модератора).
По нашей статистике в последнее время (прошедший год) число жалоб на спам сократилось в несколько раз. Число «липовых» анкет уменьшилось на порядок.Прошу прощения, но в данном случае ваше субъективное мнение не репрезентативно.
Максимальное время реагирования на жалобу — сутки. Если вы пожаловались на пользователя несколько раз за более короткий срок, то да, система выдает данное сообщение.
Мне кажется, что модерация предложений в Реформал — это нормальная процедура. Не секрет, что есть те, кто просто любит писать везде и всякое =) Возможно, ваше предложение уже дублировало другое, поэтому его удалили.

P.S. спасибо за совет, нам его очень не хватало )) Обязательно этим займемся. А пока будем рассказывать про высокие технологии. Все-таки фильтры и мыши — это не так интересно.

P.P.S. и снова спасибо, мы всегда за диалог и от помощи не отказываемся
Вы очень хорошо пишете, статистика это хорошо, особенно когда ее проверить нельзя из других источников)) Объясните пож-та в чем сложность выявить разом и удалить все анкеты содержащие фразу одну и туже фразу 1 в 1 в сотнях ато и тысячах профилей? Или Вы хотите чтобы сюда я их тоже перекопировал?

За последние полгода только я отправил вам более 30 жалоб и где результат — анкет стало таких еще больше. Лимит в сутки выдерживается далеко не всегда, чаще всего автоответ приходит в 00-00 — 01-00 по мск и на этом все. На следующий же день еще с десяток новых анкет вместо удаленных 1-2х.
Хотите чтобы было больше веры в вашу статистику — сделайте ее публичной, чтобы была

«Народный агент» кстати после первого десятка жалоб куда-то пропал из профиля))
Про Реформал, понимаю, модерация нужна, сам являюсь вебмастером неск.ресурсов, но если когда нибудь его(реформал) почитаете, то увидите, что там все вполне в рамках дозволенного написано)

PS Фильтрация данных и интеллектуальные фильтры тоже кстати интересная тема для Хабра. Уверен многие сталкивались с проблемой спама и нам очень важно знать как с этим справляется ресурс которому уже с десяток лет помнится)
Абсолютно с вами согласен. Полагаю, что такие анкеты с интим услугами являются одним из источников существования подобных ресурсов. Конечно на мамбе есть нормальные люди, но средняя температура по больнице это платный интим или его уродливые формы, причем как вы уже заметили это поощряется владельцами. Программисты здесь конечно не причем.
Да и вообще посещение мамбы создает у меня ощущение, что наступил в дерьмо.
А мне интересна статистика проекта, распределение анкет по полу, интересам и т.д. Будут ли такие посты?
Да, обязательно будут. В принципе, вы можете сами в поиске прикинуть некоторые данные.
Точно могу сказать, что людей, которые ищут ну совсем несерьезные отношения, у нас всего 5%. Просто, как правило, это самые «громкие» товарищи, которые портят мед ))
И у нас опять-таки огромное число счастливых историй знакомств и т.п. Но на «Мамбе» все как в жизни: если вы купили клевый утюг, то будете гладить и радоваться в одиночку, а если утюгу придет капец, то об этом узнают все пользователи Яндекс.Маркета )))))
Только что попробовал посмотреть, меня просят отправить SMS, чтобы воспользоваться расширенным поиском :(

И вообще, вот сейчас зарегистрировался, ко мне пришло сообщение сразу от двух пользователей sms_сервис с просьбой отправить смс на бесплатный номер (в обоих случаях номера разные) + второе сообщение содержит опечатки. Это что такое?
1. Данное сообщение означает, что юзер поленился узнать о сервисах на сайте:) Расширенный поиск дает ВИП-статус, и это легально.
2. Это классический спам. Вокруг Мамбы, как и вокруг любого успешного массового сервиса, всегда ходят толпы мошенников, пытающиеся заработать на обычных пользователях. Мамба достаточно эффективно с этим борется, уровень спама и мошенников мы сократили в десятки раз. Но 100% защиту не может обеспечить никто.
3. Наша модерация отсеивает 99% подобных товарищей, но мы просим сообщать нам об всех мошеннических действиях на сайте, чтобы мы могли улучшить свою работу (для этого есть две кнопки в окне переписки «не хочу общаться с этим юзером», «это спам»).
4. Да, и сейчас мы работаем над принципиально новой системой защиты от спама, и надеемся запустить ее этим летом:)
Хорошо, всеж приведем хотя бы пример из нескольких(в реальности разнообразия спама менее десятка видов насчитал). Скажите насколько изощренным он является, когда в сотнях(скорее тысячах) анкет в поле «О себе» ввести строго определенный текст:

О себе
Если совсем скучно, то заходи на NEEDSEX.IN
Столько много девочек ждут горячих парней, и я в том числе )


Наверное это нереально сложно поиском по базе выявить и удалить все совпадения?
Только не забудьте проверить все категории поиска целей, а не только «секс».

Кстати говоря, за последние сутки ни одна жалоба не была обработано, точнее ниодного уведомления об этом не пришло как ранее было.
«Жалоба на этого пользователя от вас уже поступала, и еще не была обработана модератором» — и так уже более 2х суток.
Я попытаюсь ответить (от лица себя лично), почему всё работает так как работает. Текущее положение нас самих не устраивает, мы пытаемся это менять, что-то получается, что-то не очень. Поиск по базе, кстати, действительно запустить не так просто, потому что он идёт больше часа и таблица при этом лочится.

Так вот.
Спамеры — это такие конторы с программистами. Массово закупаются сим-карты для регистрации, обходятся капчи, создаются анкеты. Всё это идёт постоянным потоком. Этот поток заметно снизился после введения «реал-статуса», потому что стало экономически менее выгодно спамить. Ещё немного он снизился, например, после введения фильтра по изображению — чтобы его обойти, им приходилось очень сильно искажать фотографии и обновлять, видимо, свои базы с фотографиями голых тёток, что опять-таки замедляло и удорожало спам.
Технические меры связанные с текстами пока работают не очень. Ну то есть мы можем удалить 150 анкет со словом NEEDSEX.IN (а их именно столько сейчас), но дальше адрес сайта меняется, текст меняется и всё. Нет, мы их, конечно, удалим, но нужны системные решения, а не точечные. Они в разработке, будут летом.
Фильтровать всё вручную невозможно (или крайне проблематично — объёмы слишком большие). Если же делать это автоматически, то мы опасаемся ложноположительных срабатываний (например: спамеры часто используют фразу «Привет, познакомимся», но банить за неё нельзя)
С жалобами свои проблемы.

Спасибо коллега за первый ответ по делу.

1. Про поиск. Сам тоже работал с многомиллионными таблицами, правда в Oracle. Для решения проблемы блокировки всегда выполнял поиск по частям, например по индексу города или иного поля удобного для вас. Разумеется при таком кол-ве данных запрос в лоб по всей таблице просадит всю базу.
Да и на Хабре немало статей как оптимизировать подобные запросы.

2. Про спамеров. Разумеется есть и конторы, массовое добавление анкет даже капча частично предотвратит, однако пообщавшись в личке начистоту с одним из них выяснилось, что все куда проще. Мальчики студенты шабашут так. Создают несколько анкет, загружают липовые фото сами и поддерживают их, а за это дяденька им денежку платит.

3. Про премодерацию. Сайт, что я вам привел в пример фигурирует на мамбе уже с полгода. ОК, сейчас их 150(посчитали значит, ато понимаете ли база просаживается), а вы в это число включали все регионы? а уже удаленные ранее анкеты? Наверняка 150 — это активные в данный момент только)
Да, знакомо, что сайты подставные постоянно добавляются, но как насчет предварительного фильтра содержимого полей при правке данных анкеты пользователем? Грубо говоря поступил сигнал(жалоба) на конкретный сайт — Вы его добавили в черный список PCRE выражений, который тутже вступил в силу для предварительной проверки новых пользователей(и редактирования имеющихся).
При редактировании каждого поля в анкете AJAX проверочка прогоняет блеклист, для сотен записей это недолго)

4. Обратная связь с Мамбой. Народный агент — верните уже его и на место повиднее. Убрали же ведь. Не лукавьте будто он есть и работает) И пож-та не нужно просто игнорить жалобы да еще и так будто они и не поступали — на стороне пользователя записей о них нет вообще и вы это знаете. Не хорошо как то… создал понимаешь тикет, а он просто пропал и сослаться не на что в итоге.

Резюмирую:
Порой для больших решения проблем существую достаточно простые решения, которые не столь красивые и новаторские, зато в разы меньше вредят производительности ресурса и его репутации, на котором уже и в категории «для серьезных отношений» спама стало больше чем реальных лиц. Печалька(

PS Пожелание не по теме: введите какуюнить систему поощрения пользователей с максимальным числом верно заполненных полей в анкете и наличия фото. Условные баллы, которые к примеру поднимают в рез-татах поиска не только VIP. Достали уже никчемные анкеты на переднем плане.
Сдеайте уже логин по openid. Не пойму почему эти логинилки от соц.сетей (FB, VK, Twitter и т.д.) так популярны.
Всегда в таких графиках было интересно когда люди идут спать и когда просыпаются :)
О, у создателей хабра есть чувство юмора, не знал, что приходят такие веселые сообщения:

>>Приветствуем, HomoErectus!
>>Поздравляем! Теперь вам доступен значок «Отхабренный». Вы можете увидеть его в своем профиле.

Класс, еще и форматирование не работает.
Не нравится мне ваша Мамба, не работает она так, как хотелось бы
По сути ваше решение — это полный перебор индекса. Да, с битовыми масками и с ассемблерной проверкой условия это может быть (и есть) крайне быстрым на современных процессорах. Но всё-таки, если возникает желание поднять производительность — почему не попробовать обратные индексы?
Тут не «проверка условия», потому что проверка это if, это ветвление, предсказание перехода, остановка конвейера и ожидание памяти из кэша. У нас последовательные битовые операции, префетч и работа с данными из процессорного кэша. С точки зрения «макро», или алгоритма, разницы никакой, но с точки зрения «микро» разница на порядки.

Какую проблему в вашем решении вижу я: в поиске часто используется много условий. В обычном поиске это возраст + пол кого ты ищешь + пол тебя + фото + город + цель + ещё один или два флага (в зависимости от страны), в расширенном это может быть ещё куча параметров.
Поиск по «фото» выдаст оставить 80% результатов, пол — 50%, дальше нужно эти результаты пересечь, правильно? Они отсортированы, пересекаем за линейное время. Потом возраст — 15%, тоже за линейное время. Цель — 30%. Считаем количество найденного. Для редких флагов/параметров расширенного поиска это работало бы, если бы кроме них ничего не было.
Но для фильтра по малонаселённым регионам ваша идея будет работать.

Имело бы смысл сделать не один индекс, как у меня, а набор из такого же индекса для каждой страны или для каждого города. Довольно большую часть запросов это ускорит, но держать придётся 1 индекс старый (для запросов без фильтра по стране-региону) и 1 новый набор индексов. Москва, в принципе, как раз таким образом и вынесена в отдельный индекс.
При случае попробуем.
UFO landed and left these words here
image
Если не секрет, этот интерфейс что-то готовое рисует или вы сами писали?
тсс

мы ещё напишем об этом подробно.
Only those users with full accounts are able to leave comments. Log in, please.