Pull to refresh

Индексаторы в C# под капотом: индексируем лучше Доу-Джонса

Reading time7 min
Views13K
Доброго времени суток. В данной статье я предлагаю ознакомиться с индексаторами в различных типах. Посмотрим код языка ассемблера для данных индексаторов и характеристики каждой инструкций по ее скорости. Также я предложу несколько очевидных выводов. Но что именно использовать в конкретно вашей ситуации решать вам — стоит ли жертвовать удобством ради скорости или наоборот.

image
Читать дальше →
Total votes 33: ↑32 and ↓1+31
Comments5

Python. Выражения в методах и индексаторах

Level of difficultyEasy
Reading time8 min
Views3.8K

Если вам когда-нибудь приходилось работать с NumPy, то вы скорее всего знаете, что в индексатор массива можно передать не только индексы начала, конца, и шага. Потрясающая возможность - получить срез массива по некоторому условию, в виде data[data > 0] предает массивам NumPy некоторое сходство с СУБД.

Тут же можно вспомнить про SqlAlchemy и возможность передать в функцию filter некоторое условие для отбора записей session.query(MyModel).filter(MyModel.field == 10).

Отличные, в общем-то возможности, не так ли? Не возникало ли у вас вопроса как они работают внутри? data > 0 и MyModel.field == 10 с точки зрения грамматики языка являются выражениями, и при передаче куда-либо Python попытается вычислить их значения. Попробуем разобраться как это работает.

Читать далее
Total votes 15: ↑15 and ↓0+15
Comments9

Разработка в собственном соку или как мы поняли, что занимаемся не тем, что нужно пользователям

Reading time5 min
Views15K
Вы когда-нибудь задумывались над тем, что тысячи компаний создают свои продукты и технологии в отрыве от пользовательских потребностей и решают самостоятельно придуманные проблемы, которые слабо коррелируют с реально существующими?

В части создания одной из наших технологий мы, разработчики Macroscop, относились к таким компаниям: на протяжении 6 лет работали над функцией, которая, по нашему мнению, должна была сделать жизнь тысяч людей проще и удобнее.

В 2008 году у нас родилась идея максимально упростить процесс поиска в архивах видеосистем. Представьте среднего размера систему из 100 видеокамер и примерно 1000 часов видеозаписей, которые они оставили за сутки (обычно запись видео производится только когда есть активность в кадре). И вам нужно найти что-то в этих записях, но вы не знаете, где и когда это происходило. Вы будете просматривать записи час, второй, третий, и к моменту, когда найдете то, что нужно, проклянете все на свете.

Мы решили создать инструмент, который позволит искать по видео так же, как Google ищет по тексту:
Читать дальше →
Total votes 15: ↑14 and ↓1+13
Comments8

Как Ларри Пейдж изучал Java

Reading time2 min
Views3.5K
Нынешний руководитель Google Ларри Пейдж во времена студенческой юности не был выдающимся программистом. Стивен Леви рассказывает об истории создания программ Backrub и PageRank в своей книге "In the Plex" (цитаты: 1, 2, там же ссылка на первую часть книги, которая лежит в открытом доступе).

Пейдж никак не мог добиться нормальной работы краулера и индексатора из-за большого количества багов в коде и ещё по причине использования нового и нестабильного языка Java. Система всё время падала и не годилась для реальной работы. В архивах ньюс-группы comp.lang.java за 1996 год сохранились вопросы Пейджа. Он пытается выяснить у знающих людей, как назначить User-Agent для заголовка HTTP.
Читать дальше →
Total votes 91: ↑79 and ↓12+67
Comments29

Анализ внешних ссылок в MegaIndex и обновление алгоритма закупки

Reading time1 min
Views5.1K
В начале 2015 года наша команда запустила новый индексатор, который собирает внешние ссылки на сайтах во всем мире. На текущий момент наш индекс стал самым актуальным (среднее время переиндексации страниц составляет всего 6 дней).

Спешим поделиться новыми аналитическими возможностями, которые мы добавили в сервис анализа.
Подробности
Total votes 9: ↑8 and ↓1+7
Comments1