All streams
Search
Write a publication
Pull to refresh
29
0
Пётр Грибанов @ghost404

Symfony professional developer

Send message

Проводили ли вы анализ производительности? Например, как отработает запрос со сравнениеи векторов в индексе на 50М докумеетов? Какое максималбное значение похожих документов по векторной близости можно получить?

В декументации сказано:

k
The number of nearest neighbors to return from each shard. Elasticsearch collects k results from each shard, then merges them to find the global top results. This value must be less than or equal to num_candidates. Defaults to search request size.
num_candidates
(Optional, integer) The number of nearest neighbor candidates to consider per shard while doing knn search. Cannot exceed 10,000. Increasing num_candidates tends to improve the accuracy of the final results. Defaults to 1.5 * k if k is set, or 1.5 * size if k is not set.

То есть, на сколькл я понимаю, в не зависимости от количества шардов, ника нельзя получить больше 10 000 докумеетов.

Если кандидат на собеседовании говорит, что ответ 7 при использовании кодировки cp1251, то это как минимум говорит, о том, что он понимает, что в другой кодировке может быть другой результат. +1 кандидату.

А вообще, вопрос можно построить иначе: Что выдаст следующая команда выполненная в среде Linux?

php -r 'echo strlen("привет!");'

JSONL например

Если у вас много однотипных объектов, рассмотрите формат NDJSON (Newline-Delimited JSON). Каждая строка - отдельный JSON-объект:

Хм. В первые слышу об этом формате. В подобных случаях обычно используется формат JSONL.

balance: Float ?
В опасные игры вы играете)

Как раз таки наоборот. При использовании ORM, а точнее UoW в нем, он позволяет обновлять в БД только те сущности и только те поля сущностей которые реально изменились, а не все поля.

Для обеспечения такого же функционала без ORM, придется написать километровый код.

Дополню, что квадрат является не только частным случаем прямоугольника, но и частным случаем ромба. Поэтому в принципе неправильно рассматривать квадрат как частный случай чего-то. Квадрат это самостоятельная фигура со своими, специфичными только для квадрата, свойствами.

Никак. Незачем. Пускай варится в собственном соку и просто предоставляет публичный интерфейс. А если этого недостаточно, то всегда можно сделать адаптер.

Пользуюсь сервисом уже лет 6-7 и тоже оценка обычно держится в районе 9-10)

Советую еще посмотреть в сторону статических анализаторов типа PHPStan и Psalm.

Ясно. Спасибо. Значит продолжаем ждать.

Ну resource|false это все таки не union тип. Это микс из типа и одного из значений типа. Если говорить о union, то это будет resource|bool, что подразумевает, что true так же является возможным возвращаемым значением. В этом то основная проблема.


Вчера правил баг в PHPStan и PhpStorm связанный с этим и задумался, а не пора ли наконец привести все в порядок, тем более, что выходит мажорная версия. И править нужно не сказать, что очень много.


А в целом вроде в следующих версиях планируется сначала задепрекейтить, а потом полностью отказаться от таких библиотечных функций, а перевести их на ООП основу с исключениями для ошибок.

А есть какие-то ссылки подтверждающие, что это планируют именно в PHP 8? Разговор об этом ведется уже много лет, еще со времен PHP 5.4 кажутся, но подвижек я как-то не заметил.

Мне вот интересно, а в PHP 8 собираюсь ломать обратную совместимость?


Былоб интересно например рассмотреть замену возвращаемого типа данных для функций типа fopen(), fsockopen(), mysql_connect() и т. д. в случае ошибки.


Сейчас:


/**
 * @return resource|false
 */
fopen(/* ... */): mixed

А могло бы быть:


fopen(/* ... */): ?resource

через alt+insert будут создаваться getters and setters в месте куда поставишь курсор

Мы не пользуемся Адвордс

Спасибо за разъяснение. Мы пользуемся fingerprint и пока без проблем. Будем мониторить ситуацию.


Попробуйте минифицировать js и добавить его к другим скриптам таким как modulestat2.min.js и jquery.ck.js.

Вы уверены, что Google блокирует именно fingerprint? Вы уверены в том, что этот nicetraffic не подмешивает ничего лишнего в js который вы подключаете на своем сайте?
Меня например сильно смущает домен вида www.static.nicetraffic.ru и смущает то, что я не могу посмотреть содержимое подключаемых скриптов https://www.static.nicetraffic.ru/fingerprintjs2/fingerprintjs2.js

А что, cURL это сложно? Или вы имеете что-то против конкретно PHP?
Приведенный пример легко портируется на любой популярный язык программирования будь то Python, Java, Node.js или Go. Можно и через bash пуши отправлять (пример).

Ну как сказать. Это заметное увеличение объема работ которые ещё должен кто-то оплачивать. Это уже давно не актуально для поисковиков. Для шаринга в соцсеточках достаточно отдать og: теги. Вот и получается, что это нужно для крайне малого процента пользователей с NoScript и сомнительных грабероф. Поправьте меня если я ошибаюсь.


Как уже писали выше, если вы не входите в ЦА, то почему за вас должен платить бизнес? А главное, почему из-за вас должны страдать пользователи из ЦА из-за добавления полифилоф, хуков и прочего? Да и безнес будет компенсировать увеличение расходов за счёт увеличения цен для ЦА.

Еще интересная штука. Без интернета на телефонах не работают все спойлеры. Не знаю как это может быть связано, но факт в том, что для открытия спойлера в статье на странице без интернета необходимо включить интернет и обновить страницу.

1
23 ...

Information

Rating
Does not participate
Location
Россия
Registered
Activity