Очень сильно зависит от языка программирования. Все кроме Python и TypeScript/JavaScript, и Golang уверенно посасывает лапу.
Кроме того, Gemini 2.5 Pro это первая модель, которую я видел, которая старается дописывать код в класс/файл с учетом стиля и отдельных customs, принятых в этом файле, например, способе логгирования (а прописывать все это в промпте или в cursor rules, естественно, лень). Все предыдущие модели всегда, насколько я видел, писали код в своем "любимом" стиле для того или иного ЯП, утрамбованным в них через пост-обучение. Впрочем, даже Gemini 2.5 Pro в этом плане очень далека от идеала.
Мне лень искать более свежие примеры, а сам за новостями не следил. Но по уровню надежности (и цены), разница между ИИ-воркфлоу/агентами образца весны 2023 и весны 2025 - это небо и земля.
Например, в свежем интервью CEO Mercor говорит, что AI-HR-sourcer лучше человека. И знаете, мой опыт взаимодействия с айти HR таков, что абсолютно в это верю))
Два года назад, на волне первого "шока" от ChatGPT, Хабр был полон фырканий про галлюцинации, про то что "окей, квиксорт он может написать с грехом пополам или дополнить строчку моего кода, но в интеграцию кровавых ынтерпрайзных систем со сложной логикой он на моем веку не сможет. Еще мои внуки будут поддерживать это легаси." И что? Через два года, "вы находитесь здесь".
Собака лает, караван идет. Через два-три года ваш комментарий будет выглядеть такой же архаикой, как те фыркания выглядят сейчас. Например, потому что ИИ будет настолько круче 99.9% программистов в вопросах безопасности систем, что будет считаться моветоном не прогонять через ИИ-ревью все то, что пишут другие ИИ или остатки горе-программистов.
Так а с чего вы решили, что никто этого уже не сделал? А те кто сделал, не помалкивают, чтобы не расплескать свое конкурентное преимущество раньше времени?
Я знаю компании которые активно заменяют определенные роли на ИИ, так же были и отдельные публичные репорты, например, Spotify.
Middle managers в корпорациях оптимизируют не bottom line всей фирмы, а количество людей под своим началом - чем больше, тем лучше. Это корпоративная политика 101. Кроме того, это job security для них самих, потому что толпой людей действительно нужно управлять, а если там один ИИ крутиться будет, то сами эти middle managers пойдут на выход - их роль гораздо лучше в этом случае будет играть архитектор ИИ в данной области (допустим, бухгалтерия) - человек сделанный абсолютно из другого теста.
Крайне линейное рассуждение, не учитывающее никаких трендов. Модели ИИ стали достаточно умны (raw capability) чтобы заменять большинство работников умственного труда только в 2024. При этому в большинстве конкретных профессий, конь еще практически не валялся в создании надежных "агентных" обвязов вокруг этих моделей, чтобы реально работать эту работу. А даже там где валялся и где уже есть рабочие продукты (типа "ИИ маркетолог", "ИИ страховой агент", "ИИ риск-аналитик", "ИИ врач-диагнозист", и т.д.), очевидно, инерция существующих компаний и бюрократий огромна, займет 10-15 лет чтобы заменить большинство людей которые работают эти работы.
Сейчас все главные провайдеры - OpenAI, Anthropic, Google - "GPU poor", demand на инференс выше чем они могут деливерить. И так будет еще как минимум пять лет, так так пока у TSMC и Samsung нет конкурентов в плане chip fabs и сами эти компании скалируются не очень быстро. То есть, рынок ИИ в принципе растет сейчас (и следующие 5 лет) так быстро, как только физически может!
Может быть, сериализованные таблицы надо было использовать только для retrival нужных страниц, и потом добавлять в augmentation страницы без сериализованных таблиц, плюс только заматченные чанки из сериализованных таблиц? Чтобы понять, сматчился чанк из сериализованной таблицы или нет, можно было бы хранить атрибут в векторной базе.
Если атакующий не вставляет ключи с хешами с плохим распределением, де-факто гарантируется что цепочка не будет, скажем, длины 1000, при факторе заполенности 0.875. Вероятность противоположного крайне мала (0.00000... очень много нулей).
At our max load factor of 12/14 [ ~ 86% ], the expected probe length when searching for an existing key (find hit) is 1.04, and fewer than 1% of keys are not found in one of the first 3 chunks. When searching for a key that is not in the map (find miss) the expected probe length at max load factor is 1.275 and the P99 probe length is 4.
Ну ученый (даже "два", в обоих статьях) тоже мог бы упомянуть о практическом аспекте. Но нет, у них "новый классный алгоритм", без упоминаний что с практической точки зрения смысла в нем... немного.
Если использовать криптографическую хеш-функцию и "cooperative" resizing/growth где в течение какого-то времени каждая вставка делает по часть resize работы (как в Го), то фактически гарантии будут и со SwissTable. А если НЕ использовать криптографическую хеш-функцию, то гарантий нет только при прицельной DoS атаке, что возможно далеко не всегда
Кстати, не очень понял: в Go хэш-таблицы и раньше проверяли по 8 элементов с помощью SIMD инструкции. Так что, в этом смысле SwissTable не привнёс улучшений. Возможно выгода была Open-Addressing vs Chains-of-Buckets? Т.е. старая организация бакетов (по 8 элементов каждый) в виде односвязного списка имела меньшую локальность по памяти, чем практически Linear-Probing организация бакетов в SwissTable.
Да будете передвигаться медленнее, но риски попасть в аварию при такой езде не больше, чем в России. Местные хоть и нагло водят, но инстинкт самосохранения у них тоже есть.
Все равно сильно больше риски - лихач может в вас въехать и вы ничего с этим не сделаете. Причем этот лихач вероятно будет туристом, а не местным. Ну или местным, инстинкта все-таки у некоторых нет.
Тут не настолько жарко, вечерами бывает прохладно.
В году максимум дней 10, когда температура опускается ниже 25 ночью.
Кафе/рестораны. Еда везде посредственная. Цены в некоторых заведениях зашкаливают
Куча мест с относительно недорогой и очень хорошей едой. Искать надо в канале "Бали, где вкусная еда". Дикая конкуренция делает свое дело. Я не знаю, по сравнению с какими стандартами эта еда посредственная. И это про западные кафе. А еще есть варунги с высоким качеством еды, которые еще сильно дешевле. Но их не просто найти, рейтинг 4.7+ в GoFood это необходимое, но не достаточное условие, надо пробовать разные в округе.
Секрет по дешевизне и аренды, и продуктов - жить чуть дальше, чем в даунтаун Чангу/Семиньяк. В Улувату все дешево: и кафе, и жилье, и супермаркеты, но далеко до "движухи". Или можно жить в 15-20 минутах от Чангу/Семиньяка и заказывать еду все время (время тратит водитель GoFood а не вы).
Очень сильно зависит от языка программирования. Все кроме Python и TypeScript/JavaScript, и Golang уверенно посасывает лапу.
Кроме того, Gemini 2.5 Pro это первая модель, которую я видел, которая старается дописывать код в класс/файл с учетом стиля и отдельных customs, принятых в этом файле, например, способе логгирования (а прописывать все это в промпте или в cursor rules, естественно, лень). Все предыдущие модели всегда, насколько я видел, писали код в своем "любимом" стиле для того или иного ЯП, утрамбованным в них через пост-обучение. Впрочем, даже Gemini 2.5 Pro в этом плане очень далека от идеала.
Мне лень искать более свежие примеры, а сам за новостями не следил. Но по уровню надежности (и цены), разница между ИИ-воркфлоу/агентами образца весны 2023 и весны 2025 - это небо и земля.
Например, в свежем интервью CEO Mercor говорит, что AI-HR-sourcer лучше человека. И знаете, мой опыт взаимодействия с айти HR таков, что абсолютно в это верю))
Когда 4,5 года назад я написал, что через 10 лет 90% программистов будут не нужны, мне в комментариях только ленивый не отписал, что я идиот и не лечусь (я делал перевод этой статьи на Хабр но сейчас не могу его найти, почему-то).
Два года назад, на волне первого "шока" от ChatGPT, Хабр был полон фырканий про галлюцинации, про то что "окей, квиксорт он может написать с грехом пополам или дополнить строчку моего кода, но в интеграцию кровавых ынтерпрайзных систем со сложной логикой он на моем веку не сможет. Еще мои внуки будут поддерживать это легаси." И что? Через два года, "вы находитесь здесь".
Собака лает, караван идет. Через два-три года ваш комментарий будет выглядеть такой же архаикой, как те фыркания выглядят сейчас. Например, потому что ИИ будет настолько круче 99.9% программистов в вопросах безопасности систем, что будет считаться моветоном не прогонять через ИИ-ревью все то, что пишут другие ИИ или остатки горе-программистов.
Так а с чего вы решили, что никто этого уже не сделал? А те кто сделал, не помалкивают, чтобы не расплескать свое конкурентное преимущество раньше времени?
Я знаю компании которые активно заменяют определенные роли на ИИ, так же были и отдельные публичные репорты, например, Spotify.
Вот именно - в будущем. Товарищ выше хочет чтобы этот цикл весь за полгодика провернулся :)
Middle managers в корпорациях оптимизируют не bottom line всей фирмы, а количество людей под своим началом - чем больше, тем лучше. Это корпоративная политика 101. Кроме того, это job security для них самих, потому что толпой людей действительно нужно управлять, а если там один ИИ крутиться будет, то сами эти middle managers пойдут на выход - их роль гораздо лучше в этом случае будет играть архитектор ИИ в данной области (допустим, бухгалтерия) - человек сделанный абсолютно из другого теста.
Крайне линейное рассуждение, не учитывающее никаких трендов. Модели ИИ стали достаточно умны (raw capability) чтобы заменять большинство работников умственного труда только в 2024. При этому в большинстве конкретных профессий, конь еще практически не валялся в создании надежных "агентных" обвязов вокруг этих моделей, чтобы реально работать эту работу. А даже там где валялся и где уже есть рабочие продукты (типа "ИИ маркетолог", "ИИ страховой агент", "ИИ риск-аналитик", "ИИ врач-диагнозист", и т.д.), очевидно, инерция существующих компаний и бюрократий огромна, займет 10-15 лет чтобы заменить большинство людей которые работают эти работы.
Сейчас все главные провайдеры - OpenAI, Anthropic, Google - "GPU poor", demand на инференс выше чем они могут деливерить. И так будет еще как минимум пять лет, так так пока у TSMC и Samsung нет конкурентов в плане chip fabs и сами эти компании скалируются не очень быстро. То есть, рынок ИИ в принципе растет сейчас (и следующие 5 лет) так быстро, как только физически может!
Perplexity неплох, наверное больше 50% поисков у меня туда идет
Вот именно. Но сейчас кто-то вам скажет что он программирует плату со считанными килобайтами памяти и там это супер важно.
Может быть, сериализованные таблицы надо было использовать только для retrival нужных страниц, и потом добавлять в augmentation страницы без сериализованных таблиц, плюс только заматченные чанки из сериализованных таблиц? Чтобы понять, сматчился чанк из сериализованной таблицы или нет, можно было бы хранить атрибут в векторной базе.
Если атакующий не вставляет ключи с хешами с плохим распределением, де-факто гарантируется что цепочка не будет, скажем, длины 1000, при факторе заполенности 0.875. Вероятность противоположного крайне мала (0.00000... очень много нулей).
https://github.com/facebook/folly/blob/main/folly/container/F14.md
Они используют 7/8 как resize factor, т. е. 87.5%
https://github.com/abseil/abseil-cpp/blob/f1b7d000b8b8a74640e93cb3c06bc5fa384126de/absl/container/internal/raw_hash_set.h#L1108-L1126
Проверяют по 16 слотов на машинах с SSE2 (любые современные x86), по 8 слотов на каких-то ARM: https://github.com/abseil/abseil-cpp/blob/master/absl/container/internal/hashtable_control_bytes.h#L353
При этом фактор заполненности не меняют. Хотя мб могли бы, на 8-слотах поставить 6/8, т. е. 75%.
Они используют 7/8 как resize factor, т. е. 87.5%
https://github.com/abseil/abseil-cpp/blob/f1b7d000b8b8a74640e93cb3c06bc5fa384126de/absl/container/internal/raw_hash_set.h#L1108-L1126
Ну ученый (даже "два", в обоих статьях) тоже мог бы упомянуть о практическом аспекте. Но нет, у них "новый классный алгоритм", без упоминаний что с практической точки зрения смысла в нем... немного.
Если использовать криптографическую хеш-функцию и "cooperative" resizing/growth где в течение какого-то времени каждая вставка делает по часть resize работы (как в Го), то фактически гарантии будут и со SwissTable. А если НЕ использовать криптографическую хеш-функцию, то гарантий нет только при прицельной DoS атаке, что возможно далеко не всегда
Скорее всего.
Еще с такими пересадками и легами в 5 часов почти всегда дешевле.
Но есть маршруты где это недоступно, Лос-Анджелес -- Сидней, например
Мобильный интернет хороший, тянет видеозвонки спокойно, 100гб можно купить за 100 тыс в месяц
Все равно сильно больше риски - лихач может в вас въехать и вы ничего с этим не сделаете. Причем этот лихач вероятно будет туристом, а не местным. Ну или местным, инстинкта все-таки у некоторых нет.
В году максимум дней 10, когда температура опускается ниже 25 ночью.
Куча мест с относительно недорогой и очень хорошей едой. Искать надо в канале "Бали, где вкусная еда". Дикая конкуренция делает свое дело. Я не знаю, по сравнению с какими стандартами эта еда посредственная. И это про западные кафе. А еще есть варунги с высоким качеством еды, которые еще сильно дешевле. Но их не просто найти, рейтинг 4.7+ в GoFood это необходимое, но не достаточное условие, надо пробовать разные в округе.
Секрет по дешевизне и аренды, и продуктов - жить чуть дальше, чем в даунтаун Чангу/Семиньяк. В Улувату все дешево: и кафе, и жилье, и супермаркеты, но далеко до "движухи". Или можно жить в 15-20 минутах от Чангу/Семиньяка и заказывать еду все время (время тратит водитель GoFood а не вы).