Comments / Profile of leventov / Habr

Роман Левентов @leventov

Исследователь этики и безопасности ИИ

ProfileArticles46PostsNews1Comments3.1K

Как я начал бояться вайб-кодинга, или почему мы доверяем ИИ больше, чем коллегам

leventov Apr 12 at 10:09

Очень сильно зависит от языка программирования. Все кроме Python и TypeScript/JavaScript, и Golang уверенно посасывает лапу.

Кроме того, Gemini 2.5 Pro это первая модель, которую я видел, которая старается дописывать код в класс/файл с учетом стиля и отдельных customs, принятых в этом файле, например, способе логгирования (а прописывать все это в промпте или в cursor rules, естественно, лень). Все предыдущие модели всегда, насколько я видел, писали код в своем "любимом" стиле для того или иного ЯП, утрамбованным в них через пост-обучение. Впрочем, даже Gemini 2.5 Pro в этом плане очень далека от идеала.

-2

Буря в стакане ИИ

leventov Apr 12 at 09:47

Мне лень искать более свежие примеры, а сам за новостями не следил. Но по уровню надежности (и цены), разница между ИИ-воркфлоу/агентами образца весны 2023 и весны 2025 - это небо и земля.

Например, в свежем интервью CEO Mercor говорит, что AI-HR-sourcer лучше человека. И знаете, мой опыт взаимодействия с айти HR таков, что абсолютно в это верю))

0

Как я начал бояться вайб-кодинга, или почему мы доверяем ИИ больше, чем коллегам

leventov Apr 12 at 09:30

Когда 4,5 года назад я написал, что через 10 лет 90% программистов будут не нужны, мне в комментариях только ленивый не отписал, что я идиот и не лечусь (я делал перевод этой статьи на Хабр но сейчас не могу его найти, почему-то).

Два года назад, на волне первого "шока" от ChatGPT, Хабр был полон фырканий про галлюцинации, про то что "окей, квиксорт он может написать с грехом пополам или дополнить строчку моего кода, но в интеграцию кровавых ынтерпрайзных систем со сложной логикой он на моем веку не сможет. Еще мои внуки будут поддерживать это легаси." И что? Через два года, "вы находитесь здесь".

Собака лает, караван идет. Через два-три года ваш комментарий будет выглядеть такой же архаикой, как те фыркания выглядят сейчас. Например, потому что ИИ будет настолько круче 99.9% программистов в вопросах безопасности систем, что будет считаться моветоном не прогонять через ИИ-ревью все то, что пишут другие ИИ или остатки горе-программистов.

+3

Буря в стакане ИИ

leventov Apr 12 at 08:48

Так а с чего вы решили, что никто этого уже не сделал? А те кто сделал, не помалкивают, чтобы не расплескать свое конкурентное преимущество раньше времени?

Я знаю компании которые активно заменяют определенные роли на ИИ, так же были и отдельные публичные репорты, например, Spotify.

0

Буря в стакане ИИ

leventov Apr 11 at 17:33

Вот именно - в будущем. Товарищ выше хочет чтобы этот цикл весь за полгодика провернулся :)

0

Буря в стакане ИИ

leventov Apr 11 at 17:13

Middle managers в корпорациях оптимизируют не bottom line всей фирмы, а количество людей под своим началом - чем больше, тем лучше. Это корпоративная политика 101. Кроме того, это job security для них самих, потому что толпой людей действительно нужно управлять, а если там один ИИ крутиться будет, то сами эти middle managers пойдут на выход - их роль гораздо лучше в этом случае будет играть архитектор ИИ в данной области (допустим, бухгалтерия) - человек сделанный абсолютно из другого теста.

+1

Буря в стакане ИИ

leventov Apr 11 at 15:44

Крайне линейное рассуждение, не учитывающее никаких трендов. Модели ИИ стали достаточно умны (raw capability) чтобы заменять большинство работников умственного труда только в 2024. При этому в большинстве конкретных профессий, конь еще практически не валялся в создании надежных "агентных" обвязов вокруг этих моделей, чтобы реально работать эту работу. А даже там где валялся и где уже есть рабочие продукты (типа "ИИ маркетолог", "ИИ страховой агент", "ИИ риск-аналитик", "ИИ врач-диагнозист", и т.д.), очевидно, инерция существующих компаний и бюрократий огромна, займет 10-15 лет чтобы заменить большинство людей которые работают эти работы.

Сейчас все главные провайдеры - OpenAI, Anthropic, Google - "GPU poor", demand на инференс выше чем они могут деливерить. И так будет еще как минимум пять лет, так так пока у TSMC и Samsung нет конкурентов в плане chip fabs и сами эти компании скалируются не очень быстро. То есть, рынок ИИ в принципе растет сейчас (и следующие 5 лет) так быстро, как только физически может!

0

Я больше не доверяю Google Search, но каковы альтернативы?

leventov Apr 5 at 18:26

Perplexity неплох, наверное больше 50% поисков у меня туда идет

+2

Более быстрые хеш-таблицы: претенденты на место SwissTable

leventov Mar 31 at 13:07

Вот именно. Но сейчас кто-то вам скажет что он программирует плату со считанными килобайтами памяти и там это супер важно.

0

Как я победил в RAG Challenge: от нуля до SoTA за один конкурс

leventov Mar 22 at 19:55

Может быть, сериализованные таблицы надо было использовать только для retrival нужных страниц, и потом добавлять в augmentation страницы без сериализованных таблиц, плюс только заматченные чанки из сериализованных таблиц? Чтобы понять, сматчился чанк из сериализованной таблицы или нет, можно было бы хранить атрибут в векторной базе.

0

О новых алгоритмах хеш-таблиц

leventov Mar 3 at 17:11

Если атакующий не вставляет ключи с хешами с плохим распределением, де-факто гарантируется что цепочка не будет, скажем, длины 1000, при факторе заполенности 0.875. Вероятность противоположного крайне мала (0.00000... очень много нулей).

0

О новых алгоритмах хеш-таблиц

leventov Mar 3 at 11:35

At our max load factor of 12/14 [ ~ 86% ], the expected probe length when searching for an existing key (find hit) is 1.04, and fewer than 1% of keys are not found in one of the first 3 chunks. When searching for a key that is not in the map (find miss) the expected probe length at max load factor is 1.275 and the P99 probe length is 4.

https://github.com/facebook/folly/blob/main/folly/container/F14.md

0

О новых алгоритмах хеш-таблиц

leventov Mar 3 at 11:33

Они используют 7/8 как resize factor, т. е. 87.5%

https://github.com/abseil/abseil-cpp/blob/f1b7d000b8b8a74640e93cb3c06bc5fa384126de/absl/container/internal/raw_hash_set.h#L1108-L1126

Проверяют по 16 слотов на машинах с SSE2 (любые современные x86), по 8 слотов на каких-то ARM: https://github.com/abseil/abseil-cpp/blob/master/absl/container/internal/hashtable_control_bytes.h#L353

При этом фактор заполненности не меняют. Хотя мб могли бы, на 8-слотах поставить 6/8, т. е. 75%.

+1

О новых алгоритмах хеш-таблиц

leventov Mar 3 at 11:21

Они используют 7/8 как resize factor, т. е. 87.5%

https://github.com/abseil/abseil-cpp/blob/f1b7d000b8b8a74640e93cb3c06bc5fa384126de/absl/container/internal/raw_hash_set.h#L1108-L1126

0

О новых алгоритмах хеш-таблиц

leventov Mar 3 at 11:12

Ну ученый (даже "два", в обоих статьях) тоже мог бы упомянуть о практическом аспекте. Но нет, у них "новый классный алгоритм", без упоминаний что с практической точки зрения смысла в нем... немного.

+2

О новых алгоритмах хеш-таблиц

leventov Mar 3 at 11:11

Если использовать криптографическую хеш-функцию и "cooperative" resizing/growth где в течение какого-то времени каждая вставка делает по часть resize работы (как в Го), то фактически гарантии будут и со SwissTable. А если НЕ использовать криптографическую хеш-функцию, то гарантий нет только при прицельной DoS атаке, что возможно далеко не всегда

Кстати, не очень понял: в Go хэш-таблицы и раньше проверяли по 8 элементов с помощью SIMD инструкции. Так что, в этом смысле SwissTable не привнёс улучшений. Возможно выгода была Open-Addressing vs Chains-of-Buckets? Т.е. старая организация бакетов (по 8 элементов каждый) в виде односвязного списка имела меньшую локальность по памяти, чем практически Linear-Probing организация бакетов в SwissTable.

Скорее всего.

+1

Состоялся первый полёт нового прототипа сверхзвукового коммерческого авиалайнера

leventov Mar 24 2024 at 05:20

Еще с такими пересадками и легами в 5 часов почти всегда дешевле.

Но есть маршруты где это недоступно, Лос-Анджелес -- Сидней, например

0

Бали: остров будущего для айтишников

leventov Mar 22 2024 at 10:54

Мобильный интернет хороший, тянет видеозвонки спокойно, 100гб можно купить за 100 тыс в месяц

0

Бали: остров будущего для айтишников

leventov Mar 22 2024 at 10:53

Да будете передвигаться медленнее, но риски попасть в аварию при такой езде не больше, чем в России. Местные хоть и нагло водят, но инстинкт самосохранения у них тоже есть.

Все равно сильно больше риски - лихач может в вас въехать и вы ничего с этим не сделаете. Причем этот лихач вероятно будет туристом, а не местным. Ну или местным, инстинкта все-таки у некоторых нет.

0

Бали: остров будущего для айтишников

leventov Mar 22 2024 at 10:48

Тут не настолько жарко, вечерами бывает прохладно.

В году максимум дней 10, когда температура опускается ниже 25 ночью.

Кафе/рестораны. Еда везде посредственная. Цены в некоторых заведениях зашкаливают

Куча мест с относительно недорогой и очень хорошей едой. Искать надо в канале "Бали, где вкусная еда". Дикая конкуренция делает свое дело. Я не знаю, по сравнению с какими стандартами эта еда посредственная. И это про западные кафе. А еще есть варунги с высоким качеством еды, которые еще сильно дешевле. Но их не просто найти, рейтинг 4.7+ в GoFood это необходимое, но не достаточное условие, надо пробовать разные в округе.

Секрет по дешевизне и аренды, и продуктов - жить чуть дальше, чем в даунтаун Чангу/Семиньяк. В Улувату все дешево: и кафе, и жилье, и супермаркеты, но далеко до "движухи". Или можно жить в 15-20 минутах от Чангу/Семиньяка и заказывать еду все время (время тратит водитель GoFood а не вы).

+1

1

2 3 ...