Comments / Profile of rPman / Habr

User

16 промптов, которые выжимают максимум из памяти ChatGPT

Сразу отмечу, что работает она не идеально. Во-первых, ChatGPT или помнит далеко не все, или временами вспоминает не совсем то, что нужно было бы. Во-вторых, он плохо отличает реальность от вымысла и, например, считает моими реальными друзьями некоторых персонажей из текстовых RPG, которые мы разыгрывали ранее.

самое важное, что нужно знать про эту технологию

Look

Cloudflare позволит веб-сайтам взимать плату с ИИ-ботов за сбор данных (скраппинг) из веб-ресурсов

rPman 8 hours ago

Что за referal trafic в колонке у бота? это же бот, какой нафиг реферер?

Look

YouTube тестирует ИИ-сводки под видео — теперь вместо того,...

rPman 10 hours ago

Судя по презентации гугла, у них идет анализ видеоряда целиком со звуком, а у яндекса только текстовая информация... но нужно смотреть, одно дело сказать, другое дело на практике пощупать.

В презентации примеры просмотра рекламного видео, какой абсурд, одна компания тратит на порядок больше денег что бы сделать рекламное видео вместо рекламного текста, а потом народ будет тратить деньги на то что бы из видео сделать рекламный текст, непонятно только зачем это всем участникам кроме посредника в лице гугла, который будет и генерировать это видео и декодировать.

Look

ChatGPT o3 оказалась лучшей ИИ-моделью для ответов на вопросы ученых

rPman 22 hours ago

как искали, как давали!? реализация RAG определяет качество драматически.

Специально для этого бенчмарка выпустили ограниченную версию o3 и gpt-4.1? повторяю, в интернет или во внутреннюю базу openai они кажется лезут самостоятельно без спросу.

Look

ChatGPT o3 оказалась лучшей ИИ-моделью для ответов на вопросы ученых

rPman Jul 1 at 20:55

прежде чем начать тестировать модели, они проходят часовой инструктаж.

было бы неплохо почитать о том, что в этом инструктаже было

p.s. судя по тому что предыдущие версии deepseek r1 и v3 стояли рядом, проблема не в интеллекте, а в знаниях. Reasoning обычно добавляет модели заметно очков, а вот новая версия r1-0528 стоит значительно выше, архитектура сети не менялась, ее дотюнили, возможно добавили знаний (создатели нейронки, имеющие на руках обучающую выборку это могут сделать)

Model rating comparisons

Еще момент, странно сравнивать модели, с доступом к интернету (на сколько я понял как минимум gpt-4.1 умеет давать ссылки и судя по ответу подозрительно умеет добавлять в контекстное окно необходимую информацию самостоятельно) и без него

p.p.s. очень жаль, что в исследовании отсутствовала модель qwen3-30b-a3b, по личным тестам, удивительно как им удалось в 3b эксперта впихнуть заметное качество

Look

Uber обвиняют в использовании алгоритмов для увеличения прибыли за счёт водителей и пассажиров

rPman Jul 1 at 20:43

к сожалению супермаркеты тоже очень хотят снимать сливки с каждого по разному, вводя усложненные системы скидок...

Скрытый текст

хотя пока они эксплуатируют схему сокрытия настоящей цены товара усложнением алгоритма (т.е. цена будет почти для всех одинаковой, но узнать настоящую простым взглядом на ценник будет сложно), например скидка в магазине лента может доходить до 1/3 суммы на чеке, т.е. цены в среднем на ценниках выше чем в момент оплаты, но самое главное, не каждый товар подвержен скидке, и узнать это не просто... типовой сценарий, несколько товаров заполняют чек основным объемом скидки а остальные товары скидка минимальна или отсутствует, но клиент при взгляде на ценник вычитает ожидаемую скидку с каждого товара

Look

Как я прокачал английский до B2 в США, разработав своё языковое приложение

rPman Jul 1 at 05:11

протестировать что?

Положите на счет минимальные 5$ и пополняйте по мере необходимости, мой счет на 5$ сгорел через год не использования (мне было удобнее openrouter использовать)

Look

Как я прокачал английский до B2 в США, разработав своё языковое приложение

rPman Jul 1 at 05:00

у openrouter есть бесплатные модели free, но как обычно результат не гарантируется, лучше заплатить, хоть криптовалютой

p.s. вам жалко 5-10$ на эту задачу?

Look

Как я прокачал английский до B2 в США, разработав своё языковое приложение

rPman Jul 1 at 04:44

Приложение это хорошо. Но как я понимаю, лучшие результаты (по затратам времени) получаются не от простого зубрения словаря, а общение с нативным спикером с использованием новых слов.

Я думал что практически все функции обучения иностранными языками уже прочно взяли на себя ИИ. Мало того, если речь об английском, можно с бесплатным microsoft copilot поговорить голосом, состряпав голосом системный промпт (главное неудобство) получить неплохую помощь в общении с нативным терпеливым спикером.

Модифицируй свое приложение, добавив 'chatgpt', в системный промпт которого добавь список слов, которые сегодня тебе нужно выучить.

Look

Как я разрабатываю агентские ИИ системы для извлечения признаков (feature-extraction) из мультимодальных данных

rPman Jun 30 at 17:10

А с практической точки зрения то что? Как проверяли результат и чего достигли?

Мультимодальные модели это самый верх мейнстрима, их создавать то не просто, а уж тюнить без потери их качества и подавно сложно, а вы собираетесь их peft-ом тюнить с 8-битной квантизацией?

99% проблем при работе с изображениями - они не всегда как следуют распознаются, а дальше модели делают на основе этих ошибок неверные рассуждения, умножая процент ошибки на процент галлюцинации.

Look

Штатам запретят регулировать ИИ? В конгрессе готовят 10-летний мораторий

rPman Jun 30 at 16:16

Китай пока не может (но они смогут, не сомневайтесь) производить конкурентное оборудование, они пока только 'паразитируют' (перепаивают чипы памяти на десктопном железе)... и да они в любом случае молодцы, сумели составить конкуренцию топам за на пару порядков меньшие деньги, там где нет денег и оборудования, они взяли мозгами.

Look

Uber обвиняют в использовании алгоритмов для увеличения прибыли за счёт водителей и пассажиров

rPman Jun 30 at 16:11

Ну так речь не о заработке денег, а о методах, вы же согласны что если бить всех окружающих людей по голове, и забирать все из карманов, - очень прибыльная методика, и что бы капитализм до такого не скатывался, создаются различные ограничения, с помощью законов.

Я считаю что такой подход, когда цена назначается персонально для потребителя (читай введение неравномерной комиссии) - мошенничеством, и должно регулироваться.

Вы же первые недовольны, когда таксисты используют несовершенство алгоритмов (прямая аналогия с отсутствием регуляции и законов) поднимают цены в каких-нибудь зонах, просто договорившись не брать заказы с пол часика-часок, и вот уже вы не можете уехать из непопулярного района по адекватной цене и платите 3х ценник только потому что компания допустила это в алгоритме.

Look

Штатам запретят регулировать ИИ? В конгрессе готовят 10-летний мораторий

rPman Jun 30 at 16:05

Пример опасного ИИ - рекомендательные алгоритмы и принуждение в их использовании (удаление других инструментов - фейсбук, тиктоки/ютуб шортсы и не только,..)... 'всем ясно' что это вредно, особенно детям до 22 лет, но никто не спешит регулировать и ограничивать.

Вместо полумер, лучше бы прямо в законе сказали - вот таким то компаниям можно, остальным нини. И вообще, почему они вообще заморачиваются, США самая богатая страна, владеет буквально важнейшим ресурсом, необходимым для развития ИИ - оборудованием и компетенциями.

С оборудованием там вообще сказка - искусственно созданные монополии, заградительные цены для других и деление планеты на 'этим можно а тем нини'. Внутри себя, для военки, 'продавайте даром', в крайнем случае нарисуют еще денег, не в первой, и вон кстати организационно, топы ИИ компаний уже подчиняются непосредственно минобороны

Look

UX-аппендикс, 1 часть

rPman Jun 30 at 07:41

Все да но момент про безопасность это чушь, безопасность и удобство часто не совместимые вещи, конечно останавливаться на КПП и показывать пропуск это неудобство, но без него в охраняемый периметр проще проникнуть (читай дешевле злоумышленнику и дороже защищаться).

“повторное подтверждение паролем — одна из самых ненадёжных и UX-неграмотных форм безопасности”.

Повторный ввод пароля - естественно по таймеру от последнего его ввода, нужен что бы усложнить жизнь злоумышленникам, получившим доступ к устройству пользователя на короткое время. Особенно это имеет смысл, если доступ к функционалу поделить на две группы - менее опасная, не требующая повторной аутентификации и та что должна ее требовать. Естественно это вопрос вероятностей - уменьшаем таймер между запросами пароля - уменьшаем вероятность взлома/кражи данных.

Look

Canonical выпустила проект Multipass VM Manager с полностью открытым исходным кодом

rPman Jun 30 at 06:51

Интересно, зачем нужен облегченный менеджер для kvm? он лучше virt-manager на libvirt? Типа полнофункциональные (какие еще то) не достаточно плохи и нужно еще хуже?

А можно нам другие цели, типа сделать мир лучше и удобнее?

p.s. Вот облегченный менеджер docker было бы интересно, а то официальный это монстр, требующих чуть ли не отдельную машину, к тому же не очень удобный (я перебрал кучу, с целью исключить самописные скрипты или возню с копипастой id контейнеров... все отстой)

Look

Минфин России и «Сбер» подписали договор об использовании ИИ в работе по управлению бюджетом

rPman Jun 29 at 16:10

наивный, скорее - сделай что бы 'нам' было хорошо за 'их' счет.

Look

Представлен сайт, где можно летать по миру на самолётике —...

rPman Jun 28 at 17:21

Поведение птицы наводит на мысли что видео сгенерировано (какой кошмар, что теперь приходится об этом задумываться в принципе)... а слоны при первой встречи с устройство встали в оборонительное построение (детеныши внутри, хоботами наружу)

Look

Преобразование JSON в объекты C++ на этапе компиляции: демонстрация возможностей принятой в C++26 рефлексии

rPman Jun 28 at 17:04

Хм... на основе .proto файлов нужно создавать классы

Look

Ваш персональный Джарвис ElevenLabs УБИЛИ Siri — разрабы...

rPman Jun 28 at 16:14

Как ни крутил, их голосовые агенты говорят на русском с диким акцентом, а еще у меня список голосов небольшой и find voice ничего не делает

Look

OpenAI начинает использовать тензорные процессоры Google для своих ИИ-продуктов

rPman Jun 28 at 16:03

Утечки обучающего датасета само собой (это самое важное в разработке нейронок), алгоритмы (я знаю что с python можно без исходников распространять приложение, но много ли так делают?) и итоговые веса.

гугл вполне себе адекватные модели делает, а уж среди мультимодальных моделей с тремя и более модальностями они наверное первые. Да та же голосовая модель их, которая по текстовым инструкциям может генерировать речь и звуки... где такая у openai?

Look

2 3 ...

337 338