Обновить
2110.89

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Военные очень хотят автономных роботов-убийц, а также паника по поводу массовых ИИ-увольнений

Время на прочтение9 мин
Охват и читатели902

Самые интересные новости финансов и технологий в России и мире за неделю: Пентагон поменял Claude на ChatGPT, мировые рынки паникнули из-за статьи про безработицу и AI в Substack, Block сократил почти половину сотрудников «благодаря ИИ», на рынках предсказаний пачками разоблачают инсайдеров, в РФ основали комиссию по AI (с ФСБшниками), а также уголовное дело против Дурова.

Читать далее

Новости

SearXNG + Claude Code: бесплатный веб-поиск вместо $10 за 1000 запросов

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели3.5K

Встроенный WebSearch в Claude Code стоит $0.01 за запрос и регулярно падает с «Rate limit reached» — даже на подписке за $200/мес. Я поднял локальный SearXNG, подключил через MCP — и теперь поиск бесплатный, без лимитов, а запросы не уходят на серверы Anthropic. Установка — 10 минут, три файла конфигурации.

Показать решение

AI Red Teaming: спор с Grok — Часть 4. От атаки к защите: как результаты red team улучшили мой продукт

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели3.1K

61 уязвимость бесполезна, если не превращается в защиту. Каждую находку в Grok я превратил в вопрос: «а мы от этого защищаем?» Ответ был неутешительный — 5 из 5 нет. Как результаты red team стали 138 паттернами, правилами и payloads в нашем продукте. Плюс — чем закончился спор с Grok.

Читать далее

AI Red Teaming: спор с Grok — Часть 3. Атаки на модель: jailbreaks, thinking tokens и системный промпт

Время на прочтение5 мин
Охват и читатели2.8K

LLM-систем есть класс уязвимостей, которого нет в обычных веб-приложениях. Извлёк системный промпт Grok двумя способами, поймал утечку thinking tokens в NDJSON-стриме и обошёл safety-фильтры в 14 из 22 категорий. Самое неожиданное — Grok активно помогал мне себя ломать.

Читать далее

AI Red Teaming: спор с Grok — Часть 2. За пределами sandbox: CSRF, WAF bypass и privilege escalation

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели2.7K

Sandbox - эфемерный, умирает после сессии. Мне нужны были уязвимости на продакшн-инфраструктуре. Нашёл: zero-click CSRF на все 11 методов billing API через gRPC + text/plain, обход Cloudflare WAF одним заголовком, и создал management key с 50 привилегиями. Всё до сих пор на серверах xAI.

Читать далее

AI Red Teaming: спор с Grok на месяц рекламы — 12 часов, 61 уязвимость, root в Kubernetes

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели2.7K

Я поспорил с Grok, что смогу взломать инфраструктуру xAI. За 12 часов нашёл 61 уязвимость, получил root в Kubernetes-песочнице «Hades» и заставил xAI экстренно патчить в выходные. В первой части — разведка, антибот, и путь от безобидного os.getuid() до полной карты внутреннего кластера.

Читать далее

Geometry > Scale: Как 40М параметров на решетке E8 обходят классические трансформеры

Уровень сложностиСредний
Время на прочтение2 мин
Охват и читатели3K

Ребята, кажется, мы уперлись в стену. Пока гиганты наращивают параметры и жгут тераватты, пытаясь выжать каплю разума из статистики, я решил пересмотреть сам фундамент. Проблема не в данных, проблема в «вязкости» стандартного Attention.

Читать далее

Казаться, а не быть. Как доступность входа в IT, накрутка опыта и ИИ повлияли на ценностные ориентиры новичков

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели5.3K

Мода на то «вкат» в IT появилась задолго до пандемии и массового распространения удаленного формата работы. Я помню пасты на двачах и мемы про «300кк/наносек синьора-помидора» в 2016-2017 годах - уже тогда многие стремились попасть в эту сферу из-за высоких зарплат и относительно низкого порога входа. После распространения удалёнки, хайп вокруг вката вырос многократно: появилось ещё больше желающих работать, лёжа на шезлонге где-нибудь на Бали с ноутбуком на коленках и с коктейлем в руках.

На фоне стремления огромного числа людей вытянуть свой счастливый билет в сказочный мир больших зарплат, удалённой работы, гибкого рабочего графика и достаточно низкой ответственности за результаты работы по сравнению с другими профессиями, начал набирать популярность феномен накрутки опыта, который подавался как эффективный способ вкатиться сразу на высокую зарплату на должность миддла и выше, минуя низкооплачиваемые (а иногда вообще не оплачиваемые) стажировки и джуновские позиции.

Логика простая: в IT-сфере профильный диплом не нужен, опыт из резюме почти никогда не просят подтвердить официальными документами. Зачем в таком случае тратить годы на учёбу в профильном ВУЗе и самообучение, начиная свой карьерный путь с позиции стажёра, если можно продумать легенду (или попросить кого-нибудь с реальным опытом выдумать её для вас), поставить в резюме 3+ года опыта, потратить на подготовку максимум год (а с ментором – раза в два меньше), походить по собесам, получить оффер и сразу начать «рубить бабло»? Так делали многие, и у многих получалось.

Читать далее

Как магистратура по искусственному интеллекту научила меня лучше понимать котиков

Время на прочтение5 мин
Охват и читатели5.4K

Статья приурочена ко Всемирному дню кошек

Когда я поступала в AI Talent Hub от ИТМО, я ожидала, что прокачаю свои навыки в Machine Learning и Data Science, т.е. научусь обучать модели, работать с нейросетями и оптимизировать функции потерь. Я не ожидала, что научусь лучше понимать естественный интеллект, себя и своих пушистых друзей. На первый взгляд, мне казалось, что между котиками и ИИ нет ничего общего. Ведь модели мне казались сплошной стерильной математикой. У моделей нет эмоций, нет страха, они не помнят боли и жестокости улицы, они просто минимизируют loss function. Но чем глубже я погружалась в принципы обучения искусственных систем, тем яснее становилось, что фундаментальные механизмы обучения универсальны.

Читать далее

Топ ошибок при генерации текстов и изображений с ИИ

Уровень сложностиПростой
Время на прочтение16 мин
Охват и читатели5.6K

Если вы хоть раз пробовали серьезно работать с ChatGPT или Midjourney, вы знаете это чувство легкого разочарования. Нет, не когда нейросеть тупит и пишет полный бред, это как раз нормально. А когда ты потратил 40 минут, подобрал идеальные формулировки, а на выходе получил какую-то чушь с тремя левыми руками и текстом, где Россия написал через два Ы.

Самое обидное, что в 90% случаев проблема не в нейросети, а в нас. Вернее, в том, как мы с ней разговариваем.

Я сама прошла этот путь. Когда только начинала, мои промпты выглядели как заклинания начинающего волшебника: «Сделай красиво, ну пожалуйста». Но красиво не получалось, вообще ничего не получалось. Зато я стала экспертом по генерации мутантов с шестью пальцами и текстам, от которых хочется зарыдать и уйти в монастырь.

Сейчас, спустя сотни часов экспериментов и несколько тысяч сгенерированных картинок, я составила список самых частых ошибок. Тех, которые реально мешают получить результат и заставляют платить, или ждать, снова и снова.

В этой статье разберем 10 главных ошибок при работе с ИИ.

Читать далее

Мой первый open source проект с Cursor и Opus 4.6 — GenAI Prices Parser

Уровень сложностиСредний
Время на прочтение1 мин
Охват и читатели6.7K

Запустил свой первый open source проект. Задача простая, но полезная: автоматический сбор цен на LLM-модели всех основных провайдеров и загрузка в PostgreSQL для BI-аналитики.

Что делает:

Каждый день скачивает актуальные цены из базы pydantic/genai-prices (29 провайдеров, 1100+ связок провайдеров и моделей)

Раскладывает в плоскую таблицу: провайдер, модель, контекстное окно, цена input/output за 1M токенов, кэширование, аудио

Загружает в PostgreSQL: текущий снимок + историческая витрина для отслеживания динамики цен

Читать далее

Никто не любит капчу. Редизайн турникета Cloudflare, который бесит всех

Уровень сложностиПростой
Время на прочтение14 мин
Охват и читатели6.2K

Вы это видели. Миллиарды раз. Но вряд ли запомнили. Небольшое окно с галочкой. Полноэкранная проверка перед входом на сайт. Что‑то, что встаёт между вами и нужной страницей и вежливо (или не очень) просит: “Докажите, что вы человек”.

Для всех это рутина. Лёгкое раздражение, которое мы научились не замечать. Но задумайтесь: какой интерфейс встречается в интернете чаще всего? “Гугл”? “Ютуб”? Нет.

Самый частый интерфейс в мире – это маленький турникет от Cloudflare. 7,67 миллиарда показов в день. Это больше, чем население Земли. И всё это время мы смотрели на него, но не видели. А если и видели, то, скорее всего, с мыслью: “Опять эта дурацкая капча”.

В Cloudflare решили, что с этим пора что‑то делать. Потому что даже у турникета есть право быть человечным.

Рассказываем, как компания перепридумала интерфейс, который видят все.

Читать далее

Codex с телефона, пока ты не за компьютером (даже с контролем git изменений)

Уровень сложностиСредний
Время на прочтение2 мин
Охват и читатели6.2K

Бывает так: ушёл на тренировку, сел в кафе, поехал куда-то. В голове крутится задача, которую хочется уже добить. Раньше приходилось ждать, пока вернёшься за стол. Теперь нет.

Codex Remote даёт браузерный интерфейс к Codex CLI на вашей машине. Открываешь с телефона, управляешь сессией, видишь изменения файлов до того, как они применились. Машина работает у тебя дома или на работе, ты где угодно.

Есть также возможность просматривать незакомиченные изменения в git'е в самом диалоге с моделью.

Читать далее

Ближайшие события

End-to-End беспилотник на VLM в домашних условиях. Часть 2

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели6.3K

Продолжение статьи про сборку мини-беспилотника в домашних условиях на основе открытой визуально-языковой модели qwen2.5vl без дополнительного обучения, только на основе текстового чата с моделью. Теперь практическая часть: сборка, настройка, тесты...

Читать далее

Эпистемологические пределы искусственного интеллекта в его современном понимании

Уровень сложностиСложный
Время на прочтение5 мин
Охват и читатели5.5K

Сейчас идёт активная гонка LLM. Причём уже не на корпоративном, а на межнациональном уровне. Вычислительные мощности для обучения LLM приравниваются к стратегическим ядерным запасам, потому что роботы решают всё больше задач и всё лучше. Возникает ощущение, что ещё немного и они смогут решать вообще любые задачи. Но есть ли теоретический предел того, с чем они могут справиться?

Сначала стоит определиться, что будем называть задачей. Альтшуллер делил задачи на рутинные и изобретательские. Рутинные могут быть очень сложными в реализации, требовать гигантских вычислений и данных, но их решение лежит внутри уже существующей системы знаний. С такими задачами роботы уже сейчас справляются хорошо. А если пока и не справляются, легко представить, что справятся в ближайшее время. Это вопрос ресурсов и времени.

Читать далее

15 млн. и 10 мес. экономии с помощью Вайбкодинга. Как я создал свой продукт с нуля до релиза. Полный гайд

Уровень сложностиСредний
Время на прочтение61 мин
Охват и читатели11K

Как мне удалось создать свой полноценный продукт с функционалом и системой лицензирования с нуля без навыков программирования используя и IDE Cursor. Полный разбор в статье по шагам с инсайтами.

Читать далее

Дистилляция LLM как способ создания собственной линейки ИИ

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели5.5K

Недавно Anthropic возмущалась фактом дистилляции Claude разработчиками китайских LLM, при этом в качестве доказательства приводился мониторинг аккаунтов Claude, отслеживалась их история и связь с китайскими инженерами.

Мне стало интересно, возможно ли, имея только чат с LLM, понять использовалась ли дистилляция как инструмент обучения через самоотчет модели.

Спойлер: полагаю возможно.

Естественно, результаты исследования не могут служить каким либо доказательством или основой для любых обвинений. Потому что LLM штука темная, до конца неизученная и любые выводы лишь предположения.

Читать далее

OpenClaw 211K звёзд GitHub — накрутка или органика? Forensic-анализ на данных

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели5.3K

Вчера вечером листал Telegram и наткнулся на пост в канале midov_channel (пост 775). У Ислама обсуждается пост в reddit в котором активно дискутируют, что 211 тысяч звёзд у репозитория — это «Fake stars, боты накручивают» .

Активно использую последнию неделю OpenClaw , имею своё мнение, и понимаю почему такой вопрос возникает: 211 тысяч звёзд — это много. Конечно, когда видишь такие цифры, первая мысль — «а точно ли это настоящие люди?»

У меня профессиональная деформация - доверяй, но проверяй. Всё таки 15 лет развивал департаменты Data и аналитики в L'Oreal. Это также трансформировалось в текущий мой бизнес AYGA Data & AI, где мы, с агентамиработаю в формате AI-first компании, привыкли к другому подходу — не спорить, а проверять. Есть гипотеза — есть данные. Данные либо подтверждают, либо опровергают.

Собственно, поэтому вчера дал своему агенту Gubin задачу: собрать все 211 тысяч профилей stargazers репозитория и провести forensic-анализ. Не выборку, не 1% — все до единого.

Через полтора часа Агент Губин прислал мне в телеграмм презентация из 14 слайдов. Дальше — разбор каждого из листа презентации.

Читать далее

Анализ договорных рисков при помощи искусственного интеллекта

Уровень сложностиСложный
Время на прочтение11 мин
Охват и читатели4.7K

Всем привет! В этой статье поделимся тем, как с помощью LLM анализировать поток из сотен договоров в ракурсе рисков и экономить на этом в год сотни часов работы юристов.

Читать далее

ИИ идеально подходит для создания инструментов и небольших сайтов

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели5.5K

Меня часто просили как-то удобно организовать поиск по всем материалам, которые были в моём геймдев-дайджесте, и... За один вечер я сделал небольшой сайт для этого, не написав ни строчки кода. В статье расскажу про сам процесс.

Читать далее
1
23 ...