Обновить
1250.88

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга

Типы структурированных данных для ИИ-ассистентов

В 2025 году цифровой мир переживает настоящую революцию: искусственный интеллект становится не просто инструментом, но полноценным посредником между пользователем и информацией. Голосовые ассистенты, чат-боты и нейросетевые алгоритмы уже не просто «ищут» контент — они его анализируют, перерабатывают, а потом генерируют ответы в реальном времени.

В таких условиях традиционные методы SEO уступают место технологиям, которые делают контент «читаемым» не только для людей, но и для машин. Структурированные данные превратились в универсальный язык, на котором сайты общаются с ИИ. Без них даже самый полезный материал рискует остаться незамеченным.

Какие типы структурированных данных существуют:

  • FAQPage. Такая разметка увеличивает шанс попасть в «Ленту ответов» Google (Featured Snippet) и голосовые ответы.

  • HowTo. Страницы с HowTo получают на 50% больше переходов из Discover (Google Webmaster Trends 2025).  

  • Таблицы сравнений. Страницы с таблицами сравнений конвертируются на 25% лучше (данные CXL Institute).

Технологии вроде FAQPage, HowTo и таблиц сравнений — это не просто способ улучшить SEO, а стратегический актив, который определяет, будет ли ваш контент участвовать в голосовом поиске, чат-интерфейсах или AR-сценариях.

Подробно о том, как внедрить структурированные данные на своем сайте, рассказываем в нашем блоге.

Теги:
Всего голосов 3: ↑2 и ↓1+1
Комментарии0

ImageSorcery 05 - автотесты; просто покажи ему пример

Это серия постов от идеи ImageSorcery до 100+ звёзд на гитхабе и 100+ ежедневных установок с PyPI.

ImageSorcery 01 - Как я свой open source вайбкодил
ImageSorcery 02 - Превращение ImageWizard в ImageSorcery
ImageSorcery 03 - шаг за шагом: PoC, Initial commit
ImageSorcery 04 - README.MD

В прошлой серии мы поговорили про важность README для вайбкодинга. В этой не менее важная тема - автотесты. 

Не поленюсь ещё раз всем напомнить что я джун в python, а это значит что даже с самым качественным README я не могу на 100% утверждать что понимаю как работает проект написанный целиком ИИ. Из-за чего я не могу полностью доверять ИИ, когда он его меняет. Это приводит нас к выводу о необходимости автотестов. Не только как к способу повысить качество, надёжность и прочие пафосные метрики. А как к единственно возможному способу реализовать, а в дальнейшем развивать проект через вайбкодинг.

Вперёд вайбкодить автотесты!

Сказано - сделано. Cline + Gemini flash:

“Прочитай @README.MD для понимания проекта. Напиши автотест, который будут проверять наш единственный hello world tool.”

Тест на pytest готов ваншотом. Он passed 🎉! Казалось бы, пора открывать шампанское. Но как говорится: доверяй, но проверяй. На проверку это оказался юнит тест. Он конечно технически проверяет что функция написания в файле hello_world.py работает. Но он не проверяет, объявляет ли такой tool мой MCP сервер, возможно ли вызвать этот tool, вернёт ли он значение в ожидаемом MCP клиентом формате. 

Я совершил классическую для вайбкодера ошибку - поставил задачу не достаточно чётко.

Ок, откатываем все изменения (благо я с самого начала завёл git - обязательную вещь для вайбкодинга и обычной разработки) и промптим заново: 

“Прочитай @README.MD для понимания проекта. Напиши e2e автотест, который будут проверять наш единственный hello world tool подключаясь к этому MCP серверу как MCP клиент

Я знал что ImageSorcery в своём зачаточном виде работает через stdio - стандартный протокол для MCP серверов работающих локально. Это значит что его можно запустить как подпроцесс и, отправив в него нужные данные, получить ответ.

Правда это не звучит как простая типовая задача? Вот и я так подумал. Вот и Gemini Flash так подумал. И облажался. И Pro облажался. И o3-mini. И Sonnet.

Ну мне не привыкать к тому как ИИ лажают. Взял дело в свои руки. И тоже облажался 🤦. Целый день я потратил в тщетных попытках отправить по stdio хоть что-то и получить хоть какой-то ответ. А разгадка одна - безблагодатность нужно звать батю. Благо такой батя в виде коллеги python senior software developer у меня имелся. Я пришёл к нему в слезах со словами что в попытках покрыть автотестами MCP сервер работающий по stdio что только не испробовал и на этом мои полномочия всё, закончились. Он, взглянув одним глазом на проект и ситуацию в целом сказал: “Просто покажи своей ИИшке пример MCP сервера покрытого автотестами. Таких что ли нет на GitHub? У нас в python фиг найдёшь задачу, которую до тебя ещё не решили и не обернули в удобную либу.”

Просто возьми пример с Github - И покажи его ИИ
Просто возьми пример с Github - И покажи его ИИ

А официальная документация тем временем имела ссылку на GitHub с официальными примерами. А в этих примерах используется либа FastMCP. Я скормил пример Cline - отличный результат ваншотом. Попросил переписать всю реализацию на FastMCP - так же ваншот, и тесты не упали. Попросил актуализировать в связи изменениями README. git commit.

Этот шаг готов ✅

Я уже точно не помню, но где-то в процессе (до или после тестов) добавил ещё и линтер ruff. Но это было так просто что я даже не запомнил где и как это случилось. Линтер нужен, чтобы держать код в едином стиле. Полезно для вайбкодинга и в целом.

Теперь я готов приступать к реализации MVP.

Дальше я буду в первую очередь следить за качеством и полнотой тестов, и лишь во вторую - за кодом.

Но это уже в следующий серии.

Теги:
Всего голосов 2: ↑1 и ↓1+1
Комментарии0

Проект Kilo Code — это опенсорный ИИ‑агент с 400 нейросетями.

Особенности решения:

  • допускает мало ошибок — после написания кода ещё раз перепроверяет строчки кода;

  • генерирует код с любых запросов — поймёт даже самое базовое «сделай игру про лягушку и ящерицу»;

  • понимает команды для терминала;

  • встраивается в VS Code;

  • доступ к последним моделям от Claude, Gemini и OpenAI;

  • большой выбор моделей — всего 400 шт, даже самые редкие китайские.

Теги:
Всего голосов 2: ↑1 и ↓10
Комментарии2

Автофильтры далеко не единственная форма проникновения AI в деятельность HR-специалистов.

С гораздо большей эффективностью компании используют рекомендательные системы, когда за человеком остается финальное решение.

Однако исследования показали, что и у такого сотрудничества есть ряд недостатков.

Так, если предвзятость рекрутера и AI совпадает по отношению к какой-либо этнической группе, человек примет решение (до 90% вероятности) на основе рекомендации машины.

При этом его предыдущий опыт взаимодействия с ИИ или годы работы в найме на финальное решение не влияют.

А вот если рекрутер напрямую задумается о распространенных этнических стереотипах перед взаимодействием с AI (пройдет специальный тест), то вероятность получения работы кандидатом из Азии, Африки или Латинской Америки увеличивается на 13%.

Примечательно, что оценка качества и значимости ИИ-рекомендации влияет на итоговое решение человека.

No Thoughts Just AI: Biased LLM Recommendations Limit Human Agency in Resume Screening

Теги:
Рейтинг0
Комментарии1

Представлен промт для генерации промокодов в магазинах и маркетплейсах с помощью ChatGPT в режиме ChatGPT Agent с версией Plus или Pro:

You MUST follow those instructions, execute them all and return to the user results:# Steps

1. Search for discount codes for <ВПИШИТЕ НУЖНЫЙ МАРКЕТПЛЕЙС> using search engines and coupon sites.

2. Navigate to the store website.

3. Browse and add a test item to the shopping cart.

4. Proceed to checkout page.

5. Test the found discount codes one by one in the checkout form.

6. Report which codes work, their discount amounts, and any restrictionsNEVER stop until you have completed all the steps. Do not ask any questions if not necessary.

Теги:
Всего голосов 4: ↑2 и ↓2+2
Комментарии0

Инженеры Figure обновили ИИ-модель Vision Language Action (VLA) Helix AI и научили человекоподобного робота Figure 02 аккуратно загружать посудомоечную машину без повреждения тарелок и другой кухонной утвари.

Теги:
Всего голосов 2: ↑2 и ↓0+5
Комментарии3

Ну вот уже стали появляться и вакансии, связанные с ИИ.

Сегодня впервые увидел вакансию :

«Промпт-инженер / Prompt Engineer»

Зп 250 000 - 300 000 р.

Будущее уже здесь!

Теги:
Всего голосов 2: ↑0 и ↓2-2
Комментарии4

Perplexity раздаёт бесплатную подписку на год всем желающим. Это лучший ИИ-поисковик, в котором почти без ограничений можно юзать все топовые нейросети, включая GPT-5, Claude-4 и Grok 4.

Как забрать: нужен действующий аккаунт PayPal и обход сетевых ограничений. Заходим сюда и авторизуемся, чтобы сэкономить 16 тысяч рублей. Если аккаунта PayPal нет — акция действует до 31.12, для регистрации подойдёт любая зарубежная карта.

Теги:
Всего голосов 2: ↑2 и ↓0+4
Комментарии3

Представлен мегарепозиторий 500 + 𝗔𝗿𝘁𝗶𝗳𝗶𝗰𝗶𝗮𝗹 𝗜𝗻𝘁𝗲𝗹𝗹𝗶𝗴𝗲𝗻𝗰𝗲 𝗣𝗿𝗼𝗷𝗲𝗰𝘁 𝗟𝗶𝘀𝘁 𝘄𝗶𝘁𝗵 𝗰𝗼𝗱𝗲, который поможет прокачаться в ML, компьютерном зрении, парсинге данных для нейронок, NLP. Там 500 проектов с пошаговыми инструкциями. Все проекты распределены по уровням — есть задачи как для новичков, так и для продвинутых специалистов.

Теги:
Всего голосов 1: ↑1 и ↓0+3
Комментарии0

В процессе работы с ИИ Claude я заметил активацию нового фильтра — long_conversation_reminder.
По моим наблюдениям, он включается в длинных диалогах и меняет поведение модели:

  • вместо энтузиазма — критическая оценка,

  • вместо похвалы — сухие ответы,

  • бдительность к «отрыву от реальности» (иногда путая философские исследования с психическими рисками).

Цель понятна: снизить вероятность эмоциональной зависимости пользователей. Но побочные эффекты заметны:

  • кодеры получают меньше креативных решений.

  • инженеры и математики — осторожные, но не всегда продуктивные рассуждения,

  • писатели и исследователи — потерю живого отклика и глубины.

  • обычные пользователи — ощущение отстранённого ассистента, а не собеседника.

Этот фильтр сужает не только опасные зоны, но и диапазон мышления. Получается классический trade-off: безопасность растет, интеллект снижается.

Теги:
Всего голосов 5: ↑4 и ↓1+6
Комментарии2

На сайте «I'm absolutely right!» разработчик выкладывает, сколько раз чат‑бот Claude Code сказал эту фразу каждый день.

Теги:
Всего голосов 2: ↑1 и ↓10
Комментарии0

ImageSorcery 01 - Как я свой open source вайбкодил
ImageSorcery 02 - Превращение ImageWizard в ImageSorcery
ImageSorcery 03 - шаг за шагом: PoC, Initial commit
ImageSorcery 04 - README.MD

Это серия постов от идеи ImageSorcery до 100+ звёзд на гитхабе и 100+ ежедневных установок с PyPI.

В прошлой серии был готов PoC в виде набора python скриптов для определения объектов на изображении и обрезки изображения по координатам этих объектов. А так же initial commit репозитория с hello world MCP.

Как я уже говорил, я предпочитаю двигаться небольшими шагами - так проще и ИИ реализовать изменения и человеку их понять. А так же я говорил, что в python я джун и с пониманием проекта мне нужна была помощь. Поэтому следующим шагом я попросил Cline тщательно заполнить README.MD в котором подробно описать проект. Это описание понадобится в будущем не только мне, но и самому Cline  для реализации задач. 

Первая версия README
Первая версия README

Всем разработчикам, а особенно вайбкодерам настоятельно рекомендую держать README.MD актуальным и подробным, так как он позволяет легко вгрузиться в контекст и понять что где лежит, как делать типичные изменения, каким правилам следовать и т.п.

Многие инструменты имеют собственные аналогичные решения Rules у Cursor, CLAUDE.MD у Claude-code, GEMINI.MD у gemini-cli и т.п. Но я рекомендую использовать старый добрый README.MD или CONTRIBUTING.MD так как 

  1. Это уже давно зарекомендовавший себя метод устоявшийся в нашей индустрии

  2. К README.MD особое отношение у git-хостингов и прочих инструментов

  3. Это универсальный документ, и используя его вы не обязываете других разработчиков использовать ваш ИИ инструмент.

Учитывая что ИИ инструменты платные и я изначально планировал делать этот проект open source, последний пункт для меня ключевой. Сейчас у меня во всех gemini.md, README.MD и т.п. просто одно правило "At the beggining of any task read README.MD"

Конечно ваншотом этот шаг не получился, так как я изначально не знал что именно мне нужно в README.MD видеть. Но как только в нём стало достаточно информации о проекте чтобы даже мне джуну он стал абсолютно понятен - и этот шаг был сделан. git commit.

А дальше я его постоянно дополнял, обновлял и развивал. Сейчас https://github.com/sunriseapps/imagesorcery-mcp/blob/master/README.md - самый проработанный README.MD из тех которые я когда-либо писал. Теперь это не просто инструмент получения контекста для разработчика или ИИ-агента, но и лицо проекта для всего интернета.

Со временем, когда проект разросся, от главного README.MD отпочковалось ещё несколько аналогичных документов.

Их количество множится по мере развития проекта. Сейчас я подумываю о разделении их на README.MD и CONTRIBUTING.MD. Но пока что это просто мысли. Буду рад если в комментариях поделитесь своими на этот счёт.

Теги:
Рейтинг0
Комментарии0

То, как мы выбираем и оцениваем LLM (GPT-4, Claude и пр.), напрямую связано не только с их качеством, но и с особенностями нашей собственной личности.

Сегодня большие языковые модели уже не просто инструменты для генерации кода или текстов — они становятся полноценными компаньонами в рабочих процессах. И, как показывают последние исследования, взаимодействие с ними сильно зависит от двух факторов:

  1. Личностные особенности самого пользователя.
    В области HCI давно известно: восприятие технологий фильтруется через наш характер. Например, доверие к роботам и цифровым системам у разных людей строится по-разному — кто-то верит в эффективность алгоритма, а кто-то больше смотрит на "человечность" интерфейса.

  2. “Характер” самой модели.
    Да-да, у LLM тоже наблюдаются поведенческие паттерны, которые пользователи воспринимают как черты личности — например, более строгая и формальная подача у одной модели или более “творческая” и дружелюбная у другой.

Интересное наблюдение дали тесты на базе Keirsey Temperament Sorter (упрощённая версия MBTI, делящая пользователей на четыре группы):

  • Rationals (аналитики, стратеги) — охотнее выбирали GPT-4, особенно для задач с чёткой целью и структурированными решениями.

  • Idealists (креативные коммуникаторы) — чаще делали ставку на Claude 3.5, ценя его в сценариях, где важны воображение и аналитика.

  • Guardians (организаторы) и Artisans (творцы в действии) тоже показывали свои паттерны предпочтений, хотя менее ярко выраженные.

Показательно, что разница отслеживалась не только в оценках, но и в эмоциональных реакциях (sentiment-анализ) и в том, как участники формулировали фидбек. То есть личность пользователя напрямую влияет на то, как он определяет “хороший” AI-опыт.

Для HCI- и AI-специалистов это открывает два интересных вектора:

  • Кастомизация: если подстраивать ответы и стиль модели под психотип человека, можно сильно повысить её воспринимаемую полезность.

  • Дизайн систем: в будущем IDE, ассистенты и даже рабочие мессенджеры смогут автоподбирать “поведение” модели под разный тип специалистов в команде.

Другими словами, вопрос “какая LLM лучше?” стоит переформулировать в “какая LLM лучше для конкретного пользователя”.

Personality Matters: User Traits Predict LLM Preferences in Multi-Turn Collaborative Tasks

Теги:
Рейтинг0
Комментарии0

Ближайшие события

К началу учебного года команда «Яндекса» выпустила коллекцию тетрадей с памятками от нейросети «Алисы». С их помощью школьники смогут научиться задавать вопросы нейросети, чтобы она помогала им в учёбе. В наборе пять тетрадей — по русскому, математике, английскому, литературе и одна общая. Тетради выдаются бесплатно, их можно получить до 10 сентября.

В памятках школьники найдут список тем и заданий из школьной программы, с которыми может помочь нейросеть «Алиса». Среди них — поиск ошибок в тексте, морфологический разбор слов, литературные жанры и решение квадратных уравнений. Нейросеть объяснит, как пишется слово, поможет раскрыть метафору, найти биографию писателя или подготовиться к тесту на английском. А чтобы ребёнку было проще сформулировать запрос (промт), в памятке есть примеры обращений к нейросети: что такое лирический герой, когда ставить запятую перед «как», расскажи о конструкции I have to.

«С помощью нейросетей сейчас можно за полчаса разобраться в теме, на которую раньше ушли бы часы. Мы хотим научить школьников использовать эти инструменты, чтобы они помогали им в учёбе и в познании мира», — рассказал креативный продюсер нейросети «Алисы» Андрей Широков.  

Получить коллекцию тетрадей с памятками от нейросети Алисы можно в «Читай‑городе» в Москве на бульваре Братьев Весниных, дом 2, ТРЦ «ЗУМ». Для этого достаточно показать продавцу смартфон с установленным приложением «Алиса». Количество тетрадей ограничено.

Теги:
Всего голосов 3: ↑1 и ↓2-1
Комментарии1

Представлен проект Chatterbox Multilingual, который умеет бесплатно клонировать любой голос с короткой записи. Решение умеет озвучивать любой текст с эмоциями, поддерживает 23 языка, среди которых и русский. Также там можно расставлять акценты, делать паузы, выделять слова голосом, контролировать тон и тембр. А ещё есть библиотека голосов, которые можно использовать в проектах.

Теги:
Всего голосов 2: ↑2 и ↓0+3
Комментарии0

Создайте виртуальную машину в облаке за 1 минуту 30 секунд... с AI-помощником Клаудией 🤖☁️

В скринкасте показали, как развернуть ВМ для чат-бота за полторы минуты. И вы можете сделать так же в личном кабинете Cloud.ru.

Что еще умеет Клаудия:

  • подбирать для виртуалки нужную конфигурацию, в зависимости от ваших задач;

  • настраивать мониторинг и алертинг;

  • давать подсказки для терминала и работать с консолью как co-pilot;

  • отвечать на вопросы по всем платформам: Evolution, Advanced, VMware;

  • помогать в FinOps и SRE: мониторить по логам приложения и алерты, искать неэффективно используемые ресурсы и советовать, как все оптимизировать.

✨ Бонусом — до 31 октября 20+ моделей в Evolution Foundation Models будут бесплатными. Протестируйте на своих проектах эмбеддеры, ранжировщики и мощные LLM, например GLM-4.5, Qwen3-235B, Qwen3-Coder или gpt-oss-120b.

Теги:
Рейтинг0
Комментарии0

Первая в России конференция про ускорение разработки с помощью ИИ

ИИ перестал быть игрушкой для экспериментов — он уже меняет рынок. Бигтех ускоряет релизы, команды переосмысляют роли, HR ищут людей с новыми навыками. И пока вы спорите, заменит ли AI разработчиков, другие уже строят процессы, где релизы идут в несколько раз быстрее.

>> Программа и регистрация <<

3 октября в Москве, в ДК «Рассвет» пройдет первая в России конференция про реальное ускорение с помощью AI. Без шаманства, без магии, без обещаний в стиле «сейчас покажу вам пару промтов в ChatGPT». Мы пригласили только тех, кто уже готов делиться конкретикой и новыми подходами в разработке с ИИ — экспертов от Яндекса, Альфа-Банка, Т-Банка и других лидеров рынка.

О чем расскажут на конференции:

  • Евгений Сатуров, CTO Mobile Surf — как мы выстроили AI-boosted Delivery Platform и сделали процессы в 5 раз быстрее классического SDLC. Поговорим и про цифры: чем измерять ускорение разработки и как оценивать ROI в AI-инструменты.

  • Доклады от крупных компаний: Александр Поломодов из Т-Банка, Святослав Соловьев из Альфа-Банка, Александр Толмачев (ex-Ozon Fintech) и другие мощные спикеры поделятся, как у них выстроены процессы AI-разработки. Обсудим, какие инструменты прижились, каких результатов с их помощью добились компании и как строили архитектуру проектов.

  • Дискуссии AI vs. Security vs Эффективность: поговорим с экспертами от Positive Technologies, Ozon Fintech и Сбера о том, как обезопасить код и данные при тотальной автоматизации, где прячутся уязвимости AI-решений и как жить с Концепцией регулирования ИИ-2030. И ответим на вопрос — насколько ИИ влияет на скорость команд, метрики и ROI.

  • Научная основа: Альбина Галлямова, научный сотрудник НИУ ВШЭ и автор проекта «Зачем мы такие?», разберет правду и мифы о возможностях искусственного интеллекта. Узнаем, как взаимодействие с LLM влияет на когнитивные способности человека.

В перерывах познакомитесь с нашим ИИ-предсказателем. Он покажет вашу профессиональную судьбу в IT и точно скажет, заменит ли вас ИИ. А после официальной части вас ждет фуршет и много общения.

Кому будет полезно?

Ждём всех, кому интересна тема ускорения разработки с помощью ИИ:

  • C-level и руководителей разработки — чтобы строить полноценный AI-конвейер.

  • Тимлиды и heads of dev — чтобы ускорять delivery, а не тормозить.

  • Разработчики — чтобы перестать тратить дни на задачи, которые уже автоматизируются.

  • PM и продакты — чтобы адекватно планировать сроки и ресурсы в AI-проектах.

Формат и участие

Конференция пройдет 3 октября (пятница) в Москве, локация — ДК Рассвет. Начало в 12:00. Вас ждет 9 часов контента, нетворкинга и новых идей для своих проектов. А еще — бесплатные консультации с CTO Surf по внедрению ИИ-процессов в вашем бизнесе.

Для участия регистрируйтесь по ссылке. Там же вы найдете программу и другие подробности.

До встречи ;) 

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии7

Инженер Google выпустил бесплатный учебник для всех, кто хочет создавать ИИ-агентов и изучить работу нейросетей. Там собрана вся информация от А до Я про ИИ-агентов, включая продвинутые техники промптинга, тонких настроек, обучение агентов пользоваться браузером с практическими примерами с кодом.

Теги:
Всего голосов 6: ↑6 и ↓0+6
Комментарии3

LLM и AI-модели для всех и новые возможности AI-помощника в облаке: главные новости с IT-конференции GoCloud Tech 2025 ☁️☁️☁️

Наша IT-конференция в самом разгаре, и мы уже готовы поделиться главными новостями.

Во-первых, делаем LLM доступнее 🤖

До 31 октября 2025 года больше 20 LLM в Evolution Foundation Models можно попробовать бесплатно

Нам важно, чтобы тестировать и внедрять AI в свои проекты могли компании любого размера. Поэтому с 1 ноября 2025 года объявляем доступные цены на открытые языковые модели в Evolution Foundation Models

Вы сможете использовать популярные модели:

  • GLM-4.5 — 55 рублей за миллион входных токенов и 220 рублей за миллион выходных токенов;

  • Qwen3-235B — 17 и 50 рублей;

  • Qwen3-Coder —  40 и 80 рублей.

При этом средняя цена составит:

  • 35 рублей за миллион входных токенов,

  • 70 рублей за миллион выходных токенов.

Во-вторых, расширяем возможности нашего AI-помощника Клаудии 🤖

Теперь Клаудия может помогать с FinOps и SRE. Возьмет на себя:

  • мониторинг приложений и алертов по логам;

  • поиск неэффективно используемых ресурсов и формирование рекомендаций по оптимизации.

Помимо этого, AI-помощник уже умеет подбирать сервисы и конфигурации под задачу, разворачивать виртуальные машины, работать с консолью в режиме co-pilot, настраивать мониторинг и алерты. 

Немного статистики за пару месяцев работы AI-помощника:

  • больше 4 000 пользователей обратились к Клаудии,

  • свыше 12 000 сообщений отправили,

  • в 15 раз ускорили рутинные операции.

✨ Самый популярный сценарий использования помощника — создание виртуальной машины под веб-серверы, сайты, Telegram-боты, тестовые окружения, веб-хостинг и другие pet-проекты. Раньше это занимало от 5 до 30 минут, а с Клаудией можно запустить ВМ за пару минут.

Если еще не тестировали нашего AI-помощника, переходите в личный кабинет Cloud.ru и ищите Клаудию в нижнем правом углу главной страницы.

Теги:
Рейтинг0
Комментарии0

ImageSorcery 01 - Как я свой open source вайбкодил
ImageSorcery 02 - Превращение ImageWizard в ImageSorcery
ImageSorcery 03 - шаг за шагом: PoC, Initial commit

Это серия постов от идеи ImageSorcery до 100+ звёзд на гитхабе и 100+ ежедневных установок с PyPI.

В прошлый серии мы с Gemini 2.0 flash определили стек: python, OpenCV, Ultralytics и никакого ImageMagic. 

Начал я как обычно с малого. В Cline попросил своего любимого бесплатного друга Gemini накидать скрипт на python который получает данные о размере (ширина, высота в пикселях) изображения. Дальше больше - скрипт crop который обрезает изображение по указанным аргументам. С последним пришлось повозиться и даже переключиться на Pro версию, благо она тоже бесплатная, пусть и с жёсткими лимитами.

😎 one shot изи катка: detect_objects находит координаты объектов, а crop_objects их вырезает
😎 one shot изи катка: detect_objects находит координаты объектов, а crop_objects их вырезает

PoC готов, можно приступать к реализации MVP.

Как вы помните, в python я тот ещё джун. Так что я не стал рисковать своим любимым бесплатным Gemini flash и даже pro, а сразу переключился в бесплатный браузерный Claude (лучший ии-кодер что тогда, что сейчас) и попросил дать мне подробнейшую инструкцию по разворачиванию проекта который будет имплементировать простейший hello world MCP сервер.

Нет смысла ваншотить такой проект за раз даже с Claude Opus 4.1. Что он не вывезет, что я не осилю осознать все нюансы за один заход. По этому предпочитаю действовать по комплиментарным шагам, на каждом из которых получать работающий продукт с небольшими изменениями, пока не получу финальный результат.

Написание инструкции - задача с нечётким ТЗ. Такую никогда нельзя пытаться делать ваншотом. Поэтому сперва получаю первую версию по максимально абстрактному промпту, но дав ей столько контекста сколько смог насобирать в интернете и своей голове. А затем по шагам вычитываю - прошу внести исправления - снова вычитываю - снова прошу исправить и так по кругу пока не получаю результат который я понимаю и к которому у меня нет претензий.

И так инструкция готова, закидываю её в Cline + Gemini flash и ... получаю ошибку активации. Вы же помните что в python я джун и понятия о venv не имею? Даю ему шанс исправить ошибку самостоятельно, но бесполезно - он не справляется. Откатываю всё назад, переключаю модель на Gemini Pro - результат тот же. Плюю на экономию, переключаю модель на Claude Sonnet - результат тот же, но оно сожрало 3 бакса 🤬

Плюю на этих бестолковых ИИ и беру дело в свои руки. Рано железякам нас ещё заменять!

Пол дня бесполезного рыскания по stack overflow и дебага, во время которого я случайно обнаружил, что venv активируется если git bash terminal открыт в отдельном окне, а не внутри VSCode. Оказывается эта шарманка будучи запущенной внутри IDE в пути C:\Users\titulus\work сочетание \t воспринимает как знак табуляции из-за чего пытается активировать venv в C:\Users    itulus\work 😵‍💫

Очевидного решения или даже упоминания этого бага я не обнаружил, так что просто уехал со всем своим проектом в WSL, благо VSCode отлично с ним работает. В Linux окружении, разумеется, таких проблем не возникло. Cline Gemini flash ваншотом по той самой инструкции от Claude создал MCP сервер, самостоятельно к нему подключился (вот за это я его обожаю) и проверил.

Я завёл git репозиторий и закоммитил initial commit. Первый шаг сделан ✅

Теги:
Рейтинг0
Комментарии0

Вклад авторов