Обновить
26
0.5
Кунцевич Андрей@titulusdesiderio

JS-dev | IT-specialist

Отправить сообщение

Современные мультимодальные ИИ хорошо умеют понимать изображения и даже их генерировать. Но простейшие операции редактирования (кадрировать, повернуть, подписать, заблюрить и т.п.) им не доступны.

🪄 ImageSorcery MCP - инструмент на базе компьютерного зрения, позволяющий ИИ-агентам редактировать изображения. Установив этот MCP вы дадите своему любимому ИИ возможности:

✅ Обрезать, вращать и изменять размер изображений

✅ Рисовать и писать поверх изображений

✅ Делать это при помощи указания объектов, а не координат (используется компьютерное зрение)

✅ Использовать кастомные натренированные модели для определения того, что не способна увидеть даже самая крутая LLM

Обрежь изображение так, что бы кот был по центру
Обрежь изображение так, что бы кот был по центру

Доступен в Claude, Cursor, Cline, RooCode и любом другом ИИ-агенте на ваш выбор.

Я как прочитал "на популярном фреймворке JavaScript Backbone" у меня все олдскулы свело. Товарищ переводчик, вы угораете?

Сравните пожалуйста с tl;dv - у них бесплатная транскрипция онлайн звонков без лимитов. По качеству понимания слов чуть хуже Гугла (которого у вас нет) зато знаки препинания расставляет качественно. И более менее адекватно распознает иностранные слова в русской речи.

Что за Poe на графике?

Есть ли у MCP RBAC?

Тут действует правило zero tolerance. Если мы не можем хотябы в одном проценте случаев быть уверенными в том что на доступны настоящие "мысли" модели - мы не можем полагаться на то что это настоящие "мысли" во всех 100% случаев.

Это всё-равно что считать что вы знаете мои мысли, если я в дополнение к своим словам скажу "я думал так-то". Да, я мог думать так как я озвучил, а мог не думать. Моё заявление о том что я думал совершенно не повод считать что я думал. Единственное в чём вы можете быть уверенны - в том, что я хочу чтобы вы считали, что я думал так как сказал что думаю.

https://www.anthropic.com/research/reasoning-models-dont-say-think

Они думают не в слух. То что выдаётся в качестве "рассуждения" не более чем имитация для пользователя. С настоящим рассуждением происходящим в нейросети этот текст связан весьма условно

А в чём разница двух реализаций описанных в статье?

Гугл оооочень запоздали в ИИ гонке, хотя фактически они изобрели GPT.

Но сейчас наваливают не по детски. Они и догнали и перегнали всех своих конкурентов и сейчас конкурируют(не проигрывают!) лишь в интеллекте, но уничтожают всех и вся в скорости и стоимости.

В open webui есть кнопка "продолжить". Работает превосходно. За счёт неё и контекстного окна в 1кк токенов способно генерировать гигантские консистентные артефакты вроде конфигов или например sql дампов

мотивирующий рассказ накропал некий гомо сапиенс...

Нет, этот текст явно целиком или как минимум на 90% написан нейросетью. Очень нейросетевая стилистика. Скорее всего GPT написал это по мотивам исходной истории в 2-3 предложения от автора-человека, технически не сведущего в теме. А человек скорее всего услышал её от технаря, который в этом участвовал.

Метод. self-consistency не работает на ChatGPT, так как openai использует кеширование. Соответственно если ты три раза подряд задашь без паузы в несколько часов один тот же вопрос - получишь три примерно одинаковых ответа. Если в первом была галлюцинация - в остальных двух она так же будет присутствовать

троллейбус из буханки
троллейбус из буханки

Со всем уважением к автору и восхищением его упорству

Несколько раз собесили молодых людей ~19 лет идущих на высокие позиции (сеньор/лид). Всегда была надежда на юных гениев. И мысли что мы мол не эйджисты и оценивать будем за знания, а не стаж, который у всех нарисован всё-равно.
И каждый раз разочарование - не способность ответить на базовые вопросы по программированию 🤷

Почему нам эти семнадцатилетние гении не попадаются? С другой стороны гениальность этого парня для меня пока только на словах. Не известно как он покажет себя в деле.

Хочу немного похвастаться своим новогодним пет-проектом в виде telegram бота с miniapp:

https://t me/titulus_cubegame_bot ← ссылка на бота

Это математическая игра, напоминающая 2048 (если кто-то еще помнит). В ней вы взаимодействуете с трехмерным кубиком. У вас есть всего три действия.

  1. поворот кубика

  2. соединение сторон с одинаковыми числами. Ключевой стороной является передняя. Если вы нажимаете стрелки ⬆️, ⬇️, ⬅️ или ➡️ на клавиатуре, или свайпаете на телефоне, то:

  • если та сторона отличается - 🎲 крутится в эту сторону.

  • если совпадает - она увеличивается на 1, а на передней появляется случайное число.

  1. кнопка «+1» - увеличивает значение передней стороны на 1, но у нее ограниченное количество нажатий. Начиная с 5️⃣, за каждое следующее число получаете ещё одно её нажатие.

Правила просты, но добраться до 🔟 уже весьма сложно.
🏆 Для киберкатлетов в конце каждой попытки есть лидерборд с пятью лучшими результатами за месяц.

Исходники открыты, и пусть мне за них немного стыдно, я оправдываюсь тем, что их писал ИИ. Ссылка на них на экране лидерборда

Ооо мои переписки с братюнями многому научат ИИ 😅

Я просто обозначаю некоторые достаточно очевидные факты.

Это ваши личные галлюцинации, а не очевидные факты

Такое ощущение, что ваши дети не спрашивают вас "почему стул - нога арбуз?" или "зачем какашка?"

Полтора года в ИИ - это вечность.
ChatGPT и Claude сегодня отлично справляются с саммаризацией

Спасибо за статью. Добавьте пожалуйста пару-тройку скриншотов - примеров работы. Для наглядности

Информация

В рейтинге
1 991-й
Зарегистрирован
Активность