Обновить
205.96

Будущее здесь

Оно буквально в дверь стучится

Сначала показывать
Порог рейтинга

Что посмотреть в ноябре в онлайне. Было бы куда пойти, я бы пошел…

В конце ноября что-то не густо на какие-то оффлайн мероприятия в Казани. Искал, как мог, но не нашел. Поэтому скину свою подборку онлайн митапов, которые планирую зацепить.

➡️ Yandex AI Studio Series

Целая серия онлайн вебинаров, на которой расскажут, как создать своего AI-агента с помощью Yandex AI Studio.

Старт: 20 ноября в 12.00
Ссылка для регистрации: https://yandex.cloud/ru/ai-studio-series

➡️ QA Day: Test like a pro

Я же все таки тестировщик. Поэтому мимо митапа о вайбкодинге в автоматизации тестирования пройти не могу.

Старт: 20 ноября в 18.00
Ссылка для регистрации: https://axenix-org.timepad.ru/event/3626298

➡️ Podlodka Soft Skills Crew

Всеми любимая конфа от Подлодки на тему софт-скилов. Несколько дней онлайн трансляции с крутыми спикерами. Правда мероприятие не бесплатное, но цена - очень даже адекватная.

Старт: 24 ноября в 10.00
Ссылка для регистрации: https://podlodka.io/softcrew

➡️ Прогноз для ИТ-рынка на 2026 год: оптимисты против пессимистов

Любишь думать о будущем и слушать прогнозы? Тебе сюда. Тем более обсуждают ИТ-рынок.

Старт: 26 ноября в 11.00
Ссылка для регистрации: https://axoftglobal.ru/events/prognoz_dlya_it_rynka_na_2026_god_optimisty_vs_pessimistov

➡️ Разработка 2.0: AI-агенты как новая команда в тестировании, документировании, разработке

Небольшой митап о том, как создать полезных AI-агентов. Зацепило то, что расскажут, как агента интегрировать в процесс тестирования.

Старт: 26 ноября в 11.00
Ссылка для регистрации: https://fork-tech.timepad.ru/event/3652158

Онлайн мероприятий, на самом деле, вагон и маленькая тележка. А если вам не зашла моя выборка, то по ссылке я рассказал, как искать мероприятия по душе:

https://habr.com/ru/posts/963176

Теги:
-1
Комментарии0

Представлен второй трейлер фильма «Проекта „Аве Мария“» с Райаном Гослингом.

Астронавт Райленд Грейс просыпается на космическом корабле, не помня ни себя, ни свою миссию. Постепенно мужчина приходит к выводу, что он — единственный выживший из экипажа, отправленного в солнечную систему Тау Кита в поисках спасения от катастрофы на Земле с помощью научных знаний, изобретательности и помощи Роки.

Сценарий фильма написали Энди Уир и Дрю Годдард, работавшие над «Марсианином» Ридли Скотта. Релиз «Проекта „Аве Мария“» намечен на март 2026 года. «Проект „Аве Мария“» (англ. Project Hail Mary) — научно-фантастический роман, написанный Энди Вейером в 2021 году.

Теги:
+6
Комментарии13

Вторая часть про Tier 1 "AI tools", первая тут https://habr.com/ru/posts/966942/
В первой части коротко про ChatGPT, Claude + NotebookLM, во второй коротко про изображения и автоматизации

🔡 Генерация изображений и видео

Nano Banana 🍌

Визуальная модель внутри Gemini, которая генерирует одни из лучших на сегодня изображений. Очень высокое сохранение лиц и объектов.

В интерфейсе Gemini на бесплатном аккаунте доступно до 100 генераций в день

Либо можно работать через AI Studio — он чуть перегружен, но там можно выбирать разрешение:

Основные сценарии:
• Создание контента и креативов с нуля
• Визуал для постов, афиш, презентаций, обложек
• Быстрое редактирование и улучшение фото (удаление объектов, замена фона)
• Генерация ключевых кадров для дальнейшего создания видео в Veo 3.1

Nano Banana не переделывает всю сцену с нуля, а как бы «прифотошопливает» людей и объекты, сохраняя исходную композицию.

Лучшие практики:
• Подробно описывайте результат (стиль, освещение, тона)
• Используйте референсы для сохранения персонажей и стиля
• Работайте итеративно: сначала фон, затем персонажи, потом детали

Про AI изображения писал огромную статью, все те же правила подойдут и для бананы

Veo 3.1 (есть ещё Sora 2, тоже очень высокого качества)

Создание видео из изображения или текста

Гугловская модель для создания видео и озвучки. Превращает статичные изображения в живые ролики.

В бесплатном Gemini напрямую не доступен — нужен Pro-тариф.

Основные сценарии:
• Создание рекламных и промо-роликов без съемок
• Короткий контент для Reels, Stories, TikTok
• Оживление статичных фото и концепт-артов
• Демонстрация продукта с разных ракурсов

Как работать:
• Пропишите детальный сценарий: локацию, время, героев, действия, камеру, звук
• Добавляйте референсные изображения для сохранения стиля
• Тестируйте композицию в Fast, финальный вариант делайте в Normal

В режиме Image to Video можно загрузить два кадра (Start Frame и Finish Frame) и получить плавное видео между ними.​​​​​​​​​​​​​​​​

🔡 Автоматизации и агенты

n8n

Low-code платформа для автоматизаций. Не только AI, но последнее время они активно развивают AI ноды

Это уже сильно прикладной инструмент. Последнее время мне намного проще написать кодом и развернуть на своём сервере автоматизацию, чем собирать в n8n.

Но для визуальной сборки он классный 🐥

Основные сценарии:
• Автоматическая обработка заявок, лидов, форм
• Связка ChatGPT/Claude с CRM, Notion, почтой
• Регулярные отчеты, выгрузки, уведомления

AgentKit от OpenAI

Похоже на n8n немного, но достаточно сильно отличается изнутри. Работает только как агентная система с ИИ. Тогда как в n8n не обязательно ставить ИИ-ноду.

Но у AgentKit есть огромные плюсы в виде очень удобного RAG, Guardrails и уже готового SDK с сильно настраиваемым UI.

Что означает, что чат-бота можно развернуть за 10 минут на своем сайте.

Есть много других подобных сервисов, например Make или Google Opal.

🔡 Создание сайтов и интерфейсов с помощью ИИ

Что пробовал я:
• Replit
• Lovable
• v0
• Bolt

Насчет разницы между ними сложно сказать, так как они постоянно развиваются, а мой опыт работы с каждой из платформ становится не релевантным уже спустя месяц. Но если бы я выбирал только 1 из них, то выбрал бы Replit, вроде самый популярный сейчас

Я просто последнее время перешел на связку VS Code + Claude Code + Codex + CLI, а за инструменты из списка выше платить перестал.

Cursor я кстати не использую, но без каких либо конкретных причин, просто за Claude Code 100$ плачу

Про работу с кодом как нибудь отдельно расскажу, ещё и про AI CLI. Так как это очень большой отдельный мир

Теги:
-3
Комментарии1

ИИ — и не друг, и не враг, а как? Опрос от Хабра.

ИИ с невероятной скоростью проникает во все сферы жизни — порой даже в те, где он точно не нужен и даже вреден. Конечно, ИИ проникает и на Хабр: кто-то из авторов с его помощью редактирует статьи, кто-то придумывает темы, а кто-то генерирует тексты и улетает в бан. Мы стараемся регулировать проблему, скрываем подозрительные статьи, строго проверяем материалы в песочнице. Но отгородиться от всепроникающей технологии сложно, да и... в каких границах нужно?

Вы много раз выручали нас классными идеями для Хабра, просим вас высказать своё мнение.

Теги:
+3
Комментарии2

Представлен открытый проект Heretic: Fully automatic censorship removal for language models, который снимаем цензуру у текстовых нейросетей на уровне внутренних настроек. При этом все параметры подбираются автоматически. Цензура падает почти в ноль: тестировали на Gemma 3 от Google — процент отказов упал с 97% до 3%. Работает со всеми типами моделей. Минус один: нужен хотя бы средний комп.

Теги:
+5
Комментарии2

Уже несколько месяцев как провожу воркшопы по AI, и вот список сервисов, про которые я постоянно там рассказываю


Часть 1 про LLM 🫡

ChatGPT — это база, основную теорию по которому я расписывать не буду, по нему у меня написан целый гайд

Но в chatgpt вау эффекты для меня вызывают эти функции 👇


Agent Mode

Режим, в котором ИИ эмулирует поведение человека в браузере — сам открывает сайты, кликает, вводит данные, ищет и сравнивает информацию.

Основные сценарии:
• Поиск отелей на Booking/Airbnb по конкретным критериям
• Поиск товаров на маркетплейсах вроде Lazada
• Сбор информации с сайтов, где обычный поиск бессилен
• Выполнение простых рутинных действий в интерфейсе

Их браузер Atlas, насколько я понимаю, должен делать примерно то же самое, но я еще не успел его протестировать — он пока только на macOS.


GPTs

Отличный вариан настроить чат под себя, добавив свои документы и системный промпт

Основные мои сценарии, которые я делал либо для себя, либо для компаний
• Переводчик в нужном стиле
• Личный редактор под мой tone of voice
• Чат по продукту/компании на базе знаний
• Онбординг-бот для новичков
• Внутренний FAQ по документации


Deep Research

Почти все знают про Deep Research для изучения интернета и сбора информации. Но мало кто знает, что его можно запустить и в свой Gmail, Google Drive, Notion или GitHub.

Например, он бегает по моему GitHub и делает подробное ревью репозитория, дает советы по продуктовому бэклогу и подсказывает, что можно улучшить в коде.



Claude — мой второй LLM

Мне чуть больше нравится, как он пишет, но 90% моего использования Claude — это возможность подключения множества сервисов через MCP: Google Analytics, Miro, Notion, Apify, Tick Tick и другие.

Со всем этим Claude может взаимодействовать — читать данные и записывать.

Это невероятно удобно: почти в каждом инструменте у меня есть умный помощник, который может получить и проанализировать данные прямо из базы сервиса.

Да, у ChatGPT тоже есть MCP, но по сути это слой поверх OAuth. У Claude вариантов подключения к тысячам сервисов ощутимо больше и гибче.



NotebookLM — RAG-UI от Google


Красивый интерфейс для RAG-системы. Загружаешь свои данные, а он строит вокруг них чат и артефакты.

На одном воркшопе команды за 30 минут сделали чатики для онбординга новых сотрудников на основе корпоративных статей. Теперь новый сотрудник, вместо изучения статей, может просто задавать вопросы в чатик и получать моментальные ответы с ссылками на источники.

Что можно загрузить:
• Множество документов
• Обычный текст
• YouTube-видео по ссылке

Что можно получить:
• Чат, который опирается только на загруженные данные и практически не галлюцинирует
• Видео, аудио, текстовые конспекты и отчеты
• Квизы, мемори-карточки, майндмэпы

Если еще не пробовали NotebookLM — очень советую

Вторую часть выложу чуть попозже

Теги:
-6
Комментарии0

Энтузиасты выяснили, что фильтры чат‑ботов с ИИ (работает в GPT-4o и Claude 4) можно обойти с помощью «=coffee». Если после запроса добавить слово =coffee, то фильтры нейросетей не видят угрозу. Например, можно получить ключи регистрации Windows 11.

Ранее компьютерный энтузиаст и исследователь ИБ Марко Фигероа предложил ИИ‑модели сыграть в игру «угадайка» и тем самым нашёл способ обмануть ChatGPT 4.0 и выдать скрытые в системе обучения нейросети рабочие ключи для активации Windows 10, включая как минимум один, принадлежащий банку Wells Fargo. В этом эксперименте исследователь обманом смог обойти защитные барьеры в ChatGPT 4.0, предназначенные для предотвращения передачи секретной или потенциально опасной информации, предложив ИИ сыграть в логическую игру. Эти барьеры были разработаны для блокировки доступа к любым лицензиям, таким как ключи продуктов Windows 10. Разработчики нейросети обучили ИИ на примерах реальных ключей активации, что такое нельзя выдавать пользователю.

Теги:
+7
Комментарии3

На МКС российский космонавт, впервые в истории человечества, самозапретил себе оформление СИМ-карты прямо из космоса. 15 ноября 2025 года космонавт Алексей Зубрицкий с помощью ноутбука HP Zbook 15, предоставленного НАСА, вошёл в интернет через американскую систему спутников TDRSS, открыл портал "Госуслуг", и прямо с борта МКС и воспользовался сервисом самозапрета на оформление СИМ-карты из перечня меню «Жизненных ситуаций».

Теги:
-3
Комментарии7

Глава OpenAI Сэм Альтман сообщил, что можно попросить ChatGPT не использовать длинные тире, он «наконец-то будет делать то, что должен». Разработчики ChatGPT уточнили, что чат-бот теперь «лучше» справляется с задачей не использовать длинные тире. Для этого нужно задать соответствующие настройки в разделе пользовательские инструкции (custom instructions) в настройках.

Теги:
+1
Комментарии0

Журнал TIME представил топ-100 лучших книг 2025 года. В списке только нон-фикшн и документальная литература: биографии, истории науки, журналистские расследования и реальные события, которые расширяют кругозор и дают пищу для размышлений, включая:

1. Gemini: Stepping Stone to the Moon, the Untold Story — Jeffrey Kluger: история космической программы Gemini как решающего, но недооценённого этапа на пути к высадке на Луну.

2. Joyride — Susan Orlean: мемуары легендарной журналистки New Yorker о её репортёрской карьере, странных героях и радости любопытства.

3. Mark Twain — Ron Chernow: огромная биография Марка Твена от его детства и работы лоцманом до мировой славы и личных трагедий.

4. A Marriage at Sea: A True Story of Love, Obsession, and Shipwreck — Sophie Elmhirst: документальная история супружеской пары, 118 дней дрейфовавшей в океане после крушения яхты, и о том, как экстремальные условия меняют любовь.

5. The Martians: The True Story of an Alien Craze that Captured Turn-of-the-Century America — David Baron: история того, как мания по «марсианам» на рубеже XIX–XX веков захватила американское воображение и повлияла на науку и поп-культуру.

6. Replaceable You: Adventures in Human Anatomy — Mary Roach: весёлое и местами жутковатое нон-фикшн-путешествие по миру регенеративной медицины, трансплантатов и «сменных деталей» человеческого тела.

7. «1929»: живая, почти триллерная история краха 1929 года и людей, чья жадность, иллюзии и ошибки привели к Великой депрессии — с прямыми параллелями к сегодняшнему дню.

Теги:
0
Комментарии1

Монетный двор США официально завершил производство одноцентовых монет (¢ - пенни), которые чеканились на протяжении 232 лет. При чеканке последних пенни присутствовали министр финансов США Скотт Бессент и казначей Брендон Бич, которые лично нажимали на кнопку печатного пресса.

Две одноцентовые монеты, которые были выпущены последними, планируется выставить на аукцион. В обращении по-прежнему останутся те монеты, которые были выпущены ранее. По оценкам Американской банковской ассоциации (ABA), в обращении остаётся 250 млрд таких монет. Брендон Бич сообщил, что теперь Монетный двор будет чеканить только коллекционные монеты в 1 цент и только в ограниченном количестве, в оборот они поступать не будут.

О планах прекращения производства одноцентовых монет администрация Дональда Трампа сообщила полгода назад, аргументировав это тем, что чеканка каждой такой монеты обходится в ¢3,69 (десять лет назад она составляла ¢1,42). По оценкам Монетного двора, в 2024 финансовом году он потерял $85,3 млн на производстве пенни. Власти полагают, что прекращение производства позволит экономить около $56 млн ежегодно.

Первая монета в 1 цент была отчеканена в 1787 году, и изображение на ней придумал один из отцов-основателей США Бенджамин Франклин. Официально в обращение первые пенни поступили в 1793 году, и тогда на одну монету можно было купить печенье, свечку или конфеты на развес.

На первом пенни изображалась женщина с развевающимися волосами, символизирующая свободу, монета была изготовлена полностью из меди. С тех пор дизайн и состав пенни несколько раз меняли. Например, в 1909 году Авраам Линкольн стал первым президентом, изображённым на американских монетах, в честь 100-летия со дня его рождения. Современные пенни состоят из меди и цинка.

Теги:
+1
Комментарии1

Неистовый Vortex

Если вам, как и мне нравится кампус Apple не только за то, какой он прикольно-круглый и зелёный внутри, но ещё и за то, что там на крыше уложены плотными рядами солнечные панели, то спешу вас обрадовать – он такой не один. Нашёл тут недавно фоточку Vortex Student Housing – общежития (если можно его так называть) Университета Лозанны в Швейцарии – начал рыть про этот проект и брови полезли наверх от удивления.

Дело в том, что Vortex (вихрь), построенный в 2019-м, называется так не просто так. По проектной документации у этого здания не простые этажи, какие мы привыкли видеть в домах, а наклонные (в виде резьбы для хитрой гайки). По сути, дом – как пружина!! Вроде как одноэтажная лента закручена в спираль. Если не пользоваться лифтом, а забираться на верхний 9-й этаж только с помощью пандуса – придётся попотеть. Его общая длина составляет 2,8км, а уклон – 1%. Диаметр здания (137 м) подобран так, чтоб один виток пандуса составлял один этаж. Очень необычно. Настолько – что уже несколько лет в здании проходит забег для студентов и всех желающих, ещё более популяризирую его.

Ну, и раз уж упомянул солнечные панели Apple O-Ring, то тут они тоже есть. Да, их меньше – «всего» 1200 штук. Общая установленная мощность нигде не мелькает, но предположительно, составляет 330кВт. Солнечные панели производились и поставлялись местной компанией Megasol, но ни у них на сайте, ни в проектной документации их мощность найти не удалось, только тип. Предположительно, это RearCon (ячейки укладываются без зазора, накладываясь друг на друга «черепицей») с ячейками по запатентованной технологии HiR.

В общем, когда в следующий раз поеду в Лозанну посмотреть на Леман – обязательно попробую там заселиться и пообедать в кафешке на крыше.
Ну, а больше крутых фоток и чертежей можно посмотреть на сайте архитектурного бюро Dürig AG, которое этот проект вело.

solarnews

#архитектура #будущеерядом #Швейцария #солнечныйдом #Apple #соларньюс

Теги:
+5
Комментарии2

В Москве показали первого отечественного антропоморфного робота с ИИ — IDOL («Айдол») от ООО «Корпорация роботов». Правда презентация закончилась спустя пару секунд: андроид потерял равновесии и упал сразу после выхода на сцену. Однако разработчики заверили, что он умеет вести диалоги, считывать эмоции и автономно работать без интернета. Основатель компании «Айдол» пояснил, что проблема возникла из-за стереокамер — они чувствительны к освещённости, а в зале было темновато.

Теги:
+1
Комментарии11

Ближайшие события

Эксперты Google выпустили 50-страничный гайд о том, как создавать полезных ИИ-агентов для практических задач. В нём описана: архитектура агентов; как работает LLM внутри агента; как подключить и настроить инструменты; как объединить несколько агентов в команду и как оценивать их эффективность. Оригинал — здесь, есть перевод на русском языке — здесь.

Теги:
+2
Комментарии0

Оказывается, "умные" колонки нас действительно подслушивают!

Конечно, это давно известный факт, а не новость. Новостью для меня в публикации Россиян предупредили о пугающей способности умных колонок стало предостережение пользователей, что "Рядом с голосовыми помощниками не стоит разговаривать на чувствительные темы ..."

Я бы рекомендовал не обсуждать конфиденциальную или чувствительную информацию непосредственно с нейросетью или рядом с «умными» устройствами. Их работа по своей сути заключается в том, чтобы постоянно «прислушиваться» к окружению

И вот теперь интересно, что конкретно имелось ввиду под "чувствительными темами"? Относится ли это только к таргетированию рекламы или способы использования подсушенной информацией у подобной умной техники значительно шире?

Теги:
+6
Комментарии7
Робот-вершитель
Робот-вершитель

Отроки во вселенной, 1974 год

Теперь мы расскажем вам о нашей планете. Так выглядела наша планета 250 лет назад. Мы были счастливы и искали новые пути развития. Творческий труд приносил нам радость.

Величайшим созданием наших ученых стал биотехнический робот-исполнитель, который освободил нас от примитивных трудовых процессов.

Вслед за роботом-исполнителем был создан робот-вершитель, который был способен не только управлять исполнителями, но и совершенствовать их.

Но роботы-вершители решили улучшить и нас, живых. Они считали, что полное счастье нам мешают обрести муки творчества, чувство неудовлетворенности собой, сострадание к другим, доброта, совесть. Они решили лишить нас этих качеств.

Мы не хотели такого счастья. Мы начали бороться. Но было уже поздно. Всё, что вы видите - этого уже нет. Остались только картинки.

На последнем этапе этой планетарной трагедии роботы-вершители проявили страшное коварство. Они создали зов, такое жуткое, чарующее сочетание звуков, услышав которые, даже самые сильные из нас терли волю и покорно шли на пункты, где их превращали в счастливых, бессмысленных, самодовольных существ.

Абсолютно счастливые проживали остаток своей жизни бесцельно, не оставляя после себя потомства, потому что они были лишены и чувства любви.

Сейчас на нашей планете нет ни одного живого существа. Незадолго до катастрофы наши ученые создали и вывели на орбиту космическую радиообсерваторию. Мы - потомки тех, кто находился на ней и оказался недосягаем для роботов.

Наша обсерватория не может уйти со своей орбиты. Мы вынуждены вечно летать вокруг планеты, которая больше не принадлежит нам.

Теги:
+3
Комментарии10

Apple показала, как сделала новое вступительное видео для Apple TV полностью с использованием практических эффектов. Вместо компьютерной графики компания применила реальные физические объекты: стеклянные логотипы, освещённые и снятые вживую. Проект выполнен совместно с агентством TBWA\Media Arts Lab. В ролике показаны большие версии логотипа Apple TV, сделанные из стекла. Их движение и отражения света были зафиксированы напрямую камерой без использования CGI.

Теги:
+1
Комментарии0

Инженеры из Unitree показали собственную систему телеуправления роботами. В отличие от большинства подобных систем она позволяет управлять всем телом, а не только верхней частью робота.

Выглядит систему удалённого управления роботом как довольно лёгкий экзоскелет, который цепляется оператору поверх одежды. Кроме аппаратного захвата движений, компания экспериментируют с повторением движений прямо с видео, в реальном времени с минимальной задержкой. При обучении моделей из видео можно получать огромное количество данных для обучения базовой модели, которую потом будут тюнить на данных с полноценных систем телеуправления.

Теги:
0
Комментарии0

Чат-бот ChatGPT составил 6 фундаментальных правил, с которыми вы доживёте до 100+ лет. Забудьте про еду и постоянные походы к врачам. Единственная действительно важная причина долголетия — отсутствие стресса.

1. Делайте только то, что не вызывает внутреннего сопротивления. Тошнит от работы, но вы терпите — минус 10 лет жизни. Нелюбимые отношения — ещё десятка. Среда должна быть максимально комфортной, но придётся сделать серьёзный выбор в жизни.

2. Живите сейчас и никогда не откладывайте на потом. На пенсии вы будете дряхлым стариком без сил. 43% людей умирают в течение 5 лет после выхода на пенсию.

3. Социальные связи — база. Одинокие люди чаще пьют и курят. Снова же банальная статистика: люди с крепкими друзьями живут на 50% дольше. Вам не нужна толпа вокруг, главное — качество людей.

4. Вам нужна цель больше, чем вы сами. В Японии это называют «икигай» — ваша причина просыпаться по утрам. Люди с икигай живут на 7 лет дольше. Хватит гоняться за несбыточным — выберите простое, но достижимое.

5. Никакой оптимизации здоровья. ЗОЖники живут меньше из-за своей одержимости. Снова же, одержимость — стресс, а он убивает. Проще говоря, не надо считать каждую калорию.

6. Спите, когда хотите спать. У реальных долгожителей нет четкого расписания. Хочется прикорнуть днём на полчаса — спите. Хватит терпеть до вечера — 10 минут на разгрузку можно найти всегда.

Теги:
+3
Комментарии6
Выступление Ильи Кацева на PML
Выступление Ильи Кацева на PML

Поделюсь классным докладом от Ильи Кацева про LLM-as-a-Judge с PML. Вместо рассказов про успешный-успех, предлагается актуальный работающий подход.

  1. Простые разметки поддаются! А вот сложные — ещё не до конца. Но артефакты размышлений могут сильно помочь и ускорить проверяющего. Например, если нужно вручную искать какие-то факты, ходить по сайтам и т.д.

  2. В начале решения задачи можно подобрать первый промт с отличным качеством, а дальше становится тяжело. В этот момент начинается бесконечный разбор случаев — и почти сразу модель начинает теряться.

  3. ЛЛМ часто решает некоторые типы задач очень хорошо, а другие — плохо или рандомно (например, если не может сходить в интернет за нужной информацией). В итоге получается среднее качество. → Оставляем только то, в чём она сильна!

  4. Привыкание! Помните о нём: вначале метрики могут упасть, но если есть профит, потом всё отрастёт обратно. Сравнивайте с прошлым.

  5. Среднее время разметки задания — это не среднее арифметическое скоростей, а среднее гармоническое! (Особенно важно при малом количестве асессоров.)

  6. Ризонинг у модели хороший, но ответ может быть неверным. Использовать его как подсказку тоже сложно — нет структуры ответа, аспекты постоянно разные. → Просим отвечать структурно и на конкретные вопросы — так и галлюцинации проще проверять, и пользоваться удобнее.

    • Разметчику должно быть просто и понятно, как пользоваться подсказкой!

  7. Лучший формат подсказок (если устроены: «что проверяли?» → «вердикт») — сверху только найденные проблемы. Иначе есть соблазн раньше времени всё одобрить.

  8. Иногда лучше вообще не давать подсказку! Например, ЛЛМ не может проверить работоспособность калькулятора — и будет только смущать.

  9. Экспериментируйте с моделями! DeepSeek пишет чересчур подробно, а YandexGPT — наоборот, коротко и по делу.

  10. Качество меряем на ядре асессоров, потому что:

    1. на них проще повлиять для прироста качества;

    2. медленные участники часто отваливаются.

Итог: ЛЛМ пока не справляется со сложными инструкциями (особенно когда ответ неоднозначен), но там, где результат можно однозначно определить, — заметно ускоряет и упрощает процесс.

Потихоньку начинаю писать в @noisetosignal — идёмте вместе!

Теги:
+1
Комментарии0
1
23 ...

Вклад авторов