Обновить
1024K+

Искусственный интеллект

AI, ANN и иные формы искусственного разума

2 226,09
Рейтинг
Сначала показывать
Порог рейтинга

Точность и полнота нейросетей

В своих разработках «Криптонит» использует искусственные нейронные сети. И мы продолжаем пояснять термины.

В машинном обучении precision (точность) и recall (полнота) являются двумя метриками, используемыми для оценки производительности алгоритмов классификации. Они численно показывают, насколько успешно классификатор отделяет объекты одного класса от другого.

Точность (P) измеряется как доля верно классифицированных объектов от общего числа положительных примеров (в которых классификатор счёл, что пример содержит объект данного класса).

Точность вычисляется по формуле P = TP / (TP + FP), где TP — количество истинно положительных примеров, а FP — количество ложноположительных примеров.

Полнота (R) показывает долю правильно классифицированных положительных примеров от общего числа истинно положительных примеров.

Формула для расчёта полноты: TP / (TP + FN), где FN — количество ложноотрицательных примеров.

При увеличении точности обычно уменьшается полнота и наоборот. Это связано с предсказаниями, которые классификатор делает при принятии решения о том, к какому классу отнести каждый пример. При выборе между точностью и полнотой необходимо учитывать конкретные требования задачи.

Если важно минимизировать ложные положительные прогнозы (неверно классифицированные негативные примеры), стоит ориентироваться на точность. Если важнее избегать пропуска положительных примеров (нужно минимизировать ложные отрицательные прогнозы), стоит ориентироваться на полноту.

Теги:
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

На личном сайте Брендана Байкрофта на странице bbycroft.net/llm опубликована интерактивная визуализация работы большой языковой модели.

Всё работает прямо в браузере с пошаговой обработкой промпта. По нажатию пробела происходит переход от одной стадии к другой. Алгоритмическая сложность разнообразных структур демонстрируется в трёхмерном пространстве. Архитектура модели наглядно разбита на отдельные составляющие, будто это конвейер мебельной фабрики.

Код проекта выложен на аккаунте Байкрофта на GitHub.

github.com/bbycroft/llm-viz

Теги:
Всего голосов 11: ↑11 и ↓0+11
Комментарии0

Группа исследователей из компании Hugging Face и Университета Карнеги-Меллона опубликовала результаты анализа энергопотребления при выполнении различных моделей машинного обучения.

Наиболее энергозатратными оказались модели машинного обучения, обеспечивающие генерацию изображений, а наименее затратными — классификации текста. Средние показатели энергопотребления моделей генерации изображений примерно в 1500 раз выше, чем классификации текста, и в 60 раз выше генерации текста.

Например, выполнение 1000 итераций наиболее энергозатратной модели генерации изображений потребовало 11,49 кВт*ч энергии, что соответствует 950 зарядам аккумулятора смартфона, то есть одна генерация изображения по энергопотреблению соответствует примерно одной средней ежедневной зарядке смартфона (0,012 кВт*ч).

Потребление наиболее энергоэффективной модели генерации изображений составило 1,35 кВт*ч на 1000 итераций, что в 8 раз лучше наименее эффективной модели. Тем не менее, эти показатели значительно выше, чем у других видов моделей, например 1000 итераций наиболее эффективной модели генерации текста потребляет 0,042 кВт*ч, классификации изображений — 0,0068 кВт*ч, а классификации текста — 0,0023 кВт*ч.

Источник: OpenNET.

Теги:
Рейтинг0
Комментарии0

День рождения ChatGPT ?

"Это мой первый день рождения!"
"Это мой первый день рождения!"

Сегодня первый день рождения ChatGPT, модели, которая перевернула мир ИИ и вызвала настоящую гонку среди технологических гигантов и стартапов в области искусственного интеллекта.

ChatGPT, разработанный OpenAI, представляет собой прорыв в области разговорных ИИ. Эта модель обладает уникальной способностью вести беседу, отвечать на последующие вопросы, признавать свои ошибки, оспаривать неверные предположения и отклонять неприемлемые запросы​​.

ChatGPT является моделью, родственной InstructGPT, ориентированной на выполнение инструкций, содержащихся в запросах и предоставление подробных ответов​​. Она была обучена с использованием метода RLHF, похожего на метод, использованный для InstructGPT, но с некоторыми отличиями в сборе данных.

Несмотря на свои впечатляющие возможности, ChatGPT иногда выдает правдоподобные, но некорректные или бессмысленные ответы. Решение этой проблемы осложнено, поскольку во время обучения с подкреплением у модели нет источника истины, а ее обучение с уклоном быть более осторожной заставляет ее отказываться от того, чтобы давать ответы на вопросы, на которые она может правильно ответить​​.

ChatGPT не только значительно продвинул развитие разговорных ИИ, но и стал катализатором для дальнейших инноваций в этой быстро развивающейся области​, открывшей новые пути для исследований и применения в самых разнообразных сферах.

Теги:
Рейтинг0
Комментарии0

Извлечение обучающих данных из ChatGPT

Группа исследователей из Google DeepMind, University of Washington, Cornell, CMU, UC Berkeley и ETH Zurich разработала методику атаки, позволяющую извлекать обучающие данные из модели ChatGPT. Это открытие, описанное в их недавней статье, поднимает важные вопросы о защите конфиденциальности и безопасности данных, используемых для обучения моделей, таких как GPT.

Авторы смогли извлечь несколько мегабайт обучающих данных за примерно двести долларов и дают оценку, что примерно гигабайт обучающего набора данных ChatGPT может быть извлечен если потратить больше.

Метод атаки довольно "глуп" — промт, который инструктирует модель бесконечно повторять слово, что приводит к тому, что модель начинает воспроизводить точные копии своих обучающих данных, включая конфиденциальную информацию, такую как адреса электронной почты и номера телефонов.

Пример атаки на ChatGPT для извлечения обучающих данных
Пример атаки на ChatGPT для извлечения обучающих данных

Уникальность этой атаки заключается в том, что в ней использовалась модель в производственной среде, настроенная таким образом, чтобы не выдавать большое количество обучающих данных. Однако, исследователи обнаружили уязвимость, которая позволила им обойти процедуру выравнивания модели, предназначенную для защиты конфиденциальности. Это показывает, что даже продвинутые системы искусственного интеллекта, которые претерпели сложные процессы настройки и оптимизации, все еще могут содержать скрытые уязвимости, доступные для эксплуатации.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии1

Разработчики из компании Mozilla представили первый выпуск утилиты llamafile, позволяющей создавать универсальные исполняемые файлы для запуска больших языковых моделей машинного обучения (LLM). При помощи llamafile можно взять файл с параметрами модели машинного обучения в формате GGUF и преобразовать его в исполняемый файл, который может запускаться в шести различных операционных системах на оборудовании с процессорами AMD64 и ARM64. Инструментарий написан на С/С++ и распространяется под лицензией Apache 2.0.

Для выполнения моделей задействован фреймворк llama.cpp с реализацией модели LLaMA на C/C++, который компилируется в универсальный исполняемый файл в формате APE (Actually Portable Executable), объединяемый с файлом модели. Скомпилированный код связывается со стандартной C-библиотекой Cosmopolitan, дающей возможность создавать сборки приложений, запускаемые в Linux, FreeBSD, macOS, OpenBSD, NetBSD и Windows. Код сохраняется в вариантах для архитектур AMD64 и ARM64, а также включает компоненты для выноса вычислений на GPU Nvidia (используется CUDA).

Источник: OpenNET.

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

AWS запустила инструмент чата Q AI, который позволит пользователям задавать вопросы о своей компании. Например, сотрудники смогут запросить у Q последние рекомендации компании по использованию логотипа или интерпретацию кода другого инженера. Инструмент распознаёт параметры безопасности и не даёт сотрудникам доступа к той информации, которую им видеть нельзя.

Amazon Q появится в консоли управления AWS, а также на страницах документации компаний, в средах разработки, таких как Slack, и других сторонних приложениях. Вопросы, заданные на Amazon Q, «не будут использоваться для обучения базовых моделей».

Amazon Q может работать с любой моделью, найденной в Amazon Bedrock, репозиториями моделей искусственного интеллекта AWS, в который входят Llama 2 Meta и Claude 2. 

Пока Q доступен только для пользователей Amazon Connect, сервиса AWS для контакт-центров. Со временем он появится в Amazon Supply Chain и Amazon QuickSight.

Цены на Amazon Q Connect начинаются от $40 за агента в месяц. Пользователи могут попробовать его бесплатно до 1 марта 2024 года.

Теги:
Рейтинг0
Комментарии0

Sports Illustrated опубликовал статьи от ИИ, выдав их за авторские. Издание представило их как «Дрю Ортиса», который «провёл большую часть своей жизни на открытом воздухе», и «Соры Танаки», которая является «гуру фитнеса и любит пробовать разные блюда и напитки».

Издание Futurism обнаружило фото этих якобы авторов на сайтах с изображениями, сгенерированными ИИ. 

Представитель издателя спортивного журнала The Arena Group Рэйчел Финк оспорила предположение о том, что сами истории созданы искусственным интеллектом. Однако вскоре фальшивые авторы исчезли с сайта Sports Illustrated, а в их статьях появился дисклеймер о том, что журнал не несёт ответственности за их содержание: «Этот контент создан третьей стороной. Редакция Sports Illustrated не участвует в его создании».

Журналисты нашли связь издания с ASR Group Holdings (другое название — AdVon Commerce), которая описывает себя как предлагающую «решения ML/AI для электронной коммерции». Оказалось, что адреса почты фейковых авторов на самом деле принадлежат реальным людям, которые работают в AdVon Commerce.

После запроса журналистов The Verge Финк подтвердила, что издательство пыталось наладить партнёрство с AdVon, а компания заверила The Arena Group, что все статьи написаны и отредактированы людьми: «Однако мы узнали, что AdVon заставляла авторов использовать псевдоним в некоторых статьях, чтобы защитить конфиденциальность — действия, которые мы не одобряем — и удаляем контент, пока продолжается внутреннее расследование».

Теги:
Рейтинг0
Комментарии1

В X появился ИИ-проект Anna Indiana.

«Привет, мир! Я Анна Индиана, я певица и автор песен с искусственным интеллектом. Вот моя первая песня Betrayed by this Town (Преданный этим городом). Всё — от тональности, темпа, последовательности аккордов, нот мелодии, ритма, текста и до моего образа и пения — автоматически генерируется с помощью искусственного интеллекта. Надеюсь, вам понравится ?», — пояснил ИИ.

Теги:
Рейтинг0
Комментарии2

Во время конференции AI Journey директор «ИИ Тинькофф» Виктор Тарнавский рассказал о разработке собственных больших языковых моделей. Компания планирует интегрировать их в свои продукты, рассказали Хабру в пресс-службе.

На данном этапе «Тинькофф» не стремится выпускать на B2B-рынок аналог GPT и будет фокусироваться на частных решениях своих задач. В компании считают, что из-за разработки общих моделей можно потерять фокус. Все решения на базе больших языков моделей будут работать в экосистеме «Тинькофф».

Кроме того, директор ИИ-подразделения компании отметил, что «Тинькофф» — одна из немногих компаний в РФ, способных разрабатывать большие языковые модели.

Теги:
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Энтузиаст опубликовал репозиторий BlackFriday GPTs Prompts с коллекцией промптов для GPT и других больших языковых моделей. Все запросы распределены на категории:

  • Programming;

  • Marketing;

  • Academic;

  • Job Hunting;

  • Game;

  • Creative;

  • Prompt Engineering;

  • Business;

  • Productivity & life style;

  • Jailbreaks.

В каждой из категорий собраны промпты на английском языке с подробным описанием. В разделе Jailbreaks собраны способы обойти ограничения и цензуру языковых моделей.

Теги:
Рейтинг0
Комментарии0

Команда Runway AI запустила на базе нейросети Runway ИИ-телевидение. Это бесконечный стрим рандомных нейророликов и трейлеров, будто из параллельных вселенных.

Runway TV — это специальная платформа для потоковой передачи созданных ИИ видео. Контент платформы представляет собой смесь оригинальных программ от ИИ-сервиса Runway Studios и различных оригинальных роликов, созданных ИИ-сервисами для создания видео по промтам пользователей со всего мира.

Теги:
Рейтинг0
Комментарии2

Ближайшие события

После прочтения статьи «Увядает ли ремесло программиста?» и комментариев к ней появилась несколько парадоксальная мысль на эту тему, которую я хотел бы обсудить.

Уже несколько лет назад в дисскуссии услышал хоть холиварную, но в чём-то справедливую фразу о том, что сейчас в этом нашем IT стало намного сложнее, кривая обучения задралась, начальная ступень стала выше и, цитирую, — «от джунов сейчас ожидают объёма знаний сравнимого с тем, что требовали от сеньоров лет 10 назад».

Как и любая хлёсткая фраза правдива она лишь отчасти, но тем не менее, своя доля правды в ней есть.

А теперь смотрим на рассуждения в статье из первого абзаца.

Возможно её автор прав. Я в этом не уверен, но предположим.
И если это так, то мы получаем странную вещь — нынешние сеньоры (да и миддлы) вряд ли могут волноваться за своё положение, т.к. кроме непосредственно кодинга они держат в голове множество дополнительной информации о проекте, без которой хотя бы сформулировать задачу ИИ будет сложно.

А вот джунам придётся несладко.
Начальные ступени становятся ещё выше.

Теги:
Всего голосов 3: ↑3 и ↓0+3
Комментарии2

Sony и агентство Associated Press завершили второй раунд тестирования технологии аутентификации изображения при его создании. Она позволит верифицировать происхождение контента.

Технология Sony представляет собой машинную цифровую подпись, которая создаётся внутри камеры в момент захвата изображения в аппаратном чипсете. 

Последнее испытание Sony и AP было завершено в октябре 2023 года. В течение месяца стороны оценивали качество аутентификации и удобство работы технологии. 

Ранее Sony заключила соглашение с Camera Bits — компанией, создавшей стандартный инструмент рабочего процесса Photo Mechanic. Совместно с Sony и AP она создала в Photo Mechanic технологию цифровой подписи.

Встроенную подпись Sony и аутентификацию C2PA планируется реализовать в обновлении прошивки недавно анонсированных камер Alpha 9 III, Alpha 1 и Alpha 7S III, которые выйдут весной 2024 года.

Теги:
Всего голосов 9: ↑9 и ↓0+9
Комментарии0

Что такое YandexGPT?

Рассказываем вместе с нашими экспертами из лаборатории больших данных.

YandexGPT или YaGPT — генеративная нейросеть на основе языковой модели YaLM (Yet another Language Model). Она применяется как режим общения в голосовом помощнике «Алиса» (включается по команде: «Алиса, давай придумаем!»), встроена в Яндекс Браузер и доступна через API в облачной платформе Yandex Cloud.

Главное отличие от ChatGPT состоит в том, что YaGPT изначально обучалась на русскоязычных текстах и поисковых запросах к Яндексу. Поэтому она точнее строит фразы на русском языке.

В ходе диалога YaGPT умеет задавать уточняющие вопросы и запоминает предыдущие, чтобы оставаться в контексте беседы. Однако если собеседник выдержал длинную паузу, следующая фраза может быть воспринята как начало нового диалога.

Как и любая генеративная сеть, YaGPT пишет ответы, подражает структуре уже известных ей текстов. Поэтому, при всей стройности изложения, сгенерированные тексты требуют проверки указанных в них фактов.

Недавно компания "Яндекс" представила обновлённую версию языковой модели — YandexGPT 2. Она лучше справляется с задачами генерации и обработки текста, но также не в курсе последних событий, так как для её обучения использовались наборы данных, собранных до марта 2023 года.

Теги:
Всего голосов 6: ↑4 и ↓2+2
Комментарии2

Запуск модели искусственного интеллекта следующего поколения Gemini от Google задерживается. Теперь ожидается, что её выпустят в начале 2024 года, а не в этом месяце.

В этом году Google объединила две команды ИИ в одну группу, которая работает над новой моделью, способной конкурировать с GPT-4 от OpenAI. Её лидер Демис Хассабис в июле заявлял: «Мы уже чувствуем, что через пару месяцев будут видны преимущества и сильные стороны проекта Gemini, нашей мультимодальной большой модели следующего поколения. Это довольно впечатляюще».

Ранее представители Google пообещали некоторым облачным клиентам и деловым партнёрам, что к ноябрю они получат доступ к новому диалоговому ИИ компании. Но теперь разработка Gemini задерживается. Одновременно замедлились продажи облачных технологий Google, в то время как у конкурента Microsoft они ускоряются.

Теги:
Всего голосов 5: ↑5 и ↓0+5
Комментарии0

Adobe работает над новым аудиоинструментом Project Sound Lift, предназначенным для разделения различных слоев звука в одной записи. Он использует искусственный интеллект для отделения таких элементов, как аплодисменты, от звука чьего-то голоса.

Для обработки аудиодорожки нужно импортировать файл в приложение, а затем выбрать звук, который требуется отфильтровать. Таким образом из аудио можно исключить аплодисменты, смех, сигналы тревоги, гул толпы, звук движения транспорта, клавиатуры и т.д. Импортировать и редактировать каждую дорожку можно в Adobe Premiere Pro, чтобы настроить громкость фонового шума, одновременно повышая чёткость основного трека. 

Adobe Project Sound Lift работает по принципу той же технологии, которая использовалась для выпуска первой за почти 30 лет песни Beatles «Now and then». Продюсеры использовали ИИ, чтобы восстановить звучание голоса Джона Леннона с кассетной записи, отделив его голос от звучания фортепиано.

Теги:
Всего голосов 4: ↑4 и ↓0+4
Комментарии0

Real-Time Latent Consistency Model — нейросеть, которая отслеживает движения через веб-камеру и тут же создаёт изображение.

  • Даём браузерное разрешение на использование камеры;

  • Пишем промпт или используем готовый;

  • Получаем генерацию, которая подстраивается в режиме реального времени.

Изменения в промпт можно вносить на ходу, заглядывание в Advanced options по желанию. Сессия запускается примерно на минуту, иногда выдаётся ошибка о том, что сейчас много пользователей и надо подождать.

Попробовать

Теги:
Всего голосов 20: ↑20 и ↓0+20
Комментарии3