Обновить
1380.15

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга

В продолжение к прошлому посту про нейросети. Нашел еще крутое применение такого подхода — строить диаграммы очередей голосом.

Я также наговорил текстом что именно я хочу визуализировать, после чего попросил GPT отдать мне уже причесанный mermaid формат (вот пример) того что я наговорил.

В ответ GPT, не с первого раза, но выдал мне код для диаграммы очередей, который я могу уже вставлять внутрь своей документации.

Пример диаграммы очередей
Пример диаграммы очередей

В качестве картинки приложил диаграмму очередей, которую придумал на ходу и реализовал за 1.5 минуты! Ранее на подобное ушло бы минут 5 точно.

Я, без преувеличения, в восторге. Теперь визуальные составляющие документации можно рисовать гораздо быстрее!

Рейтинг0
Комментарии0

Я тестирую новый подход к созданию текстового контента. Раньше я просто писал посты, редактировал их, удалял лишнее, перефразировал и затем публиковал их в своем Telegram-канале, блоге или в любом другом месте, где хотел опубликовать что-то.

Но теперь я нашел новый способ, который мне очень понравился, и решил поделиться им с вами.

Я включаю запись голосового сообщения в Телеграме в переписке с (пока что) бесплатным ботом Сбера и просто говорю текст, который хочу увидеть в итоговом результате. Я произношу текст как есть, не обращая внимания на паразитные слова и оговорки.

Затем я получаю текст от бота и передаю его в любой GPT, указывая, что нужно удалить паразитные слова, отформатировать и структурировать текст, добавить пунктуацию. В результате GPT возвращает мне отредактированный текст, который, конечно же, требует внимательной проверки и дополнительной правки.

Править существующий текст куда быстрее чем писать текст с нуля — в моем случае мысль голосом выразить быстрее чем писать текстом.

Этот пост, кстати, я написал именно таким способом, и я очень доволен результатом. От идеи до поста 5 минут.

Как будет время и этот процесс автоматизирую, чтобы я просто наговаривал текст своему боту, а он его конвертировал в пост внутри Notion, а дальше уже я руками приводил его в порядок.

Всего голосов 7: ↑7 и ↓0+7
Комментарии5

Автор проекта «Ай, гитарист!» заставляет легенд русского рока — с помощью машинного обучения, конечно — исполнять такие песни, которые сильно отличаются от обычного репертуара обладателей голосов.

Основная активность проекта идёт в сообществе «ВКонтакте» и на канале Telegram. Собственно работы публикуются там же и на канале YouTube, но в виде шортов. Первый видеоролик в формате собственно видео вышел два дня назад — это был трёхминутный кавер «Знаешь ли ты» певицы МакSим, но выполненный характерным рыком Егора Летова.

Подобное изрядно удивило качеством, например, известного преподавателя игры на гитаре Юрия Шильникова. В хайлайте стрима он отметил, что получилось неплохо, «роботичности» голоса не слышно.

Нейросетевые модели автор «Ай, гитариста!» поначалу скачивал, а позднее взялся тренировать сам. В скриншотах из «гримёрки» заметен локальный веб-интерфейс от RVC — пакета для преобразования голоса в реальном времени. Для работы RVC нужна либо готовая модель, либо тренировка весов нейросети на относительно небольшом датасете (от 10 до 50 минут).

Всего голосов 10: ↑10 и ↓0+10
Комментарии0

Adobe научила свою нейросеть Firefly генерировать картинки по запросу на русском языке. Компания расширила языковую поддержку в своих генеративных моделях искусственного интеллекта Firefly, добавив в том числе русский язык.

Нейросеть создаёт изображения по текстовому описанию, как это делают аналогичные ИИ. Она вшита в бета-версию Photoshop, что позволяет редактировать изображения по текстовым запросам.

Помимо русского, Adobe добавила поддержку ещё 19 языков, в том числе французского, немецкого, японского, испанского и бразильской версии португальского. Теперь нейросеть поддерживает 100 языков.

Протестировать нововведение возможно в веб-версии, в России она доступна только с помощью VPN.

Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Google работала над чат-ботом для поколения Z под названием «Bubble Characters», но позже отказалась от этой идеи, сообщили СМИ. В чат-боте должны были использоваться интерактивные цифровые персонажи.

Теперь компания «уменьшила приоритет» разработки в связи с внутренней реорганизацией. Обычно, когда это происходит, работа над продуктом прекращается.

Google работала над Bubble Characters с четвёртого квартала 2021 года. В описании приложения говорится, что в нём будут представлены «человеческие» темы, «интересные для поколения Z». В одном из примеров мультипликационный персонаж давал советы на тему отношений.

Теперь же членов команды Bubble Characters попросили приостановить свою работу над приложением, чтобы поработать над чат-ботом Bard.

Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Закончил отличный 9 месячный курс "Data science и нейронные сети". Рекомендую https://neural-university.ru/data-science_new

Курс охватывает множество современных задач и архитектур:

  1. Решение задач классификации, регрессии и авторегрессии, прогнозирование временных рядов

  2. Распознавания изображений сверточными нейронными сетями (CNN)

  3. Генерации изображений генеративно-состязательными сетями (GAN) и вариационные автокодировщиками (VAE)

  4. Решения задач обработки текста (NLP, NLU, NLG) моделями Sequence-to-sequence и Transformers

  5. Обучение с подкреплением алгоритми Q-learning, Reinforce

  6. Обнаружение объектов (Object Detection). Модели YOLOv3 и RetinaNet

  7. Обработка аудио. Распознавание и генерация речи (SpeechToText, TextToSpeech)

Каждый раздел состоит из математических основ, практических занятий и лабораторных работ в основном на Keras и TensorFlow. Курс дает отличную базу, мне очень понравилось.

К недостаткам курса можно отнести отсутствие разборов современных маркетингового-продуктовых задач: динамическое ценообразование, ранжирование и матчинг товаров, UPLIFT моделирование, A/B-тестирование с ML

Рейтинг0
Комментарии0

В английском языке, по разным оценкам от 150 до 450 тысяч слов (по данным Google), но GPT-3 знает только 50 000 слов. При этом для нас это совершенно не заметно. В чем здесь секрет? 

GPT фактически работает на подсловах (= токенах) вместо слов.

В качестве примера возьмем слово «экстраординарный», GPT услышит [«экстра», «ординарный»]. Точно так же «гидроэлектростанция» будет звучать как [«гидро», «электро», «странция»].

Это позволяет GPT свободно общаться сохраняя в памяти ограниченный словарный запас.

Это также позволяет ему адаптироваться к новым словам, которые он никогда не видел в процессе обучения.

Например: 

Я: «Что значит trumpified?»

GPT-3: «Термин «trumpified» (трампифицированный) не определен на момент прекращения моих знаний в сентябре 2021 года. Однако, учитывая контекст, если кто-то говорит, что он был «трампифицированным», это может означать, что он стал сторонником или последователь Дональда Трампа и его политических идеологий».

Вообще, процесс обучения ИИ крайне похож на процесс нашего обучения. Здесь достаточно много логики, а не просто работа с готовыми фактами. 

Проверить как это выглядит можно здесь: https://lnkd.in/dSXmc7XE

Всего голосов 2: ↑2 и ↓0+2
Комментарии0

DeepMind утверждает, что следующий чат-бот компании будет конкурировать с ChatGPT или даже превосходить модель OpenAI.

DeepMind использует методы AlphaGo, системы искусственного интеллекта, которая первой победила профессионального игрока-человека в настольной игре Go, чтобы создать конкурирующего чат-бота под названием Gemini.

Если всё пойдёт по плану, Gemini сможет планировать или решать проблемы, а также анализировать текст.

Чат-бот будет использовать инновации в обучении с подкреплением для выполнения задач, с которыми сталкиваются сегодняшние языковые модели. 

В разработке Gemini принимают участие топ-сотрудники Google, включая Джеффа Дина, руководителя по исследованиям в области искусственного интеллекта.

Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Хидео Кодзима (Hideo Kojima) не боится искусственного интеллекта. На премьере посвященного гейм-дизайнеру документального фильма он рассказал, что ИИ не удастся «взять верх» над человечеством.

Тем не менее, глава Kojima Productions отметил, что он не против использования ИИ в создании игр. Как считает Кодзима, подобные технологии позволят ускорить разработку и вдвое сократить команду, однако кто-то по-прежнему должен будет руководить процессом и давать указания ИИ. Если же ИИ перестанет слушаться, то Кодзима пообещал «выпотрошить» его.

Рейтинг0
Комментарии0

Всеанглийский клуб лаун-тенниса и крокета (AELTC) будет использовать систему ИИ от IBM, чтобы комментировать матчи Уимблдона в этом году. Однако прямой эфир по-прежнему будут освещать люди.

ИИ будет озвучивать видеоролики с нарезкой основных моментов теннисных матчей.

Система уже отображает статистические данные каждого участника и определяет игроков, которые станут фаворитами матча или всего турнира. Комментарии и субтитры будут доступны на английском языке для мужских и женских одиночных матчей Уимблдона. Оценить работу ИИ можно будет на официальном сайте Уимблдона и в мобильном приложении.

Также в этом году искусственный интеллект начнёт проводить анализ результатов жеребьёвки и определять варианты победы для каждого участника турнира. Он будет учитывать мировой рейтинг и посев, историю матчей между игроками, результаты травяных кортов, недавние травмы и другие факторы.

В будущем эту технологию планируют использовать и для освещения матчей, которые в настоящее время не комментируются людьми.

Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Project Tailwind от Google скоро будет доступен в раннем доступе — и под новым названием. По крайней мере, так говорится в уведомлении на веб-сайте Project Tailwind. Компания представила экспериментальный ноутбук с искусственным интеллектом на выставке Google I/O в этом году.

В Google пояснили, что Tailwind — это первый ноутбук с искусственным интеллектом, основанный на информации, которую пользователь выбирает и которой доверяет.

Рейтинг0
Комментарии0

На Петербургский международный экономический форум (ПМЭФ-2023) пройдёт презентация нейросети «Жириновский», сообщили РИА Новости.

Сообщается, что работы по созданию искусственного интеллекта «Жириновский» идут полным ходом. Данные загружены, алгоритм уже функционирует и уже идёт стадия обучения и тестирования. Суммарно за два месяца было обработано порядка терабайта видео, текстов, изображений. С ИИ уже можно общаться.

15 июня 2023 года на ПМЭФ-2023 состоится презентация нейросети. Задача ИИ «Жириновский» обозначена как исключительно просветительская. ПМЭФ-2023 пройдет 14–17 июня.

Всего голосов 6: ↑6 и ↓0+6
Комментарии0

Открываем новые возможности с ChatGPT и инженерией запросов

Всем привет! В этом посте хочется поделиться уникальным курсом от Исы Фулфорд (OpenAI) и Эндрю Ына (DeepLearning.AI) под названием "ChatGPT Prompt Engineering for Developers".

На этом курсе можно окунутся в удивительный мир больших языковых моделей (LLM) и узнать, как быстро создавать новые полезные приложения с их помощью. Благодаря API OpenAI можно научиться:

  • Кратко излагать (например, суммаризировать отзывы пользователей)

  • Извлекать информацию (например, классификация по настроению, извлечение тем)

  • Трансформировать текст (перевод, исправление орфографии и грамматики)

  • Расширять (например, автоматическое написание электронных писем)

Курс также затрагивает два ключевых принципа создания эффективных запросов, способы систематической разработки хороших запросов и создания собственного чат-бота. Про создание собственного чат-бота писал ранее в этом туториале.

Чтобы закрепить полученные знания, на курсе предоставляются наглядные примеры, с которыми можно поработать прямо в среде Jupyter notebook.

Курс подходит для начинающих. Для участия требуется лишь базовое знание Python. Однако этот курс также подойдет для опытных инженеров машинного обучения, стремящихся изучить передовые методы использования моделей LLM.

Не упустите свой шанс обучиться этому захватывающему направлению и выполнять разнообразные задачи с помощью умений инженерии запросов. Успехов! ?

Всего голосов 3: ↑3 и ↓0+3
Комментарии1

Ближайшие события

Зенон Элейский vs ChatGPT, или антиномии ИИ

"Другая форма этой антиномии относится к контекстам, необходимым для понимания выражений естественного языка. Чтобы обрабатывать информацию на естественном языке — это понимают все специалисты, занимающиеся автоматическим переводом и созданием формализованных языков, пригодных для описания всё новых предметных областей, — надо учитывать контексты. Именно контекст даёт понимание, но его тоже надо понять, значит, необходимо привлечь более широкий контекст, и т.д. до бесконечности, либо до некоторого окончательного контекста. Последний, однако, сразу ограничит возможности "понимания" кибернетической системой воспринимаемых ею текстов.

В этих своих формах данные антиномии — их можно назвать антиномиями "искусственного интеллекта" — напоминают апорию Зенона по которой получается, что движение никогда не может начинаться, так как, чтобы пройти 100 стадий, надо пройти сначала 50 стадий, а для этого надо сначала пройти 25 стадий и т.д." — Бирюков Б.В. О возможностях "искусственного интеллекта" (1979)

Забавно, что, по всей видимости, ChatGPT способен "обойти" это противоречие, "придумывая" несуществующие факты.

Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Воровство картинок для обучения ИИ выходит на новый уровень. Если раньше фотографии и иллюстрации просто брали без спроса (и оплаты) со стоков и личных сайтов, то теперь автору ещё и счёт могут предъявить. Звучит, как бред? Если бы…

С такой ситуацией реально столкнулся фотограф Роберт Кнешке. Он воспользовался сайтом, который позволяет проверить, не использовались ли ваши работы для обучения нейросетей. Оказалось, что его фото присутствуют в наборе данных LAION, некоммерческой организации, которая создает крупномасштабные модели машинного обучения.

Кнешке попросил LAION удалить его работу из данных обучения. Ответ был внезапным. Компания утверждает, что проводит добровольные исследования в области искусственного интеллекта и делает их доступными для широкой публики. Они используют боты-краулеры для сбора изображений, находящихся в общем доступе. А это, якобы, не нарушает закон об авторском праве (нет).

И этим бы могло ограничиться, но LAION пошли дальше. Они натравили на фотографа своего юриста, который потребовал возмещение ущерба в размере 900 евро, в соответствии с разделом 97a (4) UrhG. Фотографии они благополучно продолжают использовать.

Сгенерировано в Kandinsky 2.1
Сгенерировано в Kandinsky 2.1

Роберт Кнешке думает об ответном судебном иске.

Всего голосов 9: ↑9 и ↓0+9
Комментарии3

В РПЦ предлагают ввести запрет на антропоморфизацию программ и законодательно принудить вешать дисклеймер для нейросетей, указывающий на то, что человек общается с ИИ. Предложение озвучил иерей Фёдор Лукьянов (отец Фёдор) на круглом столе, посвящённом обсуждению правового регулирования и применения нейросетевых технологий в НИУ ВШЭ.

Также отец Фёдор предложил ввести ответственность для разработчиков за содержание информации, транслируемой нейросетью, как это сделали в Китае, где подобная ответственность закреплена в административном и в уголовном законодательствах. Несовершеннолетним вообще предложено ограничить доступ к нейросетям. В свою очередь, ChatGPT необходимо локализовать под российскую вычислительную инфраструктуру и телекоммуникационные сети, считает отец Фёдор. По его словам, страны Запада строят свои нейросети на основе собственной этики, которая может расходиться с российской.

Член комитета ТПП РФ по предпринимательству в сфере медиакоммуникаций Павел Катков указал, что реализовать предложения отца Фёдора технически возможно, но это может ослабить конкурентоспособность отечественных нейросетей.

Всего голосов 15: ↑15 и ↓0+15
Комментарии1

Как-то я делал Телеграм бота на Wolfram Language (WL) для выполнения кода. Взаимодействие с ботом получается интереснее, если его добавить в групповой чат. Теперь я хочу поделиться тем, как сделать бота для обращения к OpenAI.

Установка Wolfram Engine:

winget install WolframEngine

Запускаем ядро и выполняем:

PacletInstall["CristopherWolfram/OpenAILink"]; 
PacletInstall["KirillBelov/Objects"]; 
PacletInstall["KirillBelov/TelegramBot"]; 

Импортируем пакеты:

<<KirillBelov`TelegramBot`
<<ChristopherWolfram`OpenAILink`

Теперь реализуем доступ к gpt-3.5-turbo от OpenAI:

chatGPT[chatId_, text_String] := 
Module[{userMsg, botMsg, chat}, 
 If[Not[KeyExistsQ[$chats, chatId]], $chats[chatId] = {}]; 
 chat = $chats[chatId]; 
 AppendTo[chat,  userMsg = OpenAIChatMessageObject["user", text]];   
 botMsg = Check[
  OpenAIChatComplete[chat], 
  chat = {userMsg}; 
  OpenAIChatComplete[chat]
 ]; 
 $chats[chatId] = Append[chat, botMsg]; 
 botMsg[[-1, "Text"]]
]

Обработчик сообщений из Telegram:

handler[bot_TelegramBot, update_Association] := 
Module[{user, chatId, text, result}, 
 chatId = update["message", "chat", "id"]; 
 text = update["message", "text"]; 
 sendMessage[bot, chatId, chatGPT[chatId, text]]; 
]

Осталось только запустить нашего бота:

$chats = <||>; 
$OpenAIKey = "your_key"; 
wlgptbot = TelegramBot["your_token"]; 
task = CreateBotSession[wlgptbot, handler, {5, 100000}]; 

Готово! Изначально я сделал этого бота для группы по Mathematica и решил поделиться здесь.

Всего голосов 4: ↑4 и ↓0+4
Комментарии2

Весь вечер баловался с плагином для Photoshop — Stable.art, оказалось очень полезно и увлекательно. Плагин позволяет не выходя из Photoshop генерировать и подтягивать изображения из Stable Diffusion.

Конечно пока всё работает сыровато (либо руки у меня растут не из того места), периодически сгенерированное изображение плохо стыкуется с текущей основой и приходится подчищать в ручную. Однако качество полученного результата и ощутимая экономия моего времени определенно радуют. Вот мой пример, как всего за 2 минуты можно сгенерировать мордочку для яблока.

Инструменты:

Понимаю, многие могут сказать: «Всё тоже самое можно сделать в самом Stable Diffusion в режиме „inpaint“, вообще не прибегая к Photoshop». Лично мне понравилось, что можно не покидать Photoshop, сгенерировать новое изображения, при этом не совершая дополнительных манипуляций с копированием/сохранением файла. В любом случае, это уже хороший шаг вперед к слиянию двух инструментов.

Если вы уже попробовали Stable.art — пишите ваше впечатление в комментариях.

Теги:
Всего голосов 38: ↑38 и ↓0+40
Комментарии4

Буду ли я пророком если напишу тут сей факт что посты заполонят генеративные ответы от нейросетей подобия ChatGPT и сможете ли вы распознать написано ли это сообщение сейчас человеком или я генератор текста?

Всего голосов 12: ↑4 и ↓8-4
Комментарии2
12 ...
68

Вклад авторов