28 сентября в офисе РСХБ-Интех на Теплом Стане пройдет митап для Data-специалистов — RSHB Data Integration Meetup. Приглашаем всех желающих послушать доклады, принять участие в обсуждениях и розыгрыше призов. Можно прийти на митап лично или зарегистрироваться на онлайн-трансляцию.
В программе:
Вячеслав Жуков, Aero — «Концепция Data Governance для систематизации работы с данными»
Антон Агеев, РСХБ-Интех — «Управление данными как шаг к применению искусственного интеллекта»
Павел Филонов, независимый консультант — «Как оценить влияние DS-метрик на итоговые бизнес-результаты проекта»
Участие в митапе бесплатное. Количество мест для офлайн-участия ограничено.
Amazon обновит Alexa инструментами генеративного искусственного интеллекта. Помощник теперь способен распознавать разговорные фразы и более эффективно интерпретировать контекст, а также выполнять несколько запросов с помощью одной команды.
Помощник теперь сможет реагировать на фразу вроде «Alexa, мне холодно», чтобы увеличить температуру на подключённом термостате. При добавлении нового устройства можно будет сказать: «Alexa, включи новый свет». В LLM внедрили более 200 API-интерфейсов для умного дома. Также помощник будет реагировать на команды вроде «Alexa, включи разбрызгиватели, открой дверь моего гаража и выключи внешнее освещение».
Amazon также выпустила два инструмента, которые позволяют Alexa контролировать некоторые уникальные функции продуктов сторонних производителей, которые необязательно входят в набор инструментов экосистемы умного дома самой компании. Это функции динамического контроллера и контроллера действий. Первая позволит более естественно отображать такие функции, как предварительно созданные сцены для управления освещением. Вторая позволит разработчикам добавлять простые действия, на которые будет реагировать Alexa.
Amazon уже работает над этими функциями с GE Cync, Philips, GE Appliances, iRobot, Roborock и Xiaomi и открывает программу для большего числа разработчиков.
Пока компания будет внедрять новые функции постепенно и только в США для пользователей Echo. Новую версию Alexa решили сделать платной.
Через два дня пройдет масштабная конференция Selectel Tech Day 2023, посвященная IT-инфраструктуре для бизнеса. Ожидаете мероприятие так же, как и мы? Тогда самое время познакомиться со спикерами и темами их докладов.
В своих разработках «Криптонит» активно использует искусственные нейронные сети. Поэтому мы решили расшифровать связанные с этой сферой термины и их практический смысл. Все материалы из рубрики "Нейрословарь" подготовлены при помощи наших экспертов из лаборатории больших данных.
Self-Supervised Learning или магия самообучения. Способность нейросетей к самообучению выглядит фантастически, но на самом деле это всего лишь метод ML, основанный на избыточности данных. В отличие от классического подхода «обучение с учителем», здесь не требуются аннотированные человеком примеры (размеченные изображения, проверенные фрагменты текста и т.д.).
В парадигме self-supervised learning нейросеть учится на «сырых» (немаркированных) данных. Она сама расставляет метки при первом прогоне обучающей выборки, а затем использует их на следующих этапах обучения. Обычно для достижения сравнимого результата при самообучении требуется в разы больше данных, поэтому метод неприменим для автоматической классификации редких событий. Зато он удобен в тех случаях, когда можно дать ИИ массу однотипных примеров.
Иногда словосочетание self-supervised learning сокращается до SSL, но из контекста обычно понятно, когда речь идёт о самообучении, а когда о Secure Sockets Layer. Впрочем, ИИ уже применяют для анализа трафика, поэтому фраза «SSL для SSL» тоже не лишена смысла.
PS: Какие еще термины из сферы ИИ нам еще раскрыть? Пишите в комментариях!
Что изменилось на рынке IT-инфраструктуры в 2023 году?
Уже в следующий четверг, 21 сентября, мы соберемся на Selectel Tech Day 2023 — масштабной конференции про IT-инфраструктуру для бизнеса. Расскажем о новинках серверного рынка, поделимся опытом коллег из Ostrovok.ru, X5 Group, ПИК и Luntry. А также эксклюзивно анонсируем обновления в наших продуктах.
Кому не нужен Kubernetes? Как подобрать инфраструктуру под ML-проекты? Какое аппаратное оборудование доступно на рынке и насколько оно вам подойдет? Выбирайте из 17 докладов на актуальные темы и подключайтесь к онлайн-трансляции.
Не так давно появился функционал в браузерном Chat GPT. Это "Custom instructions" (пользовательские инструкции)
Чтобы в неё попасть, нужно: Нажать на своё имя или иконку (слева снизу) -> выбрать пункт "Custom instructions"
"Custom instructions" - это преднастройка чата. Она поделена на 2 части: 1) Описание того, что Chat GPT должен всегда помнить. 2) Какой ответ должен быть (формат, длинна, нужно ли его мнение и тд.)
1) "Описание того, что Chat GPT должен всегда помнить." - мы пишем то, что Chat GPT всегда должен помнить при общении с нами. Например: * как меня зовут * когда я родился * где я живу * чем я занимаюсь * кто такой для нас Chat GPT Это только примеры, вы можете придумать что-то своё.
Это должен быть рассказ от первого лица: "Меня зовут Роман, я живу в Москве. Теперь тебя зовут Бот Савелий"
2) "Какой ответ должен быть" - это описание того, каким должен быть ответ Chat GPT. Мы можем задать характер, стиль, длину и так далее, тут уже всё, что вы придумает, и на основе этих параметров и будет формироваться ответ. Например: "Отвечай как детская сказка"
? Все параметры будут применены только на новый чат!
По итогу, нам добавили механизм, для сохранения контекста при общении с Chat GPT.
Это будет крайне полезно тем, кто часто просит Chat GPT об одном и том же, или просто хотите персональное общение, не повторяя одни и те же сведения о себе.
Подписывайтесь на мой канал в Telegram, где я расскажу вам как работать с Chat GPT более профессионально!
Инженер и сооснователь компании Glean Дебаргья Дас поделился утечкой с расценками на ChatGPT Enterprise. Недавно, в конце августа, OpenAI объявила о новом тарифе на свои продукты, но стоимость на назвала. Вместо этого была применена излюбленная у гуру продаж тактика «цена по запросу».
Согласно твиту Дебаргья, OpenAI готова предоставить тариф Enterprise, если клиент хочет купить подписку на год от $100 тыс. В утечке нет точной формулы ценообразования. Зато названы два значения: $60 за пользователя в месяц, если их в организации 150, или $250 за каждого в месяц, если пользователей 50.
Также Дебаргья сообщает, что цена опускается даже ниже, но явно не меньше $20 за пользователя в месяц.
Выгоднее это или нет, чем платить за API по факту использования? Зависит от конкретных сценариев. Пример дорогого, но реалистично небольшого запроса к сервисам OpenAI: всего лишь один ответ на 2000 токенов с вводом в систему 20 000 токенов в GPT-4 32К обойдётся в почти полтора доллара (20·0,06 + 2·0,12 = 1,44). С другой стороны, запросы в «младшего брата» GPT-3.5 Turbo 4К дешевле в сорок с лишним раз, а много на контекст в модели на 4 тысячи токенов потратить просто не получится.
Можно ли самому написать нейросеть? Яндекс Практикум проводит бесплатный вебинар
Чтобы ответить на этот вопрос, мы позвали Ивана Ключникова — автора Youtube-канала «Уже Наступило». Его научпоп-ролики набирают сотни тысяч просмотров, и всё благодаря способности Ивана объяснять сложные штуки — такие как прыжки во времени или квантовую запутанность — просто и наглядно. Именно так он расскажет и про нейросети.
Гендиректор Amazon Энди Джасси заявил, что компания работает над генеративным искусственным интеллектом.
«Внутри Amazon каждая из наших команд работает над созданием генеративных ИИ-приложений, которые заново изобретают и улучшают опыт клиентов», — отметил он в ходе отчёта о доходах за второй квартал 2023 года.
Джасси также рассказал о некоторых продуктах AWS в области генеративного искусственного интеллекта, в том числе чипах AWS Inferentia и сервисе Amazon Bedrock.
AWS Inferentia разработаны для обеспечения высокой производительности при работе с приложениями на основе глубокого обучения. Такой чип обеспечивает работу инстансов Amazon Elastic Compute Cloud (Amazon EC2) Inf1, которые дают до 2,3 раз более высокую пропускную способность и до 70% более низкую стоимость вывода по сравнению с инстансами Amazon EC2.
Agents for Bedrock позволит компаниям создавать приложения с искусственным интеллектом, которые могут автоматически выполнять задачи самостоятельно, например, бронировать рейс для пользователей. Разработчик может выбрать, какую базовую модель использовать, предоставить ей некоторые инструкции и задать данные, которые она будет считывать.
Сбер выложил в открытый доступ модели, по которым работает их GPT-система. Это значит, что теперь можно будет запустить GPT на своих ресурсах, который будет работать в чате GPT без привязки к сторонним системам. Возможно он будет работать не так круто, как ChatGPT, но для экспериментов самое то!
Более того, я уже нашел несколько видео, в которых рассказывается о том, как эти модели можно дообучить для работы по заранее заготовленным сценариям. Интересно, что эти видео были выложены в сеть еще более двух лет назад.
Уже интересно — смогу-ли я интегрировать эту модель внутрь своего бота. Мой бот уже отлично умеет выделять команды, которые я ему сообщил. Но пока еще приходится использовать api от openai для того, чтобы обрабатывать запросы, где нужно поработать с сырым текстом и извлечь из него что-то полезное.
Я поставил качаться эти модели и может дойду, в ближайшие дни, до попытки их применить — может даже что-то получится. Интересно то, что ее можно дообучить под свои нужды и использовать уже свою отдельно развернутую на своем сервере систему типа ChatGPT.
Google готовит ИИ-инструмент Genesis для журналистов. Его уже продемонстрировали руководителям Times, Washington Post и владельцу Wall Street Journal News Corp. Компания позиционирует Genesis как «ответственную» технологию, которая генерирует информацию для статьи из разных источников
Представитель Google Дженн Крайдер заявила, что компания вместе со СМИ пока находится «на самых ранних стадиях изучения идей инструментов с поддержкой ИИ, чтобы помочь журналистам в их работе».
Как отмечают в редакциях, ИИ может быть полезен при выборе стиля материала, заголовка или поможет составлять головоломки. Однако журналисты по-прежнему считают, что время, которое они затрачивают на подготовку статьи и проверку фактов, оправданно.
Вероятно, это будет экспериментальная функция Labs. Например, посетители браузера смогут взаимодействовать с интерфейсом ChatGPT, не переходя на сайт. Они смогут менять настройки и даже выбирать модель ChatGPT. Возможно также, что пользователи смогут вызывать чат-бот на веб-страницах для создания их сводок.
Интеграция ChatGPT в настоящее время не работает в приложении Samsung Internet Browser, но для браузера доступны сторонние плагины.
Ранее сообщалось, что Samsung решила перейти с поиска Google по умолчанию на Microsoft Bing. Однако компания, по-видимому, отказалась от этого шага. Также Samsung запрещала использовать ChatGPT своим сотрудникам и даже начала разрабатывать свою версию ИИ.
В продолжение к прошлому посту про нейросети. Нашел еще крутое применение такого подхода — строить диаграммы очередей голосом.
Я также наговорил текстом что именно я хочу визуализировать, после чего попросил GPT отдать мне уже причесанный mermaid формат (вот пример) того что я наговорил.
В ответ GPT, не с первого раза, но выдал мне код для диаграммы очередей, который я могу уже вставлять внутрь своей документации.
Пример диаграммы очередей
В качестве картинки приложил диаграмму очередей, которую придумал на ходу и реализовал за 1.5 минуты! Ранее на подобное ушло бы минут 5 точно.
Я, без преувеличения, в восторге. Теперь визуальные составляющие документации можно рисовать гораздо быстрее!
Я тестирую новый подход к созданию текстового контента. Раньше я просто писал посты, редактировал их, удалял лишнее, перефразировал и затем публиковал их в своем Telegram-канале, блоге или в любом другом месте, где хотел опубликовать что-то.
Но теперь я нашел новый способ, который мне очень понравился, и решил поделиться им с вами.
Я включаю запись голосового сообщения в Телеграме в переписке с (пока что) бесплатным ботом Сбера и просто говорю текст, который хочу увидеть в итоговом результате. Я произношу текст как есть, не обращая внимания на паразитные слова и оговорки.
Затем я получаю текст от бота и передаю его в любой GPT, указывая, что нужно удалить паразитные слова, отформатировать и структурировать текст, добавить пунктуацию. В результате GPT возвращает мне отредактированный текст, который, конечно же, требует внимательной проверки и дополнительной правки.
Править существующий текст куда быстрее чем писать текст с нуля — в моем случае мысль голосом выразить быстрее чем писать текстом.
Этот пост, кстати, я написал именно таким способом, и я очень доволен результатом. От идеи до поста 5 минут.
Как будет время и этот процесс автоматизирую, чтобы я просто наговаривал текст своему боту, а он его конвертировал в пост внутри Notion, а дальше уже я руками приводил его в порядок.
Автор проекта «Ай, гитарист!» заставляет легенд русского рока — с помощью машинного обучения, конечно — исполнять такие песни, которые сильно отличаются от обычного репертуара обладателей голосов.
Основная активность проекта идёт в сообществе «ВКонтакте» и на канале Telegram. Собственно работы публикуются там же и на канале YouTube, но в виде шортов. Первый видеоролик в формате собственно видео вышел два дня назад — это был трёхминутный кавер «Знаешь ли ты» певицы МакSим, но выполненный характерным рыком Егора Летова.
Подобное изрядно удивило качеством, например, известного преподавателя игры на гитаре Юрия Шильникова. В хайлайте стрима он отметил, что получилось неплохо, «роботичности» голоса не слышно.
Нейросетевые модели автор «Ай, гитариста!» поначалу скачивал, а позднее взялся тренировать сам. В скриншотах из «гримёрки» заметен локальный веб-интерфейс от RVC — пакета для преобразования голоса в реальном времени. Для работы RVC нужна либо готовая модель, либо тренировка весов нейросети на относительно небольшом датасете (от 10 до 50 минут).
Adobe научила свою нейросеть Firefly генерировать картинки по запросу на русском языке. Компания расширила языковую поддержку в своих генеративных моделях искусственного интеллекта Firefly, добавив в том числе русский язык.
Нейросеть создаёт изображения по текстовому описанию, как это делают аналогичные ИИ. Она вшита в бета-версию Photoshop, что позволяет редактировать изображения по текстовым запросам.
Помимо русского, Adobe добавила поддержку ещё 19 языков, в том числе французского, немецкого, японского, испанского и бразильской версии португальского. Теперь нейросеть поддерживает 100 языков.
Протестировать нововведение возможно в веб-версии, в России она доступна только с помощью VPN.
Google работала над чат-ботом для поколения Z под названием «Bubble Characters», но позже отказалась от этой идеи, сообщили СМИ. В чат-боте должны были использоваться интерактивные цифровые персонажи.
Теперь компания «уменьшила приоритет» разработки в связи с внутренней реорганизацией. Обычно, когда это происходит, работа над продуктом прекращается.
Google работала над Bubble Characters с четвёртого квартала 2021 года. В описании приложения говорится, что в нём будут представлены «человеческие» темы, «интересные для поколения Z». В одном из примеров мультипликационный персонаж давал советы на тему отношений.
Теперь же членов команды Bubble Characters попросили приостановить свою работу над приложением, чтобы поработать над чат-ботом Bard.
Генерации изображений генеративно-состязательными сетями (GAN) и вариационные автокодировщиками (VAE)
Решения задач обработки текста (NLP, NLU, NLG) моделями Sequence-to-sequence и Transformers
Обучение с подкреплением алгоритми Q-learning, Reinforce
Обнаружение объектов (Object Detection). Модели YOLOv3 и RetinaNet
Обработка аудио. Распознавание и генерация речи (SpeechToText, TextToSpeech)
Каждый раздел состоит из математических основ, практических занятий и лабораторных работ в основном на Keras и TensorFlow. Курс дает отличную базу, мне очень понравилось.
К недостаткам курса можно отнести отсутствие разборов современных маркетингового-продуктовых задач: динамическое ценообразование, ранжирование и матчинг товаров, UPLIFT моделирование, A/B-тестирование с ML