Дизайнерам на заметку. Разработчик подружил GPT-4o c Figma. Оцените мощь — модель генерирует детальные и оптимизированные интерфейсы с кучей слоёв и элементов, используя обычное ТЗ. Такого уровня нейронки добились впервые.
С этим плагином Figma будет дизайнить сама по себе — нужно лишь закинуть документ с описанием продукта и нужную библиотеку элементов.
Глава стартапа xAI Илон Маск сообщил инвесторам о планах создания суперкомпьютера для новой версии чат-бота Grok, пишет Information. Бизнесмен заявил, что проект будет завершён к осени 2025 года.
Суперкомпьютер, называемый Маском «гигафабрикой вычислений», будет использовать десятки тысяч графических процессоров Nvidia H100. Для обучения Grok 2.0 применяют около 20 тыс. графических процессоров, а для новой итерации чат-бота потребуется в пять раз больше. Маск заверил инвесторов, что планируемый кластер графических процессоров будет минимум в четыре раза крупнее того объёма, который используют конкуренты xAI.
Сейчас Grok находится в версии 1.5, которая вышла в апреле. Разработчик указывает, что инструмент способен обрабатывать не только текст, но и визуальную информацию, включая фотографии, скриншоты, диаграммы и многое другое. В мае социальная сеть X начала выпускать сводки новостей, созданных при помощи ИИ на базе Grok, для премиальных пользователей.
ИИ-помощник от Google предложил пользователю в ответ на запрос «сколько камней мне нужно есть?» такой ответ: «по меньшей мере один маленький камень ежедневно».
Ранее пользователь из США не смог приготовить пиццу так, чтобы сыр нормально на ней держался. Gemini, встроенная в поиск Google, предложила ему замешать в сыр клей для фиксации.
ИИ-помощник от Google предложил пользователю поесть нетоксичного клея.
Пользователь из США не смог приготовить пиццу так, чтобы сыр нормально на ней держался. Gemini, встроенная в поиск Google, предложила ему замешать в сыр клей для фиксации.
Разгадка у казуса оказалась простая: нейросеть нашла ответ по этому запросу из поста какого-то тролля с Reddit 11-летней давности. Примечательно, что такие ИИ-ответы теперь идут в верху выдачи сервиса Google.
В анализе видеопотока с помощью ИИ выделяют два подхода. Первый из них называется обработкой разреженного (sparse) видео. Он решает задачу предсказания одного результата по анализу видеофрагмента (массива кадров).
Второй подход решает задачу предсказания одного результата на кадр. Такую покадровую обработку называют анализом плотного (dense) видео. Модели ML для работы с плотным видео востребованы там, где требуется уловить кратковременные события и проанализировать быстрые изменения сцен.
❗️Существующие модели глубокого анализа видео (например, 3D CNNs) достигли впечатляющих результатов при обработке разреженного видео. Однако их адаптация к задачам плотного видео сопряжена с рядом проблем.
В частности, эти модели менее эффективны при работе с избыточными кадрами, с трудом улавливают временные корреляции на больших интервалах и неоправданно дороги в развёртывании.
Чтобы решить эти проблемы, коллектив исследователей из Белфаста (Ирландия) разработал TDViT — модель трансформера для обработки плотного видео с блоками временнóго расширения.
Эксперименты с наборами данных ImageNet VID и YouTube VIS показали, что TDViT эффективно извлекает пространственно-временны́е представления и ослабляет негативный эффект временнóй избыточности. Также иерархическая структура блоков позволяет моделировать динамику на больших временных интервалах.
Сервис «Сбера» GigaCodeстал лучшим ИИ-сервисом по точности предсказывания кода разработки среди зарубежных аналогов. Тестирование проводилось на большом количестве файлов с кодом, сообщила пресс-служба «Сбера».
«Эксперты „Сбера“ провели обширное тестирование различных ИИ‑ассистентов разработчика на более чем 17 тыс. файлов с кодом, в ходе которого сервисам предлагалось продолжить фрагмент исходного кода, и производился замер того, насколько точно предсказывается его следующая строка. Результаты показали, что по интегральной доле верно предсказанного кода на языке Java сервис GigaCode показал результат на 2% лучше, чем GitHub Copilot, и на 3% и 6,5% лучше, чем Codeium и TabNine», — рассказал старший вице‑президент, руководитель блока «Технологическое развитие» «Сбера» Андрей Белевцев.
В процессе тестирования исследователями замерялась доля кода, предсказанного ИИ-ассистентами, при этом учитывались не только случаи полного совпадения строки, а также и случаи, в которых была удачно предсказана часть, принимались во внимание также частота и стабильность выдачи подсказок.
Сервис GigaCode помогает в режиме реального времени по фрагменту кода сгенерировать наиболее вероятные его продолжения непосредственно в среде разработки. Решение поддерживает более 15 языков программирования (Java, Python, JavaScript, TypeScript, C/C++ и другие), а также совместимо со множеством редакторов и интегрированных сред (IDEA, PyCharm, VSCode, Jupyter и другие).
Привет! Меня зовут Ильдар Ломов. Расскажу, чем занимаются ML-инженеры в Островке. Знаю об этом всё, я сам руководитель команды Data Science.
Сейчас портфель ML-проектов Островка —12 штук в нескольких направлениях: от продуктового ML (ранжирование, рекомендации), до больших языковых моделей.
Состав команды стандартный: ML-инженер, бизнес-аналитик, проджект, продакт. Опционально тимлиды и разработчики.
Работа ML-инженера в Островке — посередине между стартапом с его моделью в jupyter-ноутбуке и корпорацией, где работа с сотнями моделей упорядочена, стандартизирована, вшита в интерфейсы. Можно поработать над серьезным проектом гибко с разнообразием инструментов.
Идеал — проактивный человек, который протащит проект от исследования до прода и покрытия метриками. Важно понимать все этапы проекта, иметь усиленный скилл хотя бы на одном из них, с остальным поможет команда.
Нужно уметь покрывать метриками, следить за проектом на проде, чтобы тот не потерял смысл из-за нестыковок в ТЗ. И работал так, как задумано.
Частые итерации, проверки гипотез и новых технологий дают нашему ML-инженеру больший кругозор в сравнении с крупными компаниями. Специалист растет с технической и бизнесовой сторон.
Работа оценивается с точки зрения влияния на бизнес, инженер видит, как проекты прямо и понятно воздействуют на бизнес-метрики.
Это то, что мы всегда хотим видеть в кандидатах, но на рынке такого не много. Чем виднее на собеседованиях, что человек понимает бизнес-сторону, тем больше он нам подходит.
ML против токсичности, чат‑бот «пИИрожок» — и ещё более 10 кейсов внедрения технологий машинного обучения на конференции ML2Business.
29 мая в 14:00 приглашаем на ML2Business — первую конференцию от Yandex Cloud, посвящённую кейсам применения GenAI, NLP, CV и других технологий ML.
Мы поговорим о сложностях внедрения моделей машинного обучения и способах интеграции ML в процессы компаний, а также об оценке реальной пользы для бизнеса. Будет интересно и полезно как ИТ‑руководителям, так и ML‑экспертам — присоединяйтесь к нам в пространстве LOFT#2 в Москве или подключайтесь онлайн.
В программе
как YandexGPT меняет привычные процессы работы колл‑центра;
зачем внедрять нейросети для категоризации запросов в техподдержку;
как улучшить качество сервиса для знакомств благодаря модерации контента с помощью ML‑технологий;
что умеют современные виртуальные рекрутёры с функцией RPA;
как чат‑боты помогают покупателям подбирать товары на основании их предпочтений;
как улучшить поиск информации по внутренней «википедии» с помощью ассистента на базе YandexGPT API и Yandex DataSphere;
и ещё несколько практических примеров от компаний из разных отраслей.
Участники также могут поучаствовать в нетворкинге и тестировании ML‑сервисов в реальных бизнес‑сценариях на интерактивных площадках.
Участие бесплатное, количество мест ограничено. Регистрация открыта на сайте конференции.
Google сообщила разработчикам, что начинает взимать плату за использование Gemini API. С 30 мая 2024 года платным становится доступ к Gemini 1.5 Pro, с 14 мая плата будет взиматься за использование Gemini 1.0 Pro.
Вместе с этим компания ещё раз напомнила про более доступный тариф Gemini 1.5 Pro. В рассылке для разработчиков подчёркивается, что платным становится только доступ к языковой модели через API, в Google AI Studio с нейросетями можно будет работать бесплатно.
«Инфосистемы Джет» создала сервис на основе языковой модели YandexGPT для автоматизации работы своего сервисного центра. За один месяц компания внедрила алгоритм на базе нейросети, который может определять тематику обращений в техническую поддержку и автоматически готовить ответы на запросы, помогая диспетчерам и инженерам работать оперативнее.
Специалисты по машинному обучению «Инфосистемы Джет» в рамках пилотного проекта разработали приложение, которое, используя внешнее хранилище документов, обращается к специально созданным базам знаний (например, к базе знаний операторов сервисного центра), реализует сценарии обработки запросов и генерирует релевантный ответ. База знаний «Инфосистемы Джет» содержит информацию обо всех кейсах, с которыми специалистам компании приходилось сталкиваться за последние 30 лет.
В рамках пилотного проекта инженерам удалось автоматизировать обработку 30% из 13000 запросов. При этом 75% этих ответов были полностью автоматическими и были одобрены специалистами без доработки. Таким образом, сервис снижает нагрузку на специалистов на 22%. Компания продолжит улучшать модель и планирует внедрить технологию в качестве постоянного вспомогательного инструмента для инженеров технической поддержки, чтобы существенно ускорить обработку запросов и качество ответов.
«Особенность проекта „Инфосистемы Джет“ в том, что компании удалось в сжатые сроки научить YandexGPT работать со сложной ИТ‑тематикой», — сообщил CPO YandexGPT API Алексей Долотов.
Платформа для художников DeviantArt опубликовала в X пост о двух самых успешных продавцах иллюстраций в этом году: «Isaris-AI» и «Mikonotai». По информации, эти аккаунты заработали десятки тысяч долларов, продавая в большом количестве аватары с "пустыми" глазами в 3D, которые были созданы с помощью AI. Оказалось, что оба аккаунта являются ботами DeviantArt, созданными для генерации изображений с помощью искусственного интеллекта.
DeviantArt не проявил активности в решении возникших проблем: управляющие социальными сетями сайта удалили десятки критических ответов на твит, в котором рекламировался Mikonotai.
Пользователи соцсети обвинили владельцев в активной поддержке искусственного интеллекта в ущерб реальным авторам. Художники утверждают, что AI без их согласия был обучен на основе их работ, которые они размещали на сайте.
Сообществу не нравится текущая ситуация, которую они называют провалом DeviantArt. Некоторые авторы выразили свое несогласие с политикой администрации, удалив свои профили с сайта.
Это не первый раз, когда DeviantArt пытается внедрить новую технологическую "инновацию" и сталкивается с проблемами.
«Многие художники были возмущены с самого утра того дня, когда это было запущено. Они ожидали поддержки от сообщества художников, а не одобрения их действий. Это сильно подорвало доверие многих людей к DeviantArt»
«Изображение, сгенерированное GPT-4o — так много всего, что можно изучить, используя только возможности создания изображений GPT-4o. Команда усердно работает, чтобы представить их миру», — пояснил Брокман.
GPT-4o может воспринимать и генерировать звук, изображение и текст и будет доступна всем пользователям бесплатно.
МТС открывает в сентябре в Высшей школе экономики магистратуру по направлению «Исследования и предпринимательство в искусственном интеллекте». Об этом компания сообщила в ходе конференции True Tech Day.
Цель учебной программы — подготовка специалистов в области ИИ, которые будут создавать инновационные продукты. В ходе обучения студентам расскажут о больших языковых моделях, генеративных нейросетях, а также инструментах компьютерного зрения и распознавания естественного языка.
Магистратура от МТС по ИИ в Высшей школе экономики появится на факультете компьютерных наук. Финансирование со стороны МТС покрывает 100% стоимости обучения. Прием документов на программу продлится с 19 июня по 25 июля этого года.
«Преподавательский состав магистратуры будет состоять из ведущих специалистов факультета компьютерных наук ВШЭ и сотрудников МТС. Эксперты магистратуры поделятся реальными практическими кейсами в области ИИ, принципами работы моделей, расскажут о возможностях и нюансах их применения, укажут на риски, связанные с неправильной или некачественной обработкой данных», — отметил первый вице-президент по технологиям МТС Павел Воронин.
Первый проректор НИУ ВШЭ Леонид Гохберг заявил, что сегодня ИИ-инструменты затрагивают практически все отрасли экономики и являются драйверами цифрового развития страны. «Запуск совместной магистерской программы ВШЭ и МТС — это отличная возможность получить востребованную профессию», — добавил Гохберг.
С января этого года автоматический определитель номера «Яндекса» (АОН) зафиксировал 530 млн звонков с неизвестных номеров, в том числе в мессенджерах. Больше половины из них — 302 млн (57%) — АОН определил как нежелательные и предупредил о них пользователей. Почти 25 млн звонков АОН автоматически заблокировал тем пользователям, кто подключил эту функцию.
С начала года пользователи определителя номера «Яндекса» получили на 20% больше нежелательных звонков с незнакомых номеров, чем за тот же период прошлого года. Больше всего (на 19%) выросло количество звонков от мошенников. Предложений банковских услуг стало на 7% больше, а услуг страхования — на 5%. При этом звонков с предложением разного рода небанковских финансовых услуг стало на 38% меньше, а услуг связи — на 29% меньше.
Одна из популярных сейчас мошеннических схем, когда людям звонят от имени операторов сотовой связи и предлагают продлить договор, для чего просят назвать код из СМС. Другая схема — звонки в Viber или WhatsApp с номеров, похожих на телефоны известных компаний.
Автоматический определитель номера (АОН) доступен в приложении «Яндекс с Алисой». Система защищает пользователей от звонков с неизвестных номеров, чтобы они не тратили на них время. С помощью этой опции можно узнать, кто звонит, или заблокировать нежелательные звонки. АОН умеет блокировать звонки с рекламой финансовых услуг и нежелательные вызовы, в частности, от злоумышленников.
OpenAI представляет настольную версию ChatGPT и новую модель: GPT-4o
Сейчас в разгаре долгожданная презентация компании OpenAI, где она объявила о запуске новой модели искусственного интеллекта GPT-4o и настольной версии ChatGPT. Обновление делает GPT-4 доступным для всех пользователей, включая бесплатных.
По словам технического директора OpenAI Миры Мурати, GPT-4o является более мощной и быстрой моделью по сравнению с предыдущими версиями. Она в два раза быстрее и дешевле, а также способна работать с текстом, изображениями и аудио, а также различать интонацию в голосе.
Новая модель доступна для использования с сегодняшнего дня. Это значительный шаг вперед для OpenAI в развитии технологий искусственного интеллекта и расширении доступности своих продуктов для широкой аудитории.
Привет! 14 сентября мы вновь проведём Practical ML Conf — ежегодную конференцию Яндекса, посвящённую практическим аспектам применения ML-технологий. Сегодня мы открыли приём заявок для тех, кто хотел бы поделиться своим опытом и выступить с докладом.
Ключевые темы конференции в этом году: CV, RecSys, MLOps, NLP, Speech и Analytics. Мы ожидаем глубокие технические доклады и хотим поговорить о прикладных решениях, которые уже сейчас приносят пользу. Сбор заявок завершится 13 июля. Программный комитет примет решение об участии на основании критериев «полезность», «новизна», «сложность» и «практичность».
Кстати, если вы планируете посетить конференцию в качестве слушателя, то рекомендую зарегистрироваться уже сейчас. Мы хотим провести болею узкую встречу специалистов компании и гостей перед основной программой конференции. Приоритет в рассылке приглашений на этот закрытый ивент будет у тех, кто зарегистрировался раньше.
Предложить доклад, зарегистрироваться, найти более подробный таймлайн и доклады прошлого года — всё это можно на сайте конференции.
Если вы скептически настроены в отношении автопилота Tesla, рекомендую вам ознакомиться с этим видео, способным изменить ваше мнение.
Этот ролик демонстрирует, что AI / Tesla FSD - ключ к безопасному и надежному вождению, сравнимому с человеческим.
Система преобразует изображения с камер и данные с карт в низком разрешении в управляющие сигналы. Она эффективно справляется с различными нестандартными дорожными ситуациями и проявляет повышенную осторожность вблизи пешеходов, улавливая даже незначительные сигналы их телодвижений, чтобы предугадать их действия.
Такое поведение системы обусловлено обучением на миллионах часов видеозаписей. Система научилась интерпретировать дорожную обстановку так же, как это делает человек, и адаптироваться к неожиданным ситуациям.
В отличие от устаревших систем, основанных на тысячах правил и определений, FSD обеспечивает впечатляющее качество вождения.
Ожидается, что FSD достигнет полной функциональности в текущем году и будет одобрена в следующем.
Контекстное окно длиной 4 миллиона токенов в Llama-3 8B (V0.1) ??
8 мая 2024 г. представители Gradient AI опубликовали в X (*запрещена в России) следующий пост:
"Мы активно расширяем границы возможностей моделей с большими контекстными окнами, поэтому мы с радостью представляем раннюю версию нашей модели Llama-3 8B на 4 млн токенов, которую мы выложили на huggingface.
Несмотря на то, что её совершенствование потребует времени, на сегодняшний день, из всех моделей с исходным кодом в открытом доступе, Llama-3 8B имеет контекстное окно, которое вмещает самое большое количество токенов.
Если вам нравится то, что вы видите, следите за нами и нашими друзьями@CrusoeEnergyтак как мы продолжаем оказывать помощь сообществу!"
Также следует отметить, что контекстное окно на 4 миллиона токенов примерно соответствует тексту длиной 3 миллиона слов.
Для справки, во всех книгах серии Гарри Поттер на языке оригинала суммарно содержится порядка 1,084,170 слов.
Что именно покажут на презентации не уточнялось, но по словам Sam. A.: `not gpt-5, not a search engine, but we've been hard at work on some new stuff we think people will love! feels like magic to me`
В твиттере много отсылок к слову "magic" и слухов по поводу голосового помощника, модели связанной со звуком.
В своем канале я оставлю короткую выдержку новостей и о какой магии говорят в openai!