Как стать автором
Обновить
978.18

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга

Проверьте, используются ли ваши репозитории GitHub и исходный код ваших проектов для обучения различных больших языковых моделей (БЯМ — LLM).

На huggingface появилась вторая версия проекта Stack. Это открытый интерфейс управления между сообществом искусственного интеллекта и сообществом открытого исходного кода.

В рамках проекта BigCode выпущен и поддерживается The Stack V2 — набор данных исходного кода объёмом 67 ТБ для более чем 600 языков программирования. Одна из целей в этом проекте — предоставить людям свободу действий в отношении их исходного кода, позволяя им решать, следует ли использовать его для разработки и оценки моделей машинного обучения, поскольку сообщество признает, что не все разработчики могут захотеть, чтобы их данные использовались для этого.

Этот инструмент позволяет проверить, является ли репозиторий под именем пользователя частью набора данных The Stack. Хотели бы вы удалить свои данные из будущих версий The Stack? Вы можете это сделать, следуя инструкциям здесь.

Примечание. Stack v2.0 создан на основе общедоступного кода GitHub, предоставленного Software Heriage Archive. Он может включать репозитории, которых больше нет на GitHub, но которые были ранее заархивированы Software Heritage. Перед обучением моделей StarCoder 1 и 2 был запущен дополнительный конвейер PII для удаления имён, адресов электронной почты, паролей и ключей API из файлов доступных репозиториев исходного кода.

Теги:
Всего голосов 4: ↑4 и ↓0+4
Комментарии0

Интересное исследование применения технологий искусственного интеллекта с прогнозом развития 6 ключевых отраслей. Сделан срез по тому, как эти технологии применяются сейчас и как могут применяться на горизонте 5 и 10 лет.
https://files.microcms-assets.io/assets/8ba880c1ada24b3286662c41b2822851/554ffeea22a04f93bd78c35db622582d/iftf-ntt-data-iomc-three-horizons-of-ai-enabled-work-and-workers-eng.pdf

Теги:
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Financial Times запустила собственного чат-бота с генеративным ИИ под названием Ask FT, который обучен отвечать на различные вопросы подписчиков издания.

Для тренировки чат-бота разработчики из FT использовали только собственные материалы, полученные из базы данных сайта издания.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии2

Газета Financial Time запустила чат-бот на базе генеративного искусственного интеллекта — Ask FT. Нейросеть обучили на статьях самого издания, которые вышли за последние десятилетия. В конце каждого ответа Ask FT оставляет в квадратных скобках циферные примечания, которые отсылают к определённым материалам газеты.

Редактор Verge рассказал о ряде несоответствий в ответах чат-бота. В частности, некоторая предоставляемая нейросетью информация утратила актуальность к настоящему моменту. Хотя чат-бот может дать ответы на вопросы о текущих событиях, включая сведения о многомиллиардной субсидии правительства США для Intel в рамках закона о чипах.

Ask FT доступен нескольким сотням платных подписчиков FT Professional. Чат-бот основан на большой языковой модели Claude, разработанной Anthropic. Большинство подписчиков пока не сможет опробовать Ask FT, которая находится на стадии бета-тестирования.

Теги:
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Nvidia опубликовала в открытом доступе бесплатные обучающие курсы для пользователей любого уровня подготовки по нейросетям и нейромоделям для понимания работы ИИ.

Список курсов:

Теги:
Всего голосов 6: ↑6 и ↓0+6
Комментарии2

Выше пользовательского сообщения ChatGPT получает немного текста, который самому пользователю не виден. Этот текст — системный промпт. Он инициализирует бота: рассказывает, кто он такой, какой сегодня день и какие возможности доступны.

Получить системный промпт всё же можно, если попросить модель процитировать сообщение выше. Кстати, именно из-за изменений системного промпта качество работы ChatGPT могло ухудшаться. А меняться там есть чему: системный промпт у OpenAI составляет в длину 1700 токенов.

Системный промпт Claude.ai. AmandaAskell
Системный промпт Claude.ai. AmandaAskell

Аманда Аскелл [Amanda Askell], специалист по этике в Anthropic, показала системный промпт бота Claude 3 и объяснила, что содержит каждый из абзацев:

  1. Имя, компания-создатель и текущая дата.

  2. Временная отсечка базы знаний и инструкция отвечать с учётом того, что данные уже устаревшие.

  3. Инструкция отвечать подробно, но не слишком длинно.

  4. Claude чаще отказывается выполнять задачи, связанные с правыми взглядами, чем с левыми. Четвёртый абзац призван с этим бороться.

  5. Аналогично, пятый абзац борется с тенденцией Claude стереотипно высказываться о группах, представляющих большинство, но уходить от стереотипов, если речь идёт про различные меньшинства.

  6. Четвёртый абзац приводит к тому, что Claude часто говорит, что обе стороны в чём-то правы. Шестой абзац это исправляет.

  7. Инструкция всячески помогать и писать код в Markdown.

  8. Восьмой абзац призван не спрятать системный промпт, а снизить его избыточную цитируемость.

Впрочем, системные промпты часто и быстро меняются.

Теги:
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Научите уже кто-нибудь нейросети диагностировать те же ноутбуки, например. Камера, четыре щупа, база данных по элементной базе и ИИ, способный быстро пройтись щупами по тем же мосфетам, например. Хотя бы просто отличать пробитые от живых.

А то у́чите-у́чите всякой фигне, тот же г*внокод совершенно спокойно и без ИИ можно писать тоннами. И наукоподобную чушь генерировать, полную фактических ошибок и вымышленных «фактов» (вспоминается тот модуль из «Портала», рассуждавший про «этилбензоловые рыбки»). Научите уже своих горе-роботов делать что-то полезное из условно-рутинной деятельности, пусть человек думает, а робот — щупами тыкает.

Теги:
Всего голосов 9: ↑8 и ↓1+7
Комментарии8

Джереми Синклер поделился видеозаписью с демонстрации во время eXperience Day в кампусе Qualcomm.

Сравнению подвергли два ноутбука. Их полные спецификации названы не были, да и тест не настолько глубокий. Условно ситуацию можно описать так: справа находился новейший мобильный процессор Intel Core Ultra 7 155H, слева — Snapdragon X Elite. На обоих ноутбуках было запущено приложение для редактирования видео DaVinci Resolve, популярный в профессиональных кругах пакет цветокоррекции, визуальных эффектов и постобработки аудио для macOS, Windows и Linux.

Нетрудно разглядеть, что на обоих ноутбуках работала Windows. Разница лишь в том, что слева запустили версию DaVinci Resolve не для x86, а специально перекомпилированную под ARM. Релиз подобной версии пока лишь только намечается.

Тест касался NPU, нейроускорителя системы на кристалле Qualcomm. Представитель компании хвастает, что это самый мощный NPU на ноутбучном чипе, 45 TOPS. Для бенчмарка на ноутбуках одновременно запустили Magic Mask, нейросетевую функцию DaVinci Resolve для отслеживания объекта на видео.

За счёт нейроускорителя ноутбук на Snapdragon X Elite оказался значительно быстрее: он работал на скорости в 7 кадров в секунду против 3 у чипа Intel. При этом энергопотребление у системы на кристалле Qualcomm меньше. Точные числа названы не были; в другом видео на ARM показана категория энергопотребления «Умеренная» из «Диспетчера задач» Windows против «Очень высокой» у Intel.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Источники СМИ сообщили, что OpenAI уже некоторое время активно тестирует в закрытом формате следующее поколение модели искусственного интеллекта под названием GPT-5.

Ожидается, что перевод этого проекта в доступный режим произойдёт в середине 2024 года, предположительно, летом.

По словам тестировщиков, эта модель существенно лучше GPT-4. Там доступны новые опции типа интеллектуального агента, который умеет самостоятельно выполнять задания человека в течение длительных промежутков времени, а также различные системы для автономного выполнения задач.

СМИ выяснили, что в OpenAI продолжают обучать новый ИИ, затем он будет проходить тесты на безопасность: отвечать на наводящие вопросы от разных команд тестеров, проходить проверки на токсичность и так далее, прежде чем к этой системе получат доступ обычные пользователи.

Ранее глава OpenAI Сэм Альтман заявил, что разработчики обучают ИИ-модель пятого поколения не только на открытой информации и комбинациях общедоступных наборов данных в интернете, но и на внутренних базах данных многих крупных IT-компаний, которые сотрудничают с OpenAI.

В начале марта 2024 года исследователи обнаружили, что OpenAI работает над нейросетью GPT-4.5 Turbo, у которой окно длины контекста в 256 КБ токенов, что вдвое превышает текущие 128 КБ GPT-4 Turbo.

В марте 2023 года OpenAI представила модель ИИ интерпретации изображений и текста GPT-4, которую компания назвала «последней вехой в своих усилиях по расширению масштабов глубокого обучения».

Теги:
Всего голосов 5: ↑5 и ↓0+5
Комментарии0

OpenAI блокирует доступ к своим продуктам на территории РФ. В какой-то момент стало невозможным открыть даже документацию.

Доступ через VPN пока работает, но мы с друзьями подумали, что это неудобно, и опубликовали документацию OpenAI у себя:

https://openai-docs.ru

Более того, с помощью GPT-4 мы перевели содержание на русский язык и где возможно, заменили ссылки на дополнительные статьи (Wikipedia и подобные) на русскоязычные версии. За бесплатный доступ к GPT-4 для нашего проекта благодарим  ProxyAPI — доступ к OpenAI API в России

Мы продолжаем работать над проектом, будем дополнять документацию время от времени. Но уже сейчас все основные методы и гайды у нас доступны. Приглашаем всех желающих ознакомиться!

Теги:
Всего голосов 11: ↑11 и ↓0+11
Комментарии5

Google вернула доступ к домену AI.com и перенаправляет всех посетителей на сайт ИИ-чат-бота Gemini.

Google выкупила этот домен, ранее перенаправлявший к ChatGPT. Теперь он зарегистрирован в Squarespace Domains и оплачен до 2031 года, а в контактах указан адрес электронной почты contact-registrant[@]google.com.

Ранее OpenAI некоторое время владела доменным именем ai.com, чтобы популяризировать веб-интерфейс ChatGPT. Потом там работало перенаправление на ИИ-стартап x.ai (чат-бот Grok) на правах аренды ресурса.

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

17 марта 2024 года ИИ-стартап xAI открыл исходный код чат-бота Grok-1.

Проект Grok-1 опубликован на GitHub под лицензией Apache 2.0, а скачать архив с кодом чат-бота можно, вставив эту ссылку в торрент-клиент (300 ГБ файлов с весами MoE-модели c 314 млрд параметров):

magnet:?xt=urn:btih:5f96d43576e3d386c9ba65b883210a393b68210e&tr=https%3A%2F%2Facademictorrents.com%2Fannounce.php&tr=udp%3A%2F%2Ftracker.coppersurfer.tk%3A6969&tr=udp%3A%2F%2Ftracker.opentrackr.org%3A1337%2Fannounce

4 ноября 2023 года xAI запустила своего чат-бота Grok с генеративным искусственным интеллектом для ограниченной аудитории. В компании планировали сделать языковую модель xAI доступной для всех платных подписчиков соцсети X.

В июле прошлого года Маск объявил о начале работы xAI. Главная цель проекта — «понять истинную природу Вселенной».

11 марта 2024 года Илон Маск пообещал, что ИИ-стартап xAI откроет исходный код чат-бота Grok на неделе. Маск сделал это заявление через несколько суток после того, как подал в суд на OpenAI и пожаловался, что поддерживаемый Microsoft стартап отклонился от своих корней и не выложил в открытом доступе исходный код ChatGPT.

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

В американском законопроекте об иммиграции предусмотрено финансирование 100 высокотехнологичных устройств для обнаружения наркотиков с помощью систем ИИ. 

Предполагается, что стандартные рентгеновские системы оснастят искусственным интеллектом, чтобы пограничники могли быстрее сканировать легковые и грузовые автомобили.

Пограничная служба уже работает над установкой новых устройств, которые можно использовать до первичного досмотра. Эти системы уже строятся или эксплуатируются в Браунсвилле и Ларедо, штат Техас; Ногалесе, Аризона; Санта-Терезе, штат Нью-Мексико.

Однако даже работающие системы не способны сканировать все машины, пересекающие границу. Пока через них проходит всего 20% коммерческих и 5% частных автомобилей. Благодаря интеграции ИИ пограничники хотят решить эту проблему. К концу 2025 года планируется сканировать уже 40% легковых и 70% коммерческих авто. 

Кевин Макалинан, который занимал министра внутренней безопасности в 2019 году, в 2020 году стал соучредителем компании Pangiam, занимающейся ИИ. Она получила контракт на разработку «алгоритмов обнаружения аномалий», которые будут анализировать рентгеновские снимки на границе. Для обучения будут использоваться данные о миллионах транспортных средств и их водителях.

Теги:
Всего голосов 4: ↑4 и ↓0+4
Комментарии0

Ближайшие события

Около 26% компаний в России планируют внедрить ИИ для повышения информационной безопасности

Более половины российских компаний за 2023 год увеличили бюджеты на развитие систем информзащиты в среднем на 20% — свидетельствуют итоги опросов в рамках исследования Yandex Cloud и компании «Деловые решения и технологии». Доля ИБ‑расходов в российском бизнесе составила 15% от общего бюджета на ИТ. Среди основных статей расходов на ИБ: обновление ПО (75%), оборудования (73%) и обучение персонала (43%).

Для защиты инфраструктуры стали чаще использоваться модели машинного обучения, а для безопасной разработки — облачные технологии. При этом ИИ‑алгоритмы чаще применяют для решения двух задач: обнаружения аномалий в большом объёме данных и управления инцидентами. Искусственный интеллект при автоматизации ИБ‑процессов наиболее часто используют компании финансового сектора — это подтвердили 71% опрошенных из отрасли.

Возможность автоматизировать использование ИБ‑сервисов — один из критериев миграции на облачные платформы. 74% компаний оценивают безопасность работы с облачными провайдерами выше среднего. Одновременно с этим оценка рисков при миграции данных в облако стала базовым правилом для компаний, отмечают респонденты.

В исследовании приняли участие более 300 представителей российских компаний. Глубинные и количественные интервью прошли директора по ИТ и информационной безопасности, руководители программ цифровой трансформации, ИБ‑ и ИТ‑специалисты.

Подробности исследования — по ссылке.

Теги:
Всего голосов 5: ↑5 и ↓0+5
Комментарии0

Согласно новым данным из «утечки» от OpenAI, одним из существенных обновлений в GPT-4.5 Turbo является окно длины контекста в 256 КБ токенов, что вдвое превышает текущие 128 КБ GPT-4 Turbo. Этот шаг, похоже, является ответом OpenAI на конкурентов, запускающих модели со все более большими контекстными окнами, включая Google Gemini. Вероятно, что новая модель GPT изменит ситуацию для OpenAI или даже продвинет её впереди чат-бота Google.

OpenAI пока официально не раскрыла информацию об утечке, поэтому статус GPT-4.5 Turbo и дата выпуска в июне 2024 года окутаны тайной.

12 марта 2024 года исследователи обнаружили в кэше Bing, что OpenAI готовится представить нейросеть GPT-4.5 Turbo. Но ссылка на эту страницу на сайте OpenAI выдаёт ошибку 404. Также из поисковой выдачи пропало упоминание о новом чат-боте.

Неясно, был ли это какой-то тест или OpenAI решила придержать релиз новой версии чат-бота.

В марте 2023 года OpenAI представила новую модель ИИ интерпретации изображений и текста GPT-4, которую компания назвала «последней вехой в своих усилиях по расширению масштабов глубокого обучения».

Ожидается, что с помощью чат‑бота GPT-4.5 OpenAI стремится устранить некоторые ограничения и проблемы, с которыми столкнулись его предшественники. Это включает в себя уменьшение предвзятости в сгенерированном тексте, улучшение понимания моделью неоднозначных запросов и значительное улучшение её способности решать задачи, специфичные для определённой предметной области.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии1

Компания Figure в рамках сотрудничества OpenAI показала интеграцию своего робота-гуманоида Figure 01 с наработками компании-партнёра. Ранее представленный робот, который выполняет задачи автономно, теперь успешно делает многое с помощью нейросети.

Благодаря OpenAI Figure 01 теперь может полноценно общаться с людьми, так как ИИ-модель OpenAI даёт высокий уровень визуального и языкового интеллекта, а нейронные сети обеспечивают быстрые, низкоуровневые и ловкие действия робота. Производитель пояснил, что всё в этом видео — работа нейросети:

Робот научился описывать то, что видит, и рассуждать, что можно сделать с предметами. В ролике робот сам понял, что тарелки и стаканы надо ставить в одно место. Также он умеет анализировать ситуацию. Если попросить робота передать еду, а на столе из съедобного только яблоко, то он даст именно яблоко. С ИИ робот держит в памяти всю нужную информацию. В конце видео робот пересказал свои действия и даже дал им оценку.

У Figure 01 будут роборуки с силиконовыми кончиками пальцев. Прототип уже способен выполнять манипуляции как одной, так и двумя руками, хватая объекты и перемещая их. Так, он может манипулировать коробками, контейнерами и другими предметами на складах и на производстве. Кроме того, робот может захватывать обычные предметы, например пачку чипсов. При этом большая часть работы связана с полностью комплексными системами, которые не поддерживаются телеуправлением.

Теги:
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Глава Минцифры РФ Максут Шадаев заявил, что российские власти не блокируют зарубежные веб-сайты с технологиями искусственного интеллекта (ИИ). Он сказал об этом на пленарной сессии Дня искусственного интеллекта в рамках международной выставки-форума «Россия».

«Мы не блокируем зарубежные сайты, связанные с ИИ», — рассказал Шадаев.

В начале февраля 2024 года компания OpenAI сообщила российским СМИ, что разработанный ею чат-бот ChatGPT недоступен в России. Компания предоставила официальный список стран из почти 190 стран, где ChatGPT доступен, России среди них нет.

Другие популярные в мире чат-боты со встроенным искусственным интеллектом, среди которых Copilot от Microsoft и Gemini (ранее Bard) от Google, также не работают на территории России. Причём запреты на использование этих сервисов исходят от самих разработчиков.

Например, при открытии ИИ-сервиса Google появляется сообщение: «Gemini пока не поддерживается в вашей стране. Мы сообщим, когда это изменится».

Теги:
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Генеральный директор Perplexity Аравинд Сринивас рассказал, что в чат-бот интегрируют карты, обзоры и другую информацию из бизнес-поисковика Yelp.

Perplexity выдаёт как текст, так и ссылки при ответе на вопросы, что стало преимуществом сервиса по сравнению с другими чат-ботами, такими как Copilot, Gemini или ChatGPT. Данные Yelp позволили Perplexity предложить пользователям ответы в виде карт, фотографий или цитат из обзоров. Они включают ссылки на страницы компаний в Yelp, чтобы пользователи могли просмотреть другую информацию. 

Perplexity не раскрыла финансовые детали сделки и заявила, что не будет использовать данные Yelp для обучения какой-либо модели, поскольку компания пользуется GPT и Claude 2.

Perplexity планирует в будущем больше подобных интеграций и уже работает с системой ответов WolframAlpha.

Теги:
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

12 марта 2024 года исследователи обнаружили в кэше Bing, что OpenAI готовится представить нейросеть GPT-4.5 Turbo. Но ссылка на эту страницу на сайте OpenAI выдаёт ошибку 404. Также из поисковой выдачи пропало упоминание о новом чат-боте. Ниже — скриншот, который сделал вчера вечером сотрудник Хабра.

Неясно, был ли это какой-то тест или OpenAI решила придержать релиз новой версии чат-бота.

В марте 2023 года OpenAI представила новую модель ИИ интерпретации изображений и текста GPT-4, которую компания назвала «последней вехой в своих усилиях по расширению масштабов глубокого обучения».

Ожидается, что с помощью чат-бота GPT-4.5 OpenAI стремится устранить некоторые ограничения и проблемы, с которыми столкнулись его предшественники. Это включает в себя уменьшение предвзятости в сгенерированном тексте, улучшение понимания моделью неоднозначных запросов и значительное улучшение её способности решать задачи, специфичные для определённой предметной области.

Теги:
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Трансформеры для распознавания автомобильных номеров удивили меня.

В продолжение темы https://habr.com/ru/posts/799 287/ про распознавание текста с помощью трансформеров, решил попробовать натренировать сеть на распознавание автомобильных номеров на небольшом датасете.

Пару часов тренировки и получаем вот такой результат:

eval_loss': 0.003, 'eval_cer': 0.001, 'eval_acc': 0.999

100% распознавание, скорость инференса на CPU ~0.09 сек.

Можно попробовать в блокноте https://github.com/IgorZorkov/number-plates-ocr/blob/main/number_plates_ocr.ipynb

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии7