Расширьте возможности машинного обучения Azure с помощью расширения VS Code
Привет сообществу Python! Прошло много времени с тех пор, как мы последний раз писали об этом, но мы рады представить новые возможности, добавленные в расширение VS Code Azure Machine Learning (AML). Начиная с версии 0.6.12, мы представили изменения в пользовательском интерфейсе и способы, которые помогут вам управлять хранилищами данных, наборами данных и вычислениями прямо из любимого редактора!
Возможно некоторые из вас читают о Azure ML и расширении впервые — не волнуйтесь, мы здесь, чтобы рассказать об этом больше.
Azure ML — это сервис машинного обучения, который предоставляет исследователям, работающим с данными, широкий набор инструментов для создания, обучения и развертывания моделей. Расширение AML — это сопутствующий инструмент, который обеспечивает управляемый опыт, помогающий создавать ресурсы и управлять ими непосредственно из VS Code. Расширение направлено на оптимизацию задач, таких как проведение экспериментов, создание вычислительных целей и управление средами, без необходимости переключения контекста из редактора в браузер. Пользователи расширений могут работать в своих рабочих пространствах и взаимодействовать со своими основными ресурсами AML с помощью простого дерева навигации и с помощью команд по щелчку мыши.
Подробнее о начале работы со службой Azure ML можно узнать здесь. Если вы хотите поэкспериментировать с расширением, вы можете установить его здесь и прочитать документацию по началу работы здесь!
Интеграция с хранилищем данных
Одна из новых функций, которые мы выпустили, — поддержка регистрации в Datastore. Хранилища данных (Datastore) — это ресурс AML, который позволяет хранить информацию о подключении к службам хранения Azure. С Datastores вам больше не нужно беспокоиться о написании пользовательских коннекторов хранилища или жестком кодировании информации о вашем соединении в виде переменных среды, объектов конфигурации или строк в вашем источнике.
Расширение AML в настоящее время поддерживает типы хранилища BLOB-объектов Azure и общий доступ к файлам Azure. Чтобы ускорить регистрацию, мы разработали набор оптимизированных параметров ввода, таких как автоматическое получение учетных данных ключа учетной записи для проверки подлинности в вашей учетной записи хранения Azure.
Зарегистрируйте хранилище данных через представление дерева расширений AML
Интеграция набора данных
Расширение AML теперь поддерживает создание как табличных, так и файловых наборов данных. Наборы данных могут использоваться для определения расходуемого объекта из данных в вашем хранилище данных, локальной файловой системе или удаленном местоположении; Эти объекты могут быть использованы во время экспериментов и обучений.
Создайте набор табличных или файловых данных с помощью дерева расширений
Создав набор табличных данных, вы можете использовать расширение для предварительного просмотра первых 50 строк ваших данных. Предварительный просмотр набора данных в настоящее время поддерживает фильтрацию с помощью простых выражений (например, ищите непосредственно «str» в столбце строки или используйте «> X» в числовом столбце).
Предварительный просмотр наборов табличных данных и фильтрация значений столбцов
В предыдущих выпусках расширения AML мы добавляли поддержку, чтобы помочь вам обучать свои модели в Azure через эксперименты. Эксперименты состоят из вашего обучающего скрипта, цели вычислений, на которой вы хотите работать, и среды, в которой вы хотите работать (то есть, какие пакеты Python должны быть установлены). Благодаря введенным наборам данных мы упростили вам использование этих наборов данных в эксперименте без необходимости писать дополнительный код AML SDK. Прямо перед отправкой эксперимента вам показывают файл конфигурации со ссылкой на ваши наборы данных. В файле вам просто нужно ввести параметр сценария и механизм присоединения, чтобы использовать его для набора данных File, или именованный ввод, который вы хотели бы использовать для набора данных Tabular.
Использование набора данных в конфигурации экспериментального прогона
Интеграция вычислительных экземпляров
Вычислительные экземпляры AML — это управляемые виртуальные машины, которые вы можете настроить и использовать для экспериментов с ML. С расширением VS Code создание и управление этими вычислительными экземплярами стало еще проще! Вы можете просматривать все вычислительные экземпляры своего рабочего пространства и запускать / останавливать / перезапускать их с помощью команд в дереве. С помощью небольшого количества щелчков мыши вы можете создать вычислительный экземпляр с поддержкой SSH, а затем следовать нашей документации в редакторе, чтобы легко подключиться к нему через расширение VS Code Remote SSH.
Создайте compute instance и подключитесь к нему из VS Code
Изменения интерфейса
Мы давно слышали от разработчиков о том, что интерфейс расширения отличается от Azure ML Studio. В предыдущих GIF-файлах вы, возможно, уже заметили весьма непротиворечивый дизайн в представлении дерева расширений. Мы обновили каждый узел иконками, эквивалентными Studio, и переименовали/переупорядочили их, где это необходимо.