Да нет, у них давно есть open-source модель Whisper
Whisper - это модель распознавания речи общего назначения. Она обучена на большом наборе разнообразных аудиоданных, а также является многозадачной моделью, способной выполнять распознавание многоязычной речи, перевод речи и идентификацию языка.
Описанный вами сценарий возможен. Но для такой реализации как раз и нужен подобный компилятор. Но такое получится только когда и данные и алгоритм используют один и тот же контекст(ключ). Классический сценарий предполагает отправку всех данных(входных и констант алгоритма) в зашифрованном виде в облако, обработка под FHE и возврат зашифрованного результата. Например, недавно мы пробовали LinearRegression так реализовать, все получилось: Плюсы: 1. Точность почти как у незашифрованной версии 2. Почти нет различия в размере передачи данных Минусы: 1. Время обучения больше примерно в 45 раз 2. Валидация только на стороне отправителя данных 3. Слишком много деталей нужно знать для реализации(все зависит от размеров матриц) 4. Инференс зависит от ключа
Сложность оценки и длительность проверки. А в программировании просто тесты запускаются и метрики считаются
Да, можно предоставить спецификацию в формате OpenAPI и модель будет делать запросы
Его невозможно полностью учесть, тут как в криминалистике. Чем больше даунскейлинг, тем меньше добавленной информации остается
Да нет, у них давно есть open-source модель Whisper
Whisper - это модель распознавания речи общего назначения. Она обучена на большом наборе разнообразных аудиоданных, а также является многозадачной моделью, способной выполнять распознавание многоязычной речи, перевод речи и идентификацию языка.
А можете намекнуть где в open-source переводчике копать, чтоб воспроизвести ваш результат? Хочу для белорусского переводить
Можно так
Описанный вами сценарий возможен. Но для такой реализации как раз и нужен подобный компилятор.
Но такое получится только когда и данные и алгоритм используют один и тот же контекст(ключ).
Классический сценарий предполагает отправку всех данных(входных и констант алгоритма) в зашифрованном виде в облако, обработка под FHE и возврат зашифрованного результата.
Например, недавно мы пробовали LinearRegression так реализовать, все получилось:
Плюсы:
1. Точность почти как у незашифрованной версии
2. Почти нет различия в размере передачи данных
Минусы:
1. Время обучения больше примерно в 45 раз
2. Валидация только на стороне отправителя данных
3. Слишком много деталей нужно знать для реализации(все зависит от размеров матриц)
4. Инференс зависит от ключа