Как стать автором
Обновить

Комментарии 20

Закрепленные Закреплённые комментарии

Статья хорошая, ибо новая модель от Open AI это пока ещё событие для области. Возможно просто неудачный момент для публикации статьи. Или вы сами сильно подняли планку распознавания, и теперь людям тема кажется решённой и как следствие не интересной.

НЛО прилетело и опубликовало эту надпись здесь

угу

конечно конечно просто минусовать
за что да просто так

Я нахожу довольно ироничным, что:

  • Аккаунт зарегистрированый в марте, использующийся в основном для разжигания судя по истории (и с нулем статей), с сильно негативной кармой потратил свой единственный комментарий в сутки, чтобы написать бессодержательный и едкий комментарий,

  • С прямым оскорблением под тематической статьей (загуглите что это слово значит) ,

  • А модерка хабра не реагирует, а комьюнити этому потакает)

Так держать хабр.

НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь

Очень много вопросов к глубине и качеству подачи информации в этой статье. Автору рекомендуется ознакомится с работами Ильяхова

После первого «50 плюсов» я хотел поставить плюс. После третьего решил не ставить.

Как правило, я стараюсь не писать статьи в духе "новостей" для сбора классов на каждый релиз и чих чего-либо, что было сделано не нашими / моими руками (увы, это 95% контента Хабра в эти дни).

В этот раз я неверно оценил потенциал темы на базе личных обращений. Также обычно начало, середину и центр статьи читают разные люди.

Но отсутствие комментариев по теме показывает, что я в принципе переоценил интерес публики к этой теме.

А вашу претензию я мало понимаю. Я вложил работу, сделал уникальную, краткую и емкую расстановку точек над и по этому вопросу. Дальнейшее копание мне показалось избыточным. Но если публика не может добавить конструктивного диалога и тема ей неинтересна, то польза ехидства и личных оскорблений постом выше мне вообще мало понятна (и мне мало понятно почему Хабр не трёт прямые оскорбления авторов).

Статья хорошая, ибо новая модель от Open AI это пока ещё событие для области. Возможно просто неудачный момент для публикации статьи. Или вы сами сильно подняли планку распознавания, и теперь людям тема кажется решённой и как следствие не интересной.

По сравнению с синтезом и картинками распознавание людям всегда было интересно на порядок два меньше. А что касается комментариев не по теме и рекламы инфо бизнеса, видимо вымывание целевой аудитории с хабра события ускорили на порядок.

НЛО прилетело и опубликовало эту надпись здесь

Были бы модели для русского языка в открытом доступе, хотя бы старые версии, эту статью написали бы за вас.

Даже на знаю как отвечать на такие комментарии.

С одной стороны должно быть очевидно, что если люди что-то делают, или не делают, к этому есть экономические, бизнесовые или политические предпосылки. Даже open AI прекрасно читаются а этом плане.

С другой стороны, если мнение априори "фреймится" с отправной точки, что я безапелляционно вам всегда и всё бесплатно должен отдавать, то смысл мне ещё инвестировать время на описание очевидных процессов?

Посмотрите на это с точки зрения потенциального клиента. Предположим вы ищете self-hosted решение для распознавания речи и желаете сравнить существующие варианты. Какова вероятность, что STT от Silero попадёт в предварительную выборку, если просто достать какую-то модель для тестов уже бюрократия и требует затрат труда вне команды разработки? Решение от OpenAI можно протестировать сразу, и потенциально, даже не рассматривать дальше. Простые ситуации закрыть vosk'ом, и так же до вас не дойти.

Возможность проверить выводы, сделанные в статье, так же отсутствует.

Категория клиентов (SMB и отдельные разработчики в отделе), которую вы описываете, в наших реалиях не может генерировать какой-либо значимой выручки, и как вы продемонстрировали, обычно занимаются сбором триалок и всего бесплатного и низковисящего.

бюрократия и требует затрат труда вне команды

Я понимаю, что разработчикам не хочется выходить из идеального мира, где весь софт написан бесплатно и подарен американскими корпорациями, но как правило при решении каких-то реальных задач выход из этого мира неизбежен. Иначе де-факто вы сами пишете, а не покупаете готовое решение задачи.

Когда решение запрашивается рядовым сотрудником из команды разработки, как правило бюджет на него равен сумме, которую этот сотрудник тратит в неделю на кофе. И я слышал уже десятки версий этой истории.

А что касается мантры, что всё решение может быть упаковано в одну модель ... даже из этой статьи очевидно, что даже обладая ресурсами OpenAI сделать этого нельзя. И упаковка и обвязка иногда гораздо сложнее и важнее одной модели, которую все должны вам подарить.

А что касается демки, без бюрократии можно просто написать в телеграм и быстро потестировать все через бота. А по сайзингам и деплою это уже всегда частное обсуждение.

Раз текущие модели настолько лучше, покажите одну из старых, чтобы комьюнити могло прогнать те же самые тесты, на тех же выборках.

А зачем? В соседнем треде я описал, почему никто такие же тесты гонять не будет. Максимум, что произойдет - мы или будем сокращать кому-то time-to-market, или кто-то начнет искать попытки пиара или перепродажи нашего решения.

И да, по крайней мере раньше схема еще была безотказная как швейцарские часы - какой-то публичный "инновационный" продукт подается в некий тендер (где понятно, что пользоваться никто не будет).

Красивыми словами это называется "Темный лес". Когда-то давно я даже настрочил длинный текст на эту тему.

Были бы модели для русского языка в открытом доступе, хотя бы старые версии, эту статью написали бы за вас.

Возможность проверить выводы, сделанные в статье, так же отсутствует.

И да, насчет этого. Почему-то за два года, когда другие модели и модели в других сферах были в "открытом доступе", я не видел каких-то реально интересных непредвзятых попыток что-то сравнивать.

Есть конструктивный и неконструктивный фидбек со стороны массовой публики и профессиональных пользователей, но почему-то никто никогда не пишет статей "за правду".

Объяснение простое - рыночная экономика. Максимум сравниваются или яблоки с апельсинами в каких-то узких кейсах, или делается очевидный пиар / анти-пиар или набираются классы на какой-то площадке (допустим YouTube блоггеры про программирование для школьников).

И что самое забавное, категория пользователей, которую я описал в соседнем комментарии … никогда даже близко не пытается даже задонатить этот пресловутый бюджет на кофе. А объяснение - рыночная экономика, ценности и отсутствие банального понимания как экономика работает, что у нас, так и на западе.

Но зато вот чего хоть отбавляй - желчных пользователей и "потенциальных клиентов", которых не устраивает абсолютно все и нужно сначала все передать "на тест". А если демка есть - то просто постоянный поток ненависти и список хотелок в пол. И таких каждую неделю в активные периоды - всегда много.

Тут в принципе далеко ходить не надо, моя мотивация написать эту статью описана в первом параграфе, но всегда есть робкая надежда, что какой-то % читателей увидит сквозь шум.

Как получить ggml .bin файл из huggingface репки?

# try.py
from transformers import WhisperForConditionalGeneration
import tempfile
import torch

model = WhisperForConditionalGeneration.from_pretrained("openai/whisper-tiny.en")
model.save_pretrained('./my')
torch.save(model.state_dict(), './my/file.pt')
$ python3 try.py
$ python3 models/convert-pt-to-ggml.py ./my/file.pt ~/code/whisper ./my
Traceback (most recent call last):
File "~/code/whisper.cpp/models/convert-pt-to-ggml.py", line 210, in <module>
hparams = checkpoint["dims"]
~~~~~~~~~~^^^^^^^^
KeyError: 'dims'

Зарегистрируйтесь на Хабре , чтобы оставить комментарий

Публикации

Истории