Pull to refresh
-1
Karma
0
Rating
Жуков Роман @Wicron

Пользователь

  • Followers 6
  • Following

Ученые СПбГУ помогли определить причину исчезновения мамонтов в Сибири

Если я правильно понял. То заболотилась сразу вся почва. На юге, севере, востоке , западе. И животные, которые могли обойти 2/3 суши на планете погибли за пару тысяч лет везде.

А «убивают» ли на самом деле русский Intel?

Чтобы вас поняли, пишите конкретнее. МЦСТ могло стать звеном усиления становления производства 65 нм в РФ. Это? Не было сделано. Пришло время пробовать другим

А ещё я думаю, что компания, которая сейчас владеет производством 5 нм может сделать свой собственный процессор буквально на бонусы от контрактов.

А «убивают» ли на самом деле русский Intel?

Итак. Процессор, произведенный за пределами страны НЕЛЬЗЯ признать своим

В ситуации, когда появилась компания, которая сможет сделать новую попытку создать обновлённое предложение , нужно отдать должное уважение Ядру. Risc-v как и ARM может быть быть произведен на линиях более грубого техпроцесса. И быть востребованным. Есть применения для операций над данными , речью, текстами , хостингом. Я не понимаю где все это время был мцст, вместо того, чтобы произвести по 65нм свое изделие в РФ

62-летний инженер с тремором рук легко вышел из положения: закрепил паяльник на стабилизации для камеры

Мне известна печатная плата, которую он ремонтирует — это одна из плат Умной колонки. Искренне жаль человека. И отличная демонстрация потребности в реальном продукте, который можно создать для людей с данным видом расстройства.

WebRTC на Android: как включить аппаратное кодирование на множестве устройств

Аппаратно AV1 начал появляться только для топовых кристаллов в линейку SoC для чипов на базе Cortex A55, A72, A73, поэтому до массового очень далеко — не менее 2х лет

WebRTC на Android: как включить аппаратное кодирование на множестве устройств

Отличная статья. Актуальная проблема.
Что касается AV1 — то только выходит в свет.

Почему Kaldi хорош для распознавания речи? (обновлено 25.12.2019)

Метрики качества устроили? С Деном Пуви уже пообщались? Он кстати быстро отвечает, особенно тем, кто «из тусовки». Наиболее впечатляющими цифрами по объему исходного сета как ни странно упоминается в контексте Amazon, затем идет Google. Эталоном объема являются цифры от 100 000 часов (Google), для Amazon цифра может быть большей, я не исключу, что Amazon имеет порядка 170 000 часов для каждого из языков (кажется 7 языков). Baidu и Facebook тоже оперируют цифрами от 100 000 часов на языки, поддерживаемые сервисами. Полагаю, что освоение новых групп языков идет по мере накопления размеченных данных. На этапе, когда данных мало для e2e распознавания работают kaldi-based решения, в момент достижения объема подключаются группы разработчиков e2e решения и заменяют прежние. Конечное решение о релизе применяются на основе метрик, обозначенных ранее с добавлением «экономических» метрик.

Почему Kaldi хорош для распознавания речи? (обновлено 25.12.2019)

CER, CHER, CXER, DEL, GER, HES, IMER, IMERA, INFLER, INFLERA, INS, IWER, IWERA, LMER, MER, MSTAT, NCR, OCWR, PHER, RER, SF, SUB, WER, WLMER, WMER…
Продолжать?
Вы еще студентов учите? Не позавидую результатам.
Для подтверждения информации об объемах датасетов вам нужно изучать публикации Google и Amazon.
А еще вам стоит иметь связи с людьми, которые там делают в прод. Стоит организовать переписку с Деном Пуви (facebook)
Иначе вы будете учить тому, подтверждения чего не имеет сами, это неэффективно.

Почему Kaldi хорош для распознавания речи? (обновлено 25.12.2019)

Ваша статья с самого начала серьезно похожа на оскорбление и ложь, породили ваши доводы, ноль пруфоф, отсутствует позиция автора модели, серьезная путанница в терминах, очень поверхностный подход к оценке качества, нет учета точности измерений. Нет сравнения ваших цифр и цифр из других публикаций. Отсутствуют тесты на аугментированных тестовых данных. Нет методики оценки общего показателя качества на основании нескольких метрик одновременно. Если бы она была, google и яндекс были бы для вас заоблачны и вывод был бы другим (особенно google)

Почему Kaldi хорош для распознавания речи? (обновлено 25.12.2019)

У вас вообще нет цифр. Вы так и не ответили, связались ли с автором и спросили ли про VoxForge? Мои цифры реальные. Исходный датасет и обучающий датасет не одно и то же и я ничего не путал. Нижняя граница обучающего датасета — это объем исходного. Верхняя граница — это исходный + синтетически аугментированный. Все цифры верны. Если вы решили посчитать WER как параметр качества, то учтите, что в открытых источниках качество распознавания оценивается примерно по 15 и более известным метрикам (лично мне). Ваша попытка делать вывод о качестве на основании одной метрики — это реально смешно. Что касается тусовок, то да, кажется вас там не было видно. Однако сути вещей не меняет. Какую цель вы ставите этой публикацией? Таблица сравнения — не очень адекватная, цифры не сходятся с тестами на больших тестовых сетах. Объем тестовой выборки позволяет вам утверждать о точности определения WER только с учетом диапазона. Подскажите, вы оценили точность определения WER? Судя по объему сета и цифрам в таблице точность оценки WER тут вряд ли превышает +-5%. Вы понимаете, что максимальная ошибка ваших выводов эквивалента нескольким годам работы крупных компаний по изменению этих показателей в лучшую сторону? Статья как по мне — пример как забить гвозди микроскопом.

Почему Kaldi хорош для распознавания речи? (обновлено 25.12.2019)

Работаете в Google? Общаетесь с людьми типа Дена Пуви (kaldi)? Начитаны, но не посчитали сумму обучающих сетов из публикаций Google?
— Оценка снизу — 100 000 часов
— Сверху — 1 млн. часов.
Диапазон большой. Коэффициент увеличения искусственными аугментированными сетами — около 10-12.
Общались с руководителями направлений из Яндекс? Как давно?
Калди уже давно не в проде в Я.
Google распознавание — E2E
Утверждение об аналогичности — это также смешно, как и печально.

Почему Kaldi хорош для распознавания речи? (обновлено 25.12.2019)

В нашей тусовке на воскфордже не обучал только конченый…
Вы общались с Шмыревым и уверены в том, что его модель НЕ обучалась на voxforge?
Даже если так, что ждем теста на 10-12 видов аугментации от бытовых шумов до эффектов скорости чтения и посмотрим на показатели.

Опыт создания сборок Linux под одноплатники с поддержкой обновлений

Полный бред.
1. Нет. Смотрите цены на бирже Шеньчженя.
2. Нет. Разброс параметров Nand как раз существенно влияет на качество выпущенного изделия, блочные устройства стабильнее в этом плане.

Почему Kaldi хорош для распознавания речи? (обновлено 25.12.2019)

Очевидно, что нет. У Шнырева использовался тот же воксфордж плюс ещё столько же. Это маленькая модель. Сам тест бы поставлен неверно, для этой модели он был проведён на обучающих данных. У гугла модель русского языка на почти 1 млн. часов. И она даёт результат лучше, чем маленькая модель на собственных данных. С яндексом схожая история

Почему Kaldi хорош для распознавания речи? (обновлено 25.12.2019)

Автор, ты канонический. Взял воксфордж в качестве тестовых данных и модель шнырев. Подскажи, ты в курсе что есть почти 100% вероятность, что Шнырев использовал воксфордж в качестве обучающей выборки? Таким образом ты вычислил WER не на тестовых данных, а на обучающих

AI пати в Siliconовой Долине: мэр, миллиардер, президенты, гении, разработчики процессоров и девушка с яркими волосами

Отличная статья с людьми, чей интеллект и есть фундамент новых компаний, который, к сожалению, по мере роста становится на видно. Но фотка 90 года с бутылкой на столе и первым подключенным компьютером в СССР к сети Интернет всё равно лучшая. Я думаю, очень многим интересен формат статей, где технологии — это люди.

Как «цифровые археологи» обнаружили утерянную версию SimCity для NES и восстановили ее

Выглядит здорово, по тем временам могла бы стать хитом.

Яндекс.Станция. Как мы создавали первое устройство с Алисой

Да, есть личный обиды. Давайте я их отпущу… сюда.
Я проходил собес на разработчик железной части Станции.
Оно включало фактически 13 этапов. Я получил согласие руководителя проекта Станция и приступил к посещению некоего вида собраний. Это было перед стартом проекта. Обсуждался функционал, алисы еще не было, рассматривался вариант использования другого движка, мы привезли в яндекс прототипы, показали код формирования диаграммы направленности, локализации, VAD, графики, железный массив микрофонов, подписали документ. Тогда команды не было, фактически Круглов взял помощника и фактически все, что было сделано — заказано пару железяк и в целом был полный вакуум. Именно тогда шли активные дебаты — делать видеовыход или нет. Синтеза тоже еще не было. Отделы Яндекса еще не знали о работе и в целом не было даже взаимной кооперации. В силу наличия проблем взаимодействия рассматривались варианты использования сторонних решений. Спичкит тогда тоже был в зародыше и работал так себе.
Круглов — руководитель проекта Станция, фактически занимался раньше рекламой. При этом ему рекомендовали нас люди, которые фактически продавали спичкиту датасеты в Яндекс, а также имели обширный опыт работы в компании №3 по распознаванию русской речи и были совместные неформальные встречи. Мы проявляли действенный интерес, много спорили и не скрывали по крайней мере мы от них реального положения дел и необходимых действий, проводили оценку сроков, бюджетов, состава команды.
Вместе со мной были приняты другие люди, мы письменно спрашивали подтверждение и руководитель в письменной форме в составе личной переписке подтвердил это.
Но вот дальше начались интересные вещи. После первого собеса например мне назначили второй собес. Затем после второго — 3й собес.И в итоге в форме Яндекса, где принимают сотрудников у меня значилось что-то около 12 оценок от разных людей. Яндекс также нанял что-то типа внешнего аудитора по тех. части — человека, который не был в составе яндекса, но работал технарем в дизайн хаусе. Начали складываться мысли, что всё делается для того, чтобы не допустить нас к проекту. После этого когда мы дали подтверждение HR о согласии на оплату — договорились по сумме, настало 2 недельное ожидание даты выхода в проект. После 2 недель руководитель написал о необходимости еще времени на решение вопросов с трудоустройством, затем… спустя месяц в наглой форме написал о том, что мы якобы уже не подходим и можем идти куда подальше.
Знаете, мне зачастую плевать на сумасбродов и откровенно людей, ведущих себя как дураки. Но меня поражает 2 других момента:
Момент 1. Яндекс на эту позицию взял сотрудника стартапа Кубик. А теперь внимание — этого сотрудника в Кубик устроил Я. А теперь внимание — как это было. Когда из кубика свалил железячник я не нашел ничего более простого, как устроить туда своего знакомого, которого фактически брали паять диоды на ардуинку. Он не смог начать делать массив микрофонов и кубик отвалил эту задачу на аутсорс, причем отвалил ее человеку, который работал на нас. Круг фактически замкнулся. Да, мы платили ему, знали об этом они или нет — не знаю. Но у них получался отвратный бестолковый массив микрофонов без обработки — тупо дампер данных, дорогой, сложный, большой.
Как зовут — ну в Яндекс он именует себя Александр Брад. Был левым разработчиком, случайным — не из команды кубика.
И Круглов повелся на легенду и взял его в Станцию. Зачем это было сделано? Полагаю, что глупость — одна из причин, другие не хочу обсуждать.

Яндекс.Станция. Как мы создавали первое устройство с Алисой

Они вместо разрабов наняли шлак. Помимо вашего замечания я заметил вчера отсутствие пикофарадного конденсатора между выводами каскада, так делают, чтобы не оцифровывать высокочастотный шум, который имеет свойство проникать по питанию. В рекомендациях на сайте ST есть примеры и формула расчета емкости оного.
Эти микрофоны еще и не очень надежны в плане качества. Известна высокая капризность MEMS технологии к условиям пайки. Приводит это к разбросу параметров SNR и чувствительности при нарушении условий монтажа. Также эти микрофоны чувствительны к отмывке изделий, к составу и к обработке давлением.
65 дб — это уровень MEMS технологии образца 2015 года. Каждый год уровень MEMS растет на 1.2 дб. Реальное коммерческое применение имеют микрофоны с SNR 70. К сожалению описанные вами микрофоны с 74дб — пока выдумка, но уже на подходе — конец 2020 года. 70 дб работает на дальности до 10 метров. Реальный пример устройства я уже успел увидеть. К сожалению, рубеж в 75-76 дб мемсу будет тяжело преодолеть и скорее всего дальше будут развиваться уже другие технологии. К 2024 году технология достигнет насыщения.
Всё этого было известно компании Яндекс, которая имела ряд NDA, подписанных с другими стартапами. Также имеется персональная переписка с руководителем проекта Станция — Кругловым. В разработчики они взяли по электронике в том числе бывшего сотрудника стартапа Кубик. По результатам работы видно, что устройство может быть лучше в плане акустики. Скорее всего текущий результат связан с отсутствием реальных компетенций по обработке звука с массива микрофонов, оперирование чужими исходниками и как следствие неполное понимание задачи от и до.
Компания строит хайп вокруг проекта. У компании есть контент. Но в компании нездоровая атмосфера в руководстве, которая реально позволяет совершать глупые поступки и принимать постыдные решения, наносящие ущерб той части продукта, в которой не разбирается даже руководитель.

Яндекс.Станция. Как мы создавали первое устройство с Алисой

Да, передайте для анализа Круглову привет. Вам не стоило брать второсортный товарняк, вместо колонки у вас бухтелка. Синтез Алисы забили низами. Институту Фраунгофера вы за что заплатили? Станция по моим ощущениям не работает нормально на дальностях свыше 3х метров. Микрофоны у вас полная лажа, 100% ущербный вариант. Эта компания занимает 1-3% рынка MEMS микрофонов. В 2017 году мы уже ставили микрофоны c SNR 67.5 дб. Дальность работы нашей колонки составляла 7 метров. И производит их компания, которая имеет долю на рынке — почти 2/3 от мирового. Скажите, может ли компания с бюджетами, уступающая лидеру рынка на порядок, делать качественные микрофоны. Нет, не может. Одни из лучших русских инженеров в плане экспириенса работают в московском офисе huawei, вам бы стоило привлекать к проекту опытных инженеров-акустиков, они, кстати, подтвердили бы сказанное тут.

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Date of birth
Registered
Activity