1. Иконка тусклая
2. Тока ландшфтный режим
3. Крутить не удобно кругл кнопку
4. Не видно лого сайтов из-за кол-ва не прослушеного на них
5. Настройки… хочу тока мужской голос например слушать.
6. Хочу отметить, какие посты мне читать.
7. Нет возможности свои потоки добавлять
8. При старте программы, когда включается че за метроном… пусть гвоорит я Rss читалка лялляялял могу то и се.
дороговатенько за простое произношение текста. Сложно представить область где это так востребовано чтобы платить бакс за минуту.
Девушки по телефону вроде примерно столько же берут )) проще их переманить на зачитывание будет ;)
Небольшая логическая ошибка — у вас один клиент платит за 1 минуту прочтения ему текста 1 доллар, а значит никакой многоканальности и нагруженности за 1 доллар не предполагается.
Итого один зачитыватель должен получать 6,5 тысяч рублей за 6-и часовой рабочий день (если он целиком заполнен чтением) без угроз нагрузки и многоканальности. Я думаю что желающих найдется уйма.
А дебажить — это сколько угодно — только психоаналитик должен входить в соцпакет ;)
Простите, это правда не совсем так. Мы честно проводили исследования, а не называли цену «с потолка». Вы можете исследовать free-lance.ru или любое другое сообщество фрилансеров, чтобы узнать, за какие деньги можно озвучить текст человеческим голосом. Это в несколько раз дороже 1 доллара в минуту. Тонкость в том, что человек редко может читать текст быстро, точно и с ровным выржением долго и с первого раза. Получаются дубли, монтаж и совсем не 1 минута записанной реч за одну минуту работы.
Впрочем, если Вы чувствуете в себе силы стать профессиональным диктором — поработайте на этом поле, поконкурируйте с нашим синтезом и профессиональными дикторами. Глядишь, мы вас пригласим стать очередным голосом нашего синтеза! :)
>> Вы можете исследовать free-lance.ru или любое другое сообщество фрилансеров, чтобы узнать, за какие деньги можно озвучить текст человеческим голосом. Это в несколько раз дороже 1 доллара в минуту.
Зато будет небольшой плюс: это будет озвучено человеческим голосом.
Абстрагируемся от качества — идея «поминутной» монетизации интересна. Идея брать доллар за минуту — бредовая. Не представляю кто кроме госпредприятий будет это покупать по такой цене. Всё таки не сравнивайте пожалуйста напрямую цену работы человека и цену работы машины. Понятно — что хочется суперприбылей. Но если ваш инвестор поверил в план продаж по 1USD/min — он или сильно непрофильный или не сильно умный.
Меняйте подход — берите массовостью. Даже без особых денег. Будет у вас 100000 постоянных пользователей — продавайтесь гуглу или яндексу. Хоть что-то отобьёте.
Большое спасибо за советы, и к массовости мы придём.
Но если даже траву тянуть руками, она быстрее не вырастет. К сожалению, мы не можем разрушать наши целевые рынки, в данном случае рынок систем голосового самообслуживания, демпингом. Так что всему своё время. Если для Вас лично наши цены дороги, а уговорить нас предоставить лично Вам сервис дешевле у вас нет — значит, время не пришло для нашего с Вами лично партнёрства.
У нас нет внешнего инвестора и веб-сервис является внутренним стартапом довольно большой компании, готорая работает с компаниями масштаба Гугла и Яндекса в партнёрских отношениях.
При такой цене может дойти то абсурда как это было с телеграммами. Когда человек пишет поздравительную телеграмму — дабы, типа, поздравить добрыми словами, но пытается их всячески сокращать. Вот и вам будут отдавать на озвучку «Здрствте уважмые абннты.»
И еще один вопрос — как можно будет определить за какое время может быть прочитан текст? Т.е. у заказчика есть допустим 500 000 000 долларов на запись аудио-книги «Войны и мир» — а вдруг не хватит? ;)
Еще как вариант — для сокращения расходов — будут просить ускорить голос — а то как то слишком медленно он у вас говорит… больно дорого получается в соотношении мысль/цена
1. Ускорять и замедлять голос можно через стандартные возможности API — язык разметки SSML.
2. Тарификация посекундная, так что минуты хватит на несколько «телеграмм».
Чем просто ругать, возьмите бесплатный промо-ключ на 20 минут, попробуйте для конкретной задачи и предложите другое ценообразование, исходя из цены изделия/сервиса, которое вы хотите предложить конечному пользователю.
Что ж Вы так близко к сердцу принимаете невинный троллинг? ;)
Я кстати к Вам думал устраиваться работать, хвалили вас сильно инсаайдеры, но опередили предложением…
Цитирую: «Да в Питере у нас интересные проекты, но реально придется работать» ;)
з.ы. Про программеров не знаю, но манагерам вам срочно нужно поднимать зп ;)
1 минута озвучки 1 доллар это конская цена. Даже если эту минуту можно одновременно в тыщу потоков раздавать — всё равно конская. В конце концов 1 кусок текста на минуту озвучивается однократно, а дальше уже просто плата за трафик.
Как ниже уже заметили, дешевле для озвучки студентов нанять — у них хоть голос не роботизированный.
Мне интересно что именно включено в эту минуту за доллар? Особенно у тех девушек которые «берут дороже» :) час — 60 долларов, день — 240 долларов, месяц — почти 5 тыщ.
Теперь ещё вам надо пролоббировать на законодательном уровне замену технологии голосового меню у всех мобильных операторов. Чтобы вместо заранее начитаных диктором пунктов — обязать их пользоваться вашим сервисом. А от вас — 7% в пенсионный фонд.
Вам — денюжкка.
Операторам удобство.
Пенсионерам пенсию.
Чиновникам откаты.
Абонентам — наконец-то чтобы «связаться с оператором» не надо будет 5 минут слушать слоупоковские речи «Акции — наааажмиииите аааадин».
1. Принято.
2. Не было идей, как радио сделать вертикально. Ну и вообщем приложение-то для слуха; у нас тут все время раздвоение сознания — либо вообще отказаться от интерфесов (мы же на слух ориентируемся), но эстетика красивых приложений не дает расслабиться.
3. Кнопку можно не крутить. в видео показано как.
4. Придумаем во второй версии.
5-7. Вторая версия.
8. Метроном вообщем-то замолкает через 30 сек. сам собой или при включении канала. Но если будет раздражать — уберем. Поток кстати какой-нибудь до конца дослушайте. Там сюрприз ;) ну или просто сразу последнюю новость до конца. В следующей версии вынесем звуки в настройки. Можно будет отключить разом все.
А если серьёзно, вы же пишете сервис, вы и пробуйте.
Это вопрос дизайна и юзабилити. Можно поставить на голосование, а можно просто потратить час и попробовать как оно. А можно и чекбокс добавить, или вообще скины.
Вот я вам сейчас отвечу — ДА. А вы мне потом счёт предъявите — «сделали с переворотом — продали 18 минут речи за месяц».
Был же сервис, который накладывал звуки вувузел на видео в youtube. Аналогичным образом можно и голос накладывать, наверное. Главное — научиться в .js выковыривать субтитры из ролика и отправлять их в реальном времени на сервер. Поскольку популярных роликов мало, результаты преобразования можно легко кэшировать на сервере и большинству раздавать уже готовое.
Выглядит красиво, звучит ужасно, дольше 2х минут слушать хабр я не смог. На ролике с фокусом звучит раз в 100 лучше, почему так? Специально что-ли текст под озвучку подгоняли?
только вчера задумался о необходимости такого приложения а вы уже реализовали. молодцы!
когда едешь в метро приятно почитать свои подписки с экрана смартфона слушая музыку.а когда еду на работу за рулем глаза заняты другим делом, а новости по радио не соответствуют моим интересам. успешного и интенсивного развития вам. а также на других платформах ;)
«Ещё одна интересная особенность, также не обремененная практическим смыслом, — это умение телефона зачитывать вслух SMS. Телефон умеет „читать“ как по-английски, так и по-русски. В последнем случае лучше воспроизводятся сообщения, набранные кириллицей, хотя и с транслитом аппарат справляется неплохо»
полагаю, технически это мало отличается от зачитывания заголовков рсс, так ведь? www.mobiset.ru/articles/text/?id=437
обратите внимания на дату написания статьи
или киллер-фича приложения именно в «человечности» синтеза?
Киллер-фичи тут нет. Синтез речи уже давно не новость. Но вот к его качеству были и будут претензии. Мы стараемся сделать его лучше и лучше. Мы просто технологическая компания, разработавшая технологию русского синтеза с массой тонкостей и претендующая на лидерство в этой технологии. Долгое время держали разработку при себе и на очень узком рынке автоматических систем голосового самообслуживания, а вот сейчас решили расширить аудиторию. Будем рады, если вы воспользуетесь приложением или открыточным сервисом, дадите ваши отзывы, порадуетесь вместе с нами. Если запустите собственный стартап в партнёрстве с нами — вообще отлично! :)
Если появляются конкретные задачи, мы всегда «подпиливаем» синтез для идеального произнесения наиболее характерных для этой задачи фраз. Кроме того, можно размечать текст, чтобы помогать роботу читать его лучше. Просто новости читаются безо всякой помощи человека — это самый сложный случай для робота.
при переключении каналов сделайте отбивку, чтобы как на настоящем радио при перенастройке — «свист и улюлюкание», перебиваемое обрывками фраз с других каналов :)
сделали, потом подумали и отказались. может вернем. если реально пользоваться, а не играться — немного отвлекает.
во второй версии вынесем в настройки — «отключить все лишние звуки».
Йолки, охренеть!
Я так давно не интересовался синтезом речи, что просто ошеломлен насколько плавно компьютер научился читать на данный момент. Сейчас включил колонки и дал послушать коллегам (последний ролик), никто сразу не поверил, что это не живой человек читает.
Спасибо!
Будущее прекрасно.
зы. да, идея для приложения тоже хороша, надо опробовать.
Выдали ключ. Опробовал. На слух — по качеству синтеза речи (женские голоса) приблизительно, как гугловский. Только один женский голос (Мария) смог произнести фразу с адекватно расставленными ударениями и учетом знаков препинания. Мужские голоса не тестил.
Пишите вашу идею, рассказывайте. Всё обсуждаемо. Просто «некоммерческих» использований на самом деле довольно мало :) Если докажете, что у вас именно такое — дадим. Только не обижайтесь, если мы будем медленно и неохотно отвечать, потому что на самом деле мы делаем суровые «изделия», и у команды довольно немного свободного времени :)
Собственно, далеко ходить не надо — все есть на хабре ;) Для чего бы я использовал ваши технологии можно посмотреть из моих топиков.
Я строю систему «умный дом» на базе разрабатываемого open source ПО.
Ну тогда Вам сюда: htk.eng.cam.ac.uk/ :)
На самом деле, распознавание и синтез Гугла — это не Open Source, а использование уязвимости.
По идее, Вам бы использовать движки синтеза и распознавания с открытым кодом для чистоты идеи.
Кстати, проблема с распознаванием в умном доме — это как раз микрофоны. Вам надо либо носить микрофон с собой, либо строить в помещении дорогую систему микрофонов.
Опубликуем наш сервис распознавания — попробуете.
Но без коммерческих предпосылок никто конечно не даст коммерческие движки синтеза и распознавания надолго. Пока что это слишком дорогостоящие в разработке штуки.
Синтез точка всё. Хабрахабр в прямом эфире