Как я заработал 1 000 000 $ без опыта и связей, а потом потратил их, чтобы сделать свой переводчик

Как все начиналось


Эта история началась 15 лет назад. Работая программистом в столице, я накапливал деньги и увольнялся, чтобы потом создавать собственные проекты. Для экономии средств уезжал домой, в небольшой родной город, где работал над сайтом для студентов, программой для торговли, играми для мобильных телефонов. Но из-за отсутствия опыта ведения бизнеса это не приносило дохода, и вскоре проекты закрывались. Приходилось снова ехать в столицу и устраиваться на работу. Эта история повторилась несколько раз.

Когда у меня в очередной раз закончились деньги, наступил кризис. Я не смог найти работу, ситуация стала критической. Пришло время посмотреть на все вещи трезвым взглядом. Нужно было честно признаться себе, что я не знаю, какие ниши выбрать для бизнеса. Создавать проекты, которые просто нравятся, — путь в никуда.

Единственное, что я умел делать, это приложения для iOS. Несколько лет работы в ИТ-компаниях позволили накопить определенный опыт, и было решено сделать много простых принципиально различных приложений (игры, музыка, рисование, ЗОЖ, изучение языков) и протестировать, в каких нишах будет небольшая конкуренция. Был подготовлен набор классов и библиотек, которые позволяли быстро создавать простые приложения на различную тематику (2d игры, gps-трекеры, простые утилиты и т.д). В большинстве из них было несколько картинок, 2 кнопки и всего одна функция. Но этого было достаточно, чтобы проверить идею и то, насколько легко будет на ней заработать. Например, приложение для бега отслеживало скорость человека, пройденное расстояние, а также подсчитывало калории. На создание сотен простых приложений я потратил полтора года. Такая скорость стала возможной благодаря покупке графики на стоках, а также повторному использованию исходников.



Сначала приложения были бесплатными. Потом я добавил рекламу и встроенные покупки, подобрал ключевые слова и яркие иконки. Приложения начали скачивать.

Когда доход достиг 30 тыс $ / месяц, я решил рассказать товарищу, который работал в большой продуктовой компании, что на тестовых приложениях я смог достичь такой цифры, и предложил создавать их вместе. Он ответил, что у них всего 1 приложение — игра с доходом в 60 тыс $ и 25 тыс пользователей в месяц, против 30 тыс $ выручки и 200 тыс пользователей у меня. Это полностью изменило мои взгляды. Выяснилось, что лучше создать одно качественное приложение, чем сто некачественных

Я понимал, что на качественных можно заработать в десятки раз больше, но я был один в маленьком городе без опыта и команды дизайнеров и маркетологов. Мне требовалось платить за аренду квартиры и зарабатывать на жизнь. Тестовые приложения нужны было просто для проверки рыночных ниш и рекламных стратегий, чтобы научиться, какие приложения и как именно создавать. Просто сложилось, что некоторые из них начали приносить неплохой доход. Сейчас тема простых приложений давно умерла, и там больших денег уже не заработать.

Некоторые приложения сильно отличались по прибыли — это были переводчики, приложения для грузоперевозок, музыкальные программы (которые симулируют игру на пианино, барабанах или, например, гитарные аккорды, плееры), а также простые логические игры.

Тестируя различные виды игр, я понимал, что игры с большой длиной сессии и вовлечением пользователей (типа “2048”) способны приносить много денег на длинном интервале времени. Но поначалу это было неочевидно. Поэтому я создавал тестовые аппы типа GPS- трекеров для лыжников и в ключевых словах ставил название популярных лыжных курортов типа Куршавеля. А потом радовался, что клик по рекламе приносил 2$. Но это была краткосрочная немасштабируемая стратегия.

Потом я заметил, что буквально за месяц переводчики скачали более 1 млн раз. И это при том, что они находились примерно на 100-й позиции в рейтинге категории.

Музыкальные приложения принесли столько же скачек, но с учетом привлечения пользователей они были менее перспективны. Пользователей для них нужно привлекать по высокочастотным ключевым словам, а их в этой нише не много: тот, кто ищет приложения для гитары, вводит в поиске — «гитара», «бас-гитара», «аккорды» и т.д. Сложно подобрать много синонимов для такой тематики. Таким образом, пользователи сконцентрированы на высокочастотных запросах, и рано или поздно их привлечение будет стоить дорого. В переводчиках все по-другому.

Языков в мире сотни, и люди вводят запрос не только общим словом «переводчик», а несколько слов как решение своей проблемы: «перевести на французский», «переводчик с китайского». Если запросов много, привлекать пользователей можно просто по среднечастотным ключевым словам (ASO). Ниша оказалась перспективной, тем более, сама тема переводов мне нравилась.

Позже было создано около 40 простых переводчиков, где использовался перевод, который предоставлял Google API. Его стоимость была по $ 20 за 1 млн переведенных символов. Постепенно появились улучшенные версии приложений, где я добавил рекламу, встроенные покупки, функцию перевода голоса.

Заработав денег, я переехал в Минск и купил жилье. На то время у меня было 50−70 приложений для перевода и 5 млн скачиваний. Но с ростом пользователей увеличивался расход на платный Google Translate API. Прибыльность бизнеса серьезно снизилась. Платящие пользователи переводили блоки от 1 тыс символов за раз, что заставило ввести лимиты на запрос. Когда они упирались в лимит на перевод, писали плохие отзывы и возвращали деньги. Настал момент, когда 70% выручки уходило на расходы. При больших объемах перевода этот бизнес оказался не такой перспективный. Чтобы окупить расходы, в приложения нужно было добавлять много рекламы, а это всегда отпугивает пользователей. Требовалось сделать свое API для перевода, а это скорее всего будет не дешево.

Я пробовал просить совета и инвестиций у стартапов и ИТ-сообщества, но поддержки не встретил. Большинство людей не понимали, зачем работать на рынке, где уже есть лидер — Google-переводчик.

Помимо Google было еще несколько компаний, которые предоставлял API для перевода. Я был готов заплатить $ 30 тысяч за их лицензии технологий перевода на 40 языков. Это позволило бы мне переводить неограниченное количество раз за фиксированную цену и обслуживать любое количество пользователей на своих серверах. Но мне в ответ называли сумму в несколько раз выше. Это было слишком дорого. Было решено попробовать сделать свою технологию для перевода. Я пробовал привлечь друзей для разработки, но к тому времени у большинства из них уже были семьи, маленькие дети и кредиты. Все хотели стабильности и жизни в свое удовольствие на хорошую ЗП, а не идти в стартап. Также они не понимали, зачем создавать переводчик, если есть Google с крутым навороченным приложением для перевода и API. У меня не было опыта публичных выступлений, харизмы и крутого прототипа приложений, чтобы заинтересовать людей. Аналитика по заработку 300 тыс $ на тестовых приложениях для перевода никого не удивляла.

Я обратился к знакомому, который владеет аутсорс-компанией в Минске. В конце 2016 года он выделил для меня команду. Я рассчитывал, что решу задачу за полгода на базе open-source проектов, чтобы не зависеть по API от Google.

На пути к своему переводчику


Работа началась. В 2016 году мы нашли несколько opensource проектов — Apertium, Joshua и Moses. Это был статистический машинный перевод, подходящий для несложных текстов. Эти проекты поддерживали от 3 до 40 человек, и чтобы получить ответ на вопрос по ним, требовалось много времени. После того как разобрались и все-таки запустили их на тесты, стало ясно, что нужны мощные сервера и качественные датасеты, которые стоят дорого. Даже после того, как мы потратили деньги на железо и качественный датасет на одну из пар перевода, качество оставляло желать лучшего.

Технически все не сводилось к схеме «скачать датасет и натренировать». Оказалось, что есть миллион нюансов, о которых мы даже не подозревали. Перепробовали еще несколько ресурсов, но хороших результатов не добились. А Google и Microsoft свои наработки не раскрывают. Тем не менее, работа продолжалась, периодически подключались фрилансеры.

В марте 2017 года мы наткнулись на проект под названием Оpen NMT. Это совместная разработка компании Systran, одного из лидеров на рынке машинного перевода, и университета Гарварда. Проект только стартовал и предлагал перевод уже на базе новой технологии — нейронных сетей.

Современные технологии машинного перевода принадлежат большим компаниям, они закрыты. Мелкие игроки, понимая, как сложно внедриться в этот мир, таких попыток не предпринимают. Это тормозит развитие рынка. Качество перевода среди лидеров не сильно отличалось друг от друга долгое время. Очевидно, что и крупные компании столкнулись с дефицитом энтузиастов, научных работ, стартапов и opensource проектов, чтобы брать новые идеи и нанимать людей.

Поэтому Systran сделала принципиально новый маневр: выложила свои наработки в opensource, чтобы такие энтузиасты, как я, могли включиться в эту работу. Они создали форум, где их специалисты стали бесплатно помогать новичкам. И это принесло хорошую отдачу: начали появляться стартапы, научные работы по переводу, так как каждый мог взять основу и на базе нее проводить свои эксперименты. Systran стал во главе этого сообщества. Потом подключились другие компании.

В то время ещё не было повсеместного нейронного перевода, а Оpen NMT предлагал наработки в этой области, выигрывая по качеству у статистического машинного перевода. Я и другие ребята по всему миру могли взять эти технологии и спросить совета у специалистов. Они охотно делились опытом, и это позволило мне понять, в каком направлении двигаться.

Мы взяли OpenNMT за основу. Это происходило в начале 2017 года, когда он был еще «сырым» и не содержал ничего кроме базовых функций. Все это было на Lua (Torch), чисто для академических исследований. Обнаруживалось много багов, все работало медленно, нестабильно и крешилось при небольшой нагрузке. Для production он вообще не годился. Потом в общем чате мы все вместе тестировали, ловили ошибки, делились идеями, постепенно повышая стабильность (тогда нас было около 100 человек). Сначала я удивлялся: как же так, зачем Systran растит себе конкурентов? Но со временем понял правила игры, когда все больше компаний начали выкладывать свои наработки по обработке естественного языка в opensource.

Даже если у всех есть вычислительные мощности, чтобы обрабатывать большие датасеты, то вопрос с поиском специалистов по NLP (обработка естественного языка) на рынке стоит остро. В 2017 году эта тема была намного менее развита, чем обработка изображений и видео. Меньше датасетов, научных работ, специалистов, фреймворков и прочего. Людей, способных из научных работ по NLP построить бизнес и закрыть какую-либо из локальных ниш, еще меньше. И компаниям верхнего эшелона типа Google, и игрокам поменьше типа Systran нужно получить конкурентное преимущество относительно игроков из своей категории.

Как они решают этот вопрос?

На первый взгляд это кажется странным, но чтобы конкурировать между собой, они решают вводить на рынок новых игроков (конкурентов), а чтобы они там появлялись, нужно раскачать его. Порог входа до сих пор высок, а запрос на технологии обработки речи очень растет (голосовые ассистенты, чат-боты, переводы, распознавание и анализ речи, и т.д.) Нужного количества стартапов, которые можно купить для усиления своих позиции, до сих пор нет.

В открытом доступе публикуются научные работы от команд Google, Facebook, Alibaba. От них же в opensource выкладываются их фреймворки и датасеты. Создаются форумы с ответами на вопросы.

Крупные компании заинтересованы, чтобы такие стартапы, как наш, развивались, захватывали новые ниши и показывали максимальный рост. Они с радостью готовы покупать NLP стартапы для усиления своих больших компаний.

Ведь даже если у тебя на руках все датасеты, алгоритмы и тебе подсказывают, это ещё не значит, что ты сделаешь качественный переводчик или другой стартап в области NLP. А даже если и сделаешь, то далеко не факт, что откусишь большой кусок рынка. Поэтому нужно помочь, и если у кого-то получится, купить или объединиться.

В марте 2018 года Systran пригласила всё сообщество в Париж для обмена опытом, а также устроила бесплатный мастер-класс по основным проблемам, с которыми сталкиваются стартапы по переводам. Всем было интересно посмотреть друг на друга вживую.

У всех были различные проекты. Кто-то создавал бота для изучения английского языка, с которым можно говорить, как с человеком. Другие использовали openNMT для суммаризации текста. Значительная часть стартапов представляла плагины для SDL Trados Studio, заточенные под определенную тематику (медицина, строительство, металлургия и т.д.) или язык, чтобы помогать переводчикам экономить время на редактуру переведенного текста.

Помимо энтузиастов, в Париж приехали ребята из Ebay и Booking, которые создают переводчик на той же платформе, что и мы, но оптимизированный для перевода описаний аукционов и отелей.

Также в мае 2017 года Facebook выложил свои наработки по машинному переводу Fairseq в open-source вместе с натренированными моделями для тестов. Но мы решили остаться на OpenNMT, наблюдая, как растет сообщество.

История DeepL


В сентябре 2017 года, анализируя конкурентов, я узнал про DeepL. Они в это время только запустились и предоставляли перевод всего на 7 языков. DeepL позиционировался как инструмент для профессиональных переводчиков, помогающий тратить меньше времени на корректуру после машинного перевода. Даже небольшое изменение в качестве перевода позволяет сэкономить много денег для компаний, занимающихся переводами. Они постоянно отслеживают API для машинного перевода от разных поставщиков, так как качество на множестве языковых пар у всех разное и нет единого лидера. Хотя по количеству языков – больше всех у Google.

Чтобы продемонстрировать качество перевода, DeepL решил устроить тесты на некоторых языках.

techcrunch.com/2017/08/29/deepl-schools-other-online-translators-with-clever-machine-learning

Оценка качества проводилась методом слепого тестирования, когда профессиональные переводчики выбирают лучший перевод из Google, Microsoft, DeepL, Facebook. По результатам победил DeepL, жюри оценило его перевод как наиболее “литературный”.

Как так получилось?

Основатели DeepL владеют стартапом Linguee – крупнейшей базой ссылок на переведенные тексты. Скорее всего, у них гигантское количество датасетов, собранных парсерами, и чтобы натренировать их, нужна большая вычислительная мощность.

В 2017 году у них вышла статья о том, что они собрали в Исландии суперкомпьютер в 5 петаФлопс (на тот момент он был 23-м по производительности в мире). Натренировать большую качественную модель было лишь делом времени. В том момент казалось, что даже если мы купим качественные датасеты, то все равно никогда не сможем конкурировать с ними, не имея такого супер-компьютера.

www.top500.org/news/startup-launches-language-translator-that-taps-into-five-petaflop-supercomputer/?fbclid=IwAR3kPvVCYwnEHpIkAVUazy5O649g_K3aKiCFaaFbDyPfuCKyuRCmSX6O8To

Но все изменилось в марте 2018 года. Nvidia выпускает компьютер DGX-2 размером с тумбочку и производительностью в 2 петаФлопса (FP16), который сейчас можно взять в лизинг от 5000$ / месяц.

www.nvidia.com/en-us/data-center/dgx-2

Имея такой компьютер, можно тренировать свои модели с гигантскими датасетами быстро, а также держать большую нагрузку по API. Это кардинально меняет расклад сил всего рынка стартапов машинного обучения и позволяет небольшим компаниям конкурировать с гигантами в области работы с большими данными. Это было лучшее предложение на рынке в соотношении «цена-производительность».

Я начал искать информацию о статистике DeepL. У Google за 2018 год было 500 миллионов пользователей ежемесячно. У DeepL — 50 миллионов (статья от 12 декабря 2018).

slator.com/ma-and-funding/benchmark-capital-takes-13-6-stake-in-deepl-as-usage-explodes

Получается, что в конце 2018 года 10 % от ежемесячной аудитории Google пользовались DeepL, причем они нигде особо не рекламировались. Чуть более чем за год они захватили 10 % рынка, использую сарафанное радио.

Я задумался. Если DeepL командой в 20 человек победил Google, имея в 2017 году машину в 5 petaFlops, а сейчас можно дешево арендовать машину в 2 petaFlops и купить качественные датасеты, насколько будет сложно добиться качества Google?

Lingvanex Control Panel


Чтобы быстро разбираться с задачами перевода и не запускать тесты из консоли, был сделан Dashboard, который позволял делать все задачи, начиная от подготовки и фильтрации данных до деплоя тестов перевода на Production. На картинке ниже: cправа — список задач и GPU-серверов, на которых идет тренировка моделей. По центру — параметры нейронной сети, а снизу – датасеты, которые пойдут на тренировку.



Работа над новым языком начиналась с подготовки датасета. Мы брали их из открытых источников типа Wikipedia, заседания Европарламента, Paracrawl, Tatoeba и др. Чтобы получить среднее качество перевода, достаточно 5 миллионов переведенных строк.



Датасеты представляют собой строки текста, переведенного c одного языка на другой. Потом токенизатор разделяет текст на токены и создает из них словари, отсортированные по частоте встречания токена. Токеном могут быть как единичные символы, слоги, так и целые слова.



После того как загрузили датасеты в БД, в них оказалось очень много слов с ошибками или с некачественным переводом. Чтобы добиться хорошего качества, их нужно сильно фильтровать. Также можно купить уже качественные отфильтрованные датасеты.



Когда язык развернут на API, нужно установить для него список доступных функций (распознавание голоса, синтез речи, распознавание картинки, парсер файла, сайта и др.). Для работы функций используется стороннее API часть opensource – часть third-parties.

Потом это все разворачивается на API. Со временем был добавлен кеш. Он хорошо работает на 1- и 2-словных фразах и позволяет экономить до 30% запросов.

Продолжаем работу


Весь 2018 год я потратил на решение проблемы качественного перевода на основных европейских языках. Думал, что ещё полгода — и всё получится. Я был очень ограничен в ресурсах, задачами по Data Science занималось всего 2 человека. Нужно было двигаться быстро. Казалось, что решение проблемы в чем-то простом. Но светлый момент всё не наступал, я не был доволен качеством перевода. Было потрачено уже около 450 тыс $, заработанных на старых переводчиках, и требовалось принимать решение, как быть дальше. Запуская этот проект в одиночку и без инвестиций, я понял, сколько управленческих ошибок совершил. Но решение принято — идти до конца!

В это время я заметил, что  в нашем сообществе начали говорить про новую архитектуру для нейросетей — Transformer. Все бросились тренировать нейронные сети на базе этой Трансформер-модели и стали переходить на Python (Tensorflow) вместо старой Lua (Torch) Я решил тоже попробовать.

Также мы взяли новый токенизатор, сделали препоцессинг текста, по-другому стали фильтровать и размечать данные, иначе обрабатывать текст после перевода, чтобы исправлять ошибки. Сработало правило 10 тысяч часов: было много шажков к цели, и в определённый момент я понял, что качество перевода уже достаточно для того чтобы использовать его в API для собственных приложений. Каждое изменение добавляло 2-4% качества, которых не хватало для критической массы и при которой люди продолжают пользоваться продуктом, не уходя к конкурентам.

Потом мы начали подключать различные инструменты, которые позволяли и дальше улучшать качество перевода: определитель именованных сущностей, транслитерацию, тематические словари, систему исправления ошибок в словах. За 5 месяцев этой работы качество переводов на некоторых языках стало значительно лучше и люди начали меньше жаловаться. Это был переломный момент. Ты уже можешь продать программу, и из-за того что у тебя есть свое API для перевода, можно сильно сократить расходы. Можно наращивать продажи или количество пользователей, ведь расходы будут только на сервера.

Для обучения нейронной сети нужен был хороший компьютер. Но мы экономили. Сначала мы арендовали 20 обычных компьютеров (с одной GTX 1080) и одновременно запускали на них 20 простых тестов через Lingvanex Control Panel. На каждый тест уходило по неделе, это было долго. Чтобы добиться лучшего качества, нужно было запускать с другими параметрами, которые требовали больше ресурсов. Требовалось облако и больше видеокарт на одной машине. Мы решили взять в аренду облачный сервис Аmazon 8 GPU V100 x 4. Он быстрый, но очень дорогой. Запустили на ночь тест, а утром — счёт на 1200 $. В то время было очень мало вариантов аренды мощных GPU сервероров, кроме него. Пришлось отказаться от этой идеи и искать варианты дешевле. Может, попробовать собрать свой?

Обзвон компаний заканчивался тем, что мы сами должны были прислать детальную конфигурацию, а они его соберут. Что лучше с точки зрения «производительность / цена» для наших задач, никто не мог ответить. Попытались заказать в Москве — наткнулись на какую-то подозрительную фирму. Сайт был качественный, отдел продаж — в теме. Но банковский перевод они не принимали, и единственным вариантом оплаты был скинуть деньги на карту их бухгалтеру. Стали совещаться с командой и решили, что можно самостоятельно собрать компьютер из нескольких мощных GPU и ценой до 10 тысяч долларов, который будет решать наши задачи и окупится за месяц. Комплектующие буквально скребли по сусекам: звонили в Москву, что-то заказывали в Китае, что-то в Амстердаме. Через месяц все было готово.

В начале 2019 у себя дома я наконец-таки собрал этот компьютер и начал проводить много тестов, не беспокоясь, что нужно платить за аренду. На испанском языке я начал замечать, что перевод близок к переводу Google по метрике BLEU. Но я не понимал этот язык и на ночь поставил тренироваться модель англо-русского переводчика, чтобы понять, в какой точке нахожусь. Компьютер всю ночь гудел и жарил, спать было невозможно. Нужно было следить, чтобы не было ошибок в консоли, так как периодически все зависало. Утром я запустил тест на перевод 100 предложений с длинами от 1 до 100 слов и увидел, что получился хороший перевод, в том числе на длинных строках. Эта ночь изменила всё. Я увидел свет в конце тоннеля, что все же можно когда-нибудь добиться хорошего качества перевода.

Улучшаем качество приложений


Заработав деньги на iOS переводчике с одной кнопкой и одной функцией, я решил улучшить его качество, а также сделать версию для Android, Mac OS, Windows Desktop. Надеялся, что когда у меня будет свое API, я закончу разработку приложений и зайду на другие рынки. За то время, когда я решал задачу своего API, конкуренты ушли намного вперед. Нужны были какие-то функции, ради которых будут скачивать именно мой переводчик.

Первое, что я решил сделать, это голосовой перевод для мобильных приложений без доступа в интернет. Это было личной проблемой. Например, Вы едете в Германию, скачиваете только немецкий пакет на телефон (400 мб) и получаете перевод с английского на немецкий и обратно. На самом деле, проблема интернета в зарубежных странах стоит остро. Wifi либо нет, либо он запаролен или просто медленный, в итоге им невозможно пользоваться. Хотя качественных приложений переводчиков, которые работают только через интернет, используя API Google, даже в 2017 году были тысячи.

Так как с Lua (Torch)-версией OpenNMT у многих были проблемы ввиду не очень широкой распространенности языка, основатели перенесли логику скрипта translate.lua в C++ версию (CTranslate), которая служила для более удобных экспериментов с переводами. На Lua-версии можно было тренировать модели, на C-версии запускать. К маю 2017 года это уже можно было хоть как-то использовать за основу production для приложений.

Мы портировали CTranslate для работы под приложения и выложили все это в opensource.

Вот ссылка на эту ветку:

github.com/hunter-packages/onmt

Портировать CTranslate под разные платформы — это только первый шаг. Нужно было понять, как сделать офлайн модели небольшого размера и нормального качества для работы в телефонах и компьютерах. Первые версии моделей для перевода занимали в оперативной памяти телефона 2GB, что абсолютно никуда не годилось.

Я нашел ребят в Испании с хорошим опытом в области проектов по машинному переводу. Около 3 месяцев мы сообща вели R & D в области уменьшения размера модели нейронки для перевода, чтобы добиться в 150 мб на пару и потом запускать на мобильных телефонах.
Размер нужно было уменьшать таким образом, чтобы в определенный размер словаря (к примеру, 30 тыс слов) вложить как можно больше вариантов по переводу слов разных длин и тематик.

Позже результат наших исследований был выложен в открытый доступ и представлен на Европейской ассоциации машинного перевода в г. Аликанте (Испания) в мае 2018 года, а один из членов команды защитил по ней PhD.

rua.ua.es/dspace/bitstream/10045/76108/1/EAMT2018-Proceedings_33.pdf?fbclid=IwAR1BxipmZMR8Rt0d32gcJ7BaFt1Tf1UEm9LkJCYytBJLgdtx3ujAPFCwE80

На конференции множество человек хотели купить продукт, но пока была готова только одна языковая пара (английский — испанский). Офлайн перевод на нейронках для телефонов был готов уже в марте 2018 года, и можно было сделать его на все остальные языки до лета. Но по договору я не мог получить исходники и используемые для этого инструменты, чтобы сделать офлайн переводчик на других языках. Нужно было внимательно читать договор. В одиночку я не мог быстро воспроизвести результаты на другие языки. Пришлось приостановить эту функцию. Спустя год я вернулся к ней и доделал.

Помимо перевода текста, голоса и картинок, было решено добавить перевод телефонных звонков с транскрипцией, которой не было у конкурентов. Был расчет на то, что люди часто звонят в поддержку или по вопросам бизнеса в разные страны, причем на мобильный или стационарный телефон. Тому, кому адресуется звонок, не нужно устанавливать приложение. Эта функция потребовала много времени и затрат, поэтому позже было решено вынести ее в отдельное от основного приложение. Так появился Phone Call Translator.

У приложений для перевода была одна проблема — ими пользуются не каждый день. Не так много в жизни ситуаций, когда нужно переводить ежедневно. А вот если изучаешь язык, использование переводчика становится частым. Для изучения языков мы создали функцию карточек, когда слова добавляются в закладки на сайте через расширение для браузера или в субтитрах к фильму, а потом происходит закрепление знаний с помощью мобильного приложения чат-бота или приложения для умной колонки, которая будет проверять выбранные слова. Все приложения Lingvanex связаны между собой единым аккаунтом, поэтому можно начать переводить на мобильном приложении и продолжить на компьютере.

Также добавили голосовые чаты с переводом. Это будет полезно для туристических групп, когда гид может говорить на своем языке, а каждый из посетителей будет слушать в переводе. И в конце — перевод больших файлов на телефоне или компьютере.

Проект Backenster


За 7 лет я получил 35 миллионов скачиваний без затрат на рекламу и заработал более 1 млн долларов. Из них почти половина – переводчики. Это были тестовые приложения, чтобы научиться мобильному маркетингу. Из-за большого количества ошибок миллионы пользователей как пришли, так и ушли. Получив необходимый опыт, я принимаю решение создать небольшой внутренний подпроект Backenster для управления приложениями, рекламой и аналитикой, чтобы на качественных переводчиках не повторить ошибок прошлого и зарабатывать максимально.

Через эту систему я собираюсь перенаправить пользователей своих старых приложений-переводчиков в новые, так как на закупку трафика денег уже нет. Еще где-то 5-10 млн старых приложений осталось на телефонах. Когда будут готовы приложения, останется только нажать «Старт». Это обойдется в разы дешевле, чем привлекать то же количество пользователей платно. Постепенно добавилась система управления тестами, подписками, обновлениями, конфигурацией, уведомлениями, медиатор рекламы и др., а также возможность делать кросс-рекламу мобильных приложений в расширениях браузера, чатботах, десктоп, голосовых ассистентах и наоборот. Я решил предусмотреть все проблемы, которые возникли за это время с приложениями.



Перспектива и стратегия


Создавая API для своих приложений и вложив кучу денег, нужно понимать объем и перспективы рынка машинного перевода. В 2017 году был прогноз, что рынок к 2023 году станет 1.5 млрд $, хотя объем рынка всех переводов будет 70 млрд $ (на 2023 год).

Почему такая разбежка — около 50 раз?

Допустим, лучший машинный переводчик сейчас переводит хорошо 80% текста. Остальные 20% нужно редактировать человеку. Самое большие расходы в переводе — это корректура, то есть зарплаты людей.

Увеличение качества перевода даже на 1% (до 81% в нашем примере) может образно на 1% сократить расходы на корректуру текста. 1% от разницы между рынком всех переводов за вычетом машинного будет (70 — 1.5 = 68.5 млдрд $) или 685 млн $ уже. Цифры и расчет выше даны приблизительно, чтобы передать суть.

То есть улучшение качества даже на 1% позволяет значительно сэкономить большим компаниям на услугах перевода. По мере развития качества машинного перевода все большая его часть будет заменять рынок ручного перевода и экономить на расходах по зарплате. Не обязательно стараться охватить все языки, можно выбрать популярную пару (англо-испанский) и одно из направлений (медицина, металлургия, нефтехимия и др.). 100% качества — идеальный перевод машиной по всем тематикам — недостижим в ближайшее время. А каждый следующий процент улучшения качества будет даваться труднее.

Тем не менее, это не мешает рынку машинного перевода занять значительную часть общего всего рынка к 2023 году (по аналогии как DeepL незаметно отхватил 10% рынка Google), так как большие компании каждый день тестируют API различных переводчиков. И улучшение качества одного из них на процент (для какого-нибудь языка) позволит им экономить много миллионов $.
Стратегия больших компаний по созданию своих наработкок opensouce начала приносить свои плоды. Стало больше стартапов, научных работ и людей в индустрии, что позволило раскачать рынок и добиваться все лучшего качества перевода, повышая прогноз по рынку машинного перевода.

Каждый год проводятся соревнования по задачам NLP, где корпорации, стартапы и университеты соревнуются у кого будет лучше перевод на определенных языковых парах.

http://statmt.org/wmt18/

Анализируя список победителей, появляется уверенность, что небольшими ресурсами можно добиться отличного результата.

Открытие компании


За несколько лет проект вырос во много раз. Появились приложения не только для мобильных платформ, но и для компьютеров, носимых устройств, мессенджеров, браузеров, голосовых ассистентов. Помимо перевода текста был создан перевод голоса, картинок, файлов, сайтов и телефонных звонков. Вначале я планировал делать свое API для перевода, чтобы использовать только для своих приложений. Но потом решил предложить его всем желающим. Конкуренты ушли вперед, и нужно было не отставать.

До этого времени я управлял всем в одиночку как индивидуальный предприниматель, наняв людей на аутсорсе. Но сложность продукта и количество задач начали быстро расти, и стало очевидно, что нужно делегировать функции и быстро нанимать людей в собственную команду в своем офисе. Я позвонил другу, он уволился с работы и принял решение открыть в марте 2019 года компанию Lingvanex

До этого момента я создавал проект, нигде не рекламируясь, и когда решил собрать свою команду, столкнулся с проблемой поиска. Никто не верил, что это вообще можно сделать, и не понимал зачем. Пришлось собеседовать многих людей и каждому по 3 часа рассказывать о тысячах неочевидных деталей. Когда вышла первая статья о проекте, стало проще. Мне всегда задавали один вопрос:

Первый вопрос всегда звучит “Чем вы лучше Google?”

В данный момент наша цель — добиться качества перевода Google общей тематики на основных европейских и азиатских языках и после этого предоставлять решения для:

1) Перевода текста и сайтов через наше API втрое дешевле конкурентов, предоставляя отличный сервис поддержки и простую интеграцию. Например, стоимость перевода Google $20 за миллион символов, что получается очень дорого при значительных объемах

2) Качественного тематического перевода документов по определенным тематикам (медицина, металлургия, юриспруденция и т.д.) по API, в том числе c интеграцией в инструменты для профессиональных переводчиков (типа SDL Trados)

3) Интеграция в бизнес-процессы предприятий для запуска моделей перевода на их серверах по нашей лицензии. Это позволяет сохранить приватность данных, не зависеть от объема переведенного текста и оптимизировать перевод под специфику конкретной компании.

Можно сделать качество перевода лучше конкурентов на определенные языковые пары или темы. Можно и на все. Это вопрос ресурсов компании. При достаточных инвестициях с этим проблем нет. Что и как делать – известно, просто нужны рабочие руки и деньги.

На самом деле рынок NLP растет очень быстро по мере того, как совершенствуется распознавание, анализ речи, машинный перевод, и может принести хорошую прибыль для небольшой команды. Весь хайп тут начнется через 2-3 года, когда сегодняшняя раскрутка рынка большими компаниями принесет свои плоды. Начнется череда сделок по слиянию / поглощению. Главное в этот момент — иметь хороший продукт с аудиторией, который можно продать.

Итог


За все время тестовые приложения принесли более 1 миллиона долларов, из которых большая часть потрачена на то, чтобы сделать свой переводчик. Сейчас очевидно, что все можно было сделать гораздо дешевле и лучше. Было сделано много управленческих ошибок, но это опыт, а тогда советоваться было не с кем. В статье описана очень маленькая часть этой истории и иногда может быть непонятно, почему принимались те или иные решения. Задавайте вопросы в комментариях.

На данный момент мы не добились качества перевода Google, но я не вижу никаких проблем это сделать если в команде будет хотя бы несколько специалистов по Natural Language Processing.
Сейчас лучше всего наш переводчик работает с английского языка на немецкий, испанский, французский.

Ссылки на новые программы, которые разрабатывались в течении 3 лет и в которые были вложены деньги. Если кто хочет увидеть старые тестовые приложения, про которые шла речь в начале статьи (где были заработаны деньги и 35 млн скачек) — пишите в личку.

Переводчик для iOS


Переводчик для Android


Переводчик для Mac OS


Переводчик для Windows


Переводчик для Chrome


Переводчик для Telegram



По этой ссылке можно найти

Демонстрацию API перевода



Еще в команду нужен продакт-менеджер (мобильные приложения) и программист Python с опытом проектов NLP

Если есть идеи совместных партнерств и предложений – пишите в личку, добавляйте в Facebook, LinkedIn.
AdBlock похитил этот баннер, но баннеры не зубы — отрастут

Подробнее
Реклама

Комментарии 144

    +14
    Такая интересная статья, такой лонгрид и не одного комментария. Прочитал на одном дыхании.
      +3
      Создавать проекты, которые просто нравятся, — путь в никуда.

      Зато сколько удовольствия в процессе! Но если вам нравится распоряжаться большими деньгами и вертеть людьми, то да, вы правы.

        +45
        Я имел ввиду, что если у вас нет богатых родителей, денег, связей, вы в маленьком районном городе, то желательно подумать, на что вы будет жить, когда планируется делать очередной проект «для души». Когда я не смог заплатить $150 за съемную квартиру и просто купить еды, приоритеты становятся другими. Но у каждого могут быть свои взгляды. В тот момент у меня не было выбора.

        Эти большие деньги были заработаны не за 1 год и они не «упали с неба». Я шел к этому 14 лет, причем 9 лет без результата. Все давалось очень трудно, хотя из статьи может показаться что все просто. Было нереально трудно.

        В проекте участвовало много людей на разных этапах. Со всеми поступал по совести, часто в ущерб себе.
          0
          Когда я не смог заплатить $150 за съемную квартиру и просто купить еды, приоритеты становятся другими. Но у каждого могут быть свои взгляды.


          Но с другой стороны начинаешь смотреть на проекты со стороны заработка.
        +2
        Спасибо за статью.
        Недавно была другая заметка про тех же мальчиков
        habr.com/ru/news/t/487520
        «DeepL объявила о прорыве в переводе текста при помощи ИИ»
        и в комментах там вырисовывается сильно другая картина и по качеству перевода, и по перспективам рынка применительно к конкуренции с известными монстрами, которые и сами все еще нестабильны в качестве, и перспективы заметного повышения качества не так чтобы ясны и прозрачны.
        Вопрос:
        если Вам влом читать тамошние комменты и в своем дайджесте здесь опровергнуть хоть что-то,
        то расскажите хотя бы о том, почему Вы верите в успех, хотя из Вашей статьи я ламерски пессимистично вывожу общепринятое мнение: без денег монстров успех в этой конкретной области невозможен, а Ваше восхищение DeepL не соответствует комментам по указанной ссылке.
        Заранее благодарю за любой коммент.
          +1
          Мне в DeepL нравиться не их качество перевода, а их путь и позиционирование.

          Не нужно супер-повышение качества, чтобы захватить большую часть рынка. Иногда достаточно 1-3% от конкурента и на некоторых языках. Эти изменения в 1-3% сильно экономят деньги компаний, кто занимаются переводами и даже ради этих небольших на первый взгляд процентов, клиенты выберут другого. За год у них 50 млн пользователей без особой рекламы.

          Насчет денег монстров:
          Сейчас не нужны десятки миллионов на железо, чтобы тренировать сложные нейросети. А также делать с нуля аналоги Tensorflow. Но несколько сотен тысяч долларов надо иметь, как и на любой другой качественный проект. У меня их уже нет.

          Рынок переводов — он специфический. Но я готов в комментариях отвечать на вопросы.

            0
            готов отвечать на вопросы.
            спасибо!
            несколько сотен тысяч долларов надо иметь, как и на любой другой качественный проект. У меня их уже нет.
            а те, у кого есть — почему-то предпочитают вкладываться в менее рисковые и\или явно более прибыльные проекты. Это и есть мой пессимизм.
            Сейчас не нужны десятки миллионов
            и оптимизм я вижу только в том, что «даже при нашей жизни», если переживем коронавирус, необходимые вложения снизятся со 100 до 10 тысяч.
            изменения в 1-3% сильно экономят деньги компаний… и клиенты выберут другого.
            стакан наполовину полон или пуст: вложения в рекламу велики и необходимы. Прямо в статье Вы это признаете. А чем ниже порог вхождения, тем больше конкуренция — тем больше стервятников-СЕОшников будут стричь рекламодателей… вслед за самими поисковиками (см. недавние статьи про неоспариваемое скручивание у Гугла и навязывание своего говно-траффика вопреки явной блокировке в черном листе рекламодателя у Яндекса).
            Мне в DeepL нравиться не их качество перевода, а их путь и позиционирование.
            вот теперь я кажется понял, в чем наша разница: это опять про половину стакана.
              0
              Мне кажется что NMT, как и статистический перевод, это пока путь в никуда. Да, можно добиваться небольших улучшений улучшая модель и/или добавляя новые данные, но это все слёзы на данном этапе. Пока переводчик не научится «понимать» текст (не обязательно так-же как человек), по настоящему хорошего перевода не будет. А до этого пока еще далеко. И многие это понимают. Отсюда «пессимизм».
                +1
                Полностью согласен с вами! Машинный переводчик не научится понимать текст в ближайшей перспективе. Но чтобы захватить большой кусок рынка это не нужно. Нужно улучшение в 1 процент, как, образно, сделал DeepL

                Посмотрите на задачу, не с точки зрения науки, а с точки зрения бизнеса.
                  0

                  Боюсь, что машинный переводчик никогда не научится понимать текст как человек. Текст, как ни крути, это информация нанизанная на скелет эмоций. Игра слов, смысловые нюансы, жаргон, абстракции, и многое другое. Даже текст даташита невозможно переводить в лоб — получается пресловутый гуртовщик мыши

                    +2
                    Не совсем согласен.
                    С одной стороны, понять все ньюансы «навороченного» художественного текста и сейчас кроме автора может довольно узкая группа людей живущая в точно том-же культурном контексте, что и автор.
                    С другой стороны, компьютеры уже сейчас «понимают» некоторые тексты (те-же чат боты и т.п.)

                    И хотя сейчас понимание очень зачаточное и 100% мы никогда не достигнем, тем не менее есть вполне обоснованные надежды, что «нормальные» тексты, без особых извратов, со временем научатся «понимать» и компьютеры и соответственно переводить. Другое дело что прогресс в этом направлении пока медленный…
                      +1
                      >и 100% мы никогда не достигнем

                      Спорно. «Культурный контекст» с каждым новым поколением авторов всё лучше оцифрован, в какой-то момент в будущем он будет полностью доступен для анализа машиной.
                        0
                        ИМХО Вообще назревают реформы языка.
                        Вот убейте меня не понимаю почему сегодня в высокоразвитых языках есть исключения.
                        НУ вот в чём например проблема принципиальная проблема писать оловянный, стеклянный и деревянный с одним «Н», или в английском языке убрать например неправильные глаголы.
                        Можно конечно говорить про «культурный слой», «самоидентификацию» и т.д., но какт о 120 лет назад перешли со старославянского на текущий язык и ничего как то стали обходиться без трех букв Ф в языке.
                          +1
                          Оловянный произносится именно с двумя н. Произнесёте с одной — вас примут да деревенщину. И произнесут — смешной. С одной н. А если произнесут с двумя — вы сами над ними посмеётесь.

                          Поэтому не надо ждать реформы в тех местах, где она, по здравому размышлению, совершенно не нужна.
                            0
                            Сегодня может да, пройдет пять лет, уже нет. Пройдет 10-15 лет никто и не вспомнит.
                            +1
                            Главным образом потому, что лингвисты различают прилагательные и причастия. Можно ещё добавить «серебряный», "*овняный", «сеяный» (прил.) и «сеянный» (причастие), «масляный», «масленый» (прил.) и «масленный» (прич.), «стреляный» (прил.) и «стрелянный» (прич.), «ветряной» и «ветреный» (оба прил.) и ещё с пару десятков таких слов.

                            А вообще, лингвистика следует за узусом, но с некоторой задержкой. Поэтому в любом языке время от времени проводят реформы, которые приводят языковую норму, часто зафиксированную на уровне законов, к узусу. Если вдруг большинство носителей языка начнёт удлинять «н» в вышеуказанных мной словах, то при следующей реформе лингвистам ничего не останется, как принять сложившуюся практику и зафиксировать её как норму.

                            Вот в белорусском языке конкретно этих проблем нет, там в обоих случаях пишется одинарная «н». И вообще язык письменный максимально приближен к устному по принципу «как слышится — так и пишется». Последняя реформа, проведённая в 2008г., как раз убрала накопившиеся различия узуса и письменного языка.
                  0
                  В дополнение:
                  На рынке переводов у компаний по локализации стоят трекеры, к которым подключено много API разных поставщиков переводов (DeepL, Google, MS итд). Каждый день они прогоняют тесты, чтобы найти улучшения в качестве перевода на каждой паре и тематике. Изменения даже в 1% на популярной паре (англо-испанской) отразиться в трекерах всех компаний, чтобы в следующий раз выбрать другого поставщика API для перевода
                    +2
                    Работаем в сходной области — распознавание изображений.
                    Насчет «аналогов TensorFlow» — сам фреймворк переписывать не надо, но нужно разбираться в архитектуре сетей и делать анализ результатов активации. Эти знания — которые практически никто из грандов не публикует — дают возможность значительно уменьшить наборы данных, необходимые для обучения и время/деньги на аренду GPU.
                    Второе — нужно какое-то решение для сбора этих данных, желательно не в прямой и затратной форме вроде заданий на Mechanical Turk и подобных биржах — а в форме геймификации как у Duolingo или отслеживания корректуры как у Verbit.
                  0
                  Немного не в тему, но на страничке lingvanex.com/ru/glavnaya есть странная надпись «Более 112 языков». Это сколько? 113? Обычно пишут «более 100».
                  Спасибо за интересную статью.
                    0
                    Там сейчас 11 языков, остальные сделаем в апреле. Сайт еще в разработке.
                    0
                    Попробовал сделать несколько переводов с немецкого на русский. Простите, но результат очень далек от хорошего перевода
                      0
                      Попробуйте перевод с английского на французкий, немецкий, испанский. У других направлений перевода не будет хорошего качества сейчас.
                        0
                        Я бы попробовал, но оценить могу только английский и хоть его хорошо знаю, но ошибок не замечу, т.к. все читаю автоматически.
                          +1
                          Я попробовал.
                          Eng->Spa
                          I have some apples -> Tengo algunas (слово яблоки потерялось)
                          Spa->Eng
                          Tengo unas manzanas -> I got some apples (другой смысл)
                          tengo unas manzanas -> have some apples (лучший результат, но потеряли местоимение)
                          tenéis unas manzanas -> ye have some apples (это что вообще за слово)
                          Tenéis unas manzanas -> They'll have some apples (я говорил tenéis, а не tendrán)
                        +2
                        Шикарная статья. Желаю вам всяческого процветания.
                        А можете добавить в add-on возможность перевода страницы целиком по клику?
                        Как встроенный переводчик google translate в chrome.
                        +1
                        Выяснилось, что лучше создать одно качественное приложение, чем сто некачественных

                        У вас 30$, у них 60$, но при этом у них компания, а вы один. Т.е.если разделить доходы на каждого работника, то получится, что ваш «выхлоп» больше. :)
                          +1
                          В тот момент мне тоже так казалось. Но сейчас они выросли в десятки раз, а у меня доход упал. Лучше всего — делать качественное приложение с хорошей командой. В долгосрочной перспективе в пересчете дохода на работника это лучше :)
                            0
                            в долгосрочной перспективе выхлопа больше как раз у них, автор об этом ниже как раз пишет)
                            0
                            Вы написали про мобильный перевод оффлайн с помощью модели в 150М. Имеется в виду, что при этом распознается речь или текст вводится с клавиатуры? Если второй вариант, то работали ли вы над мобильным распознаванием речи оффлайн? И есть ли успехи?
                              0
                              Для iOS можете попробовать переводить речь offline apps.apple.com/us/app/lingvanex-language-translator/id1254981151
                                0
                                В 2018 году у нас было распознавание голоса оффлайн на русский язык через PocketSphinx. Надо было сделать офлайн модель перевода текста c русского на английский в 150 мб, чтобы после перевода речи в текст, перевести саму речь. По договору нам помогли сделать модель с испанского на английский, но не дали права на научный софт, который использовался для расчета словарей. В одиночку я не смог воспроизвести за быстрое время и отложил задачу. Сейчас iOS 13 поддерживает офлайн распознавание голоса на уровне ОС и поэтому необходимость в этом отпала.
                                  0
                                  Для распознавания без сети сейчас есть vosk-api, работает без сети, поддерживает несколько языков. Демку APK можно скачать тут.
                                  +1
                                  На данный момент мы не добились качества перевода Google, но я не вижу никаких проблем это сделать если в команде будет хотя бы несколько специалистов по Natural Language Processing.

                                  А, как с удобством доступности Online перевода PDF документов?

                                  P.S. У Google translate введено ограничение по размеру файла сейчас 10 Мб.
                                  +1
                                  Одним словом — вдохновляющая статья…
                                  Спасибо автору за нее!
                                    +1
                                    Спасибо за статью. Хорошо получилось!
                                    Не совсем уловил по статье: голос в текст вы тоже зацепили?
                                    по этой тебе у вас тоже наработки есть? так как гугл/яндекс тут тоже очень дорого просят!

                                    Спасибо!
                                      +1
                                      Распознаванием голоса мы мало занимались. Но я могу посоветовать посмотреть проекты Mozilla Deepspeech и Fairseq. Там же можно скачать готовые речевые датасеты на разные языки, чтобы потренироваться с распознаванием.
                                        0
                                        да. видел. спасибо! удачи вам.
                                      0
                                      В данный момент наша цель — добиться качества перевода Google общей тематики на основных европейских и азиатских языках

                                      Я бы Вам посоветовал сосредоточиться на более узкой специализации, учитывая, что у Вас вряд ли есть финансирование на десятки миллионов и десятки лингвистов и кодеров с опытом в NLP. Так есть высокая вероятность отобрать нишу у мейджоров и впоследствии продать компанию или найти хорошее финансирование.
                                        0
                                        Спасибо, именно так и планируется делать.
                                          +1
                                          Отлично.
                                          В качестве предложений по узкой специализации:
                                          1. API для перевода отзывов(отели, товары, услуги..).
                                          2. Приложение и API для перевода меню в общепите, рецептах, магазинах.
                                            0
                                            Спасибо за идеи! Если у кого-то есть предложения на машинный перевод какой-то ниши собственного бизнеса — пишите в личку
                                        +1
                                        Эмм у меня вызывает когнитивный диссонанс
                                        Когда доход достиг 30 тыс $ / месяц, я решил рассказать товарищу,


                                        и

                                        Я понимал, что на качественных можно заработать в десятки раз больше, но я был один в маленьком городе без опыта и команды дизайнеров и маркетологов. Мне требовалось платить за аренду квартиры и зарабатывать на жизнь.


                                        Я как понимаю что это перевод, но все же даже для США насколько понимаю зарплата в ~ 17 k считается очень даже не плохой(на вскидку вычитаю 40 %, типа налогов)
                                          +1
                                          У меня было больше сотни простых приложений, которых было очень трудно поддерживать из-за нехватки времени на каждое из них. Вначале, мне казалось что надо просто их больше делать. Но со временем оказалось, что гораздо выгоднее сфокусироваться на 1 или нескольких из них. Это я понял после разговора с более опытным коллегой позже
                                            +4

                                            Скорее всего речь идёт о том что с $30k/мес. на одного не должны возникать проблем с арендой квартиры

                                              +2
                                              У меня, как и у автора комментария выше, тоже был диссонанс на этом моменте. Если были 30к в месяц, то как могло не быть 150 на квартиру?
                                                +7
                                                30k $ / месяц это было через 2 года, после истории когда не было денег на квартиру. Это не сразу. Когда я начал делать первые приложения, в первый месяц было $100, потом $500, и так далее. В лучшее время было 30 тыс $ / месяц, но потом доход стал падать, так как поддерживать столько приложений было трудно одновременно.

                                                И вот когда я достиг максимума денег с тех приложений, я понял что больше они не принесут, было решено сфокусироваться только на приложениях для перевода.

                                                Разработка более качественных переводчиков и API финансировалась за счет старых тестовых приложений, с которых и был доход в 30k
                                              0
                                              Это Беларусь, а не США :)
                                              0
                                              Отличная мотивирующая статья!

                                              Удачи вам и вашей команде, у вас обязательно получится!
                                                0
                                                Почитайте про Unbabel.
                                                У них интересная история развития, технологии NLP и не только.
                                                Возможно, найдете для себя что-то полезное.
                                                За статью спасибо. Интеречный путь развития, как по мне.
                                                  +13
                                                  иногда бывает и так image
                                                    –2
                                                    После предложений
                                                    > ежемесячный доход был $30000
                                                    > нужно было тратить на аренду квартиры
                                                    Бросил читать. Что я понял не так?
                                                      +1
                                                      На доход в 30 тыс я вышел спустя два года когда начал делать приложения. Потом он начал падать. Сначала я зарабатывал 100$ в месяц и жил на съемной квартире. Доход рос постепенно, по мере того, как я делал приложения. Потом когда доход вырос я купил квартиру и переехал в столицу, где уже начал делать качественные приложения для перевода
                                                        +4
                                                        Не пойму, почему люди заминусили человека выше, меня тоже смутила эта «игра» цифрами.
                                                        Если прибыль (или именно доход?) в 30к$/месяц был разовая, то, возможно, стоило указать вилку или среднее значение. Потому как иначе выглядит довольно странно: вроде бы жили припеваючи, но потом ввязались в многолетний затратный проект.
                                                      –4
                                                      Спасибо большое за статью! Очень интересно было почитать.
                                                      От себя хочу добавить что качество вашего перевода действительно сопоставимо с мэтрами. Удивительно как то, что раньше с трудом делали (да так и не доделали), в Abbyy три этажа лингвистов сейчас делает стартап на коленке с ригом в квартире.
                                                      P.S.
                                                      Кстати, у меня есть универсальный метод русско-английского переводчика. Называется «жидкий стул» [смайл]. Ни ваш ни DeepL переводчики с ним не справляются. Да и в целом качество бытового «статейного» перевода на пару ступеней ниже…
                                                      Но в любом случае удачи вам! Всегда приятно когда на Галиафа находится свой Давид с нейросетевой пращой [смайл]!
                                                        0
                                                        Хорошая статья, спасибо, что поделились своим опытом
                                                          +2
                                                          в очередной раз закончились деньги

                                                          я не смог найти работу

                                                          несколько лет работы в ИТ-компаниях позволили накопить определенный опыт

                                                          Имея опыт работы в ИТ-компаниях, как Вы не смогли найти работу? При отсутствии денег не соглашались идти в компании потому, что они Вас чем-то не устраивали? Неужели слишком мало предлагали за Ваш нескольколетний опыт? :)

                                                          На создание сотен простых приложений я потратил полтора года. Такая скорость стала возможной благодаря покупке графики на стоках

                                                          Сначала приложения были бесплатными

                                                          Когда доход достиг 30 тыс $ / месяц...

                                                          И как Вы всё это провернули без денег..?
                                                            +6
                                                            Тогда был кризис и он затронул многие компании. У меня было несколько лет работы в IT программистом, но из-за специфики проектов на которых работал, твердых знаний у меня не было. Немного Java, немного VC++, objective C. Я не смог пройти собеседования. В столице мне надо было устроится хотя бы за $800, чтобы снять квартиру и осталось на жизнь. Но за месяц не смог и потратил оставшиеся деньги. Потом уехал в родной город, где вообще не было работы для IT. Просто так сложилось, что в тот момент было не так много предложений iOS разработчикам как сейчас. А мой опыт Java был в основном на апплетах и потом Swing, на которые были редкие вакансии. Это было лет десять назад.

                                                            Как я провернул все это без денег?

                                                            В 2010 году рынок мобильных приложений сильно рос и можно было делают всякую ерунду, чтобы зарабатывать деньги. Тогда Топ-10 приложения апстора — это были программы типа перделки с таймером. Сейчас такого нет.

                                                            На любом растущем рынке можно делать простые продукты и зарабатывать, пока не пришли сильные конкуренты с бюджетом на маркетинг. Но это все вскоре заканчивается. Если успеешь — заработаешь.

                                                            0
                                                            Давненько так надолго не зависал в одной статье. Было очень интересно прочесть историю от и до. Обязательно попробую приложение:)
                                                              0
                                                              Интересный материал, спасибо! А почему Вы сравниваете себя с Гуглом? Как по мне, качество перевода Яндекс лучше: пример (особенно первое предложение)

                                                              Успехов вам!
                                                                +1
                                                                У разных переводчиков на разных языках — разное качество. Просто Google — самый известный и у него больше всех языков.

                                                                Сравнение с Google я делаю из-за того, что 9 из 10 человек первым вопросом мне всегда задают «Чем вы лучше Google?» :)

                                                                  –1

                                                                  Я из статьи так и не понял, чем...

                                                                    0
                                                                    Если рассматривать приложения — то мы лучше Google
                                                                    1) Можем переводить телефонные звонки
                                                                    2) Переводить файлы на телефоне / компьютере
                                                                    3) Перевод сразу всей страницы сайта
                                                                    4) Офлайн перевод голоса
                                                                    5) Можно делать чаты-конференции с переводом голоса
                                                                    6) Клавиатура-переводчик, которая переводит текст из любого другого приложения
                                                                    7) Можно начать переводить на мобильном приложении (расширении браузера), а потом продолжить работать на Mac OS / Windows на компьютере. Синхронизация истории / закладок через аккаунт
                                                                    8) Перевод сообщений в iMessage на iOS
                                                                    9) Разговорник для туристов
                                                                    10) Функция изучения слов на 27 языках, когда можно выделить слова в браузере на компьютере на Desktop приложении, субтитрах к фильмам (браузерном расширении) а потом изучать их на телефоне.

                                                                    и другое

                                                                    Если рассматривать API — то по качеству перевода мы не лучше Google сейчас, но можно сделать лучше, относительно небольшими затратами.

                                                                    Цель статьи — показать, чего можно добиться небольшими ресурсами и найти NLP специалистов себе в команду.

                                                                    Я не давал прямых линков на приложения, чтобы не сочли за рекламу. Теперь решил дать линки сразу на магазины. Скачайте, посмотрите

                                                                    Приложение для iOS

                                                                    Приложение для Android

                                                                      0

                                                                      Если честно, мне кажется оффлайн приложения умирают, как бы это не печально было. У меня самое "оффлайновое" — это navionics.


                                                                      Переводчиками пользуюсь в месяц полтора раза, поэтому тема была не близка.


                                                                      Если ux получается круче гугла — может на этом сосредоточится?

                                                                        0
                                                                        Когда были первые версии переводчиков, многие пользователи просили работу оффлайн. Это до сих пор актуально, так как за пять лет ситуация с бесплатным Wi-fi в той же Европе не улучшилась. И не думаю, что в ближайшие 10 лет что-либо измениться.

                                                                        UX в любом случае должен быть лучше конкурентов. Работаем на этим.
                                                                          0

                                                                          Бесплатный вайфай… зачем он им нужен если у них условно бесплатный мобильный анлим?

                                                                            0
                                                                            Условный анлим стоит у крупных немецких операторов от 80 евро в месяц с заключением конракта на пару лет :)
                                                                            В итоге куча местного народа сидит на тарифах с 2-4-10 Гб траффика в месяц.
                                                                            Плюс переводчики часто нужны туристам, так что спрос ещё будет…
                                                                    0
                                                                    А где можно глянуть какой сервис в каких парах лучший?
                                                                  +1
                                                                  Большое спасибо за прекрасную статью, очень мотивирует. Как считаете, возможно ли сейчас добиться стабильного дохода от приложения, разработанного не в команде? Конечно, если стараться над дизайном и функционалом, но не имея должного финансирования и бюджета.
                                                                    +4
                                                                    Можно выйти на доход от 1 до 3 тыс $ в месяц за несколько месяцев, больше — сложнее.
                                                                    У меня лучше всего сработала Banner + Interstitial реклама от Admob + подписки c разной ценой по странам.

                                                                    На shutterstock.com можете купить за $250 (готовые красивые иконки, фоны, интерфейсы, лендинги, люди, устройства итд) и всю графику для приложений. Всего будет 750 картинок. Мне хватило на сотни приложений.

                                                                    Почитайте статьи про ASO (Appstore Search Optimizations) для Apple Appstore и Google Play. Обязательно заполняйте ключевые слова на все доступные локализации. Локализуйте скриншоты и делайте яркие иконки.

                                                                    А лучше всего устройтесь в компанию до 10 человек, которая уже успешна и делает мобильные приложения. За пол-года поймете, как и что делать по рекламе.

                                                                      +2
                                                                      Спасибо большое за развернутый ответ. Я уже работаю в компании в качестве мобильного разработчика на протяжении полутора лет и вот решил, что пора бы делать собственные приложения. Идеи есть, опыт есть, дизайнер, который не прочь работать заодно, тоже есть, не было только уверенности в том, что в одиночку получится это дело монетизировать. Теперь и это тоже есть, еще раз спасибо.
                                                                    +2
                                                                    Восхитительная статья! Очень вдохновляет!
                                                                    Скажите, где вы покупаете датасеты для переводов?
                                                                    Что скажете про новую модель BERT?
                                                                      0
                                                                      Спасибо!

                                                                      Качественные переводы можно купить на
                                                                      www.taus.net

                                                                      Бесплатные можно скачать на
                                                                      opus.nlpl.eu

                                                                      Про BERT читал, но глубоко не погружался. Сейчас у нас все сделано на Transformer и там еще есть куда копать.

                                                                      +1
                                                                      Потрясающая история! Автору респект. Но тут даже более интересен вопрос, как автору удавалось так долго «держать фокус», продираться через сложности, веря в успех?
                                                                      Ибо у самого несколько раз были аналогичные потуги. Но заканчивалось либо сразу, либо через какое-то время, «сдувались» что называется. Разве не было у автора желания в какой-то момент «а пошло оно всё лесом»?
                                                                        +3
                                                                        Спасибо!

                                                                        Много раз хотелось все бросить. Все мои проекты до переводчиков не были успешны, я послал их лесом и сконцентрировался на том, что начало «взлетать» само по себе. Но старые проекты я делал один и я мог в любое время от них отказаться. Сейчас по-другому.

                                                                        У меня небольшая, но команда. У меня есть обязательства перед людьми, которые со мной, и которые пожертвовали своими деньгами / временем итд, чтобы пройти этот путь вместе. Их было очень сложно собрать. Я не могу завтра сказать, типа «перегорел» и уезжаю в Тибет.

                                                                        Чтобы «не сорваться», мы в Минске сделали встречи основателей разных компаний (стартапов) раз месяц, где каждый рассказывает о своих проблемах и советуют, как их решать. С большего у всех одно и тоже. Это сильно помогает. Надо очень тщательно подбирать круг общения.

                                                                        Всегда работает правило 10 тысяч часов. Если занимаешься любой деятельностью длительное время, то в данной сфере ты становишся профессионал и у тебя начинает получаться. Главное — помнить про это и не опустить руки заранее. А лучше, устроиться в компанию, где уже получилось в сходном проекте и просто перенять этот опыт. Так намного быстрее.

                                                                        0
                                                                        Имхо — часто сталкиваюсь с темой. Поэтому соображения — вопросы:
                                                                        1. Русский язык он разный — кому то нравится Блок, кому-то Маяковский… Вы на кого ориентированы?
                                                                        2. Нигде в физическом мире нельзя выпечь хлеб и из муки, и из говна… В машинном переводе почему-то считают, что это возможно, учитывая то, что на английском сейчас пишут все, кому не лень, абы как и с учётом особенностей родного языка… Как вы собираетесь решать эту проблему? Не проще ли решать проблему адаптации текста на исходном языке автора под более/менее чётко заданные правила перевода / имеющийся корпус эталонных проверенных переводов, т.е. по сути или по пути регламентированного языка, как в авиации? ИМХО — этот путь может быть очень эффективен при переводе на неродной язык…
                                                                        3. Система МП — это хорошо. Но, зная слабые места Гугл и DeepL, почему не пойти бы по пути создания системы избавленной от них. Простая предварительная настройка глоссария часто позволяет добиться улучшения более 1% по сравнению с ненастраиваемыми простым пользователем Гугл и DeepL. По поводу глоссариев — посоветую обратиться на руборд в топик по конвертации словарей в Лингво. Поддержка формата словарей в качестве специализированных глоссариев — пока самый простой, эффективный и проверенный путь (учитывая то, что большинство словарей там не самосбор, а сконвертированные с бумаги проверенные временем словари).
                                                                        4. Создав систему МП, вы будете зависимы от её поддержки программами переводов. Почему бы не посмотреть в обратном направлении — например, нативной поддержки своей системой файлов САТ: кслифф, табличного RTF, ТМХ, Офис, PDF этих систем или даже создания своей простой САТ/максимальной интеграции системы в бесплатную Омега? Переводчики привыкли работать в своих программах. Простые пользователи обычно хотят загрузить исходный файл и получить переведённый в максимально подобном на оригинал виде.
                                                                        5. Сейчас традиционные САТ находятся под сильным давлением сетевых САТ, которые хотя и ущербнее по функциям, но гораздо удобнее для менеджеров БП в плане контроля выполнения работ, особенно при типичной для большинства БП текучке переводчиков… Наверняка этот фактор тоже стоит учесть…
                                                                          0
                                                                          1) Пока мы ориентированы на общую тематику перевода, чтобы покрыть нужды наших приложений. В будущем будет разделение, когда будет продаваться API

                                                                          2) Оно сейчас так и решается. Система машинного перевода не состоит только из «нейронной» части.

                                                                          Сейчас к нейронкам добавляются системы основанные на правилах (Ruled-based). То есть они всегда гибридные. DeepL выигрывает Google как раз за счет этой части, когда можно правильно переводить фразеологизмы, например. Я как раз и вставил абзац с историей от DeepL для этого.

                                                                          DeepL начал свою историю с Linguee (https://www.linguee.com/), где как раз «имеющийся корпус эталонных проверенных переводов, регламентированных словарей типа авиации...». И у них эта база самая большая.

                                                                          3) Все верно, это эффективный путь. Про это много раз писали, в том числе на форуме openNMT

                                                                          4) У нас в планах поддержка CAT и про это написано на сайте, но в данный момент еще не готово.

                                                                          5) Да, этот фактор мы учитываем.

                                                                            0
                                                                            1) Общая тематика переводов — это как раз ни о чём, попытка скрестить ужа и ежа…
                                                                            2) Не знаю, насколько Linguee с ENG-DEU парой, но переводы на русский там в основном новодельные и очень далёкие от эталонных… Эталонными, ИМХО, сейчас в общем можно считать опубликованные в советское время переводы, ну и новодел очень выборочно…
                                                                            Кстати после забрасывания Абби своего сопоставителя — проблема отсутствия хорошего многоформатного сопоставителя остаётся… Грамотное сопоставление — одно из возможных решений МП (при наличии эквивалентных множеств исходников и переводов). Для пополнения базы для тренировки нейросети вам явно потребуется такое решение…
                                                                            3) Путь эффективный — я подсказываю эффективный путь реализации подхода… Вы вряд ли найдёте лучший… Да и промт наверняка не поделится с конкурентом своими наработками…
                                                                            4) Выходить на рынок надо с очевидными преимуществами, оправдывающими переход… Пока вижу только демпинг… Глядя по промту и Смарткату — думать и делать — вещи разные…
                                                                            5) У нас наиболее распространены Смарткат и Мемсорс… С первым вы вроде пересекаетесь по бизнесу… Поэтому тут может быть сложно и, ИМХО, я бы думал просто о поддержке форматов.
                                                                            6) Встроенный в систему QA — типа Верифики или Искбенча — дополнительно плюс 1,5-3% к качеству Гугля и DeepL
                                                                            7) ИМХО — мы видим расцвет Китайского, который лет через 5-7 с вероятностью 80-90% обойдёт английский… Обратите на него не меньше внимания, чем на английский. Конкуренция тут пока тоже меньше…
                                                                            8) Голос — очень перспективно и в свете развития систем идентификации тоже… Под это, наверное, и госфинансирование найти можно…
                                                                              0
                                                                              Вижу, что у вас хороший опыт. Было бы интересно пообщаться. Добавьте меня в Facebook / LinkedIn и напишите ваш ник на Хабре вместе с сообщением.
                                                                                0
                                                                                Не сижу я на указанных вами сайтах…
                                                                                8) По поводу распознавания голоса на клиентских устройствах существенно повысить его качество может комбинированное считывание движения губ (чтение по губам). Не знаю почему это пока не реализовано в софте… Опять таки, чтение по губам наверняка заинтересует и некоторые госорганы…
                                                                                FB выбросила MSQRD на помойку, а они с лицом плотно работали. Можете обсудить с ними идею стартапа — они ведь из Минска, как и вы.
                                                                                Погоняю, что вы пока сделали — если увижу искру, сам вас найду…
                                                                                  0
                                                                                  Прогнал на небольшом примере из книжки Гетлина Petroleum Engineering
                                                                                  ИМХО!!! по качеству по убыванию DEEPL, LINGVANEX, GOOGLE…
                                                                                  Сходство LINGVANEX и DEEPL очень большое — выше 90% что заставляет задуматься…
                                                                                  Замечания по декстопному приложению…
                                                                                  1. В очередной раз приходится повторять прописное — гораздо удобнее выбирать направления перевода из небольшого списка настроенных, нежели в двух длиннющих списках языков, если конечно апп рассчитан на профессионалов, а не случайных любителей…
                                                                                  2. Сам характер аппа с вертикальным разделением — скорее любительский. 99% переводчиков (судя по скринам в вопросах на форумах) использует вертикальное табличное разделение. Такое разделение позволяет также контролировать сегментирование оригинала, если это не сплошной повествовательный текст.
                                                                                  3. Объём перевода за один запрос навскидку раза в 2-3 меньше, чем в Google и DeepL. Это как-то отбивает дальнейшее желание цицкаться.
                                                                                  4. Интеграция со словарём — хорошо. Но эргономика отвратительная. Выделив слово в оригинале в контекстном меню нет «искать в словаре» (про хоткеи тоже не нашёл). Словарь автоматом не переключается на языки перевода — это фишка или как??? Черканите на мой_ник_минус_3года на майлру — сброшу свои предложения по улучшению Лингво и GD, которые я отсылал создателям.
                                                                                  По частому вопросу исправления терминов по всему тексту перевода при наличии такой функции и поддержки формата словарей DSL приложение наверняка найдёт своих поклонников.
                                                                                  5. Как вариант для расширения функционала — распознавание и пересчёт единиц — брит-СИ.

                                                                          0
                                                                          Статья хороша. Но,
                                                                          Без опыта? Опыт то программирования был?)
                                                                          Вот у меня нет, и проекты которые я выдумываю просто пылятся на дальней полке моего сознания.
                                                                          Продвигаюсь в плане инвестиций в чужую работу, имея свою идею и получая на выходе свой продукт. Да только инвестиции жидкие. Поэтому и проекты небольшие.
                                                                          Даже не знаю, по хабровски ли будет написать про такой продукт статью, где моя идея и структура, а реализация кода оплаченна?
                                                                            0

                                                                            Я бы почитал с удовольствием.

                                                                              0

                                                                              Спрошу разработчика, не против ли будет он)))

                                                                              0
                                                                              Был опыт программирования, но в успехе он не играл главную роль. Не было опыта бизнеса. А его надо было как-то получить, используя то, что умеешь

                                                                              Пример:

                                                                              Допустим вы не связаны с IT и хотите проверить рынки товаров, по аналогии, как я проверял рынки приложений. Вы идете на Aliexpress, смотрите тренды и выбираете 100 перспективных на ваш взгляд товаров (маски от гриппа, конструкторы для детей, летающий будильник итд) и размещаете все 100 товаров в другом большом магазине (Ebay, Amazon итд). Потом закупаете (размещаете) рекламу, чтобы на эти страницы пошел трафик.

                                                                              Когда у вас будет статистика, вы будете видеть стоимость привлечения покупателя и выручку с товара. Всегда будут товары, которое продаются лучше. Останется только масштабировать.

                                                                              Или еще проще:
                                                                              Делаете одностраничный красивый сайт с описанием товара, которого нет. Потом на нем размещете кнопку «Заказать», не снимая деньги с карточки. Потом покупаете рекламу на Facebook / Google Search и направляете на сайт. Потом смотрите, сходиться ли экономика вашего бизнеса. Если сходиться — закупаете товар и тратите больше бюджет на рекламу.

                                                                              Это пример «на пальцах», чтобы передать суть :)

                                                                                0

                                                                                Спасибо за ответ)
                                                                                Описанная вами последовательность логична.
                                                                                Я это понимаю. Обычно я проверяю свои идеи простым поиском в сети.
                                                                                Но допустим один из моих проектов, который можно найти по тегу 3dcat, не выдерживает подобного подхода, т. к. спрос на время моего предложения 2017 г. был крайне низок. На данный момент спрос растет, и инвестиция в IT разработку бота (биржи заказов 3D печати) в телеграм с моей точки зрения оправданна.
                                                                                Но, я писал не об этом)
                                                                                Один из моих проектов, с которого я начал изучение и практику создания сайтов в далеком 2011 году, провалился, сыграла роль совокупности факторов — дизайн, презентация, нулевая частота повторного использования, и и всеобщее мировоззрение относительно продукта. На данный момент общество готово для этого проекта, и нужно только структурировать новое т. з., отложить инвестиции и профит) И как факт, мой опыт программирования не позволяет сделать проект самому. Это и был основной посыл.

                                                                                  0
                                                                                  Вам не обязательно уметь делать все подряд (программировать, дизайн, маркетинг). Не надо распыляться и пытаться все в одиночку, как это делал я :) Это неэффективно.

                                                                                  Важно иметь друзей / знакомых, кто может закрыть нужные компетенции и собрать их вместе. Для этого нужно иметь большой круг общения, учавствовать в хакатонах, конкурсах стартапов и т.д и быть на виду. Вы соберете команду и все будет зависить от вас, получиться ли строить бизнес, когда есть все составляющие
                                                                              0
                                                                              Приветствую!
                                                                              А не могли бы вы рассказать про трансформацию разработчик -> фаундер...?
                                                                              Очень интересно что вы поняли на этом пути, какие навыки приобретали, как научились изучать рынки, строить продажии тд. Что еще было необходимо чтобы принимать правильные решения..?

                                                                              Нужно ли больше изучать маркетинг, продажи и приобретать прочие компетенции необходимые для правильного ведения бизнеса? Или достаточно консультироваться или привлекать в команду источники таких компетенций?
                                                                                +2
                                                                                Тот путь, который я прошел, как разработчик -> фаундер неэффективный, потому, что я учился на своих ошибках. Когда я переехал в столицу, я видел молодых ребят с крутейшим опытом, который они получили всего за 2 года и потом основали компании, которые сейчас ушли по выручке далеко вперед.

                                                                                У них всех была одна и таже история. У них была возможность сразу узнать, как делать бизнес правильно (разработку, маркетинг, продажи)

                                                                                В истории с моим знакомым, я забыл рассказать интересный момент, по которому он не пошел работать со мной, хотя я зарабатывал 30 тыс $. Он пошел работать на меньшую ЗП на абсолютно другую должность, чтобы просто быть рядом с человеком, который принимает бизнес-решения по развитию мобильных приложений. Тогда он мне про это говорил, я не понимал. Сейчас понимаю, как же он был прав и это сэкономило бы мне годы, потраченные на свои ошибки.

                                                                                Самый лучший совет, который я могу дать — это найдите успешную компанию в области, в которой хотите строить бизнес. Устройтесь на любую должность, чтобы вы видели, как принимаются решения и почему. Это может быть не сразу и с потерей в зарплате. Вы все поймете и у вас все получиться. У всех получается.
                                                                                0
                                                                                Какова судьба вашей распознавалки голоса и преобразование в текст?..
                                                                                В Regulatory compliance очень важно что и как говорят при работе с клиентами, но сначала нужно получить текст.
                                                                                  0
                                                                                  У нас было много заявок на преобразование речи в текст. И мы даже сделали на 2 языка (английский на DeepSpeech и немецкий на Fairseq), чтобы просто оценить трудозатраты развития этого направления. Это очень перспективный рынок, но к сожалению, я принял решение все приостановить и сфокусироваться только на машинном переводе.

                                                                                  0
                                                                                  Шикарная статья! Будет круто, если данное приложение действительно будет чётко и достоверно распознавать речь говорящего и правильно предоставлять текстово-голосовой перевод (для лиц с ограниченными возможностями важны оба варианта передачи данных)
                                                                                    0
                                                                                    Вы смотрите шире, есть же алтернативные марктеплэйсы, в Китае их сотни. Есть же набирающий популярность AppGallery (Huawei). Еще вы не рассматривали смарт тв и голосовых помощников?
                                                                                      0
                                                                                      У нас уже есть голосовые ассистенты для Google и Amazon, в будущем будет для других. Также разместились в магазине Samsung. Через неделю будем в Huawei.
                                                                                      +1

                                                                                      Читал вашу историю еще на ресурсе тут бай. Тогда было двоякое чувство. С одной стороны искренне желал вам успеха, потому что вы двигаетесь к своей цели несмотря ни на что. С другой стороны, вы вызывали у меня чувство неприятия от того, что в той статье было упомянуто, что вы сделали 600 приложений за полтора года, т.е. в среднем 1.12 приложения в день. И подобные вам люди заполонили play market всяческим шлаком вроде ваших "приложений из 2х кнопок для проверки того, на какие будет больший спрос". В ответ на действия подобных вам людей и были введены более жесткие правила публикации, из-за которых пострадали такие дураки вроде меня, которые пытались опубликовать одно качественное приложение, на которое тратилось около года разработки. И вот, получается сейчас вы как раз и столкнулись с той ситуацией, когда и вам, наконец-то, надо сделать нечто качественное и стоящее. Я не злорадствую, скорее наоборот рад, что вы тратите, заработанные подобным методом, ресурсы на какой-то стоящий продукт. И я искренне желаю вам успеха! Не сдавайтесь несмотря ни на что! У вас всё получится!

                                                                                        0
                                                                                        вы вызывали у меня чувство неприятия от того, что в той статье было упомянуто, что вы сделали 600 приложений за полтора года, т.е. в среднем 1.12 приложения в день. И подобные вам люди заполонили play market всяческим шлаком вроде ваших «приложений из 2х кнопок для проверки того, на какие будет больший спрос». В ответ на действия подобных вам людей и были введены более жесткие правила публикации, из-за которых пострадали такие дураки вроде меня, которые пытались опубликовать одно качественное приложение, на которое тратилось около года разработки

                                                                                        :(
                                                                                          +2
                                                                                          Спасибо!

                                                                                          Уверен, что ваше приложение пострадало не из-за этого. До истории с переводчиками, я делал много лет качественные проекты (как мне казалось), тратив кучу сил и денег бестолку.

                                                                                          Но в статье я честно признался, почему они не «взлетели». Я не хочу винить в этом правительство, Google Play, погоду или ретроградного меркурия. У меня не было самого главного — бизнес опыта в IT проектах, без которого ничего нельзя сделать, даже с качественным приложением. Я работал обычным программистом, который просто делал таски в Jira, не понимая, что за бизнес за этим стоит.

                                                                                          Напишите мне в FB / LinkedIn, посмотрю ваше приложение и постараюсь помочь, если надо :)

                                                                                            +1
                                                                                            Это проблема не человека а маркета и условий в целом. Гуглу откровенно насрать было на качество приложений в маркете. Сейчас ситуация меняется но очень медленно.
                                                                                            +2
                                                                                            А ведь можно было написать кэширующий прокси для гугл переводчика, чтобы сразу возвращал ответы на распостраненные фразы. Это бы дало экономию на начальном этапе.
                                                                                              0
                                                                                              Я именно с этим апи не работал, но при работе с платными сторонними апи сталкивался с тем, что они запрещают кэшировать и вообще как-то сохранять их ответы.
                                                                                              0
                                                                                              Сервис лежит. Хабраэффект?
                                                                                                0
                                                                                                Вроде починили, проверьте
                                                                                                  0
                                                                                                  Коронавирус ломает ваш сервис. Вставил текст дисклеймера из ссылки (внизу экрана текст) на 4 абзаца.

                                                                                                  Текст
                                                                                                  Lancet Inf Dis Article: Here. Mobile Version: Here. Visualization: JHU CSSE. Automation Support: Esri Living Atlas team and JHU APL.

                                                                                                  Data sources: WHO, CDC, ECDC, NHC and DXY and local media reports. Read more in this blog. Contact US. FAQ.

                                                                                                  Downloadable database: GitHub: Here. Feature layer: Here.

                                                                                                  Confirmed cases include presumptive positive cases.

                                                                                                  Point level: Province/State level — China, US, Canada, Australia; Country level — other countries. All points shown on the map are based on geographic centroids, and are not representative of a specific address, building or any location at a spatial scale finer than a province/state.

                                                                                                  Active cases = total confirmed — total recovered — total deaths.

                                                                                                  Time Zones: lower-left corner indicator — your local time; lower-right corner plot — UTC.

                                                                                                  Visit the Johns Hopkins Coronavirus Resource Center where our experts help to advance understanding of the virus, inform the public, and brief policymakers in order to guide a response, improve care, and save lives.

                                                                                                  Note: All cases of COVID-19 in repatriated US citizens from the Diamond Princess are grouped together, and their location is currently designated at the ship’s port location off the coast of Japan. These individuals have been assigned to various quarantine locations (in military bases and hospitals) around the US. This grouping is consistent with the CDC.

                                                                                                  *This website and its contents herein, including all data, mapping, and analysis (“Website”), copyright 2020 Johns Hopkins University, all rights reserved, is provided to the public strictly for educational and academic research purposes. The Website relies upon publicly available data from multiple sources, that do not always agree. The names of locations correspond with the official designations used by the U.S. State Department, including for Taiwan. The Johns Hopkins University hereby disclaims any and all representations and warranties with respect to the Website, including accuracy, fitness for use, and merchantability. Reliance on the Website for medical guidance or use of the Website in commerce is strictly prohibited.

                                                                                                    0
                                                                                                    Не хватило GPU памяти, сейчас разнесем языки. Починим в течении пару часов
                                                                                                    0
                                                                                                    Думаю качество сами поймёте где лучше:
                                                                                                    Оригинал
                                                                                                    Visit the Johns Hopkins Coronavirus Resource Center where our experts help to advance understanding of the virus, inform the public, and brief policymakers in order to guide a response, improve care, and save lives.

                                                                                                    Ваш перевод
                                                                                                    Посетите Ресурсный центр Johns Hopkins Coropinus, где наши эксперты помогают лучше понять вирус, информируют общественность и кратких политиков, чтобы направить ответ, улучшить заботу и спасти жизни.

                                                                                                    Гугл
                                                                                                    Посетите Ресурсный центр коронавируса Джонса Хопкинса, где наши эксперты помогают лучше понять вирус, информировать общественность и информировать политиков, чтобы направлять ответные меры, улучшать уход и спасать жизни.

                                                                                                    Яндекс
                                                                                                    Посетите Ресурсный центр коронавируса Джонса Хопкинса, где наши эксперты помогают углубить понимание вируса, информировать общественность и информировать политиков, чтобы направлять ответные меры, улучшать уход и спасать жизни.
                                                                                                      +1
                                                                                                      У нас качество не лучше Google, я про это писал в статье. Хорошее качество сейчас только в переводе с английского на немецкий, французский, испанский.

                                                                                                      Цель статьи — найти специалистов по Natural Language Processing себе в команду и починить ошибки перевода. Все решаемо и понятно, как делать, — нужны люди.
                                                                                                  0
                                                                                                  Спасибо за статью — было очень интересно прочитать.
                                                                                                  Работаю над пет-проектом по созданию сервиса для тренировки слов (существующие сервисы меня не устраивают). Подскажите, пожалуйста, где можно скачать/купить словари по типу Лингво. Пока мне хватает того, что можно достать на рутрекере (там есть куча stardict словарей), но на будущее хотелось бы иметь всякие экзотические пары типа потугальский-немецкий, словари типа толковых, когда язык «перевода» тот же, что и оригинала. Как пример англо-английские словари Collins, Oxford Dictionary, наш словарь Даля. Еще мне непонятна правовая база использования словарей — как с этим можно разобраться, какие тут правила игры?
                                                                                                    0
                                                                                                    3 года назад мы смотрели эту тему и остановились на Wordnet. Качественных open-source словарей мало.

                                                                                                    Обычно в архиве исходников идет файл лицензии. Что разобраться с лицензиями я использую сервис.

                                                                                                    tldrlegal.com
                                                                                                    +1
                                                                                                    Всем привет. Я читаю хабр более 10 лет. После прочтения поста решил регнуться. Много вопросов к ТС. Чувствуется что это большой рекламный пост с ссылками в конце своего проекта и не более.
                                                                                                    1. Не вижу цифр в статье на что был потрачен 1M $. Если покупали железо? То какое? Количество/примерная цена? Если арендовали, то тоже самое какое/количество/цена?! Почему арендовали а не собирали? Если не было комплектующих в 2016 году как например у меня, то почему не катались за ними в Европу, раз уж катались на всякие сходки. Я например катался в Финку на пару недель и вытаскивал со стоков видюхи для ферм под сами знаете что и для нейронки под генерацию текста под тоже сами знаете что!
                                                                                                    2. Как показывало себя разное железо в обучении, тесты графики что-то есть?
                                                                                                    3. На сколько быстрее DGX и какова примерно реальная разница с тем железом что была?
                                                                                                    4. Что делала выделенная команда, сколько было человек за все время, что делали фрилансеры, сколько было человек, сколько стоило и то и то из того самого миллиона?
                                                                                                    5. Чем занимались вы в это время, только рулили процессами или писали какие то модули, в роли кого вы выступали?
                                                                                                    6. Вы писали про полугодовой план по разработке значит он у вас был/есть, добавьте, что пошло не так по этому плану?
                                                                                                    7. Почему не использовались кэш сервера чтобы убить 20-40% запросов до гугла.
                                                                                                    8. Почему имея 30к$ в месяц в частично не вкладывали деньги в ликвидные активы чтобы эти активы Вас поддержали на плаву в трудную минуту?
                                                                                                    10. История с севером дома не понятна вообще?! Помещения можно арендовать а в вашем случае можно было купить. Не хотите помещение то есть DC. Стойка в DC стоит от 25к рублей на 6 киловатт без ибп с патчем на 1G. 4U от 5000 р с ибп от 100 mbit/s. Я например купил помещение получая до 6к$ в месяц и сейчас там все железо стоит и не болеет а при случае могу помещение сдать в аренду.
                                                                                                    10. Почему не сделали шаблон для фрилансеров и не скармливали одни и те же книги в разных переводах. Фрилансеры могли подбить тексты оригинал к переводу за дешево. Не было денег выкупать лицензию?! Могли скачать библиотеки сами знаете где бесплатно.
                                                                                                    11. Почему не написали парсеры для сайтов готовых статей с переводами и автоматом их не скармливали.
                                                                                                    12. Почему софт бэкэнд зависал или железо зависало не понятно описано?! Реализовать аппаратные и софтовые вотчдоги было проблемой?
                                                                                                    13. Почему на стадии проработки выбора opensource вы не посмотрели результаты других участников кто юзал обучение и чего они добились и какие лучшие практики они предлагали чтобы не рыскать как слепой котенок?
                                                                                                    14. Почему было не заплатить людям кто в этой теме чтобы объяснили как и что работает вместо покупки сырого opensorce и в итоге применив знания написать полностью свое?
                                                                                                    15. Почему не делали постепенное обучение а пытались взять нахрапом создавая дедлайн? Пытались вывести на рынок продукт не имея продукта?! Или это связано с тем, что вы деньги на что-то слили?! Если слили, то на что?
                                                                                                    16. Почему распознавание голоса убрали из плана хотя самая востребованная ниша уже как 4 года?
                                                                                                    17. Какой план дальше? Искать инвестора или пользователей?
                                                                                                    18. На кого делаете ставку на физиков или на компании?
                                                                                                      +1
                                                                                                      Да, это реклама моего проекта, результатов и всего пути, который я прошел, чтобы найти редких NLP специалистов к себе в команду и быстро достичь качества Google в переводе.

                                                                                                      А теперь ответы:
                                                                                                      1) Миллион был потрачен на налоги, покупку квартиры, аутсорс разработку (около 600 тыс ), на жизнь в течении 7 лет + помощь родителям + остальное. Я понимаю, что деньги это больная тема, особенно для небольших городов как России, так и Беларуси. Те, кто меня знает, может подтвердить что я живу скромно вплоть до сегодняшнего дня. Не хочу больше поднимать этот вопрос. Из этого миллиона у меня больше не осталось денег.

                                                                                                      Железо сначала бралось в аренду у разных поставщиков. Сервера были как с одной GTX 1080 за 100$ так и AWS V100 за 32$ / час. В разное время было разное количество.

                                                                                                      Из своего железа собрал только компьютер для тестов на 2 x 2080 RTX Ti

                                                                                                      2) Есть все графики обучения и другое, у нас в Lingvanex Control Panel

                                                                                                      3) Я не смог взять DGX-2 в аренду из-за того, что фирма, на которую будет договор лизинга должна быть в США, а у меня на Кипре и они строго за этим следят. Как бы удивительно это не звучало. В то время это было так

                                                                                                      4) Много людей: мобильная и backend разработка, data-science. Разработка обошлась где-то в 600 тыс $

                                                                                                      5) Я управлял разработкой и выступал в роли продукт-менеджера. Сам код писал, но совсем немного.

                                                                                                      6) Надо было собирать свою команду в офис с самого начала, вместо найма на аутсорс. Эта самая большая ошибка.

                                                                                                      7) Кеш подключили позже

                                                                                                      8) Хороший вопрос. Сейчас бы я вложился в такие активы. Но тогда решил все потратить на бизнес.

                                                                                                      9) Дома у меня был 1 компьютер для тестов с 2 GPU RTX 2080 Ti, который был в 4 раза быстрее, чем сервера с 1 x GTX 1080, которые я арендовал как dedicated.

                                                                                                      10) Это не будет дешево. Узнайте их расценки.

                                                                                                      11) Писали парсеры, но с учетом трудозатрат для их настройки под разные форматы и исправления ошибок – прекратили. Невыгодно

                                                                                                      12) Потому что open-source проекты, когда они только начинаются – они сырые. И баги в них – это нормальное явление

                                                                                                      13) Все смотрели. Это был очень долгий и сложный путь, который не описать в одной статье.

                                                                                                      14) Переводчик – это сложная тема и нужны тысячи часов консультаций, которые очень дорого стоят (Мне сказали $250 в час). В то время было мало людей, к кому можно было обратиться. Когда появился openNMT меня консультировали бесплатно.

                                                                                                      15) У нас как раз было постепенное развитие продукта в течении 8 лет. Просто 4 года назад оно стало интенсивным, как появились деньги.

                                                                                                      16) Распознавание голоса убрали, чтобы сфокусироваться на переводчиках. Нельзя все охватить, даже если хочется.

                                                                                                      17) План в первую очередь найти NLP специалистов в команду. Инвестор не помешает, но он должен разбираться в этом рынке, а таких не много.

                                                                                                      18) Сейчас делается ставка на физиков ( приложения), как будет готово качественное API на много языков – ставка будет на компании (B2B).

                                                                                                        0
                                                                                                        Вы не поняли про деньги. Мне не интересны ваши квартиры, машины, ваша жизнь. Мне интересны траты на сам проект. Это очень важно как вы распорядились деньгами в проекте. Я вам пример привел что я делал и что делаю до сих пор.
                                                                                                        Я арендовал мощности и в итоге сел, посчитал, понял что мне проще в 90% случаев купить железо и поставить его на колокейшн в dc или тупо снять или купить помещения и туда запихнуть железки. Потому что это железо всегда можно продать по частям в течении 3 лет на б.у от 90% до 50% от цены новой на рынке если оно не нужно. А отбивается это железо от 3х месяцев до 2 лет в зависимости как юзать.

                                                                                                        Сейчас если я хочу протестить какое-то железо я просто арендую одну железку, тестирую и принимаю решение буду я покупать или нет. Если нет железки в аренду, то иду и покупаю один экземпляр и тестирую.

                                                                                                        По поводу жужжащего сервера?! Почему вы его не поставили в dc? Просто написано так, как будто поставить дома это вынужденная мера?

                                                                                                        По поводу подготовки текстов по шаблону я с вами не согласен. Я фрилансеров нанимал для написания парсеров с моим форматом выгрузки. В итоге хороший парсер маркета встал всего в 50$. Дзен до 100$ вышел. На прокси я потратил 2000-3000$. Парсил около 2 недель.
                                                                                                        Текста и картинок получил на более чем 30 терабайт. До сих пор скармливаю.

                                                                                                        Кроме того нанимал фрилансеров на рутинную работу которая требовала именно человека и работа была сложнее и объёмнее чем работа по прогону книг для литерутрного перевода. Ценник 15.000р в месяц у людей был. Работой доволен.

                                                                                                        Камней в ваш огород не кидаю. но чувствую что посидев, подумав, почитав перед стартом работ, вы бы сэкономили деньги, силы и нервы. Кто ищет тот найдет.
                                                                                                        Возможно вы были не готовы или плохо готовы к данной теме.

                                                                                                        Но в любом случае я за вас искренне рад! Вы вытянули проект. Теперь основная сложность его не дропнуть.
                                                                                                          0
                                                                                                          Спасибо за пояснения, теперь стало понятно, что вы имели ввиду.

                                                                                                          У меня не было тогда опыта сборки серверов, аренды помещений итд, расчета стоимости итд, как и не было с кем посоветоваться. Я думал, что решу задачу API для перевода за 6 месяцев, и было логичным взять в аренду на небольшой срок. Но когда задача растянулась на 3 года, сейчас ясно, что можно было купить свое железо вначале и сильно сэкономить.

                                                                                                          Парсер переведенных текстов он сложнее, чем парсер маркета. Там свои нюансы, но задача решаемая, если есть опытные люди. Но мне не всегда везло с исполнителями.

                                                                                                          Если бы тогда был сегодняшний опыт, можно было сэкономить 400 тыс $ из 600. Жаль, конечно, но что делать :)
                                                                                                      +2
                                                                                                      Немного холодного душа для тех, кто пишет «ах какая мотивирующая статья!».

                                                                                                      Для занятия бизнесом нужно очень хотеть заработать. То есть в обмен на все остальные удовольствия вы должны научиться извлекать приятное из очень затратной по времени и скучной работы по выявлению интересов абстрактного клиента и выбору методов удовлетворения этих интересов на уровне, сравнимом с конкурентами. Ну и без гарантий, разумеется. Точнее даже с гарантией того, что даже просто на самоокупаемость выйти будет трудно (а многим — невозможно).

                                                                                                      При этом, разумеется, вы должны забыть о разного рода копании в алгоритмах, создании сложных систем и т.д. Это всё должны делать другие, потому что у вас не будет на это времени. Поэтому ваш путь пройдёт через open-source и прочие готовые/покупные технологии. Сами вы ничего разрабатывать не будете. А если будете — потеряете бизнес.

                                                                                                      Но, конечно, пока не попробуешь — не поймёшь, так что — попробуйте, проверьте, ну вдруг вы попадёте в волну (одну на миллион) и вам ничего из указанного делать не придётся. А если не попадёте — вас ждёт довольно скучная (на мой взгляд) работа. Но может вам она покажется ближе, чем мне.
                                                                                                        0
                                                                                                        В открытом доступе публикуются научные работы от команд Google, Facebook, Alibaba. От них же в opensource выкладываются их фреймворки и датасеты. Создаются форумы с ответами на вопросы.

                                                                                                        Крупные компании заинтересованы, чтобы такие стартапы, как наш, развивались, захватывали новые ниши и показывали максимальный рост. Они с радостью готовы покупать NLP стартапы для усиления своих больших компаний.

                                                                                                        Вы красиво и просто описали схему раскачки рынка крупнейшими гигантами и их мотивы публикации знаний в публичный доступ. Спасибо.

                                                                                                        А вот по теме «как в одиночку вырасти до 30к на приложениях со свистюльками» не очень понятно. Вера в обычный hardworking у людей сломана.
                                                                                                          +1
                                                                                                          Надеюсь, в будущем я сделаю большую статью, где подробно распишу эту часть. Лучше всего устроится в небольшую компанию до 10 человек iOS / Android программистом. Так или иначе, делая таски и задавая свои вопросы вы поймете суть этого бизнеса за пол-года. Очень важно выбрать компанию, в которой можно получить такой опыт. Потом сделаете свое приложение правильно с точки зрения бизнеса и начнете зарабатывать. Потом будете масштабироваться. Вы все поймете.

                                                                                                          0
                                                                                                          Можно по технологической части вопрос?

                                                                                                          Как я понял, там применяется смесь из нейросетей с обработкой на основе различных эвристик. Как-то можно классифицировать эти эвристики? Например был шум на тему semantic web, что-то подобное применяется при переводе? По логике там ему самое место, но по факту там рулит статистика и нейросети. Ну и может что-то ещё.

                                                                                                          А если автору не трудно (пусть в виде рекламы своей компании), было бы интересно почитать статью именно про технологическую часть.

                                                                                                          И кстати, раз уж статья целится на поиск знатоков NLP, то интересно, а какие задачи они будут решать? Ведь основа давно задана, никакие вольности в виде исследований не позволительны (ограничение по деньгам), и по сути получается, что нужны просто знакомые с используемыми в предметной области терминологией и алгоритмами люди, что бы им поставить задачу, ну и они её пилили как в обычных программистских конторах. Может даже вообще есть смысл иметь лишь одного эксперта, а всё остальное поручать гораздо более дешёвым помощникам, которым просто спускается план действий, может с какими-то пояснениями, мол вот с этого сайта текст надо скормить этой приблуде, она посчитает статистику, потом результат сохранится сюда, а ты выберешь из статистики такие-то части и включишь в программу для Андроида (в её базу данных).

                                                                                                          И опять кстати, программа для Андроида имеет всего 1000 установок и непонятно сколько из них активны. Как-то мало.
                                                                                                            0
                                                                                                            Мне написало много людей, и я уже не успеваю всем отвечать. По технической части — лучше сделаю отдельную статью позже, чисто про работу переводчика. А вторую — только по раскрутке мобильных приложений.

                                                                                                            Программа для Android — это новые переводчики, там минимум скачек. Все деньги и 20 млн были заработаны на старых версиях. Напишите в Facebook, я покажу статистику и все остальное.
                                                                                                            0

                                                                                                            Очень интересно (я б сказал охренительно). Видно что вы научились делать бизнес на переводах, и у вас есть план на будущее. Но и Гугл в шапку не спит (https://3dnews.ru/1006202). Так что отрасль растёт, но и конкуренция не уменьшается.

                                                                                                              0
                                                                                                              как так получается, что «успешное приложение на 20млн закачек» имеет на апсторе 39 оценок всего, а на плеймаркете 1000 закачек и 41 оценку, половина из которых написано в один день?
                                                                                                                0
                                                                                                                Напишите мне в Facebook, я покажу аккаунты, где расположены старые переводчики вместе со статистикой в 20 млн закачек. Эти закачки в сумме на 40 приложений для перевода (тестов языковых пар)
                                                                                                                –2
                                                                                                                Выичтал в комментах это «При этом, разумеется, вы должны забыть о разного рода копании в алгоритмах, создании сложных систем и т.д. Это всё должны делать другие, потому что у вас не будет на это времени. Поэтому ваш путь пройдёт через open-source и прочие готовые/покупные технологии. Сами вы ничего разрабатывать не будете. А если будете — потеряете бизнес»

                                                                                                                Не согласен и объясню на своем примере почему

                                                                                                                В мире софта есть всего 3 варианта продажи вашего «продукта».
                                                                                                                1.Разовые покупки.
                                                                                                                2.Подписка.
                                                                                                                3.Раздача бесплатно с последующей продажей вашей инсталл базы себе, либо другим покупателям-рекламодателям. Именно это делал ТС в приложениях с рекламой.
                                                                                                                Сами схемы продажи могут быть сложные или простые но так или иначе подойдут под эти три пункта или под синтез из этих трёх пунктов.
                                                                                                                Чтобы продать свой продукт его надо сначала сделать, чтобы его сделать его надо найти или увидеть или придумать! В моем случае это был алгоритм который я нашел сам. У ТС это идея, к которой он пришел юзая чужой API. Зачем юзать чужой API и платить деньги, когда можно сделать свой API и тебе уже будут платить деньги.
                                                                                                                Что касается меня то 13 лет назад я нашел алгоритм в YOUTUBE. Сначала его слили в маленький кружок в виде коллективной покупки а 3-4 года назад бесплатно в сеть. Алгоритм был для накрутки в youtube просмотров за очень дешево в 10-100 раз меньше чем все предлагали и этим предлагателям мы и сливали накрутку а они сливали покупателям. Я реализовал эту задачу через движки магазинов, форумов, блогов. Очень любил wordpress для этих целей.)))

                                                                                                                Сейчас я занимаюсь нейронкой. Учу рерайтингу, оформлять посты, прикреплять картинки перед этим их уникализируя, писать отзывы для магазинов. Тренируюсь я на Яндекс Дзен и Яндекс Маркете но это только пока. В будущем хочу окучивать Amazon.

                                                                                                                Я придерживаюсь мнения что на каждую нейронную гайку всегда найдется нейронный болт. Судя по моим успехам я нарезаю резьбу в любую сторону!
                                                                                                                Все сервисы сейчас легко обходятся ботами без нейронок а с нейронками-ну вы поняли.

                                                                                                                Мои ниши это всегда от 100 до 1000 заинтересованных ботоводов для различных сервисов. Цена таких подписок на api и мощности от 1000$ до нет предела в месяц. Заказов больше чем могу дать мощностей. Это пример того как можно окучивать узкую аудиторию.

                                                                                                                Таких ниш ребята просто тьма. Можете даже в мою влезать я там почти один с нейронкой и системой паттернов.

                                                                                                                У меня на бумаге ещё 17 проектов, которые ждут времени которого нет. Скорей всего не успею сделать и подохну.

                                                                                                                Вам всем советы!
                                                                                                                Залезайте в генерацию текста и рерайтинг, генерацию видео, это одни из самых прибыльных ниш будут на следующие 10 лет.

                                                                                                                Ещё очень нравится крипта точнее то, что на ней можно построить совершенно разные платформы с внутренней валютой — забрать фиат а взамен отдать веру в воздух и твой проект. Но мне надо подтягивать матан а я его ненавижу.
                                                                                                                  +2
                                                                                                                  Ничего не понял, вы прошарили тему накруток и на… лова, и можете давать советы в теме, где обсуждается рождение качественного и конкурентного гуглу специфического и сложного сервиса? :) Миром будут править не ботоводы и прочие спамеры, а те, кто принесёт людям нужный и полезный сервис. Может, вам в сторону созидания посмотреть (благо, технически вы подкованы)?
                                                                                                                    –2
                                                                                                                    Давать советы могу и буду если захочу))) 12 лет опыта работы с железом и инфраструктурой собранной для нагруженных и специфических проектов делают меня минимум знающим человеком по железу, его стоимости и где его достать а также куда поставить и как обслуживать.
                                                                                                                    Миром уже правят ботоводы, спамеры а также продажа рекламы, продажа инсталл базы и ваших личных данных. Это факт! Кто его отрицает просто не дружит с головой.

                                                                                                                    Или вы думаете что Facebook или Instagram это созидательные проекты где есть бизнес аккаунт с покупкой рекламы и её показом вам? Или может быть ТС делает бесплатный переводчик без лимита строк на перевод и не будет брать денег за превышения лимита? ТС делает коммерческий продукт с самого начала. Как и я. И мои закрытые продукты тоже приносят пользу. Пользу покупателям продукта. Польза может быть во всем и деньгах тоже.
                                                                                                                  –2
                                                                                                                  Советы я даю хорошие, залезете сейчас в эти темы будете грести лопатой деньги потом.
                                                                                                                  Если бы внимательно читали то поняли что спам тут не причем. Представьте что такой пост как написал ТС, был написан не ТС а сгенерирован за 1-10 минут и опубликован. Вы об этом не знали и думали что это настоящий человек. Мало того, так он вам и отвечает на ваши вопросы.
                                                                                                                  Кто-то сейчас почитывает Дзен и думает что он читает посты человека и подписывается на него))) А потом подписавших монетезируют либо сам яндекс либо вы-держатель аккаунтов.

                                                                                                                  Ну и напоследок. Если вы считаете что гугл и яндекс созидает что-то и двигает развитие сервисов, то вы просто не владеете информацией. На вас зарабатывают такие компании. А я зарабатываю на этих компаниях или с этими компаниями чего и всем желаю.
                                                                                                                    0
                                                                                                                    >Но мне в ответ называли сумму в несколько раз выше. Это было слишком дорого.

                                                                                                                    Ну, теперь вы понимаете почему они просили сумму в несколько раз выше? Всю простыню не осилил, сделали какие-то выводы? Как я понял по итогу вы потратили 600К USD и кучу времени, которое могли бы пустить на новые проекты.

                                                                                                                    Проблема таких горе бизнесменов, что они советуются с сообществом по факту, когда ситуацию уже не выправить.
                                                                                                                      0
                                                                                                                      Все можно выправить. Хабра-эффект работает ))
                                                                                                                    • НЛО прилетело и опубликовало эту надпись здесь
                                                                                                                        0
                                                                                                                        Спасибо, что поделились своей историей, интересно почитать похожие

                                                                                                                        Я не пытаюсь конкурировать с Google, у меня нет таких ресурсов. Тут расчет на то, что скоро будет передел рынка переводчиков, когда выйдут новые игроки типа DeepL. Скоро не будет монополии Google. Из-за того, что сейчас не нужно десятков миллионов долларов на компьютеры и датасеты, есть шанс захватить каких-то 0.5% большого рынка, что в деньгах для команды в 30 человек в «условной» Беларуси или России будет очень много. Но для Google или Microsoft это будут крохи.

                                                                                                                        У меня есть знакомые из Минска, которые зарабатывают на приложениях для бега 30 млн $ / год. Для корпорации это копейки, но для фирмы до 100 человек — вполне деньги, ради которых стоит пройти трудный путь.

                                                                                                                        Согласен, что заработанными деньгами я распорядился неправильно. Но как говориться «Если бы молодость знала, если бы старость могла». Все могло быть по-другому :)

                                                                                                                        Я не считаю себя оптимистом, просто когда уже потратил $300 тыс на проект, я не смог его закрыть просто так. До этого все проекты закрыл, но там потраченные ресурсы были небольшие. Это было очень тяжелое решение — продолжить. Меня ломало месяца три :)

                                                                                                                        Самый главный вывод, который я понял за 15 лет IT, что основа любого успешного дела — люди. Не идея, не рынок, не технология, а именно команда. Хорошая команда сделает проект любой сложности. Даже если ошибется дорогой, но все же вырулит к цели. Было много примеров среди знакомых.

                                                                                                                        Своей главной ошибкой считаю, что я стал «публичным» очень поздно. Надо было на старте писать статьи о проекте, выступать на меприятиях, кричать про эти переводчики из каждого утюга. Не надо было все отдавать на аутсорс и фрилансеров и молча спрашивать советов через личку Facebook.

                                                                                                                        Статьи о проекте, работают очень круто для поиска нужных людей в команду. Через вакансии я бы никогда их не нашел. И когда, наконец, собрал команду и завел проект из «песка и палок» — тут стали заканчиваться деньги ))))

                                                                                                                        • НЛО прилетело и опубликовало эту надпись здесь
                                                                                                                          0
                                                                                                                          А какой идеальный конечный результат Вы хотите получить от этого проекта?
                                                                                                                            0
                                                                                                                            Продать компанию более крупному игроку на рынке машинного перевода.
                                                                                                                              0
                                                                                                                              Т.е. фактически деньги, но только уже умноженные на какой-то мультипликатор к 1М.

                                                                                                                              Статья интересная и познавательная! Спасибо Вам!
                                                                                                                                0
                                                                                                                                Я думаю автору и процесс интересен. Иначе давно бы проел миллион на яхтах и прочем.
                                                                                                                                  0
                                                                                                                                  Все верно, не без этого :)
                                                                                                                                    0
                                                                                                                                    Возможно и так, но мы же не можем за автора выбирать цель его жизни…

                                                                                                                                    яхта и прочее — это фактически процесс потребления без созидания, действительно ранее автор выбрал другой путь, но путь «как не крути» всё равно зависит от цели
                                                                                                                                      0
                                                                                                                                      Успешных бизнесов «с нуля» и только ради потребления, на мой взгляд, просто нет. От папы с мамой по наследству — это есть, но что бы реально работать — да ни за что. То есть потребление не является достаточным стимулом.

                                                                                                                                      И наоборот — волевой человек, привыкший к скромной жизни, легко может потратить много энергии на дело. Ну и результат, иногда, тоже случается. А вот безвольный потребитель — ну как он может себя заставить? Только от папы с мамой.
                                                                                                                              0
                                                                                                                              Офигенная история! Прочитал без остановок. Респект за настойчивость, ведь так тяжело не опускать руки при неудачах, особенно когда уже ничто не говорит о возможном успехе…
                                                                                                                              И так много структурированной практичной информации.
                                                                                                                              Автору огромное спасибо за статью!
                                                                                                                              Без сомнений в закладки!
                                                                                                                                0
                                                                                                                                Вот после этой статьи начал использовать ваш переводчик.
                                                                                                                                Не нравится то что программа для Windows на проч зависает во время перевода (после нажатии на кнопку перевести). Можете это исправить?
                                                                                                                                И пропадает написанный и переведённый текст в add-on для Firefox когда «сворачивается окошко переводчика».
                                                                                                                                  0
                                                                                                                                  Спасибо за отзыв, будем чинить.
                                                                                                                                  0

                                                                                                                                  Предположим, что вам дали задачу сделать переводчик с английского на язык Z и обратно(носителями языка Z являются не более 1млн человек, поэтому пока ни у кого нет реализации). В какой последовательности вы бы решали задачу?

                                                                                                                                    0

                                                                                                                                    Очень классная статья.Прочитал на одном дыхании

                                                                                                                                    Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                                                                                                                    Самое читаемое