All streams
Search
Write a publication
Pull to refresh
85
5
Рудак Алексей @Aliaksei_Rudak

Основатель компании Lingvanex (www.lingvanex.com)

Send message
3 года назад мы смотрели эту тему и остановились на Wordnet. Качественных open-source словарей мало.

Обычно в архиве исходников идет файл лицензии. Что разобраться с лицензиями я использую сервис.

tldrlegal.com
Не хватило GPU памяти, сейчас разнесем языки. Починим в течении пару часов
Был опыт программирования, но в успехе он не играл главную роль. Не было опыта бизнеса. А его надо было как-то получить, используя то, что умеешь

Пример:

Допустим вы не связаны с IT и хотите проверить рынки товаров, по аналогии, как я проверял рынки приложений. Вы идете на Aliexpress, смотрите тренды и выбираете 100 перспективных на ваш взгляд товаров (маски от гриппа, конструкторы для детей, летающий будильник итд) и размещаете все 100 товаров в другом большом магазине (Ebay, Amazon итд). Потом закупаете (размещаете) рекламу, чтобы на эти страницы пошел трафик.

Когда у вас будет статистика, вы будете видеть стоимость привлечения покупателя и выручку с товара. Всегда будут товары, которое продаются лучше. Останется только масштабировать.

Или еще проще:
Делаете одностраничный красивый сайт с описанием товара, которого нет. Потом на нем размещете кнопку «Заказать», не снимая деньги с карточки. Потом покупаете рекламу на Facebook / Google Search и направляете на сайт. Потом смотрите, сходиться ли экономика вашего бизнеса. Если сходиться — закупаете товар и тратите больше бюджет на рекламу.

Это пример «на пальцах», чтобы передать суть :)

У нас уже есть голосовые ассистенты для Google и Amazon, в будущем будет для других. Также разместились в магазине Samsung. Через неделю будем в Huawei.
У нас качество не лучше Google, я про это писал в статье. Хорошее качество сейчас только в переводе с английского на немецкий, французский, испанский.

Цель статьи — найти специалистов по Natural Language Processing себе в команду и починить ошибки перевода. Все решаемо и понятно, как делать, — нужны люди.
Спасибо!

Уверен, что ваше приложение пострадало не из-за этого. До истории с переводчиками, я делал много лет качественные проекты (как мне казалось), тратив кучу сил и денег бестолку.

Но в статье я честно признался, почему они не «взлетели». Я не хочу винить в этом правительство, Google Play, погоду или ретроградного меркурия. У меня не было самого главного — бизнес опыта в IT проектах, без которого ничего нельзя сделать, даже с качественным приложением. Я работал обычным программистом, который просто делал таски в Jira, не понимая, что за бизнес за этим стоит.

Напишите мне в FB / LinkedIn, посмотрю ваше приложение и постараюсь помочь, если надо :)

Вижу, что у вас хороший опыт. Было бы интересно пообщаться. Добавьте меня в Facebook / LinkedIn и напишите ваш ник на Хабре вместе с сообщением.
Если рассматривать приложения — то мы лучше Google
1) Можем переводить телефонные звонки
2) Переводить файлы на телефоне / компьютере
3) Перевод сразу всей страницы сайта
4) Офлайн перевод голоса
5) Можно делать чаты-конференции с переводом голоса
6) Клавиатура-переводчик, которая переводит текст из любого другого приложения
7) Можно начать переводить на мобильном приложении (расширении браузера), а потом продолжить работать на Mac OS / Windows на компьютере. Синхронизация истории / закладок через аккаунт
8) Перевод сообщений в iMessage на iOS
9) Разговорник для туристов
10) Функция изучения слов на 27 языках, когда можно выделить слова в браузере на компьютере на Desktop приложении, субтитрах к фильмам (браузерном расширении) а потом изучать их на телефоне.

и другое

Если рассматривать API — то по качеству перевода мы не лучше Google сейчас, но можно сделать лучше, относительно небольшими затратами.

Цель статьи — показать, чего можно добиться небольшими ресурсами и найти NLP специалистов себе в команду.

Я не давал прямых линков на приложения, чтобы не сочли за рекламу. Теперь решил дать линки сразу на магазины. Скачайте, посмотрите

Приложение для iOS

Приложение для Android

Тот путь, который я прошел, как разработчик -> фаундер неэффективный, потому, что я учился на своих ошибках. Когда я переехал в столицу, я видел молодых ребят с крутейшим опытом, который они получили всего за 2 года и потом основали компании, которые сейчас ушли по выручке далеко вперед.

У них всех была одна и таже история. У них была возможность сразу узнать, как делать бизнес правильно (разработку, маркетинг, продажи)

В истории с моим знакомым, я забыл рассказать интересный момент, по которому он не пошел работать со мной, хотя я зарабатывал 30 тыс $. Он пошел работать на меньшую ЗП на абсолютно другую должность, чтобы просто быть рядом с человеком, который принимает бизнес-решения по развитию мобильных приложений. Тогда он мне про это говорил, я не понимал. Сейчас понимаю, как же он был прав и это сэкономило бы мне годы, потраченные на свои ошибки.

Самый лучший совет, который я могу дать — это найдите успешную компанию в области, в которой хотите строить бизнес. Устройтесь на любую должность, чтобы вы видели, как принимаются решения и почему. Это может быть не сразу и с потерей в зарплате. Вы все поймете и у вас все получиться. У всех получается.
У нас было много заявок на преобразование речи в текст. И мы даже сделали на 2 языка (английский на DeepSpeech и немецкий на Fairseq), чтобы просто оценить трудозатраты развития этого направления. Это очень перспективный рынок, но к сожалению, я принял решение все приостановить и сфокусироваться только на машинном переводе.

1) Пока мы ориентированы на общую тематику перевода, чтобы покрыть нужды наших приложений. В будущем будет разделение, когда будет продаваться API

2) Оно сейчас так и решается. Система машинного перевода не состоит только из «нейронной» части.

Сейчас к нейронкам добавляются системы основанные на правилах (Ruled-based). То есть они всегда гибридные. DeepL выигрывает Google как раз за счет этой части, когда можно правильно переводить фразеологизмы, например. Я как раз и вставил абзац с историей от DeepL для этого.

DeepL начал свою историю с Linguee (https://www.linguee.com/), где как раз «имеющийся корпус эталонных проверенных переводов, регламентированных словарей типа авиации...». И у них эта база самая большая.

3) Все верно, это эффективный путь. Про это много раз писали, в том числе на форуме openNMT

4) У нас в планах поддержка CAT и про это написано на сайте, но в данный момент еще не готово.

5) Да, этот фактор мы учитываем.

Спасибо!

Много раз хотелось все бросить. Все мои проекты до переводчиков не были успешны, я послал их лесом и сконцентрировался на том, что начало «взлетать» само по себе. Но старые проекты я делал один и я мог в любое время от них отказаться. Сейчас по-другому.

У меня небольшая, но команда. У меня есть обязательства перед людьми, которые со мной, и которые пожертвовали своими деньгами / временем итд, чтобы пройти этот путь вместе. Их было очень сложно собрать. Я не могу завтра сказать, типа «перегорел» и уезжаю в Тибет.

Чтобы «не сорваться», мы в Минске сделали встречи основателей разных компаний (стартапов) раз месяц, где каждый рассказывает о своих проблемах и советуют, как их решать. С большего у всех одно и тоже. Это сильно помогает. Надо очень тщательно подбирать круг общения.

Всегда работает правило 10 тысяч часов. Если занимаешься любой деятельностью длительное время, то в данной сфере ты становишся профессионал и у тебя начинает получаться. Главное — помнить про это и не опустить руки заранее. А лучше, устроиться в компанию, где уже получилось в сходном проекте и просто перенять этот опыт. Так намного быстрее.

Спасибо!

Качественные переводы можно купить на
www.taus.net

Бесплатные можно скачать на
opus.nlpl.eu

Про BERT читал, но глубоко не погружался. Сейчас у нас все сделано на Transformer и там еще есть куда копать.

Можно выйти на доход от 1 до 3 тыс $ в месяц за несколько месяцев, больше — сложнее.
У меня лучше всего сработала Banner + Interstitial реклама от Admob + подписки c разной ценой по странам.

На shutterstock.com можете купить за $250 (готовые красивые иконки, фоны, интерфейсы, лендинги, люди, устройства итд) и всю графику для приложений. Всего будет 750 картинок. Мне хватило на сотни приложений.

Почитайте статьи про ASO (Appstore Search Optimizations) для Apple Appstore и Google Play. Обязательно заполняйте ключевые слова на все доступные локализации. Локализуйте скриншоты и делайте яркие иконки.

А лучше всего устройтесь в компанию до 10 человек, которая уже успешна и делает мобильные приложения. За пол-года поймете, как и что делать по рекламе.

У разных переводчиков на разных языках — разное качество. Просто Google — самый известный и у него больше всех языков.

Сравнение с Google я делаю из-за того, что 9 из 10 человек первым вопросом мне всегда задают «Чем вы лучше Google?» :)

Тогда был кризис и он затронул многие компании. У меня было несколько лет работы в IT программистом, но из-за специфики проектов на которых работал, твердых знаний у меня не было. Немного Java, немного VC++, objective C. Я не смог пройти собеседования. В столице мне надо было устроится хотя бы за $800, чтобы снять квартиру и осталось на жизнь. Но за месяц не смог и потратил оставшиеся деньги. Потом уехал в родной город, где вообще не было работы для IT. Просто так сложилось, что в тот момент было не так много предложений iOS разработчикам как сейчас. А мой опыт Java был в основном на апплетах и потом Swing, на которые были редкие вакансии. Это было лет десять назад.

Как я провернул все это без денег?

В 2010 году рынок мобильных приложений сильно рос и можно было делают всякую ерунду, чтобы зарабатывать деньги. Тогда Топ-10 приложения апстора — это были программы типа перделки с таймером. Сейчас такого нет.

На любом растущем рынке можно делать простые продукты и зарабатывать, пока не пришли сильные конкуренты с бюджетом на маркетинг. Но это все вскоре заканчивается. Если успеешь — заработаешь.

На доход в 30 тыс я вышел спустя два года когда начал делать приложения. Потом он начал падать. Сначала я зарабатывал 100$ в месяц и жил на съемной квартире. Доход рос постепенно, по мере того, как я делал приложения. Потом когда доход вырос я купил квартиру и переехал в столицу, где уже начал делать качественные приложения для перевода
30k $ / месяц это было через 2 года, после истории когда не было денег на квартиру. Это не сразу. Когда я начал делать первые приложения, в первый месяц было $100, потом $500, и так далее. В лучшее время было 30 тыс $ / месяц, но потом доход стал падать, так как поддерживать столько приложений было трудно одновременно.

И вот когда я достиг максимума денег с тех приложений, я понял что больше они не принесут, было решено сфокусироваться только на приложениях для перевода.

Разработка более качественных переводчиков и API финансировалась за счет старых тестовых приложений, с которых и был доход в 30k
Спасибо за идеи! Если у кого-то есть предложения на машинный перевод какой-то ниши собственного бизнеса — пишите в личку

Information

Rating
970-th
Location
Warszawa, Польша
Registered
Activity

Specialization

Chief Executive Officer (CEO)
Lead
Git
English
Software development
Database
OOP
C++