Pull to refresh
57
0
Evgeniy V. Bartov @bartov-e

ИТ/ИБ переводчик

Send message

Краткий обзор методик обучения визуально-языковых (мультимодальных) моделей

Level of difficultyMedium
Reading time12 min
Views3.3K

Продолжаю разбор материалов на тему NLP в контексте работы переводчиков, на этот раз мы с практикантами решили поразбираться в том, как работают мультимодальные модели, т. е. как машины учатся находить соответствие не только между словами из разных языков, но и между картинкой и словами. Представляем вашему вниманию перевод статьи на эту тему.
Материал местами несколько академичный, но надеюсь, будет интересен не только нам.

Читать далее
Total votes 7: ↑7 and ↓0+7
Comments1

'Attention is all you need' простым языком

Level of difficultyEasy
Reading time6 min
Views14K

Некоторое время назад я повесил здесь статью с кратким обзором техник векторизации, и мне показалось логичным продолжить эту тему попыткой разобраться с тем, в какую сторону NLP шагнула дальше, как научилась оцифровывать смысл: выбор пал на механизм attention. Мы с коллегой-переводчицей перевели и переработали Youtube-ролик 'Attention is all you need explained' в статью, которую и представляем вашему вниманию.

Заранее прошу прощения за светофор в картинках: по-другому черный фон из скриншотов убрать не получалось :).

В 2017 году, в статье Attention is all you need, исследователи из Google представили архитектуру Transformer. Новизна Transformer заключалась в использовании self-attention (досл. с англ. — самовнимание, внутреннее внимание) — механизма, благодаря которому модель может сосредоточиться не на всех сразу, а на наиболее важных элементах входной последовательности...

Читать продолжение
Total votes 5: ↑4 and ↓1+4
Comments9

Краткий обзор техник векторизации в NLP

Level of difficultyEasy
Reading time21 min
Views19K

Как переводчик-редактор, я интересуюсь темой NLP и автоматизации рутины бюро переводов. Изучая вопрос того, как смысл слов превращается в векторы, наткнулся на эту обзорную статью. Статья мне показалась изложенной доступно, поэтому я перевел ее для удобства других коллег. Работоспособность большей части кода проверял, вроде работает (см. Jupiter Notebook). Надеюсь, будет полезно.

===

Технологии NLP — Natural Language Processing, обработки естественного языка — позволяют компьютерам обрабатывать человеческий язык, понимать его значение и контекст, а также связанные с ним эмоциональную окраску и намерения, и далее, использовать эти данные для создания чего-то нового.

Как сделать слова понятными для компьютеров? Используется векторизация. Рассмотрим несколько техник такой векторизации.

Читать далее
Total votes 15: ↑15 and ↓0+15
Comments1

Сложности подготовки текста из видео

Level of difficultyEasy
Reading time6 min
Views2.2K

Иногда нам поручают подготовить какой-нибудь текст из видеоматериала, и когда мы начинаем задавать клиентам уточняющие вопросы, некоторые искренне удивляются: «Хосподи, ну это же субтитры/текст/статья, что там сложного?».

Мы решили рассказать как про основной порядок действий, так и про сложности разных видов такой текстовой работы.

Читать далее
Total votes 2: ↑1 and ↓10
Comments3

Как техпису изложить фактуру в техдоке?

Level of difficultyEasy
Reading time5 min
Views3.7K

Ни в форумах, ни в блогах, ни в России, ни в англоязычных ресурсах я не смог найти информацию о том, как логично упаковать всю релевантную фактуру в приятный технический документ. В книге М. Ильяхова «Пиши, сокращай» есть отдельная глава про дидактику, но там очень мало, вскользь и не совсем о том.

Еще есть ГОСТы 34 и 19 — там уже написано, из каких разделов должен состоять стандартизованный документ, но ведь кроме стандартизованных есть и другие документы — во всяком случае заказы на таковые ко мне приходили, — и каждый раз приходилось ломать голову.

Читать далее
Total votes 7: ↑5 and ↓2+3
Comments2

5 шагов для устранения «рунглиша» из ИТ-переводов

Level of difficultyEasy
Reading time6 min
Views8K

К моим словам прошу относиться со здоровой долей скепсиса, ибо я не нейтив-спикер, а просто ИТшный переводчик-редактор (пусть даже и с 20-летним опытом).

В последние полгода англо-русские переводы по понятным причинам практически исчезли, и по работе на проверку приходят в основном русско-английские, зачастую на «рунглише». Отмечу, что «рунглишевые» ошибки в присылаемых материалах более или менее однотипные, поэтому я и предположил, что коллегам может быть полезно, если эти ошибки кто-то разложит по полкам.

Эту памятку или «дорожную карту» я опубликовал в своем телеграм-канале несколько месяцев назад, многократно её обкатал на проектах, и убедился в ее применимости — поэтому вешаю ниже.

Шагов в этой памятке 5:

Читать далее
Total votes 29: ↑28 and ↓1+35
Comments32

Про перевод слов «выбор»/«выбирать» без choose/choice/select

Reading time4 min
Views5.4K


Новая подборка по переводческим решениям для еще одного популярного слова в ИТ- и бизнес-литературе. Смотрите, пользуйтесь.


Синонимы


decide


Начнется все с самого простого, например с выбора фильма для просмотра.
It starts with simple things, like deciding which movie to watch.

Когда Великобритания оказалась перед выбором, выходить из ЕС или нет…
… when Britain needed to decide whether it should leave the EU…
Читать дальше →
Total votes 12: ↑7 and ↓5+4
Comments5

Про перевод слов «полезно»/«пользоваться» без use/useful

Reading time4 min
Views3K


В телеграм-комментариях нас попросили сделать подборку фраз по тому, как переводить слова на тему «пользы» без слова use. Нам показалась эта тема любопытной, и мы ее копнули.


Вариантов оказалось немыслимо много, поэтому мы выбрали только наиболее частотные, да и то просмотрели не все (там получилось свыше 500 страниц цитат, мы просмотрели около 200-300). Как обычно, разложили по полкам, смотрите.


Слова


Good, best


Я попытался собрать самые полезные из них в одном месте…
I have tried to gather together the best of these into one place…
Читать дальше →
Total votes 7: ↑4 and ↓3+3
Comments1

Про перевод database: какие бывают, что с ними делают и с чем их едят

Reading time10 min
Views9.5K

Казалось бы, база данных она и в Африке database, но читая аутентичную техническую литературу по СУБД (которую русские переводчики традиционно переводят как DBMS — database management system), я ни разу этот термин — DBMS — там не увидел (не исключаю, что плохо смотрел, но ей-богу не вру).


Получается, этот термин выдуман? И много ли такого самопала?


В этой публикации я собрал из разной ИТ-литературы англоязычных авторов так называемое «семантическое поле» вокруг термина databaseкакие базы данных бывают, что с ними делают и с чем их едят. Мне показалось, что это будет явно нагляднее и достовернее, чем обычные глоссарии. Решать, конечно же, вам.


Итак, поехали.



Какие бывают?


Объектные базы данных появились в конце 1980-х — начале 1990-х годов и снова вышли из моды.
Object databases came and went again in the late 1980s and early 1990s.

В начале 2000-х появились базы данных XML, но нашли только узкое применение.
XML databases appeared in the early 2000s, but have only seen niche adoption.
Читать дальше →
Total votes 2: ↑1 and ↓1+2
Comments6

Как переводить «участие»/«участников» без part/participate

Reading time8 min
Views1.7K


Есть еще один куст слов, по которому в голову большинства переводчиков (я в их числе) в голову лезет только один дежурный набор вариантов:
участник/участие > take part/participate/participant.


Как обычно, мы посмотрели несколько переведенных с английского книг по бизнесу и ИТ (список книг внизу), развернули направление перевода (стало русско-английским), вытащили около 300 вариантов перевода, отбросили те, которые с дежурным переводом, и разложили по полочкам наиболее интересные и применимые.


Поехали.



Трансформации. Пропуск


Здесь необходимо участие обеих сторон.
It takes two to tango.

Единство мнений других участников рынка отражает цена.
That’s because the consensus view is baked into the price.
Читать дальше →
Total votes 7: ↑7 and ↓0+7
Comments0

Про перевод «начал» и «начинаний» без begin, start и first

Reading time7 min
Views4K

Если в переводном тексте кто-то что-то где-то начинает — то у меня сразу всплывают три дежурных варианта: begin/beginning, start/starting, first/firstly.


Судя по тому, что я вижу в присылаемых мне на проверку переводах, эта бедность речи наблюдается не только у меня. Зато у наших американских переводчиков я такого не наблюдаю — тут тебе и синонимы красивые, или вообще без всяких begin/start дело обходится.


Я подумал, что пришло время устранить этот пробел в знаниях, делюсь наиболее интересными находками.


Самые экзотические варианты (напр. ignite) сюда впихивать не стал, вроде и без них есть из чего выбрать (но если в будущем экзотика тоже интересует, напишите в комментах).


Поехали.


image



Слова-синонимы


Через последовательность действий


Я принял все предложения без споров и оправданий и начал действовать.
I accepted their advice without arguing or defending and acted on it.
Читать дальше →
Total votes 14: ↑14 and ↓0+14
Comments4

Про перевод «теории»/«теоретически» без theory/theoretical

Reading time6 min
Views1.6K


Теория (+её производные) — ещё одно слово, на котором у меня включается творческий тупик: в голову ничего кроме theory/theoretical/theoretically не лезет. Поэтому его мы тоже с коллегами решили покрутить и так, и этак — посмотреть, как обыгрывают эту концепцию носители.
Среди примеров вы обязательно увидите мой любимый — не переводить вообще (раздел «Трансформации. Пропуски»).
В конце будет раздел «Бонус» — использование theory в необычных контекстах.


Principle


В этой книге обсуждаются как теоретические, так и практические вопросы построения компьютерных сетей.
This book discusses both the principles and practice of computer networking.
Читать дальше →
Total votes 7: ↑7 and ↓0+7
Comments0

Про перевод «интереса» без interest

Reading time8 min
Views1.8K

То, что я вляпался в болото, стало понятно часа через 4 после начала раскопок этой пары терминов (и это я еще финансовый смысл не рыл — interest rate) — примеров получилось неожиданно больше, так что извините, будет «много букв».


На первый взгляд интерес = interest — полные эквиваленты, однако во фразе «интервьюеры обычно интересуются, сколько памяти занимает структура данных»interest лезет с большим скрипом (мне фантазии не хватило).


Или бывает автор, сам того не замечая, пишет несколько слов подряд с этим корнем — и как тогда это отрабатывать в переводе? А вот как! Смотрите примеры.

Читать дальше →
Total votes 8: ↑8 and ↓0+8
Comments3

Про перевод «практики»/«практичности» без practice/practical

Reading time5 min
Views1.6K

Безусловным лидером и локомотивным вариантом для перевода около-«практичных» фраз являются производные от фраз in practice/practical:


  • Если, например, Volvo начнет меньше акцентировать безопасность своих автомобилей и больше упирать на блестящий стиль, это может оттолкнуть от марки ее приверженцев с практическим складом ума.
  • If Volvo, for example, placed less emphasis on safety and more on slick styling, this could turn off practical -minded Volvo fans.

Несколько реже встречаются варианты с practicality:


  • Практичность: можете ли вы разработать разумный план тестирования?
  • Practicality: Can you actually create reasonable testing plans?



  • Эта книга проведет обширный экскурс в страну как теоретических принципов, так и практических аспектов информационных систем, а также возможностей их
    использования для создания высоконагруженных данными приложений.
  • This book is a journey through both the principles and the practicalities of data systems, and how you can use them to build data-intensive applications.



Но иногда эти фразы так набивают оскомину, что хочется что-то свеженького (причем, как я понял, не только мне — на идею этой публикации навели именно наши американские переводчики), а ничего кроме вышеупомянутых вариантов в голову не лезет.


Поэтому здесь я собрал, наверное, для многих из вас очевидные, но годные для освежения памяти вещи.

Читать дальше →
Total votes 6: ↑6 and ↓0+6
Comments3

Про перевод «сферы» без sphere

Reading time5 min
Views2.7K

Про «сферы»


Не знаю, как вас, а меня корёжит, когда «в сфере» переводят на английский in the sphere. В этой статье я как раз поговорю об этих всяких сферах и сразу дам спойлер — слова sphere вы нигде в примерах не увидите. Примерно в половине случаев эта фраза вообще не переводится. Как же тогда переводится? Смотрите сами (примеры взяты из англоязычных книг и их опубликованных русских переводов).

Читать дальше →
Total votes 9: ↑8 and ↓1+9
Comments10

SurfingAttack: компрометация смартфонов со звуковыми помощниками [+видео]

Reading time2 min
Views2.5K

[Дисклеймер: Я ИБ-переводчик, не ИБэшник, поэтому мог промахнуться. Но вроде бы про эту атаку на Хабре не писали, а мне понравилась — она красивая (+ моя XiaoMi-шка оказалась в списке уязвимых). Для тех, кто любит учить английский, я добавил в скобочках термины].


Новый тип атаки под названием “Surfing Attack” можно использовать против устройств с голосовым помощником.

Читать дальше →
Total votes 9: ↑9 and ↓0+9
Comments3

Как ИТ-компании мира защищаются от конкурентов в лице бывших сотрудников?

Reading time9 min
Views39K

В этой теме я сторонний наблюдатель — часто перевожу разные договоры и соглашения про эту боль для ИТ-компаний.


Однажды задался вопросом — а как в целом в разных странах, ну и в первую очередь в России, защищаются от этой беды?


Про неконкуренцию


Вообще, уход сотрудника — это 3 «полярные лисички», а не одна.



Ушедший сотрудник:


  1. создает свою компанию или устраивается к конкурентам (даже не знаю, что хуже);
  2. уносит с собой голову, в которой хранится куча конфиденциальной информации и наработок;
  3. уводит сотрудников, как правило, наиболее ценных, чем делает «лисичку» еще полнее.

Как бы ты хорошо ни относился к сотруднику, поневоле задумаешься о разных ограничительных соглашениях, обозначаемых за рубежом общим термином non-competes.


О них и поговорим.

Читать дальше →
Total votes 57: ↑50 and ↓7+43
Comments169

Как сделать презентацию продукта, которая будет вовлекать клиента?

Reading time4 min
Views14K

Сегодня делимся с вами рекомендациями Люка Геттинга (Luke Goetting) —
признанного эксперта по созданию бизнес-презентаций, директора агентства Puffingston Presentations.


Но начнем мы со слов Джил Конрат (Jill Konrath), эксперта по комплексным стратегиям продаж.


Она описывает масштаб катастрофы так:


«95% тех презентаций, что мне довелось увидеть (а может даже больше),
на самом деле СНИЖАЮТ шансы на успех. Они длинные и полностью посвящены компании-продавцу, ее продуктам, ее услугам. Бла-бла-бла».

Вы наверняка и сами не раз прочувствовали на себе всю боль работы с традиционными PowerPoint-слайдами:


линейная презентация — с заранее определенной последовательностью показа — просто не соответствует динамике живого общения с клиентами


В итоге, встает выбор: показывать все слайды, что есть, в том порядке, в котором есть, или же вовсе от них отказаться.


Читать дальше →
Total votes 12: ↑12 and ↓0+12
Comments0

Как зависит перевод термина trunk от вендора коммутаторов?

Reading time5 min
Views14K

На эту ошибку (или, если хотите, разночтение) я обратил внимание во время проверки перевода по коммутаторам NETGEAR. Дело в том, что при переводе термина “trunk” нужно обязательно учитывать, чьей трактовки придерживается вендор — Cisco или HP, ибо между ними очень разный технический смысл.


Давайте разбираться.




Рассмотрим проблему на следующих примерах:


1. Cisco



2. HP



Внимательный читатель обратит внимание, что “trunk” в этих примерах имеет разное значение.


Будем «копать».

Читать дальше →
Total votes 27: ↑24 and ↓3+21
Comments28

Как писать и продвигать White Paper?

Reading time16 min
Views43K

Мой клиент попросил меня написать White Paper к его продукту — а я раньше их никогда не писал (хотя копирайтингом занимаюсь давно). Поискал в рунете — статей много, но они SEO-шные, водянистые — хороший документ по таким не составишь.


Полез в англоязычный интернет — перебрал около 50 различных описаний, нашёл то, которое более или менее закрывало мои вопросы (хотя там тоже было прилично «воды» и рекламы — при переводе мы, как могли, это «высушили»).


Надеюсь, вы найдете наш адаптированный перевод для себя полезным.


Читать дальше →
Total votes 24: ↑19 and ↓5+14
Comments11
1

Information

Rating
Does not participate
Location
Томск, Томская обл., Россия
Date of birth
Registered
Activity