Как стать автором
Обновить
61
14
Evgeniy V. Bartov @bartov-e

Переводчик-редактор (ИТ, медицина)

Отправить сообщение

Сортировка книг по тематикам скриптами Python

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров6.5K

На момент написания этой заметки около половины из 16 тысяч книг в моей библиотеке — ИТшные, другая половина — медицинские. Две трети этих книг на английском, одна треть — на русском.

Примерно раз в месяц я с телеграм-каналов докачиваю еще 1–2 тысячи книг, из которых реально новых — не более 100–200, остальное у меня уже есть. Кроме того, попадаются сканированные книги с околонулевой пользой, если их не распознавать.

Всё это добро мне нужно регулярно дедуплицировать, раскладывать по тематическим папочкам, выкладывать в облако для коллег и при этом не тратить на это много времени. Готовых программ для таких задач я не нашел, поэтому, как мог, справлялся сам — писал скрипты на Python.

Читать далее

Краткий обзор методик обучения визуально-языковых (мультимодальных) моделей

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров3.7K

Продолжаю разбор материалов на тему NLP в контексте работы переводчиков, на этот раз мы с практикантами решили поразбираться в том, как работают мультимодальные модели, т. е. как машины учатся находить соответствие не только между словами из разных языков, но и между картинкой и словами. Представляем вашему вниманию перевод статьи на эту тему.
Материал местами несколько академичный, но надеюсь, будет интересен не только нам.

Читать далее

'Attention is all you need' простым языком

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров15K

Некоторое время назад я повесил здесь статью с кратким обзором техник векторизации, и мне показалось логичным продолжить эту тему попыткой разобраться с тем, в какую сторону NLP шагнула дальше, как научилась оцифровывать смысл: выбор пал на механизм attention. Мы с коллегой-переводчицей перевели и переработали Youtube-ролик 'Attention is all you need explained' в статью, которую и представляем вашему вниманию.

Заранее прошу прощения за светофор в картинках: по-другому черный фон из скриншотов убрать не получалось :).

В 2017 году, в статье Attention is all you need, исследователи из Google представили архитектуру Transformer. Новизна Transformer заключалась в использовании self-attention (досл. с англ. — самовнимание, внутреннее внимание) — механизма, благодаря которому модель может сосредоточиться не на всех сразу, а на наиболее важных элементах входной последовательности...

Читать продолжение

Краткий обзор техник векторизации в NLP

Уровень сложностиПростой
Время на прочтение21 мин
Количество просмотров22K

Как переводчик-редактор, я интересуюсь темой NLP и автоматизации рутины бюро переводов. Изучая вопрос того, как смысл слов превращается в векторы, наткнулся на эту обзорную статью. Статья мне показалась изложенной доступно, поэтому я перевел ее для удобства других коллег. Работоспособность большей части кода проверял, вроде работает (см. Jupiter Notebook). Надеюсь, будет полезно.

===

Технологии NLP — Natural Language Processing, обработки естественного языка — позволяют компьютерам обрабатывать человеческий язык, понимать его значение и контекст, а также связанные с ним эмоциональную окраску и намерения, и далее, использовать эти данные для создания чего-то нового.

Как сделать слова понятными для компьютеров? Используется векторизация. Рассмотрим несколько техник такой векторизации.

Читать далее

Сложности подготовки текста из видео

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров2.3K

Иногда нам поручают подготовить какой-нибудь текст из видеоматериала, и когда мы начинаем задавать клиентам уточняющие вопросы, некоторые искренне удивляются: «Хосподи, ну это же субтитры/текст/статья, что там сложного?».

Мы решили рассказать как про основной порядок действий, так и про сложности разных видов такой текстовой работы.

Читать далее

Как техпису изложить фактуру в техдоке?

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров3.7K

Ни в форумах, ни в блогах, ни в России, ни в англоязычных ресурсах я не смог найти информацию о том, как логично упаковать всю релевантную фактуру в приятный технический документ. В книге М. Ильяхова «Пиши, сокращай» есть отдельная глава про дидактику, но там очень мало, вскользь и не совсем о том.

Еще есть ГОСТы 34 и 19 — там уже написано, из каких разделов должен состоять стандартизованный документ, но ведь кроме стандартизованных есть и другие документы — во всяком случае заказы на таковые ко мне приходили, — и каждый раз приходилось ломать голову.

Читать далее

5 шагов для устранения «рунглиша» из ИТ-переводов

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров8K

К моим словам прошу относиться со здоровой долей скепсиса, ибо я не нейтив-спикер, а просто ИТшный переводчик-редактор (пусть даже и с 20-летним опытом).

В последние полгода англо-русские переводы по понятным причинам практически исчезли, и по работе на проверку приходят в основном русско-английские, зачастую на «рунглише». Отмечу, что «рунглишевые» ошибки в присылаемых материалах более или менее однотипные, поэтому я и предположил, что коллегам может быть полезно, если эти ошибки кто-то разложит по полкам.

Эту памятку или «дорожную карту» я опубликовал в своем телеграм-канале несколько месяцев назад, многократно её обкатал на проектах, и убедился в ее применимости — поэтому вешаю ниже.

Шагов в этой памятке 5:

Читать далее

Про перевод слов «выбор»/«выбирать» без choose/choice/select

Время на прочтение4 мин
Количество просмотров5.4K


Новая подборка по переводческим решениям для еще одного популярного слова в ИТ- и бизнес-литературе. Смотрите, пользуйтесь.


Синонимы


decide


Начнется все с самого простого, например с выбора фильма для просмотра.
It starts with simple things, like deciding which movie to watch.

Когда Великобритания оказалась перед выбором, выходить из ЕС или нет…
… when Britain needed to decide whether it should leave the EU…
Читать дальше →

Про перевод слов «полезно»/«пользоваться» без use/useful

Время на прочтение4 мин
Количество просмотров3K


В телеграм-комментариях нас попросили сделать подборку фраз по тому, как переводить слова на тему «пользы» без слова use. Нам показалась эта тема любопытной, и мы ее копнули.


Вариантов оказалось немыслимо много, поэтому мы выбрали только наиболее частотные, да и то просмотрели не все (там получилось свыше 500 страниц цитат, мы просмотрели около 200-300). Как обычно, разложили по полкам, смотрите.


Слова


Good, best


Я попытался собрать самые полезные из них в одном месте…
I have tried to gather together the best of these into one place…
Читать дальше →

Про перевод database: какие бывают, что с ними делают и с чем их едят

Время на прочтение10 мин
Количество просмотров9.5K

Казалось бы, база данных она и в Африке database, но читая аутентичную техническую литературу по СУБД (которую русские переводчики традиционно переводят как DBMS — database management system), я ни разу этот термин — DBMS — там не увидел (не исключаю, что плохо смотрел, но ей-богу не вру).


Получается, этот термин выдуман? И много ли такого самопала?


В этой публикации я собрал из разной ИТ-литературы англоязычных авторов так называемое «семантическое поле» вокруг термина databaseкакие базы данных бывают, что с ними делают и с чем их едят. Мне показалось, что это будет явно нагляднее и достовернее, чем обычные глоссарии. Решать, конечно же, вам.


Итак, поехали.



Какие бывают?


Объектные базы данных появились в конце 1980-х — начале 1990-х годов и снова вышли из моды.
Object databases came and went again in the late 1980s and early 1990s.

В начале 2000-х появились базы данных XML, но нашли только узкое применение.
XML databases appeared in the early 2000s, but have only seen niche adoption.
Читать дальше →

Как переводить «участие»/«участников» без part/participate

Время на прочтение8 мин
Количество просмотров1.7K


Есть еще один куст слов, по которому в голову большинства переводчиков (я в их числе) в голову лезет только один дежурный набор вариантов:
участник/участие > take part/participate/participant.


Как обычно, мы посмотрели несколько переведенных с английского книг по бизнесу и ИТ (список книг внизу), развернули направление перевода (стало русско-английским), вытащили около 300 вариантов перевода, отбросили те, которые с дежурным переводом, и разложили по полочкам наиболее интересные и применимые.


Поехали.



Трансформации. Пропуск


Здесь необходимо участие обеих сторон.
It takes two to tango.

Единство мнений других участников рынка отражает цена.
That’s because the consensus view is baked into the price.
Читать дальше →

Про перевод «начал» и «начинаний» без begin, start и first

Время на прочтение7 мин
Количество просмотров4K

Если в переводном тексте кто-то что-то где-то начинает — то у меня сразу всплывают три дежурных варианта: begin/beginning, start/starting, first/firstly.


Судя по тому, что я вижу в присылаемых мне на проверку переводах, эта бедность речи наблюдается не только у меня. Зато у наших американских переводчиков я такого не наблюдаю — тут тебе и синонимы красивые, или вообще без всяких begin/start дело обходится.


Я подумал, что пришло время устранить этот пробел в знаниях, делюсь наиболее интересными находками.


Самые экзотические варианты (напр. ignite) сюда впихивать не стал, вроде и без них есть из чего выбрать (но если в будущем экзотика тоже интересует, напишите в комментах).


Поехали.


image



Слова-синонимы


Через последовательность действий


Я принял все предложения без споров и оправданий и начал действовать.
I accepted their advice without arguing or defending and acted on it.
Читать дальше →

Про перевод «теории»/«теоретически» без theory/theoretical

Время на прочтение6 мин
Количество просмотров1.6K


Теория (+её производные) — ещё одно слово, на котором у меня включается творческий тупик: в голову ничего кроме theory/theoretical/theoretically не лезет. Поэтому его мы тоже с коллегами решили покрутить и так, и этак — посмотреть, как обыгрывают эту концепцию носители.
Среди примеров вы обязательно увидите мой любимый — не переводить вообще (раздел «Трансформации. Пропуски»).
В конце будет раздел «Бонус» — использование theory в необычных контекстах.


Principle


В этой книге обсуждаются как теоретические, так и практические вопросы построения компьютерных сетей.
This book discusses both the principles and practice of computer networking.
Читать дальше →

Про перевод «интереса» без interest

Время на прочтение8 мин
Количество просмотров1.8K

То, что я вляпался в болото, стало понятно часа через 4 после начала раскопок этой пары терминов (и это я еще финансовый смысл не рыл — interest rate) — примеров получилось неожиданно больше, так что извините, будет «много букв».


На первый взгляд интерес = interest — полные эквиваленты, однако во фразе «интервьюеры обычно интересуются, сколько памяти занимает структура данных»interest лезет с большим скрипом (мне фантазии не хватило).


Или бывает автор, сам того не замечая, пишет несколько слов подряд с этим корнем — и как тогда это отрабатывать в переводе? А вот как! Смотрите примеры.

Читать дальше →

Про перевод «практики»/«практичности» без practice/practical

Время на прочтение5 мин
Количество просмотров1.6K

Безусловным лидером и локомотивным вариантом для перевода около-«практичных» фраз являются производные от фраз in practice/practical:


  • Если, например, Volvo начнет меньше акцентировать безопасность своих автомобилей и больше упирать на блестящий стиль, это может оттолкнуть от марки ее приверженцев с практическим складом ума.
  • If Volvo, for example, placed less emphasis on safety and more on slick styling, this could turn off practical -minded Volvo fans.

Несколько реже встречаются варианты с practicality:


  • Практичность: можете ли вы разработать разумный план тестирования?
  • Practicality: Can you actually create reasonable testing plans?



  • Эта книга проведет обширный экскурс в страну как теоретических принципов, так и практических аспектов информационных систем, а также возможностей их
    использования для создания высоконагруженных данными приложений.
  • This book is a journey through both the principles and the practicalities of data systems, and how you can use them to build data-intensive applications.



Но иногда эти фразы так набивают оскомину, что хочется что-то свеженького (причем, как я понял, не только мне — на идею этой публикации навели именно наши американские переводчики), а ничего кроме вышеупомянутых вариантов в голову не лезет.


Поэтому здесь я собрал, наверное, для многих из вас очевидные, но годные для освежения памяти вещи.

Читать дальше →

Про перевод «сферы» без sphere

Время на прочтение5 мин
Количество просмотров2.7K

Про «сферы»


Не знаю, как вас, а меня корёжит, когда «в сфере» переводят на английский in the sphere. В этой статье я как раз поговорю об этих всяких сферах и сразу дам спойлер — слова sphere вы нигде в примерах не увидите. Примерно в половине случаев эта фраза вообще не переводится. Как же тогда переводится? Смотрите сами (примеры взяты из англоязычных книг и их опубликованных русских переводов).

Читать дальше →

SurfingAttack: компрометация смартфонов со звуковыми помощниками [+видео]

Время на прочтение2 мин
Количество просмотров2.5K

[Дисклеймер: Я ИБ-переводчик, не ИБэшник, поэтому мог промахнуться. Но вроде бы про эту атаку на Хабре не писали, а мне понравилась — она красивая (+ моя XiaoMi-шка оказалась в списке уязвимых). Для тех, кто любит учить английский, я добавил в скобочках термины].


Новый тип атаки под названием “Surfing Attack” можно использовать против устройств с голосовым помощником.

Читать дальше →

Как ИТ-компании мира защищаются от конкурентов в лице бывших сотрудников?

Время на прочтение9 мин
Количество просмотров39K

В этой теме я сторонний наблюдатель — часто перевожу разные договоры и соглашения про эту боль для ИТ-компаний.


Однажды задался вопросом — а как в целом в разных странах, ну и в первую очередь в России, защищаются от этой беды?


Про неконкуренцию


Вообще, уход сотрудника — это 3 «полярные лисички», а не одна.



Ушедший сотрудник:


  1. создает свою компанию или устраивается к конкурентам (даже не знаю, что хуже);
  2. уносит с собой голову, в которой хранится куча конфиденциальной информации и наработок;
  3. уводит сотрудников, как правило, наиболее ценных, чем делает «лисичку» еще полнее.

Как бы ты хорошо ни относился к сотруднику, поневоле задумаешься о разных ограничительных соглашениях, обозначаемых за рубежом общим термином non-competes.


О них и поговорим.

Читать дальше →

Как сделать презентацию продукта, которая будет вовлекать клиента?

Время на прочтение4 мин
Количество просмотров14K

Сегодня делимся с вами рекомендациями Люка Геттинга (Luke Goetting) —
признанного эксперта по созданию бизнес-презентаций, директора агентства Puffingston Presentations.


Но начнем мы со слов Джил Конрат (Jill Konrath), эксперта по комплексным стратегиям продаж.


Она описывает масштаб катастрофы так:


«95% тех презентаций, что мне довелось увидеть (а может даже больше),
на самом деле СНИЖАЮТ шансы на успех. Они длинные и полностью посвящены компании-продавцу, ее продуктам, ее услугам. Бла-бла-бла».

Вы наверняка и сами не раз прочувствовали на себе всю боль работы с традиционными PowerPoint-слайдами:


линейная презентация — с заранее определенной последовательностью показа — просто не соответствует динамике живого общения с клиентами


В итоге, встает выбор: показывать все слайды, что есть, в том порядке, в котором есть, или же вовсе от них отказаться.


Читать дальше →

Как зависит перевод термина trunk от вендора коммутаторов?

Время на прочтение5 мин
Количество просмотров14K

На эту ошибку (или, если хотите, разночтение) я обратил внимание во время проверки перевода по коммутаторам NETGEAR. Дело в том, что при переводе термина “trunk” нужно обязательно учитывать, чьей трактовки придерживается вендор — Cisco или HP, ибо между ними очень разный технический смысл.


Давайте разбираться.




Рассмотрим проблему на следующих примерах:


1. Cisco



2. HP



Внимательный читатель обратит внимание, что “trunk” в этих примерах имеет разное значение.


Будем «копать».

Читать дальше →
1

Информация

В рейтинге
472-й
Откуда
Томск, Томская обл., Россия
Дата рождения
Зарегистрирован
Активность