Pull to refresh

Comments 252

Ну разумеется, если каждый переводчик будет решать что и как переводить — никогда стандартов не появится...


Термин «machine learning»

Давно уже устоялся термин "машинное обучение". И нейросети в России не "тренируют", а именно что обучают.


Термин «thread»

Всегда был "потоком" (управления). Слово "нить" тоже допустимо использовать, но только если надо отличить thread от stream или flow.


Термин «lock»

Всегда переводился как "блокировка", которой он по смыслу и является.


Термин «service»

В контексте системного администрирования следует переводить, безусловно, как службу (хотя и "сервис" будет понятным), а вот такая вещь как "web service" может быть только "веб-сервисом".


Всевозможные FOOaS также должны переводиться как "FOO как сервис", а не как "FOO как служба", потому что в русском языке фирмы клиентам предоставляют именно сервис, а не службу. Разумеется, фирма может обслужить клиента, т.е. предоставить ему обслуживание, но "FOO как обслуживание" выглядит ещё более коряво.

>И нейросети в России не «тренируют», а именно что обучают.
Особенно если учесть, что сама она обучиться ничему не способна, и именно специалист ее обучает, тем или иным образом. Т.е. речь идет о процессе, активным действующим лицом которого является скорее человек, а не нейросеть, которая чего-то там сама «усваивает».
нейросеть тренируют, она усваивает неуловимые человеком закономерности aka регулярности.
Да-да. Есть такой метод наименьших квадратов, ему сто лет в обед. Он умеет вписывать кривую в известный набор точек. Сказать, что он может что-то там усвоить — это нонсенс. Машинное обучение конечно далеко ушло от метода наименьших квадратов, но интеллекта в нем ровно столько же — и это интеллект разработчика.
Вы не внимательно читали пост. Отцы-основатели МУ исходили из иерархии:
«усвоение знаний» -> «теории усвоения знаний» -> [«усвоение знаний животным» (animal learning), «усвоение знаний человеком» (human learning) и «усвоение знаний машиной» (machine learning)].

"Усвоение знаний", по сути, и есть "обучение". Просто "усвоение" — более широкое понятие. Например, усвоение питательных веществ организмом в процессе переваривания. Поэтому когда Вы пишете "машинное усвоение", вы подразумеваете "машинное усвоение знаний". Это длинно, проще написать "машинное обучение".

Обучение несет в себе двусмысленность: передавать знания и получать знания. Поэтому learning в психологии, например, переводится как усвоение знаний. Уже упоминал ниже дважды про последствия такого недопонимания: перевод термина representation learning. Тело определения говорит, что «это методика, которая позволяет системе автоматически обнаруживать представления, необходимые для выявления признаков или классифицирования из сырых данных». НО определяемое не имеет никакого отношения к телу определения. Термин правильно звучит так "(автоматическое) усвоение представлений данных", тогда как в вики «обучение признакам». И только один случай. А еще есть пустая сущность «учитель», которой нет за рубежом от слова совсем.И далее по списку.

В процессе обучения (усвоения знаний) наличие учителя не обязательно. Иногда достаточно хорошей [переводной] книги — источника знаний. ;)
P.S. Статью плюсанул, за поднятие интересной темы.

После нескольких повторов, сознание привыкает к «машинному усвоению»))
По поводу каждого переводчика. Повторяю в сотый раз. Я исхожу из железобетонного принципа здравого смысла «если все глобальное программистское сообщество мыслит в терминах «нитей» и «замков», то и я буду тоже», и принципа бритвы Оккама и пытаюсь донести до вас смысл в том виде, в котором он передается там, откуда к нам поступает вся информация, убрав искажающий фильтр. Поток-то однонаправленный оттуда сюда. Вы же пытаетесь отстоять местечковое (неправильное) понимание.
все глобальное программистское сообщество мыслит в терминах «нитей»

У французов tâche «задача», у поляков wątek «кладка», у турков parçacık «частица»…
Каждый (...) как он хочет.
При этом следует все-таки учитывать лидерство английского языка. И кому же нигде из упомянутых языков нет наложения как у нас с потоками) 1:0 в мою пользу.

Ну, раз так, то пусть будут «тред» и «лок». Зачем усложнять?

lock. С блокировкой 2 проблемы: это отглагольное существительное, и этот перевод вступает в коллизию со словом block, т.е. тем самым действием, которое нить выполняет, когда совместный ресурс закрыт на замок. К тому же процессор не управляет, а исполняет команды.
train. Модель МУ тренируют, какой бы она ни была, в том числе нейросеть.
service. В научно-технической литературе нет такого явления, как «здесь хочу это, а там хочу то». Это называется принципом единообразия.
thread. Интересно, как вы будете обходиться, когда речь идет об обработке streams с использованием threads? ))
machine learning. Ничего не вечно под луной. Точка
lock. С блокировкой 2 проблемы: это отглагольное существительное, и этот перевод вступает в коллизию со словом block, т.е. тем самым действием, которое нить выполняет, когда совместный ресурс закрыт на замок. К тому же процессор не управляет, а исполняет команды.

Блокировка потому и называется блокировкой, что она блокирует выполнение нити. Это не коллизия, а этимология. Это во-первых.


А во-вторых, устоявшийся русский термин называется "блокировка" независимо от ваших аргументов. Если вы желаете, чтобы ваши переводы были технической литературой, а не макулатурой — надо использовать именно "блокировку" и точка.


service. В научно-технической литературе нет такого явления, как «здесь хочу это, а там хочу то». Это называется принципом единообразия.

Вот только принцип единообразия относится к терминам, а не к словам. И такие вещи, как "windows service", "web service" и "foo as service" — это разные термины, и принцип единообразия не требует переводить их одинаково.


И если вы как переводчик не понимаете, что в зависимости от контекста одно и то же слово может переводиться по-разному и требуете какого-то там "единообразия" — вон из профессии!

А в чём проблема для stream использовать стрим? Скоро будет такое же обычное слово, как арбуз или штаны.
Коммент из разряда «все-равно все умрем»)) Я вам про Фому (про правильное понимание), вы мне про Ерему (статус-кво есть, и пусть оно остается, даже если неправильное).
UFO just landed and posted this here
Сторонитесь чела, который начинает свои мудрствования со слова бред.

Отзывов к книгам подобно хабровским тоже немало:


Книга хорошая. Перевод очень плохой. Перевод сделан формально. Переводчик не до конца разобрался в теме. Например, flatten matrix он переводит как "сглаженная матрица" — ясно, что 1) сам он руками flatten никогда не делал 2) смысл он не понимает.
Второй огромный недостаток — переведены абсолютно все термины, это лишает вас возможности связать ваши английские и русские знания. Никто никогда не называет "Model cross validation" словами "Перекрестная проверка моделеЙ", все русские говорят "кроссвалидация".
Подробнее: https://www.labirint.ru/books/709200/



Перевод местами кривой, в целом сумбурное изложение
Подробнее: https://www.labirint.ru/reviews/goods/590293/



Огромная ложка дегтя в этой, в общем-то, неплохой книге — это очень посредственное качество перевода на русский, что в последнее время стало, к сожалению, нормой. Иногда доходит до грубых переводческих ошибок и искажения смысла — в основном это касается математической части. Например, начало главы про "наивный байес" переводчик, видимо, просто не понял и понаписал чепухи, что в подобной литературе совершенно недопустимо. Замечены также опечатки в формулах, и это уже за гранью.
Подробнее: https://www.labirint.ru/reviews/goods/590293/

Был выхвачен всего 1 нужный комментарий из 7, среди которых 5 были позитивными и 1 нейтральным. Вот пример позитивного:


Хорошее введение в основы Data Science. Коротко, ясно и по делу. Пожалуйста, не воспринимайте эту книгу, как всеобъемлющее руководство. Перевод отличный + ценные комментарии от переводчика. Качество печати и иллюстраций вполне приемлемое, лучшего и не надо. За лучшее всегда приходится платить больше, а это не тот случай.


По второй книге имелось всего 2 текстовых отзыва, один из которых негативный.


В моей практике комменты к любому переводу бывали с плюсом и с минусом — сколько читателей, столько и мнений. Если хочешь давать весомую оценку, то потрудись предложить факты, а не чьи-то субъективные оценки.

Любой знает, что терминология не устоялась, и нет стандартов. Но и мои переводы с годами эволюционировали. По началу я использовал ГОСТы по сертификации, где в качестве валидационной проверки встречал контрольную проверку. Помимо кроссвалидации, чаще используется более понятная «перекрестная валидация». Сейчас я придерживаюсь этого варианта. Были бы стандарты, этой дискуссии не было бы. Что касается flatten, то это слово тоже переводится по-разному — уплощение, сжатие, сглаживание, вертикальное разворачивание и пр. Выбрано сглаживание, т.к. в англ. iron (утюг) flattens the sheets, и приведено английское слово, чтобы дать читателю понять, о чем идет речь. В подобных случаях всегда привожу английский термин.
Улыбнуло. Вы только что бредом обозвали принятую во всем мире парадигму!!!
Поразительно! Как переводчику мне точно известно, что в научно-техническом переводе синонимия вредна, и термин характеризуется тем, что имеет уникальное имя. Термин не должен называться по-разному в разных контекстах. Иначе может произойти подмена терминов, а сам тест станет логически несвязным спагетти.
Следите за пальцами. В многозадачных ОС сперва некоторые задачи были выделены в службы. Потом некоторые службы были перенесены на сервер локальной сети. Потом с развитием интернета некоторые были вынесены вовне на машины за пределами локальной сети. И потом уже некоторые службы стали распределенными и облачными. Показан весь процесс развития служб. Скажите на каком этапе рубильник включается в положение «сервис»?)))))))))))))))

Не думаю, что веб-сервисы появились в результате переноса служб на сервер локальной сети.


И уж точно IaaS никогда не имела в предках ни одного веб-сервиса.

А ничего, что Google, Microsoft, IBM и даже HP (у моей дочки один из последних ноутбуков HP, и на нем фирменное приложение с облачными СЛУЖБАМИ наподобие службы печати и службы конфигурирования и пр., и все на русском) в документации везде используют службы, включая TensorFlow?

Вы, выходит, тоже конформист, раз ссылаетесь на документацию? :)

Я ссылаюсь на факты. Они состоят в том, что поток данных по информатике и поток изобретений в области ИИ/ML идет оттуда сюда, а не наоборот. А значит и вся терминология. И если под конформизмом вы это понимаете, то да, конформист. Но я это называю практичностью. А вот отстаивать не вами придуманные ошибки, считаю, неразумно.
По ходу двухдневной дискуссии начинаю понимать, насколько все запущено тут.

У меня такая же мысль.

Обратите внимание, я отстаиваемую позицию, которая укладывается в общепризнанную и обыденно понимаемую во всем мире парадигму, именуемую как усвоение знаний машиной, или машинное усвоение знаний, где под знанием подразумевается линия поведения, а также закономерности, регулярности и шаблоны, неуловимые для человека...)
Исхожу из железобетонного принципа здравого смысла «если все глобальное программистское сообщество мыслит в терминах «нитей» и «замков», то и я буду тоже» и принципа бритвы Оккама «не порождай пустых сущностей», термины thread и lock должны переводиться без искажений, что и было сделано.
Не Вы первый и не Вы последний. Помнится во времена, когда текстовые редакторы только начали массово входить в обиход русскоязычных пользователей и стала появляться первая русскоязычная литература по ним, автор одной из книг по multiedit (ни фамилии автора, ни названия книги уже не вспомню) объявил крестовый поход против одинакового перевода «string» и «line» как «строка». Помнится, что для «line» он придумал перевод «полоска». Книга в общем-то вышла вполне полезная, ибо «на безрыбье и рак рыба», но дальше конкретной книги вновь изобретенная терминология не пошла, хотя и была логически обоснованной, чему автор даже посвятил отдельный раздел во введении.
Если терминология уже устоялась, то, даже если она не очень удачная, борьба с ней превращается в донкиходство.
Кстати да — если текстильная тематика так берёт вас за душу, то перевод string как «строка» вас ведь тоже не устроит? Будут у нас «шнурковые переменные»?
Крайности. Но проблема есть. В особенности, когда в одном предложении встречается string, row и line. Тогда для первого будет переменная типа String, для второго — строка таблицы/файла и третьего — строка кода. В остальных случаях строковая переменная/значение. Надо признать, что в литературе в 80х годов прошлого века использовалась цепочка символов. Сегодня нередко можно встретить и последовательность символов.
Скажу больше — назрела необходимость русифицировать прилагательное default-ный. Например в Java, C++ и Rust есть проблема с переводом термина default implementation. По идее тут должно переводиться как дефолтная имплементация (программисты будут только за, т.к. нет искажений), поскольку «по умолчанию» делает перевод громоздким и малопонятным.
Термины lock и block нередко оба переводятся расплывчато как «блокировка», под которой может пониматься и объект, и процесс. Эти слова встречаются в текстах очень часто, и поэтому, если переводить их одинаково, то получится мешанина, которую будет невозможно понять. В английском языке для процесса блокирования как приостановки продвижения есть свой термин blocking, а под термином lock имеется в виду «замок», «замковый защитный механизм», locking будет соответственно установкой замка, замыканием.
Не надо трогать замыкание. Это уже устоявшийся термин, соответствующий английскому «closure». Никакого отношения к блокировке («lock») он не имеет.
устоявшийся термин
в этой дискуссии — бесполезно
Вы серьезно считаете, что, скажем, американцы, говоря services в контексте Windows имеют в виду одно, а в контексте Интернет — другое? Если да, то я — в экстазе. Учитывая, что американцы неизменно твердят одно слово «services» в рамках ОС и в рамках Веб, у меня такое ощущение, что кто-то из двух не догоняет: либо американцы (твердя одно и то же), либо местные «спецы», которые на пустом месте изобретают сущности.
А в чём драма-то? Всё так и есть же, говорят про REST service — имеют в виду одно, говорят про Windows/systemd service — имеют в виду другое.
Драма в создании препятствий на пустом месте. Вы хорошо подметили, что в обоих случая в оригинале стоит одинаковый термин в разных контекстах. У нас же под разный контекст изобретается новый термин. И теряется терминологическое единообразие и преемственность.

Именно поэтому все лучше читать в оригинале

Это идеальный случай. Но мир на счастье переводчиков не таков))
Странно, я постоянно называл thread потоком, и меня все понимали.
Близоруко… А как быть с этим? «threads allow multiple streams of program control flow to coexist within a process»

"потоки управления сосуществуют внутри одного процесса"

Не вижу связи с отмороженными ушами.


Если в русском языке некоторый термин понятнее чем в английском — глупо этим не воспользоваться при переводе.

не, не, мы же знаем, что в английском ВСЕ термины, априори, понятнее, точнее и правильнее, чем в русском.
Ведь же неверно переводите, но все-равно используете неправильный вариант термина

Напротив, именно правильный вариант термина я и использую.

Ну, а смысл куда девался? Мне кажется вы его потеряли, но зато «правильный» термин))
Как указано в первом комментарии, есть устоявшиеся переводы терминов. То, что переводчику кажется, что этот перевод некорректен, в первую очередь проблема переводчика. И использовать ему надо устоявшиеся, понятные варианты, а не изобретать свои.
На моем счету более 50 переводов книг по ИТ и более 30 лет опыта в этой области. Уж поверьте моей статистике, что только на Русской равнине machine learning имеет неправильное название. Помимо переводов я занимаюсь финансами. Вот мой аккаунт на TradingView. Пробую имлементировать МУ в торговле на финрынках — www.tradingview.com/u/capissimo/#published-scripts

Тут возникает вопрос. Что вы вкладываете в слова "неправильное название"? По каким критериям оно неправильное? В русском языке, например, вполне понятно, что если человек (или машина) чему-то обучились, то они это усвоили, то есть наблюдается синонимичность обучения и усвоения. Хотя она и не отражена в словарях синонимов, (более того, можно обучать так, что человек ничего не усвоит), тем не менее де-факто она есть. Человек чему-то обучен тогда, когда он это усвоил.


С другой стороны, машинное усвоение, учитывая опять же некоторую специфику русского языка и культуры, несколько перекликается с пищеварением (я об усвоении пищи), что, согласитесь, путает и вводит в некоторое замешательство (и даже смешит), а слова должны быть чёткими, а терминология не должна вносить вот это ощущение комедии, иначе под вопросом доверие к переводу. Не говоря уже о том, что машинное усвоение просто не звучит.


То есть да, с точки зрения формально правильного технического перевода с переносом всего и вся в текст вы правы. Но есть другая сторона. Мы же не переводим предложение I am a translator как "Я являюсь неким переводчиком", а опираемся на нормы и благозвучие прежде всего русского языка.


Как выйти из положения? Возможно, стоит делать сноску с формально точным переводом. Тогда не потеряется точно ничего.

Слово «обучение» — двусмысленно. Речь о направленности действия. Если оно направлено на себя, то усвоение (learn). Если от себя, то обучение (teach). Но это в английском все просто. В русском же «обучение», как уже сказал, понимается двояко. А двусмысленности в научно-техническом тексте просто не должно быть, потому что оно порождает пустые сущности, как в случае пресловутым учителем.
Что касается пищеварения, то это на первый взгляд так. Каждая подобласть науки — это своего рода замкнутый мир, в котором каждый термин имеет свое место и не занимает место другого (однозначность). Этот мир встраивается в родительски узел графа знаний, которым в случае МУ является УСВОЕНИЕ ЗНАНИЙ или теории усвоения знания (их всего 4, кстати). В педагогике, психологии и пр. соцнауках данный термин общепринят. Пардон за сумбур, но вы поняли. Переводчик же не должен вмешиваться в перевод, что я и делаю, передавая смысл как есть.

Двусмысленность здесь разрешается самой природой сочетания, то есть тем, что это сочетание — термин. Единожды прочитав определение на русском языке, я уже не буду думать о том, на себя машинное обучение или от себя, да и безо всяких определений понятно: сочетание, как минимум, о процессах, направленных на обучение машины чему-либо. Даже если я ничего не знаю о термине, направление всегда будет понятно из контекста (исключение составляют только случаи, когда контекста нет).


К обратному процессу, то есть к двусмысленности, о которой вы говорите, когда машина учит чему-то (machine teaching), сочетание "машинное обучение" просто не клеится. Machine teaching логично переводить как "Машинное преподавание". Тут вы можете сказать "Это преподавание машиной или машине?", но в этом случае уже не клеится "преподавание машине".


То есть двусмысленность разрешается на уровне языковой интуиции.


Иными словами, резкой двусмысленностью направления обладает только глагол учить/научить (себя или кого-то?), с обучением всё намного яснее. Мы не говорим "Я обучил себя". Я даже проверил лишний раз: в ответ на запрос точного совпадения со строкой "Я обучил себя" Google выдал:


Показаны результаты по запросу "Я научил себя"
Не найдено результатов по запросу "Я обучил себя".


И это при том, что индексируются все тексты: и правильно написанные, и написанные с ошибками.


То есть изначально обучение направлено вовне, в случае машинного обучения — на машину. Тогда как машинное усвоение вообще не включает никакую языковую интуицию, оставляя читателя теряться в догадках, что это за усвоение и как машина усваивает.

Все ваше рассуждение разбивается о название «Теория усвоения знаний» aka learning theory. Как тут ни крути, но придется согласиться с иерархией learning -> learning theory -> (animal learning, human learning, machine learning)

Нет, не разбивается. Я не оспариваю перевод понятия "Теория усвоения знаний". Перевод — это ведь не только о том, чтобы передать нечто слово в слово, но и о том, чтобы соотнести понятия, а также правильно подобрать слова для целевой аудитории.


Поэтому перевод "Теория усвоения знаний" прекрасен: он соответствует контексту, передаёт суть и научный язык — для целевой аудитории, а также, наконец, правильно сопоставляет понятийные аппараты.


Но это вовсе не означает, что именно его нужно переносить во все остальные технические и научные тексты. Более того, следуя вашей же логике выше (каждая научная область — отдельный мир) как раз логично разграничить термины разными переводами, потому что теория усвоения знаний — это педагогика, а машинное обучение — совсем нет.

Не только педагогика, но и психология, когнитивистика и пр. Не суть. В замкнутом терминологическом мире (closed world) термины переплетены, но каждый однозначно определяет некое понятие/явление в нем. Как совокупность они определяются на более высоком уровне. Поэтому теория усвоения знаний определяет то, что находится ниже в иерархии.

То есть, опираясь на существующие хорошие переводы, вы хотите сказать, что машинное обучение — в контексте этих существующих терминов и его смысла — кривой перевод?


Но у вопроса есть другая сторона: язык — средство коммуникации для людей, а не против них. И, когда некий абстрактный читатель слышит "машинное усвоение", как я уже говорил, он ничего не понимает, в отличие от ситуации с "машинным обучением".


Учитывая широчайший охват термина (он вышел за пределы только аудитории науки и уже давно), перевод "машинное обучение" представляется меньшим злом, иными словами язык просто "нагружает" слово обучение смыслом слова усвоение (как уже говорил выше), для упрощения коммуникации, вместо того, чтобы заставлять читателя копать в педагогику и прочие науки.


Говоря коротко, на разных уровнях правы обе стороны.

Поздравляю! Вы — первый, кто принял мудрую позицию по данной теме))) Тут собрались в основном одни конформисты: пуст будет статус-кво, даже если он ложен.
Усвоение знаний у животных объясняет павловская теория условных-безусловных рефлексов. Сюда еще в последнее время добавился надиндивидуальный уровень — усвоение знаний на уровне роя. Усвоение знаний у людей объясняется бихейвиористской теорией, теорией Б.Блума и пр. Усвоение знаний у машин… и тут вы в чем-то правы… объясняется всеми предыдущими, но здесь оно происходит как моделирование процессов, протекающих у людей. Однако предмет один и тот же — усвоение знаний.
Ну давайте тогда переводить «I'm learning English» как «Я усваиваю английский». Оно же на себя направлено.
все правильно, только вот процесс приобретения знаний в зависимости от контекста может выражаться на русском по-разному: знания усваивают, язык учат
А можно примеры переведенных вами книг? Потому что после этих слов про 50 книг почему-то вспомнились многочисленные нелестные отзывы об отечественных переводах книг об ИТ. Хотелось бы взглянуть на примеры того, как надо переводить.
Не вижу необходимости. Но немалое число из них было у нас бестселлерами. Говорю без ложной скромности, так как сами книги были бестселлерами на английском. Но в этом была и моя заслуга, так как удалось передать содержание неискаженным.

Погодите, правильное название — это то, которое используется профильными специалистами в области. Остальные будут неправильными, пусть даже они со всех лингвистических позиций лучше.

Я отталкиваюсь от того, как это воспринимается за рубежом, и поскольку вся информатика идет оттуда, то профильные тут ни при чем.

Но за рубежом ведь не русские термины

И что из этого? Кроме терминов есть еще их определения. Если термин не понятен, я смотрю его определение. В некоторых случаях я сверяюсь с другими языками (выполняя перекрестную проверку).
Мне кажется, мы друг друга не поняли. Схема, как правило, такая:
  • в англоязычном источнике появляется новый термин
  • русскоязычные специалисты начинают использовать этот термин, выступают с ним на конференциях, пишут статьи, делают доклады на внутрикорпоративных мероприятиях. На русском. Там они используют какой-нибудь перевод термина.
  • через полгода появляется книжка на английском с употреблением термина
  • она получает популярность и кто-то принимает решение перевести ее на русский, зовет переводчика
  • в этот момент если переводчик умный и хороший — он смотрит, а как русскоязычное сообщество переводит этот термин, есть ли сложившаяся практика. Плохой же переводчик делает вид, что русскоязычного сообщества нет и переводит термин как бог на душу положит. И вот у нас есть еще одна книжка с фиговым переводом. Особенно плохо, если переводчик или редакция не пишут английские термины в скобочках после русских.
Информатика кишит примерами «правильных» переводов, сделанных специалистами.

Об этом вся статья. Она написана, чтобы привлечь внимание на несоответствия тому, как это понимается за рубежом.

unit testing, data mining, representation learning…
Unit в данном контексте означает единицу кода, а единицей может быть выражение, строка, блок, функция, класс и только потом модуль! Русский перевод искажает смысл англоязычного термина. Правильнее было бы что-то вроде «посегментного тестирования»

Информатика полна метафор, и data science — еще один такой пример. В основе термина лежит горнодобывающая метафора. Он должен переводится, как добыча полезных ископаемых из данных либо добыча полезных сведений из данных либо добыча закономерностей, как-то так. Но вовсе не как «интеллектуальная обработка данных». А что любая другая обработка разве «НЕинтеллектуальная»)))

Representation learning — ярчайший пример тех дебрей, в которые завело ваше «обучение». На сегодняшний день данный термин на Вики переводится, как «обучения представлениям», тогда как под ним понимается (автоматическое) усвоение представлений данных.

Вопрос, когда смешить мир прекратим? Или прекратим ли вообще?
Пардон, очепятка вышла…
Сей пассаж «Информатика полна метафор, и data science...»
должен быть заменен на «Информатика полна метафор, и data mining...»
На моем счету более 50 переводов книг по ИТ

Ну что же, это всего лишь означает, что пятьюдесятью корявыми переводами, от которых специалисты плюются, больше.

Да-да. Когда-то давно такой же как вы рассказывал мне, что не надо баскетбольный термин pivot переводить как «пивот». Однако же баскетболисты и тренеры только так и говорят. И на переводчиков им плевать.
Кстати, а как надо переводить по вашему?
Переводить pivot надо как «пивот», потому что самое важное при переводе термина — это сложившаяся в профессиональном сообществе практика его перевода. Слушаешь русскоязычных профильных спецов — повторяешь за ними — пользуешься славой отличного переводчика! Игнорируешь русскоязычных специалистов и пишешь отсебятину — становишься частью легиона Надмозгов.
стержень; точка вращения; штифт; ось; короткая ось; основной пункт; опорный пункт; опорная точка; шкворень; смысловой центр чего-л.; резкая смена стратегии; точка разворота; ось; центр вращения; шарнир; керн; шпиндель, шарнир, осевой стержень,… ))

А по сути изложения будут возражения?
Прежде чем переводить текст на незнакомую тему, переводчику следует хотя бы погуглить самому, и понять, что pivot в английском это движение, его делают, выполняют, совершают и т.п. Нельзя выполнить стержень, совершить ось, сделать шарнир.

>А по сути изложения будут возражения?
Какие тут еще нужны возражения, если все предложенные варианты — откровенная чушь? Это я вам как переводчик, игрок и тренер со стажем.
делать поворот; вращать штырь; поворачиваться; качаться относительно оси; качаться относительно ее; надевать на стержень; опирать поворотно;…
)))

Эта статья в очередной раз показывает, что невозможен адекватный перевод с одного языка на другой без отсебятины или изменения смысла. Естественно, никто не может овладеть всеми языками мира и читать все в оригинале, поэтому приходится так или иначе работать с переводами.


Я считаю, что использование литературно-точных терминов вместо простых и общепринятых только ухудшает ситуацию. Абсолютно всем понятно, что такое "машинное обучение" (на мой взгляд, точнее будет "самообучение"), и что такое machine learning, потому что термины устоялись. Кто там что "усваивает" еще нужно догадаться. С потоком та же проблема. Да, stream, flow, thread у нас назваются потоками, но все понимают разницу между stream и thread, поэтому всегда легко понять, какой из "потоков" имеется ввиду. Если нет — добавьте "поток данных", например — обычно в каждой области есть свои общепринятые термины.


Я прекрасно понимаю, что речь идет об официальных перводах в солидных книжках, но если бы я вдруг купил бы книгу на русском и обнаружил бы фразу типа "чтобы выполнить операцию спасения файла, мы порождаем новую нить и используем замковый механизм для преодоления ограничений конкурентности", я бы больше никогда не покупал книги этого издательства/переводчика, и пошел бы читать "to execute the Save File operation, we spawn a new thread and use the lock mechanism to bypass the limitations of the concurrency model".


Хуже всего, если начинающий разработчик начинается таких ультралокализованных и лингвистически-корректных переводов, а потом придет на работу или конференцию и внезапно откроет для себя дивный новый мир заимствований и слэнга.

«В целях исполнения операции „Сохранить файл“ мы порождаем новую нить и используем замковый механизм, чтобы обойти пределы модели конкурентности».
Добро пожаловать в язык информатики, такой каков он есть на самом деле!

А потом выкидываешь такую книжку, потому что уж проще тогда в оригинале с грубым английским, а не вникать в красивый витиеватый слог ;)

)) Но все же считаю, что вся беда из-за отсутствия стандартов н-т терминологии в этой сфере. Читая их статьи и литру натурально завидую, что эта работа у них поставлена на высшем уровне. У нас же — кто в лес, кто по дрова.)
А вы больше финансами занимаетесь или информатикой? На каком основании вы считаете, что предлагаемая вами терминология лучше, чем устоявшаяся?

Изобретатели понятий «thread» и «lock», возможно, тоже шли на какие-то компромиссы, пытаясь выразить новую сущность каким-то известным словом. Они взяли эти слова, но был ли их выбор идеальным? Вероятно, нет, так как эти слова ранее обозначали принципиально другие сущности. Висячий замок на двери мало похож на lock в информатике; а хлопчатобумажная нить — на thread оттуда же.

В таком случае русский перевод и не обязан в точности соответствовать оригинальным словам, особенно, если в русском языке значения слов «нить» и «замок» ещё дальше отстоят от thread и lock в информатике. Или если в русском языке найдутся более удачно подобранные слова.

Термин «thread» появился в английском языке не сразу. До него для обозначения того же самого использовались термины «process» и «task». Некоторое время использовался термин «lightweight process». И только, по-моему, в Windows NT впервые появился термин «thread», который и был потом перенят другими операционными системами и стал в конце концов общепринятым.

В русском языке тоже были колебания насчёт перевода. Разные люди предлагали разное. Были дискуссии среди программистов, были статьи, были обсуждения. В конце концов один вариант стал общеупотребительным. Это «поток» для thread, и «блокировка» — для lock. Может, это где-то неидеально, но, по крайней мере: 1) слова русские; 2) хоть чуть-чуть понятны человеку, который слышит их впервые.

В предметной области ведь не только на правила перевода надо ориентироваться, а ещё и на понятность и доступность терминологии для специалистов и обучающихся. А устоявшиеся русские термины прошли отбор и проверку временем.
На сколько мне известно на этом же сайте можно найти статью про нити. Статья за 2009 год, кажется. Так что про историю вопросы вы немного ошибаетесь. Термины lock и thread означают то, что они означают — именное существительно замок и такое же существительное нить Точка. Нормальный переводчик никогда не вмешивается в авторскую письменную речь. А если у него такой позыв возникает, то ему следует написать свою книгу.
Понятность и доступность обеспечивается соотнесением 1:1, отсутствие отглагольных существительных, когда требуется именное, единообразием терминологии и Бритвой Оккама (не порождай пустых сущностей)

Нет, я не спорю, пусть таковым будет, но я, читая такое, сразу представляю себе книжку 50-летней давности, что-нибудь в духе "Основы написания инструкций для ЭВМ", либо же продукт современного канцелярита, "загруженный из информационно-коммуникацонной сети Интернет". Ни то, ни другое читать невозможно.


UPD: Я не пытаюсь как-то уязвить вас (или сообщество переводчиков), просто теоретически верное решение на практике может оказаться просто неприменимым.

ну, это крайности. С одной стороны, «информационно-коммуникацонная сеть», с другой — «нетворк». Я против последнего.

Вот из-за таких вот "переводов" читать предпочитаю в оригинале, все последние попытки прочитать книгу в русском переводе спотыкались о "замковый механизм, чтобы обойти пределы модели конкурентности" и другие дивные термины и выражения, существующие только в голове "переводчика" :)


Причем хочу заметить, что старые переводы, когда над ними работали профессионалы в IT, а не "эксперты в лингвистике", по моему ощущению были гораздо адекватнее.

Над старыми (доперестроечными) переводами работали технические специалисты вместе с языковыми редакторами. Когда текст пишут профессионалы в IT без присмотра экспертов в лингвистике, возникает противоположная проблема — все термины на месте, но смысл повествования непроницаем сквозь косноязычие.

Настоящие лингвисты аккуратно относятся к заимствованным словам и адекватно относятся к языковой гибкости.

В основном, когда это возможно, русские названия стараются выбирать созвучными оригинальным (например, профиль для profile и домен для domain), даже когда это созвучное слово кажется бессмысленным в новом контексте. Довольно редко выбирается небуквальный перевод, выражающий общий смысл, как ярлык для shortcut. Зачастую такой перевод оказывается слишком неуклюжим, чтобы закрепиться в живой речи: вспомним обозреватель вместо browser, учётную запись вместо account, или обнаружен узел web вместо website found.
Приложеньице было, безусловно, исключением — не калькой и не канцеляризмом, а живым новым словом; поэтому в «языковую политику» Microsoft оно явно не вписывалось.
(отсюда)
И это мы ещё не обсуждали такие живые русские термины, как «дрова», «мозги»; и единицы измерения «килограммы», «метры» и «гектары»!
Это «не на самом деле», это вы начали создавать параллельную вселенную. Ваша ценность как переводчика состоит не в создании альтернативных русскоязычных терминов, а в том, чтобы ловко переводить словесные обороты, понимать устойчивые выражения, адаптировать шутки, метафоры и аллюзии.
По мне, так благодаря накопленным ошибкам прошлых лет параллельная вселенная выстроена в РФ, в результате чего теперь тут машины «обучают» (teach), тогда как во всем остальном мире машины учатся сами (усваивают от learn). Читайте внимательнее.

Для хорошей эволюции нужно хорошее потрясение.
фразу типа "чтобы выполнить операцию спасения файла, мы порождаем новую нить и используем замковый механизм для преодоления ограничений конкурентности

Я, пока не прочитал эту фразу на английском, вообще смысла о чем речь не понял

UFO just landed and posted this here
Кто-то неплохо сказал, что для хорошей эволюции требуется хорошее потрясение)
русский язык уже не является языком науки и инженерии, а является просто языком для местного общения на личные темы

Разве когда-то им был?
До английского языком науки и инженерии был немецкий, ещё раньше — латынь.
При чтении статьи испытал знакомый толчок: сколько переводчиков, столько и правильных названий.
В предпоследнем абзаце есть конкретное предложение. Стандартизация.
Стандартизация

Вы прескриптивист?

Ни в коем случае. Но нужен авторитетный источник информации наподобие энциклопедии, как это делается за рубежом. Википедия не в счет

Например, в Большой российской энциклопедии используется машинное обучение, хоть и отдельной статьи, похоже, нет.

По-видимому, тут надо, чтобы источник поддерживался авторитетными ИТ-компаниями, а термины обсуждались среди сообществ.

ГОСТ преводы ISO и других зарубежных стандартов?

Не обязательно. Springer, например, периодически выпускает энциклопедии. Тут само имя издательства является авторитетным для всех сообществ.

Не знаю. Уже не первый раз за выходные в мобильной версии после отправки два сообщения появляются. Удалить нельзя, можно только отредактировать. Вот и пишу пояснение. Можно, конечно, просто прочерк ставить, но так скучно. :)

Понятно. Будем иметь в виду.
да, уж с толчком вышел промах. Поменял на озарение. ))
Но речь-то вообще о терминологии. А это, как говорят в Одессе, две разные вещи)
да, уж с толчком вышел промах

Теперь двусмысленно вдвойне
в основе модели лежит алгоритм усвоения (learning algorithm), aka искатель минимумов (или максимумов) для надлежащим образом сформулированной математической функции.

Машинное обучение — это не задача минимизации известной функции. Если бы это было так, то всё было бы намного проще.


У нас есть обучающая выборка и нам нужно построить функцию, которая минимизирует потери не только на ней, но и на заранее неизвестной тестовой выборке. Минимизация как таковая тут не особо важна, важна генерализация.

Правильно говорить потеря, если мы говорим о функции потери. Далее, данные делятся на 2 среза (splits): тренировочный и тестовый, бывает что и на 3 (плюс валидационный). В целях соблюдения стилистического параллелизма здесь не должно быть отпричастных прилагательных, поэтому тренировочный срез. Насколько я знаю стохастический градиентный спуск как раз и занимается тем, о чем я пишу в указанной вами цитате.
не в малой степени
а по-русски принято говорить в немалой степени. Такое ощущение, что русский вам близок, но не основной, отсюда и куча этих ваших «озарений» )))
Не пытайтесь «перевести». Просто расскажите своими словами, по-русски, но максимально близко к иностранному тексту.
Но для этого нужно знать язык, на который переводишь. Вы его не забыли после тесного общения с зарубежными источниками?
Достижения в области machine learning не в малой степени
должна переводится как «трансферное усвоение»

Может лучше так:
Достижения в области machine learning в немалой степени
должна переводиться как «трансферное усвоение»
Пытаясь понизить мой статус по моим опечаткам, вы уводите дискуссию в сторону. Но все же исправлено.
от этих нитей коробит. тред — это поток. потоки бывают встроенные (реализуемые на уровне ОС) и эмулируемые самим интерпретатором (зеленые). потоки могут выполняться «одновременно» одним процессором благодаря механизму переключения контекста. вкратце: выполняется N операций одного потока, потом контекст переключается и выполняется N операций другого, создается лишь видимость параллельной работы, на самом деле она строго последовательна. с добавлением дополнительных процессоров уже появляется реальная параллельность… процесс же от потока отличается лишь тем, что один процесс может группировать множество потоков, которые работают с общей памятью. не понимаю зачем и о чем этот текст… промотал текст выше, встретил термин bias. bias — это порог. в русскоязычной среде у всех этих терминов есть наши родные имена, которые не соответсвуют прямому переводу
НИТИ бывают встроенные (имплементируемые на уровне ОС) и эмулируемые самим интерпретатором (зеленые). НИТИ могут исполняться «конкурентно» одним процессором благодаря механизму переключения контекста. Вкратце: выполняется N операций одного НИТИ, потом контекст переключается и выполняется N операций другой.
В чем проблема, собственно?
Про bias без комментариев. Как грится, на вашу совесть))

А как вы предлагаете переводить термины multithreaded, multithreading?
Многонитевый, многонитевость?

да + многонитевая обработка. Эти варианты уже применялись в начале нулевых. Вы поймите, тупиковых ситуаций тут нет

А теперь hyperthreading. Гипернитность?

Опустим что звучит максимально не по-русски, оно искажает смысл: звучит как-будто это поддержка каких-то особых нитей, господи упаси, но они там самые обычные, необычная компоновка процессора. А само название просто придумка, которую, наверное, не стоит переводить буквально.

К слову, вот вопрос: нужно переводить «литературно точно» (я бы сказал в стиле prompt — thread значит нить и контекст не важен), использовать общепринятое название, использовать оригинал покуда это название конкретной технологи или переводить технически точно, но очень отдаленно от оригинальной фразы (виртуальная многоядерность или что-то в этом духе для hyper threading)? И что делать с квантовой механикой, где куча терминов — просто случайные слова, которые выбраны просто потому что и не отражают истинное значение. (Запах, спин. Спин, к слову, вообще принято оставлять спином, хоть русский аналог слова существует).


Я бы использовал общепринятые названия.

А ещё один вендор в своих доках использует треды, а другой варпы, но смысл одинаковый.
Так что я тоже за общепринятые понятия.
вообще, «нити» в книжках, например, 90-х годов встречается. Потом уже устоялось «поток». И, конечно, вроде бы нигде не было ада а-ля «многонитевость»
было-было, не надо отсебятины.
если вы про свои переводы, то возможно
Повторяю для особо одаренных. Я перевожу так как есть, пытаюсь, по крайней мере. Это понятно? 1-в-1, так как это воcпринимается на языке носителя. А теперь понятно?

Повторяю для особо одарённых. Переводчика, который переводит 1-в-1, надо гнать из профессии.

Я тут почитал, комментарии, сгорел с ваших ответов но все не решался комментировать, чтобы не опуститься до вашего уровня. Но тут это совсем за гранью добра и зла…
1-в-1, так как это воcпринимается на языке носителя

Вы для кого переводите? Для носителей языка(английского)? Чтобы им на русском было комфортно читать? Серьезно? Какова вероятность что носитель языка при наличии материала на родном языке будет читать перевод на иностранный? У меня хоть и нет 30 летнего опыта в «переводах» книг, но мне кажется что переводить стоит все-таки именно для тех, кто вероятнее всего будет читать ваши переводы.
С другой стороны, переводчик не хочет вкладывать в уста зарубежному автору более доступные русскому читателю формулировки, если они отличаются по смыслу от авторских. Между точностью перевода и адаптацией для читателя всегда приходится искать компромисс.
Дак он и не должен я думаю ничего вкладывать. Это не его работа. А вот искать компромиссы — возможно. И если переводчик не может этого сделать — он скорее всего и не переводчик вовсе. По крайней мере технической литературы. Художественной — возможно… и то не факт. (Вспоминаем и притягиваем за уши перевод Марии Спивак серии книг о мальчике который жил на Бирючинной улице)
С самого начала своего появления в России вся сфера цифровой техники переводилась исключительно тупым калькированием, поэтому было бы странно ожидать, что внезапно что-то изменится.
Калькирование — это несколько другое.
Отнюдь, у нас были ПЭВМ с НЖМД и АЦПУ.
А советские клавиатуры с ВСТ, КОН, РЕГ ^_^

А какая у вас цель? Чтобы книгу поняли или чтобы восторжествовала некоторая вселенская справедливость?


А вдруг устоявшийся русскоязычный термин как раз удачнее? А если и не удачнее, то что с того?


Вот, скажем, машинное обучение, которым я занимаюсь. Когда я слышу эту фразу, я вообще не задумываюсь, обучение там или усвоение. Для меня это словосочетание — это термин, единое целое. Я слышу его, и я сразу понимаю, о чём речь. И это понимание было бы абсолютно таким же, если бы устоялся перевод машинное усвоение. Или прикладная статистика (что было бы ещё точнее во многих случаях).


Словосочетанию машинное обучение сто лет в обед. Когда его произносят, все понимают, о чём речь. А если произнесут машинное усвоение, никто ничего не поймёт. А ведь ваша цель как переводчика — чтобы люди поняли! Если вы хотите реформировать русскоязычную терминологию, то не нужно говорить, что Вы переводчик. Переводчики этим не занимаются.


А это именно русскоязычная терминология. Она устоялась. Много лет и даже десятилетий так все говорят. Эти термины есть в словарях и энциклопедиях. Какой ещё Вам нужен стандарт?


Вы, конечно, вправе сказать, что перевод неточный. Ну, может, с Вами согласятся и запомнят как забавный факт. Как, скажем, факт, что ящик Пандоры — это тоже неточный перевод, а надо пифос Пандоры. Но кого это волнует?


Или, скажем, Вы предлагает переводить image не как изображение, а как снимок. Я вот не согласен. Очень часто приходится работать с изображениями, которые снимками не являются и синтезированы, а не сняты.


Ещё раз повторю свой тезис: переводчики переводят, чтобы текст поняли. Даже если им не нравятся слова и сам текст.

В русском языке есть много переводов, которые давно устоялись, но на самом деле они неточные. Например, слово православие — в греческом оригинале речь не о славе, а об учении. Тоже будем менять? На мой взгляд, поздновато.

Вы поставили свой вопрос от моего лица и положили его на лопатки. Круто)

Такой цели не было. Если я Вам приписал то, что Вы не имели в виду, то это потому, что я неправильно понял, что Вы хотите сказать.

Основательно)
Вот именно — переводят, чтобы поняли. Добавлю только, чтобы поняли ПРАВИЛЬНО, без искажений.
Наличие в тексте слова image в большинстве случаев связано со снимками: медицинскими, спутниковыми или в базе данных ImageNet. Когда речь идет, скажем, о фотографиях или изображения на выходе из декодировщика, то это будет соответственно фотография и изображение. Однако, слово снимок позволяет излагать материал глаже и значит понятнее, потому что это именное существительное и потому что оно может использоваться как определение.
Уже отмечал выше, проблема с термином МО в том, что он рождает пустые сущности, а значит уводит в сторону. Весь предмет machine learning сфокусирован на САМООБУЧЕНИИ, т.е. автоматическом усвоении закономерностей. У нас же ниоткуда возникает учитель. Это как раз тот случай, когда говорят «как корабль назовешь, так он и поплывет».
Добавлю только, чтобы поняли ПРАВИЛЬНО, без искажений.

А разве изменение устоявшейся терминологии как-то поможет понять более правильно? По-моему, наоборот. Для меня новояз — это и есть искажение.


Если рентген заменить на лучи X физик поморщится, но понимание того, о чём идёт речь, не изменится. В данном случае содержание первично, а форма вторична.


Будь Ваш вариант перевода первым, я бы и слова не сказал. Но вы с терминологией опоздали на несколько десятков нет.


Когда речь идет, скажем, о фотографиях или изображения на выходе из декодировщика, то это будет соответственно фотография и изображение.

А к чему вводить лишние сущности и добавлять избыточную информацию о происхождении? И вообще, это ли хотел сказать автор?


Однако, слово снимок позволяет излагать материал глаже и значит понятнее, потому что это именное существительное и потому что оно может использоваться как определение.

Кому понятнее? Не забывайте, что целевая аудитория ваших переводов — я. Меня непривычная терминология запутает.


Уже отмечал выше, проблема с термином МО в том, что он рождает пустые сущности, а значит уводит в сторону.

Никуда он не уводит. Мы суть понимаем не из термина, а из определения.


Тогда уж и слово машинное надо заменять на компьютерное.


Весь предмет machine learning сфокусирован на САМООБУЧЕНИИ, т.е. автоматическом усвоении закономерностей. У нас же ниоткуда возникает учитель.

И это мы ещё не коснулись обучения с учителем и без учителя (которые supervised и unsupervised). :)

В вашем очаровательном изложении меня коробит конформизм вот в этой фразе «Мы суть понимаем не из термина, а из определения.» На деле оно как раз и не так. Но вы пытаетесь отстаивать ложную точку зрения. Перейдите а Вики на represantation learning по русски. Этот термин означат автоматическое усвоение представлений данных, и вас голова пойдет кругом от написанного. Лабуда про новейшее направление…
В вашем очаровательном изложении меня коробит конформизм

С каких пор следование традициям перевода — это конформизм?


Перейдите а Вики на represantation learning по русски. Этот термин означат автоматическое усвоение представлений данных

Перешёл. Обучение представлениям. Нормально суть передаёт. Если не впадать в философствование относительно разницы между обучением и усвоением, то выходит то же самое, что и у Вас. Только вы добавили автоматическое и данных, которых не было в оригинале и которые не нужны, так как и без этих слов понятно, что из данных и автоматически.

Цель — обратить внимание, что есть несоответствия, есть необходимость в стандартизации, в конце концов, привлечь на свою сторону.

Смотрите, какая тут ситуация.


Вы говорите, что переводят неправильно. Скажем, есть machine learning, его перевели как машинное обучение, и Вы критикуете этот перевод.


Но это было бы так, если бы в русском языке не было термина. А он есть, и он как смысловая единица однозначно соответствует англоязычному.


То есть, прикрываясь переводом Вы критикуете сам термин. Вот что я хочу сказать. И аргументы Ваши не совсем переводческие. Если убрать из них всё, что относится к переводу, то почти ничего не изменится.


Так давайте называть вещи своими именами. Вам не нравится русскоязычный термин, а перевод тут ни при чём.


Однако, как переводчик вы с термином сделать ничего не сможете. Максимум — оставить переводческий комментарий и изложить свой взгляд.

Вся критика тут касается лишь 3 терминов: машинное усвоение, нить исполнения и замок. Вы отстаиваете консервативную позицию «имеем то, что имеем», таков, мол, статус-кво, и ничего менять не надо. Я же обращаю внимание на то, что статус-кво в отношении этих терминов основан на неправильных посылках. В особенности, это касается названия подобласти ИИ, которая принадлежит иерархии «усвоение знаний» -> «теории усвоения знаний» -> [«усвоение знаний животным» (animal learning), «усвоение знаний человеком» (human learning) и «усвоение знаний машиной» (machine learning)]. На поверку общепринятый подход является близоруким в том, что он не укладывается в эту иерархию, выбивается из нее, а также в том, что он переворачивает смысл этой подобласти наоборот. А это имеет последствия в том, что возникают пустые сущности (учитель) и появляется неверное понимание механизмов ее работы.
погодите, но ведь учитель (человеческий) занимается обучением школьников/студентов. В школе происходит процесс обучения ребенка чему-то. То же и с компьютерами. Есть человек, занимающийся обучением компьютера чему-то.
Это мы еще не касались вопроса, что не все машины — компьютеры. Есть еще башенные краны, например.
Мы говорим об информатике. Не надо уводить в сторону. Машины в информатике — это компьютеры. И вы подменяете понятие. С самого начала речь о приобретении знаний животным, человеком и машиной, то есть об усвоении знаний.
вообще, программист занимается не усвоением знаний компьютером, он как раз обучает
Он тренирует модель, внутри которой заложен алгоритм автоматического усвоения закономерностей. Точка.
И? Он занимается усвоением каким-то? Чего он там усваивает?
Повторяю упрощенно цепочку))
модель -> алгоритм -> матфункция
Человек строит модель и собирает данные. Все остальное делает (усваивает закономерности) модель благодаря алгоритму внутри нее, который минимизирует/максимизирует некую величину (если речь о градиентном спуске). Так понятно?
в какой момент тут программист занимается машинным усвоением чего-то?
Он создает алгоритм, который передается машине, чтобы та как-то хитро обработала данные.
Программист может изучать как машина обрабатывает эти данные — это процесс изучения того, как машина изучает.
Но это не сам процесс создания программы, это изучение того, почему программы надо делать именно такими.

Так и у людей то же самое! Учитель тренирует ученика, у которого в мозгу заложены биологические алгоритмы усвоения закономерностей.

А разве усвоение это не успешный результат обучения? Вы хотите заменить процесс его результатом?

см. иерархию «усвоение знаний» -> «теории усвоения знаний» -> [«усвоение знаний животным» (animal learning), «усвоение знаний человеком» (human learning) и «усвоение знаний машиной» (machine learning)].

Уважаемый, ну вам каждый второй разными словами пытается донести, что стандартизация давно есть. Термины в индустрии устоялись, они общеприняты и всем понятны. Даже если в русскоязычной среде общепринятым термином для machine learning было "угабугабанга" — то вам пришлось бы переводить его именно таким образом. Если вы из личных представлений о прекрасном будете переводить устоявшиеся термины какими-то самостоятельно изобретенными словами или словосочетаниями — сообщество ваших переводов понимать не будет, книжки продаваться будут плохо, карма будет падать.

Уважаемый, вы ваши домыслы оставьте при себе. Моя практика подсказывает, что стандартов нет.
Взять пример с thread. В зарубежной технической литературе данное понятие объясняется именно на нитях, которые рассматриваются как основные инфраструктурные единицы планирования в операционных системах. Продолжим логический ряд – там где нити, там и клубок. А где клубок, там и кот. Сразу видно, что первых переводчиков не было котов, т.е. глобального информационного ресурса (оно и понятно, т.к. в 70-80-х годах Интернет только зарождался). Так и возникла путаница. Тем более что существуют другие потоки под терминами stream и flow. И не надо думать, что вам сойдет с рук, когда в следующий раз придется разбираться в свежем англоязычном блог-посте, затрагивающем обработку стандартных потоков ввода-вывода (I/O stream) или анализ потока управления (control flow) в «многопоточной» (multi-threaded) программе (если исходить из принятого искаженного перевода). От сентенций типа «threads allow multiple streams of program control flow to coexist within a process» у вас пойдет голова кругом, и даже Google-переводчик не поможет, т. к. он выдаст вам нечто вроде «потоки позволяют нескольким потокам потока управления программой сосуществовать в процессе». Кстати, яркий пример словоблудия ИИ-переводчика).

Ну так вот же вы сами приводите вполне понятные и устоявшиеся переводы всего этого — поток управления, поток ввода-вывода, многопоточный. Как добавление новой сущности типа "нитей" в эти конструкции повысит понимаемость перевода?
Извините, если мой предыдущий коммент показался агрессивным, я этого не хотел.

Ничего, в пылу дискуссии это допустимо.) No offense taken.
Вы не обратили внимание на кавычки. Считаю принятые варианты близорукими. Они занимают места других терминов и поэтому вносят путаницу. Если вся терминология информатики идет с Запада, то следует ее использовать как есть. ИМХО. Это к тому же лучше сказывается на понятный взаимообмен и повышает конкурентноспособность нашего образования.

Ну вот я ровно про то же самое же :) неважно, какое сочетание букв на нашем конце перевода, важно то, насколько в рамках знания большинства русскоязычного сообщества это сочетание букв однозначно описывает то или иное понятие. Треды, потоки, нити, одно слово с нашей стороны или несколько — это неважно. Важно чтоб максимальное количество людей не ломало мозг, пытаясь понять, какой изначальный термин стоит за переводом. В этом смысле попытка введения новой сущности мне кажется не самым продуктивным подходом.
А вообще, конечно, в моём мире розовых пони и радуг человечество давно уже должно перейти на общий язык и высвободить кучу ресурсов на более классные вещи, чем такие заморочки, как в этом треде :) Пис энд лав :)

Так, я и не рассчитывал на принятие сразу же. Мое дело поднять тему, объяснить несуразности. Человеческое сознание в массе своей неповоротливо как старый крейсер)). Мы привыкли цепляться за старое — так удобнее.
«в этой нити дискуссии», вы хотели сказать)). Но глобально все так.
Кстати, добавлю-ка я взаимообмен и конкурентноспособность в выводы статьи))
в действующем законе об образовании человек, получающий знания, в школе, вузе, курсах — обучающийся. Т.е., даже по отношению к людям сейчас нет разделения на «обучение» и «изучение», потому не «изучающий» или «усваивающий», а «обучающийся».
А уж «машинное усвоение» — это, ИМХО, что-то про питание терминаторов чипсами.
Выставлять напоказ свою неосведомленность неосмотрительно). А что делать с иерархией в которую вписывается машинное усвоение? — «усвоение знаний» -> «теории усвоения знаний» -> [«усвоение знаний животным» (animal learning), «усвоение знаний человеком» (human learning) и «усвоение знаний машиной» (machine learning)].
а как быть с усвоением питательных веществ?
Может быть не надо заменять вполне понятный более-менее узкоспециализированный термин более широким?
Никак. В английском как-то обходятся с выражением data ingestion, который у нас суть приемка данных, но у них оно воспринимается как «поглощение данных». Давайте тогда придираться к чересстрочной разверстке как к продразверстке)))
т.е., тут придираемся, тут не придираемся, а тут рыбу заворачивали?
Вы зачем-то пытаетесь назвать то, чем занимается программист (обучение машины) тем, что происходит с самим компьютером («усвоение» чего-то). Хотя это вообще две противоположных стороны.
Вы пытаетесь строить рассуждения на своем узком понимании. Ну, кто вам сказал, что усвоение ассоциируется с питательными веществами? А что делать с целым направлением в когнитивистике и психологии под название «Формирование и усвоения знаний»? Так что про рыбу не по адресу. Программист НЕ обучает машину. Он пишет программу, в которой задействуется модель (доморощенная либо кем-то уже построенная), внутри которой лежит алгоритм автоматического (машинного) усвоения шаблонов/регулярностей/закономерностей. Программист собирает данные, предобрабатывает их и подает в модель. Получив результаты, он сравнивает их с эталоном и если надо, вносить поправки в гиперпараметры (хотя он может и этот процесс автоматизировать). И на каком шаге он тут обучает??? Модель в силу своей особенности учится САМА, т.к. в нее заложен особый алгоритм — learning algo.
хм, а учитель в школе на каком этапе обучает? Он же не соединяет руками синапсы в головах учеников. Он просто рассказывает и подает предобработанные данные.
Да и программист не программирует вовсе, а занимается исполнением программы, правильно? Ведь в компьютере происходит исполнение программы, а не какое-то там программирование
Так, давайте отделим кожуру от мякоти. В триаде animal learning, human learning и machine learning есть небольшое отличие первых двух от последнего. Первые два уже наделены природой способностью усваивать знания. В случае машины сперва надо построить модель автоматического усвоения, если исходить из классического определения МУ, как наделение машины способностью усваивать знания самостоятельно, без вмешательства человека, без необходимости ее программировать.
и это означает… что нужно называть это одним термином «усвоение»… хм…
Вы не поверите, но там, откуда все это пришло так и сделали))))))
но вы же сами говорите, что это разные вещи. У животных и людей это встроено в прошивку, а у компьютера — нет. Нужен программист, который будет что-то делать, чтобы машина что-то там изучала.
Вы не понимаете, что «будет что-то делать» — это не то же самое, что «она там изучает»?
Работа разработчика завершается на этапе сдачи в работу готовой модели. Все. Точка. Затем к работе приступает исследователь данных (data scientist), который собирает и предобрабатывает данные и затем подает их в модель. Все остальное делает модель!!!
а вы переводите книжки про то, как надо скармливать датасет компьютеру?
Тогда это не ML, это «Оператор ЭВМ»
Мой сын выражается датасетами тоже)) И я называю это чириканьем (без обид).
Вообще в МУ есть целый ряд ролей. Например, исследователь данных (data scientist) ‐ это человек, в центре внимания которого находится сбор, интерпретирование и обработка наборов данных. Он проводит статистический и разведывательный анализ данных. Применительно к машинному усвоению, исследователь данных может работать над сбором данных, генерированием признаков, строительством моделей и т. д. Исследователи данных часто работают на Python или R в среде блокнотов, и в организации они обычно являются первыми, кто возводят модели машинного усвоения.
Инженер данных (data engineer) сосредоточен на инфраструктуре и рабочем потоке процессов, приводящих корпоративные данные в движение. Они помогают управлять тем, как в компании выполняется приемка данных, как работают конвейеры данных и как данные хранятся и передаются. Инженеры данных имплементируют связанные с данными инфраструктуру и конвейеры.
Инженеры машинного усвоения (ML engineer) выполняют те же задачи, что и инженеры данных, но для моделей МУ. Они берут модели, разработанные исследователями данных, и занимаются управлением инфраструктурой и операциями, связанными с тренировкой и развертыванием этих моделей. Инженеры МУ помогают строить производственные системы, способные выполнять обновления моделей, управлять версиями моделей и обслуживать конечных пользователей модельными предсказаниями.
Материал взят из последней переведенной мной книжки 2021 года. Сейчас она находится в редактуре, и решается вопрос по терминологии.
Я пытаюсь отстоять МУ)) (по секрету ;-))
во всех этих определениях человек не занимается «машинным усвоением», т.к., «усваивает» машина, а не человек.
Человек совершает какие-то действия, которые приводят к «усвоению» чего-то машиной.
Равно как и школьный учитель, профессор в вузе или директор школы занимаются обучением школьников или студентов.
Вы ошибаетесь. Все они занимаются **организацией** работы модели: одни данными, другие инфраструктурой, третьи параллелизацией и распределенной обработкой, четвертые обслуживанием запросов на получение предсказаний.
школьный учитель, завуч, директор школы, министр образования, профессор на кафедре также занимаются «организацией» работы модели. Но мы что-то не говорим, что они занимаются «человеческим усвоением»
Читайте выше по ветке о различиях между усвоением знаний у животных/людей и усвоением знаний у машин. Спойлер: вернитесь к классическому определению в статье…
может вам тогда просто новый термин придумать? Не знаю, «машинная калабудра» или что-то подобное.
А то вы в одном месте хотите все называть одним термином, в другом говорите о различиях.
Мне кажется, вы начинаете уже 3 итерацию)))). Приведу еще раз выдержку и на этом надо завершать. Вы тратите мое время.
Мы имеем феномен, который называется «усвоением знаний человеком и животными». Этот феномен объясняется теориями усвоения знаний (в частности павловской теорией условных-безусловных рефлексов). В 60-х годах XX-го века компьютерные ученые задались вопросом о том, как создать самообучающуюся машину, и дали классическое определение такой машины (определение дано выше в посте), как способной автоматически усваивать знания из данных, не будучи для этого программируемой. То есть признавалось, что вычислительную машину, в отличие от людей и животных, которые наделены такой способностью по природе, надо еще наделить способностью усваивать знания. Это делается путем строительства специальных моделей машинного усвоения знаний, в основе которых лежит алгоритм машинного усвоения. Строительство таких моделей и алгоритмов и является предметом подобласти ИИ под названием «машинное усвоение» (МУ).
ML пересекается с ИИ, но это не одно и то же.
А уж то, что вы так лихо приписали компьютеру усвоение каких-то знаний и из этого сделали далеко идущие вывод, то это оставим на вашей совести.
Вы удивитесь, но я ничего НЕ придумываю. Просто показываю то, как эта тема понимается ТАМ. Может оттого вся информатика идет оттуда? Вы не задумывались?
Может быть… МОЖЕТ БЫТЬ… у них там неправильный термин?
когда ученый (химик, астрофизик, биолог, и т.д.) берет какие-то данные и загружает их в какую-то шайтан-машину, которая выдает ему какой-то результат, он не занимается машинным обучением. Он использует машинное обучение (тут термин неправильный, да) для своей работы.
Но вы же переводите книжки не про то, как загрузить готовые данные в готовый блокнот, верно?

Представил как машина охотится на другие машины, поглащает их и затем усваивает:) Такой машинный канибализм.
Тогда уже "машинное усвоение информации". Немного длиннее, но понятно о чем речь.

Не следует выставлять свою неосведомленность напоказ. Не осмотрительно.
Давайте тогда придираться к чересстрочной разверстке как к продразверстке)))

А какая связь? Развёртка и развёрстка — разные слова.

Поддержу многих комментаторов. Технический точный перевод часто не совпадает с понятным и удобным. И дело тут, как ни странно (в контексте молодой технической области знаний), в культурном контексте. Именно культурный контекст приводит к тому, какой инвариант термина входит в язык, а какой остаётся точным, но чуждым.

Взять то же обучение. Даже если сократить понятийную область до сферы научения чему-либо, всё равно окажется, что усвоение — исключительно самостоятельный, внутренний процесс. При этом, опять же, как ни странно, в этом значении, усвоение похоже на пищеварение — т.е. на преобразование в какую-то пользу. Машина же в рамках mashine learning не самостоятельна. У неё есть учитель. Именно поэтому в русском языке получилось обучение. А train в смысле тренировки у нас употребляют чаще в области спорта, где речь идёт про наработку механических навыков, что изрядно противоречит интеллектуальному обучению.

Насколько мне известно, переводчики в поисках правильного перевода обычно ищут в культурном контексте целевого языка что-то наиболее семантически близкое к оригиналу. И тут очень часто точный перевод оригинального термина оказывается семантически некорректен в целевом языке.
Особенно сильно это заметно в литературных переводах. Но не надо думать, что технические тексты свободны от этих проблем.
Все проще. каждый переводчик, как и любой человек, ограничен рамками своих пониманий, взглядов и образования. Этот тезис ярко демонстрируется всей текущей дискуссией под моим постом. Взять только пониманием термина bias как порога)) у одного из комментаторов.
Ваш замечательный комментарий является яркой демонстрацией того, что в психологии называется рационализацией, т.е. объяснением причин, почему следует соблюдать статус-кво, даже если он ложен.
Не соглашусь. Многие технические специалисты не слишком близки с виртуозным владением словом, и применяют чуть ли не первое более-менее подходящее слово.

Обучение не требует учителя (хоть в русском для такого метода есть «самообучение»). Усвоение не требует одиночества (если на него идёт упор в «самостоятельный»). В контексте статьи «усвоение» ближе, чем «обучение». Но даже и в его точности уверенности, лично у меня, нет. Но и это спорно, т.к. в начале надо определиться с тем, что мы хотим получить от процесса обучения/усвоения на выходе и что мы видим результатом ML.

В одном из комментариев вы пишете, что хотите убедить в необходимости стандартов и привлечь на свою сторону. Допустим, вы объединились с переводчиками и разработчиками ПО, и создали институт стандартизации переводов, а дальше, ввели термины, такие как "машинное усвоение" и т.д. в новые переводы книг. Представьте, я покупаю книгу "Машинное усвоение", а там нити, блоки, тренировка. Мне тяжело и непривычно её читать, поэтому я делаю возврат в течение 14 дней. Поэтому вам не удается меня привлечь, даже если я понимаю вас и иду навстречу. Переход на новые термины должен идти не от институтов стандартов или из книг, а от людей в компаниях, потому что язык формируется в коммуникации, его нельзя сформировать указом сверху.

Один из немногих дельных комментариев.

А разве не это же мы все пытаемся до Вас донести? :) Пока что статья выглядит, извините, как «все шагают не в ногу, а один я в ногу». Может даже все неправы.


Вот вы же переводчик, значит изучали языкознание в вузе. Помните, сколько в языке нерегулярностей? А сколько буквализмов или просто неправильных, но устоявшихся переводов?

Стерпеть потоки еще можно, но когда дело доходит до ML оно принимает весьма нежелательный оборот.

Я про так называемое «обучение признакам» в вики. Вообще отстой. Яркий пример последствия неправильного понимания термина ML.

Термин правильно звучит так: (автоматическое) усвоение представлений данных. А его определение так: методика, которая позволяет системе автоматически обнаруживать представления, необходимые для выявления признаков или классифицирования из сырых данных». НО определяемое «обучение признакам» не имеет никакого отношения к телу определения!!!
В науке говорят, что новые теории окончательно побеждают со смертью последнего оппонента))
Я выдал пост с аргументацией. И если кому-то он запал в душу, то я со своей задачей справился.
Если издавать энциклопедию, сертифицированную авторитетными организациями, то сообщество, включая и издательства будут черпать информацию из нее.

Если в этой энциклопедии будут "усвоение", "замки" и прочее — то авторитетные организации потеряют часть своего авторитета. И более никаких изменений не случится.

Если терминологический стандарт будет принят в дебатах, то это совсем другая ситьюэйшн

А говорили, что не прескриптивист… А какие организации будут авторитетными, кстати?


А что если специалисты скажут, что нужно переводить как машинное обучение? Смиритесь?

Даже в аутенти(фи?)кации уже вряд ли удастся избавиться от «фи» ради великой справедливости, а ваши цели ещё более донкихотскиенесбыточные.
Перейдите на русскую страницу для representation learning (автоматическое усвоение представлений данных). Вы можете говорить все что угодно. Но разве ТАКОЕ мы хотим в отечественной информатике! По мне так полный бред. И все из-за невежественного понимания термина machine learning. Казалось бы, пустяк. Термин какой-то… А какая фигня получается. Спойлер: там тот термин на сегодняшний день переводится как обучения признакам!!! Все наоборот. A-la Слышу звон, да не знаю, где он…
Тело определения говорит, что «это методика, которая позволяет системе автоматически обнаруживать представления, необходимые для выявления признаков или классифицирования из сырых данных». НО определяемое не имеет никакого отношения к телу определения. Повторяю термин правильно звучит так "(автоматическое) усвоение представлений данных".
представление в виде графика, таблицы, текста, аудио?
Учите матчасть. Представление в виде строковых, числовых, категориальных переменных и пр. В виде числового массива, векторного вложения, матрицы…
Т.е., должно быть:
«автоматическое усвоение данных, представленных в виде строковых, числовых, категориальных переменных и пр. В виде числового массива, векторного вложения, матрицы»
И это лучше, чем «обучение признакам»
Но ведь еще в 60-е годы были устройства для чтения перфокарт, которое позволяло компьютеру автоматически усваивать (получать) данные, представленные в виде строки цифр.
Это что же получается, по такому определению, они там тоже машинлернингом занимались?
Без комментариев. Вы я смотрю тут днюете и ночуете.))
да нет, просто воскресенье. Да и не работаю я Спасителем Глупого Человечества от Лингвистического Апокалипсиса, чтобы уж совсем времени свободного не было.
Коммент на грани дозволенного и на вашей совести. Я лишь собрал перечень несуразностей и показал их публике. И пробую их отстоять. По-хорошему вам надо извиниться.
вот разные представители публики вам и ответили, неоднократно, что это проблема, высосанная из пальца.
Если от термина «обучение», действительно, есть какой-то вред, а с «усвоением» отечественное ИТ попрет, как на дрожжах, то язык — штука достаточно гибкая, чтобы измениться в нужную сторону.
Используйте в переводе «усвоение» и посмотрите потом на проданный тираж, рецензии и на комментарии на рутрекере по поводу перевода.
Повторяю термин правильно звучит так "(автоматическое) усвоение представлений данных".

А что такое правильно в Вашем понимании?

Нет, правильно, это то как говорит подавляющее большинство носителей языка
на текущий момент времени. Языка, на который осуществляется перевод, а не языка оригинала (разумеется!). Если бы на русском 50% говорило «машинное обучение», 25% говорило «машинное усвоение», а оставшиеся 25% говорило бы «обучение компьютеров», то все бы три варианта были бы правильные. Правильные на текущий момент. И дискуссия имела бы хоть какой-то смысл. Сейчас она смысла не имеет. Тут я почему-то вспоминаю про мужской род кофе.

Кстати, было бы здорово спросить мнение любого билингва знакомого с машинным обучением, что он думает по поводу «машинного усвоения».
На хабре билингвы есть.

PS. Извините, но кажется вы сделали себе жуткую антирекламу. Мне стало интересно, я загуглил «машинное усвоение» и нашел ваше имя. Посмотрел книги, которые вы переводили. И хоть называются они прилично, без всяких «усвоений», но из-за этой статьи я уже никогда не куплю книги с вашим переводом, потому что мне будет страшно, не появится ли там какой-нибудь другой ужас «правильного и точного» перевода. И даже на книги издательств, с которыми вы сотрудничаете, тоже буду смотреть с небольшим опасением.
Если это возможно, лично Ваше понимание термина «машинное обучение» могу я узнать? Если Вы полностью согласны с какой-либо трактовой данного термина уже описанной в интернет (та же Википедия или иной ресурс), достаточно просто ссылки, конечно.
Определение понятие через род-вид из формальной логики вспомните. И вуаля. Мы плавно возвращаемся к теме learning (усвоению знаний).
Автор, на полном серьёзе(!) использующий, помимо прочего, аббревиатуру «МУ» в глобальном контексте, болезненно напоминает мне одного
персонажа
— As punishment, they craved to imprison my body. But I'm fast, fast, clever, clever. They lost the chase, and locked up their entire race, building a prison around the whole world. Now I'm the only free one.
— Huh? Free? But you're clearly the one behind the bars…
— Things don't seem such from here!
Вы серьезно против понимания, которое принято во всем мире? ))
Просто интересно, вот есть устойчивое и понятное выражение:
«Обучить нейросеть распознаванию лиц на фото»
Как тогда правильно должна звучать эта фраза на русском, с правильным переводом?
Есть вариант :) «Натренировать искусственную нейронную сеть распознаванию образов лиц на цифровых изображениях».
Принимается:)
Немного напоминает инструкцию по эксплуатации к некоторым товарам.
Натренировать нейросеть распознавать лица на фотоснимках.
Например, нередко можно услышать, что специалисты...

Сейчас бы сказали " нередко можно услышать то, что специалисты… "

Спасибо за статью
До прочтения статьи я думал, что авторы плохих переводов просто ленятся и переводят без оглядки на сообщество специалистов потому что у них нет времени и не хочется сделать хорошую работу. Оказалось, что они просто по-другому понимают, что такое хорошая работа! Оказалось, что у некоторых переводчиков есть своя философия, в которой просто не нужно оглядываться на то, как сегодня носители русского языка переводят тот или иной термин.

Кажется такому переводчику, что MLaaS надо переводить как «Машинное усвоение как служба» — он возьмет и переведет! И обоснует! При этом его совершенно не будет интересовать, что русскоязычные программисты на всех конференциях, в разговорах и статьях говорят «Машинное обучение как сервис».
Коммент типа «знай свое место».

Я, если что, имею 30-летний опыт в информатике. Слушал лекции в МГУ по ИИ еще в тот год, когда в Москву приезжал президент Р.Рейган, а сервисы были только в гостиницах))
Повторяю свой тезис, если вы не поняли: ML имеет неправильное название, которое вводит в заблуждение. Англоговорящий, говоря service, на всем протяжении имеет в виду одно и тоже и не переключается на каком то этапе со службы на сервис.
Это все очень интересно, а почему вы считаете, что не нужно оглядываться на то, как он называется сегодня во всех статьях и на всех конференциях?
Пижонство новообращенных (образованцев) — вот в чем проблема всех новейших течений. Они открывают для себя Омерики и предлагают называть их Омериками.)
Sign up to leave a comment.

Articles