Comments 252
Ну разумеется, если каждый переводчик будет решать что и как переводить — никогда стандартов не появится...
Термин «machine learning»
Давно уже устоялся термин "машинное обучение". И нейросети в России не "тренируют", а именно что обучают.
Термин «thread»
Всегда был "потоком" (управления). Слово "нить" тоже допустимо использовать, но только если надо отличить thread от stream или flow.
Термин «lock»
Всегда переводился как "блокировка", которой он по смыслу и является.
Термин «service»
В контексте системного администрирования следует переводить, безусловно, как службу (хотя и "сервис" будет понятным), а вот такая вещь как "web service" может быть только "веб-сервисом".
Всевозможные FOOaS также должны переводиться как "FOO как сервис", а не как "FOO как служба", потому что в русском языке фирмы клиентам предоставляют именно сервис, а не службу. Разумеется, фирма может обслужить клиента, т.е. предоставить ему обслуживание, но "FOO как обслуживание" выглядит ещё более коряво.
Особенно если учесть, что сама она обучиться ничему не способна, и именно специалист ее обучает, тем или иным образом. Т.е. речь идет о процессе, активным действующим лицом которого является скорее человек, а не нейросеть, которая чего-то там сама «усваивает».
«усвоение знаний» -> «теории усвоения знаний» -> [«усвоение знаний животным» (animal learning), «усвоение знаний человеком» (human learning) и «усвоение знаний машиной» (machine learning)].
"Усвоение знаний", по сути, и есть "обучение". Просто "усвоение" — более широкое понятие. Например, усвоение питательных веществ организмом в процессе переваривания. Поэтому когда Вы пишете "машинное усвоение", вы подразумеваете "машинное усвоение знаний". Это длинно, проще написать "машинное обучение".
train. Модель МУ тренируют, какой бы она ни была, в том числе нейросеть.
service. В научно-технической литературе нет такого явления, как «здесь хочу это, а там хочу то». Это называется принципом единообразия.
thread. Интересно, как вы будете обходиться, когда речь идет об обработке streams с использованием threads? ))
machine learning. Ничего не вечно под луной. Точка
lock. С блокировкой 2 проблемы: это отглагольное существительное, и этот перевод вступает в коллизию со словом block, т.е. тем самым действием, которое нить выполняет, когда совместный ресурс закрыт на замок. К тому же процессор не управляет, а исполняет команды.
Блокировка потому и называется блокировкой, что она блокирует выполнение нити. Это не коллизия, а этимология. Это во-первых.
А во-вторых, устоявшийся русский термин называется "блокировка" независимо от ваших аргументов. Если вы желаете, чтобы ваши переводы были технической литературой, а не макулатурой — надо использовать именно "блокировку" и точка.
service. В научно-технической литературе нет такого явления, как «здесь хочу это, а там хочу то». Это называется принципом единообразия.
Вот только принцип единообразия относится к терминам, а не к словам. И такие вещи, как "windows service", "web service" и "foo as service" — это разные термины, и принцип единообразия не требует переводить их одинаково.
И если вы как переводчик не понимаете, что в зависимости от контекста одно и то же слово может переводиться по-разному и требуете какого-то там "единообразия" — вон из профессии!
Отзывов к книгам подобно хабровским тоже немало:
Книга хорошая. Перевод очень плохой. Перевод сделан формально. Переводчик не до конца разобрался в теме. Например, flatten matrix он переводит как "сглаженная матрица" — ясно, что 1) сам он руками flatten никогда не делал 2) смысл он не понимает.
Второй огромный недостаток — переведены абсолютно все термины, это лишает вас возможности связать ваши английские и русские знания. Никто никогда не называет "Model cross validation" словами "Перекрестная проверка моделеЙ", все русские говорят "кроссвалидация".
Подробнее: https://www.labirint.ru/books/709200/
Перевод местами кривой, в целом сумбурное изложение
Подробнее: https://www.labirint.ru/reviews/goods/590293/
Огромная ложка дегтя в этой, в общем-то, неплохой книге — это очень посредственное качество перевода на русский, что в последнее время стало, к сожалению, нормой. Иногда доходит до грубых переводческих ошибок и искажения смысла — в основном это касается математической части. Например, начало главы про "наивный байес" переводчик, видимо, просто не понял и понаписал чепухи, что в подобной литературе совершенно недопустимо. Замечены также опечатки в формулах, и это уже за гранью.
Подробнее: https://www.labirint.ru/reviews/goods/590293/
Был выхвачен всего 1 нужный комментарий из 7, среди которых 5 были позитивными и 1 нейтральным. Вот пример позитивного:
Хорошее введение в основы Data Science. Коротко, ясно и по делу. Пожалуйста, не воспринимайте эту книгу, как всеобъемлющее руководство. Перевод отличный + ценные комментарии от переводчика. Качество печати и иллюстраций вполне приемлемое, лучшего и не надо. За лучшее всегда приходится платить больше, а это не тот случай.
По второй книге имелось всего 2 текстовых отзыва, один из которых негативный.
В моей практике комменты к любому переводу бывали с плюсом и с минусом — сколько читателей, столько и мнений. Если хочешь давать весомую оценку, то потрудись предложить факты, а не чьи-то субъективные оценки.
Поразительно! Как переводчику мне точно известно, что в научно-техническом переводе синонимия вредна, и термин характеризуется тем, что имеет уникальное имя. Термин не должен называться по-разному в разных контекстах. Иначе может произойти подмена терминов, а сам тест станет логически несвязным спагетти.
Не думаю, что веб-сервисы появились в результате переноса служб на сервер локальной сети.
И уж точно IaaS никогда не имела в предках ни одного веб-сервиса.
Вы, выходит, тоже конформист, раз ссылаетесь на документацию? :)
У меня такая же мысль.
Если терминология уже устоялась, то, даже если она не очень удачная, борьба с ней превращается в донкиходство.
Именно поэтому все лучше читать в оригинале
"потоки управления сосуществуют внутри одного процесса"
Не вижу связи с отмороженными ушами.
Если в русском языке некоторый термин понятнее чем в английском — глупо этим не воспользоваться при переводе.
Тут возникает вопрос. Что вы вкладываете в слова "неправильное название"? По каким критериям оно неправильное? В русском языке, например, вполне понятно, что если человек (или машина) чему-то обучились, то они это усвоили, то есть наблюдается синонимичность обучения и усвоения. Хотя она и не отражена в словарях синонимов, (более того, можно обучать так, что человек ничего не усвоит), тем не менее де-факто она есть. Человек чему-то обучен тогда, когда он это усвоил.
С другой стороны, машинное усвоение, учитывая опять же некоторую специфику русского языка и культуры, несколько перекликается с пищеварением (я об усвоении пищи), что, согласитесь, путает и вводит в некоторое замешательство (и даже смешит), а слова должны быть чёткими, а терминология не должна вносить вот это ощущение комедии, иначе под вопросом доверие к переводу. Не говоря уже о том, что машинное усвоение просто не звучит.
То есть да, с точки зрения формально правильного технического перевода с переносом всего и вся в текст вы правы. Но есть другая сторона. Мы же не переводим предложение I am a translator как "Я являюсь неким переводчиком", а опираемся на нормы и благозвучие прежде всего русского языка.
Как выйти из положения? Возможно, стоит делать сноску с формально точным переводом. Тогда не потеряется точно ничего.
Что касается пищеварения, то это на первый взгляд так. Каждая подобласть науки — это своего рода замкнутый мир, в котором каждый термин имеет свое место и не занимает место другого (однозначность). Этот мир встраивается в родительски узел графа знаний, которым в случае МУ является УСВОЕНИЕ ЗНАНИЙ или теории усвоения знания (их всего 4, кстати). В педагогике, психологии и пр. соцнауках данный термин общепринят. Пардон за сумбур, но вы поняли. Переводчик же не должен вмешиваться в перевод, что я и делаю, передавая смысл как есть.
Двусмысленность здесь разрешается самой природой сочетания, то есть тем, что это сочетание — термин. Единожды прочитав определение на русском языке, я уже не буду думать о том, на себя машинное обучение или от себя, да и безо всяких определений понятно: сочетание, как минимум, о процессах, направленных на обучение машины чему-либо. Даже если я ничего не знаю о термине, направление всегда будет понятно из контекста (исключение составляют только случаи, когда контекста нет).
К обратному процессу, то есть к двусмысленности, о которой вы говорите, когда машина учит чему-то (machine teaching), сочетание "машинное обучение" просто не клеится. Machine teaching логично переводить как "Машинное преподавание". Тут вы можете сказать "Это преподавание машиной или машине?", но в этом случае уже не клеится "преподавание машине".
То есть двусмысленность разрешается на уровне языковой интуиции.
Иными словами, резкой двусмысленностью направления обладает только глагол учить/научить (себя или кого-то?), с обучением всё намного яснее. Мы не говорим "Я обучил себя". Я даже проверил лишний раз: в ответ на запрос точного совпадения со строкой "Я обучил себя" Google выдал:
Показаны результаты по запросу "Я научил себя"
Не найдено результатов по запросу "Я обучил себя".
И это при том, что индексируются все тексты: и правильно написанные, и написанные с ошибками.
То есть изначально обучение направлено вовне, в случае машинного обучения — на машину. Тогда как машинное усвоение вообще не включает никакую языковую интуицию, оставляя читателя теряться в догадках, что это за усвоение и как машина усваивает.
Нет, не разбивается. Я не оспариваю перевод понятия "Теория усвоения знаний". Перевод — это ведь не только о том, чтобы передать нечто слово в слово, но и о том, чтобы соотнести понятия, а также правильно подобрать слова для целевой аудитории.
Поэтому перевод "Теория усвоения знаний" прекрасен: он соответствует контексту, передаёт суть и научный язык — для целевой аудитории, а также, наконец, правильно сопоставляет понятийные аппараты.
Но это вовсе не означает, что именно его нужно переносить во все остальные технические и научные тексты. Более того, следуя вашей же логике выше (каждая научная область — отдельный мир) как раз логично разграничить термины разными переводами, потому что теория усвоения знаний — это педагогика, а машинное обучение — совсем нет.
То есть, опираясь на существующие хорошие переводы, вы хотите сказать, что машинное обучение — в контексте этих существующих терминов и его смысла — кривой перевод?
Но у вопроса есть другая сторона: язык — средство коммуникации для людей, а не против них. И, когда некий абстрактный читатель слышит "машинное усвоение", как я уже говорил, он ничего не понимает, в отличие от ситуации с "машинным обучением".
Учитывая широчайший охват термина (он вышел за пределы только аудитории науки и уже давно), перевод "машинное обучение" представляется меньшим злом, иными словами язык просто "нагружает" слово обучение смыслом слова усвоение (как уже говорил выше), для упрощения коммуникации, вместо того, чтобы заставлять читателя копать в педагогику и прочие науки.
Говоря коротко, на разных уровнях правы обе стороны.
Погодите, правильное название — это то, которое используется профильными специалистами в области. Остальные будут неправильными, пусть даже они со всех лингвистических позиций лучше.
Но за рубежом ведь не русские термины
- в англоязычном источнике появляется новый термин
- русскоязычные специалисты начинают использовать этот термин, выступают с ним на конференциях, пишут статьи, делают доклады на внутрикорпоративных мероприятиях. На русском. Там они используют какой-нибудь перевод термина.
- через полгода появляется книжка на английском с употреблением термина
- она получает популярность и кто-то принимает решение перевести ее на русский, зовет переводчика
- в этот момент если переводчик умный и хороший — он смотрит, а как русскоязычное сообщество переводит этот термин, есть ли сложившаяся практика. Плохой же переводчик делает вид, что русскоязычного сообщества нет и переводит термин как бог на душу положит. И вот у нас есть еще одна книжка с фиговым переводом. Особенно плохо, если переводчик или редакция не пишут английские термины в скобочках после русских.
Об этом вся статья. Она написана, чтобы привлечь внимание на несоответствия тому, как это понимается за рубежом.
unit testing, data mining, representation learning…
Информатика полна метафор, и data science — еще один такой пример. В основе термина лежит горнодобывающая метафора. Он должен переводится, как добыча полезных ископаемых из данных либо добыча полезных сведений из данных либо добыча закономерностей, как-то так. Но вовсе не как «интеллектуальная обработка данных». А что любая другая обработка разве «НЕинтеллектуальная»)))
Representation learning — ярчайший пример тех дебрей, в которые завело ваше «обучение». На сегодняшний день данный термин на Вики переводится, как «обучения представлениям», тогда как под ним понимается (автоматическое) усвоение представлений данных.
Вопрос, когда смешить мир прекратим? Или прекратим ли вообще?
Сей пассаж «Информатика полна метафор, и data science...»
должен быть заменен на «Информатика полна метафор, и data mining...»
На моем счету более 50 переводов книг по ИТ
Ну что же, это всего лишь означает, что пятьюдесятью корявыми переводами, от которых специалисты плюются, больше.
А по сути изложения будут возражения?
>А по сути изложения будут возражения?
Какие тут еще нужны возражения, если все предложенные варианты — откровенная чушь? Это я вам как переводчик, игрок и тренер со стажем.
Эта статья в очередной раз показывает, что невозможен адекватный перевод с одного языка на другой без отсебятины или изменения смысла. Естественно, никто не может овладеть всеми языками мира и читать все в оригинале, поэтому приходится так или иначе работать с переводами.
Я считаю, что использование литературно-точных терминов вместо простых и общепринятых только ухудшает ситуацию. Абсолютно всем понятно, что такое "машинное обучение" (на мой взгляд, точнее будет "самообучение"), и что такое machine learning, потому что термины устоялись. Кто там что "усваивает" еще нужно догадаться. С потоком та же проблема. Да, stream, flow, thread у нас назваются потоками, но все понимают разницу между stream и thread, поэтому всегда легко понять, какой из "потоков" имеется ввиду. Если нет — добавьте "поток данных", например — обычно в каждой области есть свои общепринятые термины.
Я прекрасно понимаю, что речь идет об официальных перводах в солидных книжках, но если бы я вдруг купил бы книгу на русском и обнаружил бы фразу типа "чтобы выполнить операцию спасения файла, мы порождаем новую нить и используем замковый механизм для преодоления ограничений конкурентности", я бы больше никогда не покупал книги этого издательства/переводчика, и пошел бы читать "to execute the Save File operation, we spawn a new thread and use the lock mechanism to bypass the limitations of the concurrency model".
Хуже всего, если начинающий разработчик начинается таких ультралокализованных и лингвистически-корректных переводов, а потом придет на работу или конференцию и внезапно откроет для себя дивный новый мир заимствований и слэнга.
Добро пожаловать в язык информатики, такой каков он есть на самом деле!
А потом выкидываешь такую книжку, потому что уж проще тогда в оригинале с грубым английским, а не вникать в красивый витиеватый слог ;)
Изобретатели понятий «thread» и «lock», возможно, тоже шли на какие-то компромиссы, пытаясь выразить новую сущность каким-то известным словом. Они взяли эти слова, но был ли их выбор идеальным? Вероятно, нет, так как эти слова ранее обозначали принципиально другие сущности. Висячий замок на двери мало похож на lock в информатике; а хлопчатобумажная нить — на thread оттуда же.
В таком случае русский перевод и не обязан в точности соответствовать оригинальным словам, особенно, если в русском языке значения слов «нить» и «замок» ещё дальше отстоят от thread и lock в информатике. Или если в русском языке найдутся более удачно подобранные слова.
Термин «thread» появился в английском языке не сразу. До него для обозначения того же самого использовались термины «process» и «task». Некоторое время использовался термин «lightweight process». И только, по-моему, в Windows NT впервые появился термин «thread», который и был потом перенят другими операционными системами и стал в конце концов общепринятым.
В русском языке тоже были колебания насчёт перевода. Разные люди предлагали разное. Были дискуссии среди программистов, были статьи, были обсуждения. В конце концов один вариант стал общеупотребительным. Это «поток» для thread, и «блокировка» — для lock. Может, это где-то неидеально, но, по крайней мере: 1) слова русские; 2) хоть чуть-чуть понятны человеку, который слышит их впервые.
В предметной области ведь не только на правила перевода надо ориентироваться, а ещё и на понятность и доступность терминологии для специалистов и обучающихся. А устоявшиеся русские термины прошли отбор и проверку временем.
Понятность и доступность обеспечивается соотнесением 1:1, отсутствие отглагольных существительных, когда требуется именное, единообразием терминологии и Бритвой Оккама (не порождай пустых сущностей)
Нет, я не спорю, пусть таковым будет, но я, читая такое, сразу представляю себе книжку 50-летней давности, что-нибудь в духе "Основы написания инструкций для ЭВМ", либо же продукт современного канцелярита, "загруженный из информационно-коммуникацонной сети Интернет". Ни то, ни другое читать невозможно.
UPD: Я не пытаюсь как-то уязвить вас (или сообщество переводчиков), просто теоретически верное решение на практике может оказаться просто неприменимым.
Вот из-за таких вот "переводов" читать предпочитаю в оригинале, все последние попытки прочитать книгу в русском переводе спотыкались о "замковый механизм, чтобы обойти пределы модели конкурентности" и другие дивные термины и выражения, существующие только в голове "переводчика" :)
Причем хочу заметить, что старые переводы, когда над ними работали профессионалы в IT, а не "эксперты в лингвистике", по моему ощущению были гораздо адекватнее.
Настоящие лингвисты аккуратно относятся к заимствованным словам и адекватно относятся к языковой гибкости.
В основном, когда это возможно, русские названия стараются выбирать созвучными оригинальным (например, профиль для profile и домен для domain), даже когда это созвучное слово кажется бессмысленным в новом контексте. Довольно редко выбирается небуквальный перевод, выражающий общий смысл, как ярлык для shortcut. Зачастую такой перевод оказывается слишком неуклюжим, чтобы закрепиться в живой речи: вспомним обозреватель вместо browser, учётную запись вместо account, или обнаружен узел web вместо website found.(отсюда)
Приложеньице было, безусловно, исключением — не калькой и не канцеляризмом, а живым новым словом; поэтому в «языковую политику» Microsoft оно явно не вписывалось.
фразу типа "чтобы выполнить операцию спасения файла, мы порождаем новую нить и используем замковый механизм для преодоления ограничений конкурентности
Я, пока не прочитал эту фразу на английском, вообще смысла о чем речь не понял
Стандартизация
Вы прескриптивист?
Например, в Большой российской энциклопедии используется машинное обучение, хоть и отдельной статьи, похоже, нет.
ГОСТ преводы ISO и других зарубежных стандартов?
(предыдущее сообщение отправилось дважды)
Но речь-то вообще о терминологии. А это, как говорят в Одессе, две разные вещи)
в основе модели лежит алгоритм усвоения (learning algorithm), aka искатель минимумов (или максимумов) для надлежащим образом сформулированной математической функции.
Машинное обучение — это не задача минимизации известной функции. Если бы это было так, то всё было бы намного проще.
У нас есть обучающая выборка и нам нужно построить функцию, которая минимизирует потери не только на ней, но и на заранее неизвестной тестовой выборке. Минимизация как таковая тут не особо важна, важна генерализация.
не в малой степениа по-русски принято говорить в немалой степени. Такое ощущение, что русский вам близок, но не основной, отсюда и куча этих ваших «озарений» )))
Но для этого нужно знать язык, на который переводишь. Вы его не забыли после тесного общения с зарубежными источниками?
Достижения в области machine learning не в малой степени
должна переводится как «трансферное усвоение»
Может лучше так:
Достижения в области machine learning в немалой степени
должна переводиться как «трансферное усвоение»
В чем проблема, собственно?
Про bias без комментариев. Как грится, на вашу совесть))
А как вы предлагаете переводить термины multithreaded, multithreading?
Многонитевый, многонитевость?
А теперь hyperthreading. Гипернитность?
Опустим что звучит максимально не по-русски, оно искажает смысл: звучит как-будто это поддержка каких-то особых нитей, господи упаси, но они там самые обычные, необычная компоновка процессора. А само название просто придумка, которую, наверное, не стоит переводить буквально.
К слову, вот вопрос: нужно переводить «литературно точно» (я бы сказал в стиле prompt — thread значит нить и контекст не важен), использовать общепринятое название, использовать оригинал покуда это название конкретной технологи или переводить технически точно, но очень отдаленно от оригинальной фразы (виртуальная многоядерность или что-то в этом духе для hyper threading)? И что делать с квантовой механикой, где куча терминов — просто случайные слова, которые выбраны просто потому что и не отражают истинное значение. (Запах, спин. Спин, к слову, вообще принято оставлять спином, хоть русский аналог слова существует).
Я бы использовал общепринятые названия.
Повторяю для особо одарённых. Переводчика, который переводит 1-в-1, надо гнать из профессии.
1-в-1, так как это воcпринимается на языке носителя
Вы для кого переводите? Для носителей языка(английского)? Чтобы им на русском было комфортно читать? Серьезно? Какова вероятность что носитель языка при наличии материала на родном языке будет читать перевод на иностранный? У меня хоть и нет 30 летнего опыта в «переводах» книг, но мне кажется что переводить стоит все-таки именно для тех, кто вероятнее всего будет читать ваши переводы.
А какая у вас цель? Чтобы книгу поняли или чтобы восторжествовала некоторая вселенская справедливость?
А вдруг устоявшийся русскоязычный термин как раз удачнее? А если и не удачнее, то что с того?
Вот, скажем, машинное обучение, которым я занимаюсь. Когда я слышу эту фразу, я вообще не задумываюсь, обучение там или усвоение. Для меня это словосочетание — это термин, единое целое. Я слышу его, и я сразу понимаю, о чём речь. И это понимание было бы абсолютно таким же, если бы устоялся перевод машинное усвоение. Или прикладная статистика (что было бы ещё точнее во многих случаях).
Словосочетанию машинное обучение сто лет в обед. Когда его произносят, все понимают, о чём речь. А если произнесут машинное усвоение, никто ничего не поймёт. А ведь ваша цель как переводчика — чтобы люди поняли! Если вы хотите реформировать русскоязычную терминологию, то не нужно говорить, что Вы переводчик. Переводчики этим не занимаются.
А это именно русскоязычная терминология. Она устоялась. Много лет и даже десятилетий так все говорят. Эти термины есть в словарях и энциклопедиях. Какой ещё Вам нужен стандарт?
Вы, конечно, вправе сказать, что перевод неточный. Ну, может, с Вами согласятся и запомнят как забавный факт. Как, скажем, факт, что ящик Пандоры — это тоже неточный перевод, а надо пифос Пандоры. Но кого это волнует?
Или, скажем, Вы предлагает переводить image не как изображение, а как снимок. Я вот не согласен. Очень часто приходится работать с изображениями, которые снимками не являются и синтезированы, а не сняты.
Ещё раз повторю свой тезис: переводчики переводят, чтобы текст поняли. Даже если им не нравятся слова и сам текст.
В русском языке есть много переводов, которые давно устоялись, но на самом деле они неточные. Например, слово православие — в греческом оригинале речь не о славе, а об учении. Тоже будем менять? На мой взгляд, поздновато.
Вот именно — переводят, чтобы поняли. Добавлю только, чтобы поняли ПРАВИЛЬНО, без искажений.
Наличие в тексте слова image в большинстве случаев связано со снимками: медицинскими, спутниковыми или в базе данных ImageNet. Когда речь идет, скажем, о фотографиях или изображения на выходе из декодировщика, то это будет соответственно фотография и изображение. Однако, слово снимок позволяет излагать материал глаже и значит понятнее, потому что это именное существительное и потому что оно может использоваться как определение.
Уже отмечал выше, проблема с термином МО в том, что он рождает пустые сущности, а значит уводит в сторону. Весь предмет machine learning сфокусирован на САМООБУЧЕНИИ, т.е. автоматическом усвоении закономерностей. У нас же ниоткуда возникает учитель. Это как раз тот случай, когда говорят «как корабль назовешь, так он и поплывет».
Добавлю только, чтобы поняли ПРАВИЛЬНО, без искажений.
А разве изменение устоявшейся терминологии как-то поможет понять более правильно? По-моему, наоборот. Для меня новояз — это и есть искажение.
Если рентген заменить на лучи X физик поморщится, но понимание того, о чём идёт речь, не изменится. В данном случае содержание первично, а форма вторична.
Будь Ваш вариант перевода первым, я бы и слова не сказал. Но вы с терминологией опоздали на несколько десятков нет.
Когда речь идет, скажем, о фотографиях или изображения на выходе из декодировщика, то это будет соответственно фотография и изображение.
А к чему вводить лишние сущности и добавлять избыточную информацию о происхождении? И вообще, это ли хотел сказать автор?
Однако, слово снимок позволяет излагать материал глаже и значит понятнее, потому что это именное существительное и потому что оно может использоваться как определение.
Кому понятнее? Не забывайте, что целевая аудитория ваших переводов — я. Меня непривычная терминология запутает.
Уже отмечал выше, проблема с термином МО в том, что он рождает пустые сущности, а значит уводит в сторону.
Никуда он не уводит. Мы суть понимаем не из термина, а из определения.
Тогда уж и слово машинное надо заменять на компьютерное.
Весь предмет machine learning сфокусирован на САМООБУЧЕНИИ, т.е. автоматическом усвоении закономерностей. У нас же ниоткуда возникает учитель.
И это мы ещё не коснулись обучения с учителем и без учителя (которые supervised и unsupervised). :)
В вашем очаровательном изложении меня коробит конформизм
С каких пор следование традициям перевода — это конформизм?
Перейдите а Вики на represantation learning по русски. Этот термин означат автоматическое усвоение представлений данных
Перешёл. Обучение представлениям. Нормально суть передаёт. Если не впадать в философствование относительно разницы между обучением и усвоением, то выходит то же самое, что и у Вас. Только вы добавили автоматическое и данных, которых не было в оригинале и которые не нужны, так как и без этих слов понятно, что из данных и автоматически.
Смотрите, какая тут ситуация.
Вы говорите, что переводят неправильно. Скажем, есть machine learning, его перевели как машинное обучение, и Вы критикуете этот перевод.
Но это было бы так, если бы в русском языке не было термина. А он есть, и он как смысловая единица однозначно соответствует англоязычному.
То есть, прикрываясь переводом Вы критикуете сам термин. Вот что я хочу сказать. И аргументы Ваши не совсем переводческие. Если убрать из них всё, что относится к переводу, то почти ничего не изменится.
Так давайте называть вещи своими именами. Вам не нравится русскоязычный термин, а перевод тут ни при чём.
Однако, как переводчик вы с термином сделать ничего не сможете. Максимум — оставить переводческий комментарий и изложить свой взгляд.
Это мы еще не касались вопроса, что не все машины — компьютеры. Есть еще башенные краны, например.
модель -> алгоритм -> матфункция
Человек строит модель и собирает данные. Все остальное делает (усваивает закономерности) модель благодаря алгоритму внутри нее, который минимизирует/максимизирует некую величину (если речь о градиентном спуске). Так понятно?
Он создает алгоритм, который передается машине, чтобы та как-то хитро обработала данные.
Программист может изучать как машина обрабатывает эти данные — это процесс изучения того, как машина изучает.
Но это не сам процесс создания программы, это изучение того, почему программы надо делать именно такими.
Так и у людей то же самое! Учитель тренирует ученика, у которого в мозгу заложены биологические алгоритмы усвоения закономерностей.
А разве усвоение это не успешный результат обучения? Вы хотите заменить процесс его результатом?
Уважаемый, ну вам каждый второй разными словами пытается донести, что стандартизация давно есть. Термины в индустрии устоялись, они общеприняты и всем понятны. Даже если в русскоязычной среде общепринятым термином для machine learning было "угабугабанга" — то вам пришлось бы переводить его именно таким образом. Если вы из личных представлений о прекрасном будете переводить устоявшиеся термины какими-то самостоятельно изобретенными словами или словосочетаниями — сообщество ваших переводов понимать не будет, книжки продаваться будут плохо, карма будет падать.
Взять пример с thread. В зарубежной технической литературе данное понятие объясняется именно на нитях, которые рассматриваются как основные инфраструктурные единицы планирования в операционных системах. Продолжим логический ряд – там где нити, там и клубок. А где клубок, там и кот. Сразу видно, что первых переводчиков не было котов, т.е. глобального информационного ресурса (оно и понятно, т.к. в 70-80-х годах Интернет только зарождался). Так и возникла путаница. Тем более что существуют другие потоки под терминами stream и flow. И не надо думать, что вам сойдет с рук, когда в следующий раз придется разбираться в свежем англоязычном блог-посте, затрагивающем обработку стандартных потоков ввода-вывода (I/O stream) или анализ потока управления (control flow) в «многопоточной» (multi-threaded) программе (если исходить из принятого искаженного перевода). От сентенций типа «threads allow multiple streams of program control flow to coexist within a process» у вас пойдет голова кругом, и даже Google-переводчик не поможет, т. к. он выдаст вам нечто вроде «потоки позволяют нескольким потокам потока управления программой сосуществовать в процессе». Кстати, яркий пример словоблудия ИИ-переводчика).
Ну так вот же вы сами приводите вполне понятные и устоявшиеся переводы всего этого — поток управления, поток ввода-вывода, многопоточный. Как добавление новой сущности типа "нитей" в эти конструкции повысит понимаемость перевода?
Извините, если мой предыдущий коммент показался агрессивным, я этого не хотел.
Вы не обратили внимание на кавычки. Считаю принятые варианты близорукими. Они занимают места других терминов и поэтому вносят путаницу. Если вся терминология информатики идет с Запада, то следует ее использовать как есть. ИМХО. Это к тому же лучше сказывается на понятный взаимообмен и повышает конкурентноспособность нашего образования.
Ну вот я ровно про то же самое же :) неважно, какое сочетание букв на нашем конце перевода, важно то, насколько в рамках знания большинства русскоязычного сообщества это сочетание букв однозначно описывает то или иное понятие. Треды, потоки, нити, одно слово с нашей стороны или несколько — это неважно. Важно чтоб максимальное количество людей не ломало мозг, пытаясь понять, какой изначальный термин стоит за переводом. В этом смысле попытка введения новой сущности мне кажется не самым продуктивным подходом.
А вообще, конечно, в моём мире розовых пони и радуг человечество давно уже должно перейти на общий язык и высвободить кучу ресурсов на более классные вещи, чем такие заморочки, как в этом треде :) Пис энд лав :)
А уж «машинное усвоение» — это, ИМХО, что-то про питание терминаторов чипсами.
Может быть не надо заменять вполне понятный более-менее узкоспециализированный термин более широким?
Вы зачем-то пытаетесь назвать то, чем занимается программист (обучение машины) тем, что происходит с самим компьютером («усвоение» чего-то). Хотя это вообще две противоположных стороны.
Да и программист не программирует вовсе, а занимается исполнением программы, правильно? Ведь в компьютере происходит исполнение программы, а не какое-то там программирование
Вы не понимаете, что «будет что-то делать» — это не то же самое, что «она там изучает»?
Тогда это не ML, это «Оператор ЭВМ»
Вообще в МУ есть целый ряд ролей. Например, исследователь данных (data scientist) ‐ это человек, в центре внимания которого находится сбор, интерпретирование и обработка наборов данных. Он проводит статистический и разведывательный анализ данных. Применительно к машинному усвоению, исследователь данных может работать над сбором данных, генерированием признаков, строительством моделей и т. д. Исследователи данных часто работают на Python или R в среде блокнотов, и в организации они обычно являются первыми, кто возводят модели машинного усвоения.
Я пытаюсь отстоять МУ)) (по секрету ;-))
Человек совершает какие-то действия, которые приводят к «усвоению» чего-то машиной.
Равно как и школьный учитель, профессор в вузе или директор школы занимаются обучением школьников или студентов.
А то вы в одном месте хотите все называть одним термином, в другом говорите о различиях.
Но вы же переводите книжки не про то, как загрузить готовые данные в готовый блокнот, верно?
Представил как машина охотится на другие машины, поглащает их и затем усваивает:) Такой машинный канибализм.
Тогда уже "машинное усвоение информации". Немного длиннее, но понятно о чем речь.
Давайте тогда придираться к чересстрочной разверстке как к продразверстке)))
А какая связь? Развёртка и развёрстка — разные слова.
Взять то же обучение. Даже если сократить понятийную область до сферы научения чему-либо, всё равно окажется, что усвоение — исключительно самостоятельный, внутренний процесс. При этом, опять же, как ни странно, в этом значении, усвоение похоже на пищеварение — т.е. на преобразование в какую-то пользу. Машина же в рамках mashine learning не самостоятельна. У неё есть учитель. Именно поэтому в русском языке получилось обучение. А train в смысле тренировки у нас употребляют чаще в области спорта, где речь идёт про наработку механических навыков, что изрядно противоречит интеллектуальному обучению.
Насколько мне известно, переводчики в поисках правильного перевода обычно ищут в культурном контексте целевого языка что-то наиболее семантически близкое к оригиналу. И тут очень часто точный перевод оригинального термина оказывается семантически некорректен в целевом языке.
Особенно сильно это заметно в литературных переводах. Но не надо думать, что технические тексты свободны от этих проблем.
Ваш замечательный комментарий является яркой демонстрацией того, что в психологии называется рационализацией, т.е. объяснением причин, почему следует соблюдать статус-кво, даже если он ложен.
Обучение не требует учителя (хоть в русском для такого метода есть «самообучение»). Усвоение не требует одиночества (если на него идёт упор в «самостоятельный»). В контексте статьи «усвоение» ближе, чем «обучение». Но даже и в его точности уверенности, лично у меня, нет. Но и это спорно, т.к. в начале надо определиться с тем, что мы хотим получить от процесса обучения/усвоения на выходе и что мы видим результатом ML.
В одном из комментариев вы пишете, что хотите убедить в необходимости стандартов и привлечь на свою сторону. Допустим, вы объединились с переводчиками и разработчиками ПО, и создали институт стандартизации переводов, а дальше, ввели термины, такие как "машинное усвоение" и т.д. в новые переводы книг. Представьте, я покупаю книгу "Машинное усвоение", а там нити, блоки, тренировка. Мне тяжело и непривычно её читать, поэтому я делаю возврат в течение 14 дней. Поэтому вам не удается меня привлечь, даже если я понимаю вас и иду навстречу. Переход на новые термины должен идти не от институтов стандартов или из книг, а от людей в компаниях, потому что язык формируется в коммуникации, его нельзя сформировать указом сверху.
А разве не это же мы все пытаемся до Вас донести? :) Пока что статья выглядит, извините, как «все шагают не в ногу, а один я в ногу». Может даже все неправы.
Вот вы же переводчик, значит изучали языкознание в вузе. Помните, сколько в языке нерегулярностей? А сколько буквализмов или просто неправильных, но устоявшихся переводов?
Я про так называемое «обучение признакам» в вики. Вообще отстой. Яркий пример последствия неправильного понимания термина ML.
Термин правильно звучит так: (автоматическое) усвоение представлений данных. А его определение так: методика, которая позволяет системе автоматически обнаруживать представления, необходимые для выявления признаков или классифицирования из сырых данных». НО определяемое «обучение признакам» не имеет никакого отношения к телу определения!!!
Я выдал пост с аргументацией. И если кому-то он запал в душу, то я со своей задачей справился.
Если в этой энциклопедии будут "усвоение", "замки" и прочее — то авторитетные организации потеряют часть своего авторитета. И более никаких изменений не случится.
А говорили, что не прескриптивист… А какие организации будут авторитетными, кстати?
А что если специалисты скажут, что нужно переводить как машинное обучение? Смиритесь?
«автоматическое усвоение данных, представленных в виде строковых, числовых, категориальных переменных и пр. В виде числового массива, векторного вложения, матрицы»
И это лучше, чем «обучение признакам»
Но ведь еще в 60-е годы были устройства для чтения перфокарт, которое позволяло компьютеру автоматически усваивать (получать) данные, представленные в виде строки цифр.
Это что же получается, по такому определению, они там тоже машинлернингом занимались?
Если от термина «обучение», действительно, есть какой-то вред, а с «усвоением» отечественное ИТ попрет, как на дрожжах, то язык — штука достаточно гибкая, чтобы измениться в нужную сторону.
Используйте в переводе «усвоение» и посмотрите потом на проданный тираж, рецензии и на комментарии на рутрекере по поводу перевода.
Повторяю термин правильно звучит так "(автоматическое) усвоение представлений данных".
А что такое правильно в Вашем понимании?
на текущий момент времени. Языка, на который осуществляется перевод, а не языка оригинала (разумеется!). Если бы на русском 50% говорило «машинное обучение», 25% говорило «машинное усвоение», а оставшиеся 25% говорило бы «обучение компьютеров», то все бы три варианта были бы правильные. Правильные на текущий момент. И дискуссия имела бы хоть какой-то смысл. Сейчас она смысла не имеет. Тут я почему-то вспоминаю про мужской род кофе.
Кстати, было бы здорово спросить мнение любого билингва знакомого с машинным обучением, что он думает по поводу «машинного усвоения».
На хабре билингвы есть.
PS. Извините, но кажется вы сделали себе жуткую антирекламу. Мне стало интересно, я загуглил «машинное усвоение» и нашел ваше имя. Посмотрел книги, которые вы переводили. И хоть называются они прилично, без всяких «усвоений», но из-за этой статьи я уже никогда не куплю книги с вашим переводом, потому что мне будет страшно, не появится ли там какой-нибудь другой ужас «правильного и точного» перевода. И даже на книги издательств, с которыми вы сотрудничаете, тоже буду смотреть с небольшим опасением.
«Обучить нейросеть распознаванию лиц на фото»
Как тогда правильно должна звучать эта фраза на русском, с правильным переводом?
Например, нередко можно услышать, что специалисты...
Сейчас бы сказали " нередко можно услышать то, что специалисты… "
Спасибо за статью
Кажется такому переводчику, что MLaaS надо переводить как «Машинное усвоение как служба» — он возьмет и переведет! И обоснует! При этом его совершенно не будет интересовать, что русскоязычные программисты на всех конференциях, в разговорах и статьях говорят «Машинное обучение как сервис».
Я, если что, имею 30-летний опыт в информатике. Слушал лекции в МГУ по ИИ еще в тот год, когда в Москву приезжал президент Р.Рейган, а сервисы были только в гостиницах))
Повторяю свой тезис, если вы не поняли: ML имеет неправильное название, которое вводит в заблуждение. Англоговорящий, говоря service, на всем протяжении имеет в виду одно и тоже и не переключается на каком то этапе со службы на сервис.
О machine learning: никто машину не обучает