Comments 9
Спасибо за перевод, это большая и полезная работа. Да я знаю английский в достаточной степени чтобы читать в оригинале, но очень неудобно переключать раскладку или транслитить когда общаешься на тему машинного обучения. Подобные переводы формируют устоявшийся словарь терминов в данной области, машинное обучение пока имеет очень скудный словарик: один из экземпляров здесь и всегда интересно, как другие называют по-русски те или иные термины.
Может сделать специальный раздел по терминам?
Да и просто приятнее читать на родном языке.
Может сделать специальный раздел по терминам?
Да и просто приятнее читать на родном языке.
+3
Вопрос с терминами очень не прост. С одной стороны, термины переводить надо, иначе родной язык становится беднее. Это проблема всех языков (кроме английского). В разных странах к ней подходят по разному. На сколько я знаю, в корейском, например, заимствуют термины (просто транслитерируют), во Франции, наоборот, есть чуть-ли не требование, переводить терминологию на французский.
С другой стороны, многообразие переводов терминов может запутать, может мешать эффективно общаться на профессиональные темы. Приведу пример из области обработки изображений: co-occurrence matrix. В книге Т.Павлидиса «Алгоритмы машинной графики и обработки изображений» (М.: Радио и связь, 1986): матрица совместной встречаемости. В книге У.Прэтта «Цифровая обработка изображений», (М.: Мир, 1982): гистограмма второго порядка. У Л. Шапиро и Дж. Стокмана “Компьютерное зрение” (М.: БИНОМ, 2006): матрица вхождений. И это все книги, даже не статьи или сайты. Причем первые две книги изданы ещё в СССР, где переводу терминов уделялось большое внимание.
С другой стороны, многообразие переводов терминов может запутать, может мешать эффективно общаться на профессиональные темы. Приведу пример из области обработки изображений: co-occurrence matrix. В книге Т.Павлидиса «Алгоритмы машинной графики и обработки изображений» (М.: Радио и связь, 1986): матрица совместной встречаемости. В книге У.Прэтта «Цифровая обработка изображений», (М.: Мир, 1982): гистограмма второго порядка. У Л. Шапиро и Дж. Стокмана “Компьютерное зрение” (М.: БИНОМ, 2006): матрица вхождений. И это все книги, даже не статьи или сайты. Причем первые две книги изданы ещё в СССР, где переводу терминов уделялось большое внимание.
+1
Переведенные термины важны даже не столько для тех кто уже «в теме», им то как раз не особо актуально, так как область очень динамично развивается и просто перевод часто занимает столько времени, что тема может уже уйти с переднего края, да и сами понятия у них уже сформированы.
А вот новичкам получается очень высокий порог вхождения, так как сами термины даны в терминах других областей (мат. статистика, мат. анализ, лин. алгебра, тензорное исчисление,… ), в которых людям еще нужно сопоставить то что они изучали в университете на русском языке, с тем что написано на английском.
Есть еще одно предложение, может использовать средства совместного перевода? Ну что то типа этого, для одного работа очень большая.
А вот новичкам получается очень высокий порог вхождения, так как сами термины даны в терминах других областей (мат. статистика, мат. анализ, лин. алгебра, тензорное исчисление,… ), в которых людям еще нужно сопоставить то что они изучали в университете на русском языке, с тем что написано на английском.
Есть еще одно предложение, может использовать средства совместного перевода? Ну что то типа этого, для одного работа очень большая.
+1
Spasibo za perevod.
+2
Спасибо!
По поводу development set. Вы сами пишете, что он для настройки, поэтому разумно называть его настроечной выборкой, я встречал такой термин в русскоязычной литературе.
И еще, не ради придирок, а чтобы улучшить результат — есть несколько бросающихся в глаза опечаток. Должно быть «распознАвание», «насколько (слитно!!!) хорошо».
По поводу development set. Вы сами пишете, что он для настройки, поэтому разумно называть его настроечной выборкой, я встречал такой термин в русскоязычной литературе.
И еще, не ради придирок, а чтобы улучшить результат — есть несколько бросающихся в глаза опечаток. Должно быть «распознАвание», «насколько (слитно!!!) хорошо».
+1
Спасибо! Опечатки исправил. Про «настроечную выборку» добавил.
0
А зачем?) В конечном итоге, кто станет заниматься машинным обучением так и будет говорить: train set(«на/в трейне»), test set(«на/и тесте»), validation(«в/на валидации»), «кросс-валидации», «кей-фолд» и т.д.
Уверен, что это не тот случай, когда необходимо поддерживать идеологически-верное произношение на Великом и Могучем.
Уверен, что это не тот случай, когда необходимо поддерживать идеологически-верное произношение на Великом и Могучем.
0
Для тех кто только начал, будет сложно. Во многих областях знаний есть нормальная русская терминология, иначе можно получить что то типа: (для машиностроения, чтобы понятно было как новичок это видит) «Приаттачим этот пайп фленжем согласно дровингу ассембла при помощи скревов диаметром 3 и натов. Смазав все предварительно ойлом и незабыв установить силинги». Причем транслитерация будет у всех своя.
+1
А зачем? В конечном итоге, кто станет заниматься машинным обучением так и будет говорить: train set(«на/в трейне»)Это крайне дискуссионный «вечный» вопрос.
Вспомним «Евгения Онегина»:
Но панталоны, фрак, жилет,
Всех этих слов на русском нет;
А вижу я, винюсь пред вами,
Что уж и так мой бедный слог
Пестреть гораздо б меньше мог
Иноплеменными словами,
Хоть и заглядывал я встарь
В Академический Словарь.
Для себя лично я решил, что поскольку текст размещается на русскоязычном ресурсе, и это письменная речь, а не устная, то термины должны быть переведены. А в случае возможности неоднозначного толкования термина, рядом пишется англоязычный термин из исходного текста.
0
Sign up to leave a comment.
Articles
Change theme settings
Черновик книги Эндрю Ына «Жажда машинного обучения», главы 1-7