Комментарии 41
Понятно, что вы имеете ввиду, но это понятно не из термина, а из длинных пространных объяснений, которые всё равно не стыкуются с этимологией слова «усвоение».
В статье приведено несколько трактовок с подробными разъяснениями и все они относятся так или иначе к искусственному интеллекту и, особенно, про способность машины научиться лучше понимать/анализировать данные после некоего обучения.
Ок, часть процесса — это как раз усвоение данных. Но это только часть обучения.
Возьмите аналог со школой. В процессе обучения математике ученики усваивают, например, таблицу умножения, правила математических операций и т.д. Но то, что усваивается — это данность. 2+2=4, а 2*4=8. Но даст ли усвоение этих знаний ответ на вопрос «сколько будет дважды два четыре?» Даст ли ответ про то, что можно складывать функции? И т.д.
Иначе говоря, всё же, обучение значительно шире по возможностям и ближе к тому, чем всё-таки занимаются в рамках machine learning.
Да даже в самом узком применении, в распознавании образов, помимо усвоение имеющейся информации, надо где-то как-то научить машину анализировать и делать выводы.
1) предобработка данных,
2) генерирование понятных для модели признаков,
3) тренировка модели с гиперпараметрической настройкой
4) валидация модели
5) оценивание модели,
6) продукционализация модели
7) обслуживание запросов со стороны пользователей и других приложений на получение модельных предсказаний.
Пункты 1-6 подпадают под то, что у них называется «обеспечением машины способность усваивать знания». При этом на этапе 3 модель уже начинает делать то, что она должна делать — усваивать неуловимые человеком закономерности.
В пункте 5 человек принимает решение о результативности работы модели. И если все устраивает, то продолжает работу по «обеспечению», внедряя ее в производство.
Как видно, человек не обучает модель — наоборот, модель учится сама. Человек — поставщик и организатор.
НАСТОЯЩИЙ термин пошел не из России— чтобы оставить настоящий придётся его не переводить. И, можно сказать, примерно так и происходит. Никто не пытается разгадать смысл этих слов, а просто использую как готовый термин.
акцент на приобретении знаний, а не на их передачеа вот я, скажем, когда учась играть на пианино, усваиваю, учусь или обучаюсь? Я могу усвоить нотную грамоту, но игре придётся учиться. И да, вот прямо непосредственно мне никто ничего не передаёт. Но взявши в руки самоучитель я уже обучаюсь.
И ещё, ваш перечень сильно напоминает модель школьно-вузовского обучение. Ведь кто-то пишет учебники, кто-то готовит учебные планы, кто-то оценивает прогресс знаний, полученных в рамках обучения, чтобы потом подправить учебную модель или адаптировать под изменения.
И, на всякий. Я не говорю, что ваша позиция в части прояснения сути термина плоха. Я лишь говорю, что пока из коротких терминов (которые мне известны) машинное обучение всё же ближе к смыслу в семантике русского языка. И чем более подробно вы описываете суть термина, тем эта близость сильнее.
Сначала вот рисунок, показывающий аналогию, но не соответствие:
Но всё же обучение ближе к сути, чем усвоение.
Такое понимание еще важно с точки зрения, откуда все пошло:
усвоение знаний как явление -> усвоение знаний человеком/животным/машиной.
Зря вы настаиваете на усвоении — это сильно другая вещь, чем изучение. Усвоение не предполагает возможности делать новые выводы.
Не, я конечно не переводчик. Я всего лишь более 20 лет читаю техническую литературу на английском и многое изучаю сначала в изложении на языке оригинала, а уж потом приходят русскоязычные адаптации. И вот как-то привык, что приживаются семантические более близкие термины или те, которые успели прижиться. При этом первые часто сменяют вторые, а вот иезуитски точные переводы не приживаются.
И чаще всего никто не пытается точно перевести термин именно из-за разницы семантики и культурного контекста. Просто специалисты знают что это, а для объяснения использую от пары фраз до пары книг. А не специалист всё равно по переводу не поймёт сути.
Я тут недавно искал книгу старую в инете и набрел на книгу 2010 года
Learning from Data (Усвоение закономерностей из данных). Так вот ее русское название было «Изучая данные». Вы зря полагаетесь на качество перевода. Learning from Data — это терминологическое выражение, и переводчик ничтоже сумняшеся родил то, что родил. В 1й статье я писал, что у нас нет стандартов, и каждый на свой лад. Вот так и получилось с «обучением», так же как и «блокировкой» и прочей хренью.
human learning = усвоение знаний человеком
animal learning = усвоение знаний животным
…
machine learning = усвоение знаний машиной
Также найдете почти в любом педагогическом тексте
www.kp.ru/guide/usvoenie-znanii-uchashchimisja-pri-udalennom-obuchenii.html
pedagogic.ru/pedenc/item/f00/s02/e0002510/index.shtml
Также можно выяснить косвенно через термин Теории усвоения знаний
vikent.ru/enc/6380
Learning Theory
en.wikipedia.org/wiki/Learning_theory_(education)
Итого:
Мультитран — упоминается такой перевод ровно один раз и далеко не на первом месте. "обучение (животного); учение; учёность; эрудиция; изучение; познания; выработка условного рефлекса; создание новых навыков направленным тренажом;"
В педагогике — да, часто употребляют термины "освоение" и "усвоение", как часть учебного процессе. Напрямую эти термины нельзя однозначно соотнести с "learning".
Вики — "Learning theory describes how students receive, process, and retain knowledge during learning.", вообще больше теорию изучения. Я понимаю, есть соблазн выдрать отсюда receive и превратить его в усвоение, но тоже получится искаженение.
Вывод: не убедительно.
Я вам привел в качестве подтверждения переводную статью, в которой даются цитаты лидеров, взять того же Бенжио.
Возьмите любой англо-английский словарь и проверьте сами. Вот кембриджский словарь английского:
the activity of obtaining knowledge = деательность по приобретению знаний
dictionary.cambridge.org/ru/%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8C/%D0%B0%D0%BD%D0%B3%D0%BB%D0%B8%D0%B9%D1%81%D0%BA%D0%B8%D0%B9/learning
learning = the activity of obtaining knowledge
усвоение знаний = деятельность по приобретению знаний
www.personalitydevelopment.org/levels-of-human-learning.html
Тут частная трактовка в частном мнении автора статьи.
Как ни крути — нет простого однозначного перевода, потому как "learning" может переводится в разные фразы в зависимости от контекста, и даже в рамках одной области знания семантически верный перевод может отличаться в зависимости от того, на что сделан акцент в автора текста.
Я подозреваю, что даже на родине термина у него есть несколько трактовок...
Да, именно из-за направленности действия всё сложно. Ближе всего к learning — изучение.
Но машина не самостоятельная в этом процессе. А machine learning и вовсе про то, как научить машину получать знания.
А про разные трактовки я имел ввиду, к примеру, то, что этот термин используется в диапазоне от построения сильного ИИ, где речь идёт именно про знания, до систем распознавания, где речь идёт о тренировке навыка, никак не связанного со знаниями.
И даже в рамках самого словосочетания machine learning — это и процесс получения знаний машиной, так и термин, суть которого даже одной фразой сложно описать.
Ещё раз. Поймите. Я понимаю, почему вы топите за "усвоение". Я же говорю про то, почему оно в таком виде не приживается в русском языке.
В рамках правильной трактовки все легко понять вот к примеру, graph representation learning (aka graph feature learning) — это всего лишь автоматическое усвоение графового представления данных. Но если вы перейдете в вики по «feature learning», то увидите в русском сегменте результат неправильного понимания.
Напомню на всякий случай, что автоматическое усвоение признаков/представлений существует как антитеза инженерии признаков (aka генерированию признаков) в ручную.
Термин «усвоение (знаний)» уже давно существует в психологии, когнитивистике и педагогике, как минимум. В основе ИИ лежат первые две.
Да в том то и дело, что не плывёт усвоение. Ну не трактуется этот термин столь узко.
Даже просто по смыслу извлечение знаний и усвоение знаний сильно разные вещи.
Термин «усвоение знаний» (learning) считается родовым понятием в указанных выше науках, а также в ML за рубежом, читай, во всем мире.
В отечественном ML мы имеет тот случай, который наблюдается в отечественной статистике. Во всем мире говорят «интервал уверенности», т.к. везде речь идет об уверенности аналитика в полученных данных, тогда как у нас вводится термин «доверие» и переводится как «доверительный интервал». За рубежом, говоря variance и covariance, имеют в виду вариативность и совариативность, у нас же эти парные термины разорваны и переводятся как «дисперсия» и «ковариация». Уже молчу про понятие «стат. критерий» для test statistic, в котором вообще все с ног на голову поставлено, тогда как речь всего-то о проверочной статистической величине в рамках проверки стат. гипотез.
Зарубежная терминология имеет более строгий и логически упорядоченный вид, в отличие от нашей.
Да оно и понятно, про "более строгий и логически упорядоченный вид" - так почти всегда бывает в языке оригинала. Но при этом, почти всегда, не получается однозначного и точного перевода.
Термин «усвоение знаний»
Этот термин ввели вы. А вот learning используется везде, согласен. Я согласен, что "обучение" - не очень верный перевод. Но и усвоение не точный.
Тема действительно интересная. На мой скромный взгляд практикующего DS, оба термина, и обучение и усвоение не очень удачны. Обучение, потому что процесс больше похож на тренировку. Почти всегда в коде есть модуль «train» и также называется часть данных, которая используется в этом процессе.
Термин «усвоение» мне непривычен, но проблема не только в нём. Проблема — в знаниях, которые машина должна усваивать. Мне всегда казалось, что знания должны быть как-то связаны с индивидом, с отражением действительности в сознании, которым пока машины не обладают. На мой взгляд то, что приобретает машина на данном уровне развития технологий больше похоже на интуицию.
Пожалуй «усвоение» еще как-то выключает меня из процесса (а это обидно). Да, есть такие системы, где роль исследователя данных минимальна, но в основном, это я подбираю для машины кейсы, я оцениваю как и сколько она учится, я слежу за качеством модели и иногда за предвзятостью, и да, это я подкручиваю гиперпараметры.
Интересно, что термин «знания» в оригинальной статье упоминается только два раза, в определении Dr. Yoshua Bengio. И там не очень понятно, это относится к ML или AI.
Но модель в силу алгоритма усвоения внутри нее улавливает неразличимые для человека сведения уже сама.
При таком раскладе, то, что делает человек называется «обеспечением машины способностью усваивать знания и действовать так же, как люди, и совершенствовать свое усвоение знаний с течением времени автономным образом». Иными словами, человек поставляет на вход модели данные, а все остальное в пределе делает модель.
Таким образом, человек не выступает учителем никоим образом.
Но модель в силу алгоритма усвоения внутри нее улавливает неразличимые для человека сведения уже сама.
Это только часть моделей. А для другой части нужно разметить данные, т.е. «показать» алгоритму, что правильно, что нет, что искать на изображении, каким должно быть удачное «саммари» для текста. Процесс разметки данных или подготовки правильных ответов может занимать 99% времени проекта.
Возможно Вам будет интересно, среди моих коллег термин модель применяется только к обученной модели, ну или по вашему, модели, усвоившей знания. Пока процесс не завершен, это, например, машина или алгоритм и никакой ценности она не представляет, какой бы сложной не была её архитектура.
Я использую векторное вложение (слов, предложений, текста, фотоснимков). Мне кажется, сексизм тут не к месту.))
Что такое machine learning?