Как стать автором
Обновить

Комментарии 41

«Как вы оцениваете материал в настоящем посте»… Настоящем, Карл? Вы бы еще написали «в данном», что совсем прослыть канцелярской крысой… «В этом посте», Карл, «в этом». Ну и материальчик тоже ни о чем.
Уж извините, но не лезет это «усвоение» никак.
Понятно, что вы имеете ввиду, но это понятно не из термина, а из длинных пространных объяснений, которые всё равно не стыкуются с этимологией слова «усвоение».
В статье приведено несколько трактовок с подробными разъяснениями и все они относятся так или иначе к искусственному интеллекту и, особенно, про способность машины научиться лучше понимать/анализировать данные после некоего обучения.
Ок, часть процесса — это как раз усвоение данных. Но это только часть обучения.
Возьмите аналог со школой. В процессе обучения математике ученики усваивают, например, таблицу умножения, правила математических операций и т.д. Но то, что усваивается — это данность. 2+2=4, а 2*4=8. Но даст ли усвоение этих знаний ответ на вопрос «сколько будет дважды два четыре?» Даст ли ответ про то, что можно складывать функции? И т.д.
Иначе говоря, всё же, обучение значительно шире по возможностям и ближе к тому, чем всё-таки занимаются в рамках machine learning.
Да даже в самом узком применении, в распознавании образов, помимо усвоение имеющейся информации, надо где-то как-то научить машину анализировать и делать выводы.
Однако, при все при этом, НАСТОЯЩИЙ термин пошел не из России и содержит в своем составе именно слово learning. делая акцент на приобретении знаний, а не на их передаче. И в зарубежной литературе по этой теме НЕТ понятия учитель!
Рабочий поток состоит из следующих процессов:
1) предобработка данных,
2) генерирование понятных для модели признаков,
3) тренировка модели с гиперпараметрической настройкой
4) валидация модели
5) оценивание модели,
6) продукционализация модели
7) обслуживание запросов со стороны пользователей и других приложений на получение модельных предсказаний.

Пункты 1-6 подпадают под то, что у них называется «обеспечением машины способность усваивать знания». При этом на этапе 3 модель уже начинает делать то, что она должна делать — усваивать неуловимые человеком закономерности.

В пункте 5 человек принимает решение о результативности работы модели. И если все устраивает, то продолжает работу по «обеспечению», внедряя ее в производство.

Как видно, человек не обучает модель — наоборот, модель учится сама. Человек — поставщик и организатор.
Кстати, есть еще и пункт 8) перетренировка модели, в случае дрейфа данных или концепции модели.
НАСТОЯЩИЙ термин пошел не из России
— чтобы оставить настоящий придётся его не переводить. И, можно сказать, примерно так и происходит. Никто не пытается разгадать смысл этих слов, а просто использую как готовый термин.

акцент на приобретении знаний, а не на их передаче
а вот я, скажем, когда учась играть на пианино, усваиваю, учусь или обучаюсь? Я могу усвоить нотную грамоту, но игре придётся учиться. И да, вот прямо непосредственно мне никто ничего не передаёт. Но взявши в руки самоучитель я уже обучаюсь.

И ещё, ваш перечень сильно напоминает модель школьно-вузовского обучение. Ведь кто-то пишет учебники, кто-то готовит учебные планы, кто-то оценивает прогресс знаний, полученных в рамках обучения, чтобы потом подправить учебную модель или адаптировать под изменения.

И, на всякий. Я не говорю, что ваша позиция в части прояснения сути термина плоха. Я лишь говорю, что пока из коротких терминов (которые мне известны) машинное обучение всё же ближе к смыслу в семантике русского языка. И чем более подробно вы описываете суть термина, тем эта близость сильнее.
Мне кажется, не стоит переносит антропоморфные признаки на вычислительную модель.
Сначала вот рисунок, показывающий аналогию, но не соответствие:
image
Ежу понятно, что не соответствует, хотя есть аналогия.
Но всё же обучение ближе к сути, чем усвоение.
Я в выводе статьи добавил описание, что никто никого не обучает. Человек — поставщик, наладчик и организатор. Вот и все его роли. Усвоением закономерностей занимается ядро модели — ее алгоритм усвоения знаний.

Такое понимание еще важно с точки зрения, откуда все пошло:
усвоение знаний как явление -> усвоение знаний человеком/животным/машиной.
Дык ведь и учитель ученику не прямо в мозг знания закладывает, а лишь способствует процессу обучения.
Зря вы настаиваете на усвоении — это сильно другая вещь, чем изучение. Усвоение не предполагает возможности делать новые выводы.
Вы забыли, что излагаю парадигму, принятую во всем мире. И только на Русской равнине все катится куда-то неизвестно куда)))
Да где и кто в мире называет это усвоением?

Не, я конечно не переводчик. Я всего лишь более 20 лет читаю техническую литературу на английском и многое изучаю сначала в изложении на языке оригинала, а уж потом приходят русскоязычные адаптации. И вот как-то привык, что приживаются семантические более близкие термины или те, которые успели прижиться. При этом первые часто сменяют вторые, а вот иезуитски точные переводы не приживаются.

И чаще всего никто не пытается точно перевести термин именно из-за разницы семантики и культурного контекста. Просто специалисты знают что это, а для объяснения использую от пары фраз до пары книг. А не специалист всё равно по переводу не поймёт сути.
learning = усвоение знаний, приобретение знаний

Я тут недавно искал книгу старую в инете и набрел на книгу 2010 года
Learning from Data (Усвоение закономерностей из данных). Так вот ее русское название было «Изучая данные». Вы зря полагаетесь на качество перевода. Learning from Data — это терминологическое выражение, и переводчик ничтоже сумняшеся родил то, что родил. В 1й статье я писал, что у нас нет стандартов, и каждый на свой лад. Вот так и получилось с «обучением», так же как и «блокировкой» и прочей хренью.
Learning Theory = теория усвоения знаний
human learning = усвоение знаний человеком
animal learning = усвоение знаний животным

machine learning = усвоение знаний машиной
а можете поделиться сведениями, где, в каких словарях такой перевод считается правильным и основным?
www.multitran.com/m.exe?l1=1&l2=2&s=learning&langlist=2

Также найдете почти в любом педагогическом тексте
www.kp.ru/guide/usvoenie-znanii-uchashchimisja-pri-udalennom-obuchenii.html
pedagogic.ru/pedenc/item/f00/s02/e0002510/index.shtml

Также можно выяснить косвенно через термин Теории усвоения знаний
vikent.ru/enc/6380
Learning Theory
en.wikipedia.org/wiki/Learning_theory_(education)

Итого:
Мультитран — упоминается такой перевод ровно один раз и далеко не на первом месте. "обучение (животного); учение; учёность; эрудиция; изучение; познания; выработка условного рефлекса; создание новых навыков направленным тренажом;"
В педагогике — да, часто употребляют термины "освоение" и "усвоение", как часть учебного процессе. Напрямую эти термины нельзя однозначно соотнести с "learning".
Вики — "Learning theory describes how students receive, process, and retain knowledge during learning.", вообще больше теорию изучения. Я понимаю, есть соблазн выдрать отсюда receive и превратить его в усвоение, но тоже получится искаженение.


Вывод: не убедительно.

Вы поймите, никаких соблазнов, никакого подвоха, никакого хайпа. Точка.

Я вам привел в качестве подтверждения переводную статью, в которой даются цитаты лидеров, взять того же Бенжио.

Возьмите любой англо-английский словарь и проверьте сами. Вот кембриджский словарь английского:
the activity of obtaining knowledge = деательность по приобретению знаний
Но самый главный источник — это англо-английские словари.
dictionary.cambridge.org/ru/%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8C/%D0%B0%D0%BD%D0%B3%D0%BB%D0%B8%D0%B9%D1%81%D0%BA%D0%B8%D0%B9/learning

learning = the activity of obtaining knowledge
усвоение знаний = деятельность по приобретению знаний

А мне как-то ближе и понятнее
"изучение = деятельность по приобретению знаний"

Тут частная трактовка в частном мнении автора статьи.


Как ни крути — нет простого однозначного перевода, потому как "learning" может переводится в разные фразы в зависимости от контекста, и даже в рамках одной области знания семантически верный перевод может отличаться в зависимости от того, на что сделан акцент в автора текста.
Я подозреваю, что даже на родине термина у него есть несколько трактовок...

«Подозреваю — не подозреваю» — это не метод. Общая направленность английского глагола learn всегда остается одной — направленность действия на себя, соответственно русский перевод будет варьироваться, но всегда будет обозначать примерно одно и то же: учить, изучать, усваивать, зубрить, заучивать,…

Да, именно из-за направленности действия всё сложно. Ближе всего к learning — изучение.
Но машина не самостоятельная в этом процессе. А machine learning и вовсе про то, как научить машину получать знания.


А про разные трактовки я имел ввиду, к примеру, то, что этот термин используется в диапазоне от построения сильного ИИ, где речь идёт именно про знания, до систем распознавания, где речь идёт о тренировке навыка, никак не связанного со знаниями.
И даже в рамках самого словосочетания machine learning — это и процесс получения знаний машиной, так и термин, суть которого даже одной фразой сложно описать.


Ещё раз. Поймите. Я понимаю, почему вы топите за "усвоение". Я же говорю про то, почему оно в таком виде не приживается в русском языке.

Дело не во мне вовсе, а в том, что «как назовешь, так и поплывет»)).
В рамках правильной трактовки все легко понять вот к примеру, graph representation learning (aka graph feature learning) — это всего лишь автоматическое усвоение графового представления данных. Но если вы перейдете в вики по «feature learning», то увидите в русском сегменте результат неправильного понимания.

Напомню на всякий случай, что автоматическое усвоение признаков/представлений существует как антитеза инженерии признаков (aka генерированию признаков) в ручную.

Термин «усвоение (знаний)» уже давно существует в психологии, когнитивистике и педагогике, как минимум. В основе ИИ лежат первые две.

Да в том то и дело, что не плывёт усвоение. Ну не трактуется этот термин столь узко.

Даже просто по смыслу извлечение знаний и усвоение знаний сильно разные вещи.

Обращаю ваше внимание на то, что я нигде не подменяю понятия «усвоение знаний» (learning) и «извлечение» (extraction).

Термин «усвоение знаний» (learning) считается родовым понятием в указанных выше науках, а также в ML за рубежом, читай, во всем мире.

В отечественном ML мы имеет тот случай, который наблюдается в отечественной статистике. Во всем мире говорят «интервал уверенности», т.к. везде речь идет об уверенности аналитика в полученных данных, тогда как у нас вводится термин «доверие» и переводится как «доверительный интервал». За рубежом, говоря variance и covariance, имеют в виду вариативность и совариативность, у нас же эти парные термины разорваны и переводятся как «дисперсия» и «ковариация». Уже молчу про понятие «стат. критерий» для test statistic, в котором вообще все с ног на голову поставлено, тогда как речь всего-то о проверочной статистической величине в рамках проверки стат. гипотез.

Зарубежная терминология имеет более строгий и логически упорядоченный вид, в отличие от нашей.

Да оно и понятно, про "более строгий и логически упорядоченный вид" - так почти всегда бывает в языке оригинала. Но при этом, почти всегда, не получается однозначного и точного перевода.

Термин «усвоение знаний»

Этот термин ввели вы. А вот learning используется везде, согласен. Я согласен, что "обучение" - не очень верный перевод. Но и усвоение не точный.

Вот ссылка ни рисунок если он не загрузится (https://www.researchgate.net/profile/Annie-Desrochers/publication/326306245/figure/fig1/AS:784185971200003@1563975913257/Analogy-of-machine-learning-and-human-thinking-Colour-online.ppm)
У вычислительной машины рабочий поток строго регламентирован перечисленными шагами (или процессами). Участие человека необходимо с целью обеспечения/наделения машины способностью и поддержания ее в работоспособном состоянии. Модели изобретаются в академических институтах или самородками. Исследователи данных готовят данные. Инженеры организуют остальной процесс.
Поставил плюс статье за Вашу позицию и то, как Вы её отстаиваете.
Тема действительно интересная. На мой скромный взгляд практикующего DS, оба термина, и обучение и усвоение не очень удачны. Обучение, потому что процесс больше похож на тренировку. Почти всегда в коде есть модуль «train» и также называется часть данных, которая используется в этом процессе.

Термин «усвоение» мне непривычен, но проблема не только в нём. Проблема — в знаниях, которые машина должна усваивать. Мне всегда казалось, что знания должны быть как-то связаны с индивидом, с отражением действительности в сознании, которым пока машины не обладают. На мой взгляд то, что приобретает машина на данном уровне развития технологий больше похоже на интуицию.

Пожалуй «усвоение» еще как-то выключает меня из процесса (а это обидно). Да, есть такие системы, где роль исследователя данных минимальна, но в основном, это я подбираю для машины кейсы, я оцениваю как и сколько она учится, я слежу за качеством модели и иногда за предвзятостью, и да, это я подкручиваю гиперпараметры.

Интересно, что термин «знания» в оригинальной статье упоминается только два раза, в определении Dr. Yoshua Bengio. И там не очень понятно, это относится к ML или AI.
Благодарю. Ценю такие комменты. В русском термин «усвоение» просто требует за собой дополнения, поэтому «знания», под которыми подразумеваются закономерности, регулярности, шаблоны и линии поведения. Чуть шире отвечу попозже.
Что касается подбора вариантов использования и предобработки со стороны человека. Рабочий поток состоит из процессов предобработки данных -> генерирования понятных для модели признаков (т.н. инженерии признаков) -> тренировки модели -> гиперпараметрической настройки (которая может быть автоматизирована). Все так.

Но модель в силу алгоритма усвоения внутри нее улавливает неразличимые для человека сведения уже сама.

При таком раскладе, то, что делает человек называется «обеспечением машины способностью усваивать знания и действовать так же, как люди, и совершенствовать свое усвоение знаний с течением времени автономным образом». Иными словами, человек поставляет на вход модели данные, а все остальное в пределе делает модель.

Таким образом, человек не выступает учителем никоим образом.
Но модель в силу алгоритма усвоения внутри нее улавливает неразличимые для человека сведения уже сама.

Это только часть моделей. А для другой части нужно разметить данные, т.е. «показать» алгоритму, что правильно, что нет, что искать на изображении, каким должно быть удачное «саммари» для текста. Процесс разметки данных или подготовки правильных ответов может занимать 99% времени проекта.

Возможно Вам будет интересно, среди моих коллег термин модель применяется только к обученной модели, ну или по вашему, модели, усвоившей знания. Пока процесс не завершен, это, например, машина или алгоритм и никакой ценности она не представляет, какой бы сложной не была её архитектура.
По моему будет «натренированная модель» )
Про разметку смотрите ниже. Я кажется пост себе самому отправил.
Но так или иначе, мы ведем речь об этапе предобработки и генерирования признаков. Т.Е. об «обеспечении» в рамках западной парадигмы. Западные авторы не разделяют между не-натренированной и натренированной моделями. Например, когда я использую модель на основе kNN для обработки временного ряда, я знаю, на что она способна, знаю, какие входные переменные ей требуются и что получу на выходе. Т.е. для меня это все-равно модель.
Не настаиваю, но, говоря о модели, правильнее все же использовать термин смещенность (bias) модели, т.к. предвзятость (bias) — это свойство человека придавать больший или меньший вес чему-либо в силу своего образования или воспитания или взглядов. Предвзятость проявляется на этапе сбора человеком данных и выбора представлений данных. Представьте, что вы попросили врачей назначить метки медицинским снимкам — наверняка у них будут разные метки для одинаковых снимков — это называется искаженностью данных на этапе сбора данных (data bias). Что касается модели, то тут вступает в игру статистически обусловленная смещенность (bias).
Да, Вы правы, bias — смещение, смещенность. Но я имел в виду именно предвзятость. Последнее время встречаю немало публикаций на эту тему. Что-то вроде «can be interpreted as one group's prejudice based on a particular categorical distinction». Западные коллеги даже Embeddings (векторные пространства слов, кажется Вы предложили вариант «внедрения», на мой взгляд — вполне удачный) корректируют, что бы избежать обвинений в сексисзме.
Нет, я предложил вложение. Embedding в теории множеств — это вложение (или отображение из одного множества в другое), а векторное — потому что некая сущность отображается в вектор.
Я использую векторное вложение (слов, предложений, текста, фотоснимков). Мне кажется, сексизм тут не к месту.))
Да, точно, вложение!
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории