Я тут недавно искал книгу старую в инете и набрел на книгу 2010 года
Learning from Data (Усвоение закономерностей из данных). Так вот ее русское название было «Изучая данные». Вы зря полагаетесь на качество перевода. Learning from Data — это терминологическое выражение, и переводчик ничтоже сумняшеся родил то, что родил. В 1й статье я писал, что у нас нет стандартов, и каждый на свой лад. Вот так и получилось с «обучением», так же как и «блокировкой» и прочей хренью.
Я в выводе статьи добавил описание, что никто никого не обучает. Человек — поставщик, наладчик и организатор. Вот и все его роли. Усвоением закономерностей занимается ядро модели — ее алгоритм усвоения знаний.
Такое понимание еще важно с точки зрения, откуда все пошло:
усвоение знаний как явление -> усвоение знаний человеком/животным/машиной.
У вычислительной машины рабочий поток строго регламентирован перечисленными шагами (или процессами). Участие человека необходимо с целью обеспечения/наделения машины способностью и поддержания ее в работоспособном состоянии. Модели изобретаются в академических институтах или самородками. Исследователи данных готовят данные. Инженеры организуют остальной процесс.
Вот ссылка ни рисунок если он не загрузится (https://www.researchgate.net/profile/Annie-Desrochers/publication/326306245/figure/fig1/AS:784185971200003@1563975913257/Analogy-of-machine-learning-and-human-thinking-Colour-online.ppm)
Нет, я предложил вложение. Embedding в теории множеств — это вложение (или отображение из одного множества в другое), а векторное — потому что некая сущность отображается в вектор.
Я использую векторное вложение (слов, предложений, текста, фотоснимков). Мне кажется, сексизм тут не к месту.))
Но так или иначе, мы ведем речь об этапе предобработки и генерирования признаков. Т.Е. об «обеспечении» в рамках западной парадигмы. Западные авторы не разделяют между не-натренированной и натренированной моделями. Например, когда я использую модель на основе kNN для обработки временного ряда, я знаю, на что она способна, знаю, какие входные переменные ей требуются и что получу на выходе. Т.е. для меня это все-равно модель.
Не настаиваю, но, говоря о модели, правильнее все же использовать термин смещенность (bias) модели, т.к. предвзятость (bias) — это свойство человека придавать больший или меньший вес чему-либо в силу своего образования или воспитания или взглядов. Предвзятость проявляется на этапе сбора человеком данных и выбора представлений данных. Представьте, что вы попросили врачей назначить метки медицинским снимкам — наверняка у них будут разные метки для одинаковых снимков — это называется искаженностью данных на этапе сбора данных (data bias). Что касается модели, то тут вступает в игру статистически обусловленная смещенность (bias).
Рабочий поток состоит из следующих процессов:
1) предобработка данных,
2) генерирование понятных для модели признаков,
3) тренировка модели с гиперпараметрической настройкой
4) валидация модели
5) оценивание модели,
6) продукционализация модели
7) обслуживание запросов со стороны пользователей и других приложений на получение модельных предсказаний.
Пункты 1-6 подпадают под то, что у них называется «обеспечением машины способность усваивать знания». При этом на этапе 3 модель уже начинает делать то, что она должна делать — усваивать неуловимые человеком закономерности.
В пункте 5 человек принимает решение о результативности работы модели. И если все устраивает, то продолжает работу по «обеспечению», внедряя ее в производство.
Как видно, человек не обучает модель — наоборот, модель учится сама. Человек — поставщик и организатор.
Что касается подбора вариантов использования и предобработки со стороны человека. Рабочий поток состоит из процессов предобработки данных -> генерирования понятных для модели признаков (т.н. инженерии признаков) -> тренировки модели -> гиперпараметрической настройки (которая может быть автоматизирована). Все так.
Но модель в силу алгоритма усвоения внутри нее улавливает неразличимые для человека сведения уже сама.
При таком раскладе, то, что делает человек называется «обеспечением машины способностью усваивать знания и действовать так же, как люди, и совершенствовать свое усвоение знаний с течением времени автономным образом». Иными словами, человек поставляет на вход модели данные, а все остальное в пределе делает модель.
Таким образом, человек не выступает учителем никоим образом.
Благодарю. Ценю такие комменты. В русском термин «усвоение» просто требует за собой дополнения, поэтому «знания», под которыми подразумеваются закономерности, регулярности, шаблоны и линии поведения. Чуть шире отвечу попозже.
Однако, при все при этом, НАСТОЯЩИЙ термин пошел не из России и содержит в своем составе именно слово learning. делая акцент на приобретении знаний, а не на их передаче. И в зарубежной литературе по этой теме НЕТ понятия учитель!
Обратите внимание, я отстаиваемую позицию, которая укладывается в общепризнанную и обыденно понимаемую во всем мире парадигму, именуемую как усвоение знаний машиной, или машинное усвоение знаний, где под знанием подразумевается линия поведения, а также закономерности, регулярности и шаблоны, неуловимые для человека...)
dictionary.cambridge.org/ru/%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8C/%D0%B0%D0%BD%D0%B3%D0%BB%D0%B8%D0%B9%D1%81%D0%BA%D0%B8%D0%B9/learning
learning = the activity of obtaining knowledge
усвоение знаний = деятельность по приобретению знаний
Также найдете почти в любом педагогическом тексте
www.kp.ru/guide/usvoenie-znanii-uchashchimisja-pri-udalennom-obuchenii.html
pedagogic.ru/pedenc/item/f00/s02/e0002510/index.shtml
Также можно выяснить косвенно через термин Теории усвоения знаний
vikent.ru/enc/6380
Learning Theory
en.wikipedia.org/wiki/Learning_theory_(education)
human learning = усвоение знаний человеком
animal learning = усвоение знаний животным
…
machine learning = усвоение знаний машиной
Я тут недавно искал книгу старую в инете и набрел на книгу 2010 года
Learning from Data (Усвоение закономерностей из данных). Так вот ее русское название было «Изучая данные». Вы зря полагаетесь на качество перевода. Learning from Data — это терминологическое выражение, и переводчик ничтоже сумняшеся родил то, что родил. В 1й статье я писал, что у нас нет стандартов, и каждый на свой лад. Вот так и получилось с «обучением», так же как и «блокировкой» и прочей хренью.
Такое понимание еще важно с точки зрения, откуда все пошло:
усвоение знаний как явление -> усвоение знаний человеком/животным/машиной.
Сначала вот рисунок, показывающий аналогию, но не соответствие:
Я использую векторное вложение (слов, предложений, текста, фотоснимков). Мне кажется, сексизм тут не к месту.))
1) предобработка данных,
2) генерирование понятных для модели признаков,
3) тренировка модели с гиперпараметрической настройкой
4) валидация модели
5) оценивание модели,
6) продукционализация модели
7) обслуживание запросов со стороны пользователей и других приложений на получение модельных предсказаний.
Пункты 1-6 подпадают под то, что у них называется «обеспечением машины способность усваивать знания». При этом на этапе 3 модель уже начинает делать то, что она должна делать — усваивать неуловимые человеком закономерности.
В пункте 5 человек принимает решение о результативности работы модели. И если все устраивает, то продолжает работу по «обеспечению», внедряя ее в производство.
Как видно, человек не обучает модель — наоборот, модель учится сама. Человек — поставщик и организатор.
Но модель в силу алгоритма усвоения внутри нее улавливает неразличимые для человека сведения уже сама.
При таком раскладе, то, что делает человек называется «обеспечением машины способностью усваивать знания и действовать так же, как люди, и совершенствовать свое усвоение знаний с течением времени автономным образом». Иными словами, человек поставляет на вход модели данные, а все остальное в пределе делает модель.
Таким образом, человек не выступает учителем никоим образом.