смотрите список команд в боте (/changemodel). Про платное использование у нас написано: "добавить менеджмент баланса токенов для того, чтобы люди, находящие бота, не пользовались им безлимитно"
Всё таки стоимость (Wert) и потребительская стоимость (Gebrauchswert) это разные понятия (в любой теории).
Стоимость не обязательно должна создаваться трудом человека, мы сплошь и рядом пользуемся силами природы или механизмами. Чтобы использовать природные ресурсы, нам всё равно приходится тратить ресурсы. И с механизмами такая же ситуация.
Труд это необходимое, но не достаточное условия. Без труда нет стоимости, как ни крути. "Мы пользуемся силами природы..." -- так или иначе, чтобы построить, например, ГЭС -- нужен труд, чтобы построить солнечные панели нужен труд, и даже если это всё полностью автоматизировать, в конечном итоге будут необходимы "системные администраторы", контролирующие работу автоматики. И кстати, я ещё не встречал ни одного производства/бизнеса/процесса, который бы функционировал исключительно без человека (человеческого труда).
Даже если ИТ и в отрыве от "каноничного" производства (заводы), ничего не меняется, ведь труд программиста всё равно производителен. В случае соц. сетей, трудятся ещё и сами участники сети создавая своими постами и лайками данные для таргетированной рекламы (см. https://habr.com/ru/post/691538/ и https://lenincrew.com/digital-politeconomy/)
Согласен. Но разве орудия труда не являются частью средств производства? Думаю, что один и тот же предмет (напр. видеокарту) можно рассматривать с разных сторон: 1. Видеокарта, как орудие труда deep learning ижненера, 2. Видеокарта, как *нечто* сдающееся в аренду. 1 и 2 это кардинально разные типы предпринимательства.
PS. Не могу сказать, есть ли у рантье свои средства производства и какие у него орудия труда.
Способен ли толокчанин за 25 секунд плошку риса качественно это оценить?
Возможно не способен, но что будет если их несколько? И если 25 секунд возьмём как триггер к блокировке за слишком быстрое выполнение? А что если покрытие одной новости при разметке, например, 8 раз? Так же стоит понять для чего мы размечаем и что хотим предугадать? Если хотим предугадать действия среднестатистического неквалифицированного инвестора, то мнение усреднённого толокера скорее всего подойдёт. Ну а если хотим наиболее объективную информацию, как вы упомянули с учётом ожиданий и фактов, нужен, естественно, более глубокий анализ.
Также стоит добавить, что это не столько датасет, сколько бенчмарк. Т.е. набор данных для оценки точности системы с небольшим тренировочным набором для оптимизации. Тренировочных данных и моделей для под-задач информационного поиска, например, распознавание именованых сущностей множество, однако, очень мало качественных данных для оценки систем ответа на вопросы и информационного поиска целиком (особенно на нескольких языках).
что это дает например тому же башкирскому? Как можно применить?
В следствие того, что я описал, бенчмарк даёт возможность адекватно оценить работоспособность системы на башкирском языке + если необходимо донастройки системы на имеющемся тренировочном наборе
Ответы в виде ссылки
На самом деле это не ссылка, а идентификатор ресурса (URI)
как из вопроса вытаскиваются сущности
Есть множество подходов к Named Entity Recognition / Linking это и есть та самая задача вытаскивания сущностей
чтоб на сайте викидата их хотя бы использовать?
Система сама по себе не общается с "сайтом", а с так называемой точкой доступа данных SPARQL, после того как запрос сгенерирован, он исполняется и возвращается ответ. Пусть ответом на вопрос "кто президент США?" будет Джо Байден. Получив URI Джо Байдена в викидате, мы на его основе можем красиво визуализировать ответ имея данные, находящиеся в ней и имеющие отношения к URI (изображение, краткая биография и тд). В общем всё то же самое что делает гугл (и он делает это в точности как я и описал)
Данная статья писалась для студентов, ещё не сталкивавшихся с защитой. Возможно, для тебя она ни о чём, если это так, можно было просто закрыть и не читать дальше.
По поводу студента, который готовится за 2 года — я привёл свой личный пример и подтвердил, что это работает.
По поводу совета, о том, что писать см. первый абзац.
Если найдёте бесплатный доступ к описанному функционалу в одном месте, можете первым кинуть в меня камень
Это всё же не теория и не идея. Это модель организации своего рабочего процесса и личных дел. Одна из многих других.
Модель это всегда попытка формализовать реальность и поставить её в какие‑либо рамки, поэтому никто не говорит о безшовности — это априори невозможно.
Посыл в том, чтобы донести суть модели/методологии...называйте как хотите, а стоит ли её применять — каждый решает сам
Не стоит воспринимать пример буквально, на то он и пример. Смысл там конечно был не в дереве, и даже не в доме...
смотрите список команд в боте (/changemodel). Про платное использование у нас написано: "добавить менеджмент баланса токенов для того, чтобы люди, находящие бота, не пользовались им безлимитно"
Пока изображения не обрабатываем, только текст. Думаю в будующем подключим OCR туда
Нет, бот предоставляется "AS-IS"
В просторечии люди используют фразу "через Wi-Fi работает, а через мобильный интернет -- нет"
Главное, чтобы не было как с телеграмом несколько лет назад, так заблокировали, что аж Гугл Диск перестал открываться
Исправил, хотел написать, что Outline VPN был разработан дочкой гугла
Всё таки стоимость (Wert) и потребительская стоимость (Gebrauchswert) это разные понятия (в любой теории).
Труд это необходимое, но не достаточное условия. Без труда нет стоимости, как ни крути. "Мы пользуемся силами природы..." -- так или иначе, чтобы построить, например, ГЭС -- нужен труд, чтобы построить солнечные панели нужен труд, и даже если это всё полностью автоматизировать, в конечном итоге будут необходимы "системные администраторы", контролирующие работу автоматики. И кстати, я ещё не встречал ни одного производства/бизнеса/процесса, который бы функционировал исключительно без человека (человеческого труда).
Даже если ИТ и в отрыве от "каноничного" производства (заводы), ничего не меняется, ведь труд программиста всё равно производителен. В случае соц. сетей, трудятся ещё и сами участники сети создавая своими постами и лайками данные для таргетированной рекламы (см. https://habr.com/ru/post/691538/ и https://lenincrew.com/digital-politeconomy/)
Согласен. Но разве орудия труда не являются частью средств производства? Думаю, что один и тот же предмет (напр. видеокарту) можно рассматривать с разных сторон: 1. Видеокарта, как орудие труда deep learning ижненера, 2. Видеокарта, как *нечто* сдающееся в аренду. 1 и 2 это кардинально разные типы предпринимательства.
PS. Не могу сказать, есть ли у рантье свои средства производства и какие у него орудия труда.
Возможно не способен, но что будет если их несколько? И если 25 секунд возьмём как триггер к блокировке за слишком быстрое выполнение? А что если покрытие одной новости при разметке, например, 8 раз? Так же стоит понять для чего мы размечаем и что хотим предугадать? Если хотим предугадать действия среднестатистического неквалифицированного инвестора, то мнение усреднённого толокера скорее всего подойдёт. Ну а если хотим наиболее объективную информацию, как вы упомянули с учётом ожиданий и фактов, нужен, естественно, более глубокий анализ.
Статья о датасете, а не о стратегии. Можете взять за основу и сравнить)
Это фундаментальный вопрос всей темы информационного поиска. Можно почитать тут более подробно про то, как делается Question Answering: https://web.stanford.edu/~jurafsky/slp3/23.pdf, http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.233.6482&rep=rep1&type=pdf
Также стоит добавить, что это не столько датасет, сколько бенчмарк. Т.е. набор данных для оценки точности системы с небольшим тренировочным набором для оптимизации. Тренировочных данных и моделей для под-задач информационного поиска, например, распознавание именованых сущностей множество, однако, очень мало качественных данных для оценки систем ответа на вопросы и информационного поиска целиком (особенно на нескольких языках).
В следствие того, что я описал, бенчмарк даёт возможность адекватно оценить работоспособность системы на башкирском языке + если необходимо донастройки системы на имеющемся тренировочном наборе
На самом деле это не ссылка, а идентификатор ресурса (URI)
Есть множество подходов к Named Entity Recognition / Linking это и есть та самая задача вытаскивания сущностей
Система сама по себе не общается с "сайтом", а с так называемой точкой доступа данных SPARQL, после того как запрос сгенерирован, он исполняется и возвращается ответ. Пусть ответом на вопрос "кто президент США?" будет Джо Байден. Получив URI Джо Байдена в викидате, мы на его основе можем красиво визуализировать ответ имея данные, находящиеся в ней и имеющие отношения к URI (изображение, краткая биография и тд). В общем всё то же самое что делает гугл (и он делает это в точности как я и описал)
Для примера, можно поиграться тут: https://qanswer-frontend.univ-st-etienne.fr/
По поводу студента, который готовится за 2 года — я привёл свой личный пример и подтвердил, что это работает.
По поводу совета, о том, что писать см. первый абзац.