Вот удобно сравнивать со странами, где цена такой книги - 2 чашки кофе. У авторов, продающихся по 300 рублей с нормальным переплетом и качественной бумагой тоже был бы неплохой спрос, уверяю, независимо от пиратства.
То же самое было с играми в начале нулевых, когда все пиратили. Как повысился средний доход и издатели сделали региональные цены, порой в разы ниже западных - покупатели побежали толпой.
Издатель читает полностью до публикации потому, что рискует своими деньгами. То же самое делают обычные читатели. Конечно, избежать этого можно в том случае, если стоимость покупки несущественна.
И в услугах то же самое, ремонт в квартире начинающей бригаде без отзывов и примеров вы бы не доверили. Разве что если бы это было раза в 3 дешевле, чем у остальных. А продавать в этих условиях услугу по той же цене, что и у крупных компаний, помогает только то, что она предоставляется авансом, и лишь в конце после окончательного результата покупатель решает, платить или нет.
Так давайте вместе с авторами пропустим этот затратный этап и ознакомимся просто с текстом в формате .doc
Вот почему авторы не приходят к издателям с той же логикой продажи кота в мешке? Мол, сначала договор и оплата, а потом уж читайте полностью. Если это более эффективная схема...
Думаю, потому, что существует только одна рабочая форма продажи текста: сначала ознакомление, затем покупка. Конечно, можно справедливо заметить, что некоторые успешно продают и кота в мешке в расчете на простака: звонок бодрой девочки по телефону с предложением онлайн-курсов, белорусские духи без пробников и сектор приз на Поле Чудес. Но, по несчастливой случайности, эта техника редко работает с людьми, которые читают книги.
Начинающие авторы не понимают или не хотят понимать, что человек, прочитавший книгу, хотя скорее всего и не купит её, но проходит тот самый необходимый этап ознакомления, после которого будет советовать её другим. Или не будет, если она не годится. Но факт в том, что покупка будет совершена только после этого этапа. Кинга покупают по рекомендации и рекламе, как и подписку на известную газету. А кто купит их, если закрыть пиратов? Только друзья, знакомые и коллеги. По рекомендации...
Согласен полностью. Другое дело - пришёл в книжный, почитал книгу и пошел дальше. Затёр её немного, правда, но я же не специально. Да и всё равно купят, я думаю. А вот это пиратство никому пользы не приносит. Конечно, если бы я то же самое дома сделал - это пиратство и очень плохо.
Человек ведь, когда покупает, он как обычно думает? "Кот в мешке, как здорово, надо купить. Стивен Кинг и Вася Крыжопинский по одной цене, надо дать шанс начинающему автору". А пиратство тут вредит очень сильно - прочитал читатель обе книги бесплатно, утолил жажду, и пойдет на эти деньги теперь покупать пельмени. А иначе вместо пельменей Васин труд бы уважил финансово, это как пить дать!
Правда, я вот думаю, почему ни разу в жизни не купил книгу малоизвестного автора до того, как ознакомиться с ней в "книжном"... может быть, потому, что именно пиратство и даёт читательскую базу этим авторам? И без неё будут они влачить жалкое существование, как 99,9% самиздатчиков в 80-х, когда инета не было? Да не, бред какой-то.
Пример с пельменями и онлайн-книгами очень философский. Физические объекты с затратами на производство и текстовый файл, реплицируемый почти бесконечное количество раз. Предлагаю идею для научной фантастики: человечество научилось создавать еду из ничего, словно файлы, и у каждого есть запасы еды на десять лет вперед. Но фермеры всё ещё требуют платить им за их труд, не понимая, что любые оплаты, идущие им - это теперь по доброте душевной и от восхищения вкусом, а не из необходимости утолить голод, как раньше.
Еще онлайн-переводчики нужно все прикрыть. Натренировались на профессиональных переводах (чужом интеллектуальном труде!) и давай переводить всем желающим - без контекста, порой нелепо, да и вообще без души, что ли. Перевод инструкции к мультиварке, куплета песни, незнакомых выражений - правильно было бы заказывать всё это в переводческом бюро. Да, подождать немного, зато получить качественный результат. Великий переводческий труд вот так взяли и низвергли до обычного запроса, куда это годится? Люди учатся годами, осваивают, а тут ИИ работу забрал, и всё насмарку. Нехорошо!
Это всё от лени и неспособности. Я вот сейчас таксистом подрабатываю и вижу, как все по навигаторам ездят. И даже не стесняются прямо при клиенте подсматривать! Хотя просчёт пути, знание города - это тонкая мозговая настройка, результат пережитого водителем опыта и ошибок. А новички вот так просто клац-клац и поехали, пользуются моментом, пока навигаторы не запретили.
Конечно, ИИ не место в таком тонком и глубоком искусстве, как реклама колы, обложка детектива и комиксы. Мы - за настоящее, за жизнь! Ответ прошу дать письмом, люблю ощущать запах бумаги вместо этих бездушных пикселей. И лучше чернилами, у них особый запах, не искусственный, как от авторучек...
Риторический вопрос: почему каждый раз, когда на хабре подаются псевдонаучные размышления в виде исследования, это всегда лингвистика?
Вы несколько раз во вступлении делаете акцент на уровне С2, упоминая, что международный уровень С2 часто позиционируется как уровень образованного носителя, и подводите к вопросу "Так есть разница или нет?"
Хорошо, давайте возьмём за цель исследования опровержение или подтверждение гипотезы: "С2 – это действительно уровень образованного носителя". Или её же, но развёрнутой на 180: "Между уровнем носителя и уровнем С2 – бездна".
1) Обобщив тексты С1 и С2, вы со старта стреляете исследованию в колено, потому как тексты С1 совершенно не относятся к вашим размышлениям. Уже многократно доказана даже разница между уровнями С1 и С2 сама по себе, поэтому доказывать наличие или отсутствие различия между С1 и уровнем носителя нет совершенно никакого смысла. Таким образом, внедрение текстов С1 в ваш челлендж существенно искажает результаты, подсчитанные вами в метриках, что, в свою очередь, делает невозможным их дальнейшее сравнение с результатами AI.
2) Отсутствует статзначимость. 17 преподавателей, 20 текстов, 24 эссе в валидационной выборке - это подходящие цифры для качественного, но не количественного исследования. "Accuracy = 0.66" и "Accuracy = 0.95" выглядят солидно, но это некорректно. Нельзя просто спросить двух человек с разным мнением, и сделать вывод об Accuracy = 0.5
3) Черри-пикинг. Не устроили результаты датасета Кембриджа, и вы взяли статьи из британских изданий "The Independent, The Guardian, Reader’s Digest UK, The Vogue UK, The Evening Standard". Если бы и они не устроили, можно было продолжать менять статьи в датасете вручную до тех пор, пока не попадётся ожидаемый результат. Почему бы просто не сравнивать эссе и эссе? Ведь в сухом остатке получилось, что вы сравниваете скромные эссе русскоязычных обладателей С1 с профессиональными статьями на Queen's English, и почему-то удивляетесь, что AI безошибочно определяет разницу. Это более чем ожидаемо, удивляет лишь то, что ваши эксперты не смогли это сделать.
4) Квалификация экспертов не подтверждена и основывается на вашем мнении о них. Есть общепринятые экзамены вроде IELTS, который, по статистике, на уровень С2 сдаёт не более 2% испытуемых. Могут ли ваши эксперты выделять разницу между текстами С2 и Native, если этого уровня они сами ещё не достигли? Сколько из 17 имеют реальный С2? Приблизительно представляя коллективный портрет 17 случайных экспертов, выведенных в аудиториях постсоветских лингвистических факультетов, я был бы очень осторожен в оценке, особенно учитывая, что международные сертификаты бывают совершенно разными, как и методы их получения. Например, ваши знакомые могут подготовить других учителей на классический В2, даже обладая таким же В2 или слабым С1, и при этом плохо справиться с вашим заданием. Вы получили бы другие показатели, если бы тексты сравнивались сертифицированными экспертами IELTS или TOEFL.
Мой ответ может показаться недружелюбным, но это просто реакция на позиционирование проведённой вами работы как исследования. Она имеет очень мало общего с исследованиями, и совсем ничего - с заголовком. Однако ваши размышления дают интересную пищу для обмена мнениями и идеями.
Например, для меня ваш эксперимент с AI интересен в разрезе возможности дифференциации диалектов. Можно было бы сравнивать разные датасеты и делать интересную инфографику родства диалектов по мнению AI. Или сравнивать разницу между эссе всех уровней от А2 до С2 среди русскоязычных, определяя, между какими уровнями наблюдается наибольший скачок.
Вот удобно сравнивать со странами, где цена такой книги - 2 чашки кофе. У авторов, продающихся по 300 рублей с нормальным переплетом и качественной бумагой тоже был бы неплохой спрос, уверяю, независимо от пиратства.
То же самое было с играми в начале нулевых, когда все пиратили. Как повысился средний доход и издатели сделали региональные цены, порой в разы ниже западных - покупатели побежали толпой.
Издатель читает полностью до публикации потому, что рискует своими деньгами. То же самое делают обычные читатели. Конечно, избежать этого можно в том случае, если стоимость покупки несущественна.
И в услугах то же самое, ремонт в квартире начинающей бригаде без отзывов и примеров вы бы не доверили. Разве что если бы это было раза в 3 дешевле, чем у остальных. А продавать в этих условиях услугу по той же цене, что и у крупных компаний, помогает только то, что она предоставляется авансом, и лишь в конце после окончательного результата покупатель решает, платить или нет.
Так давайте вместе с авторами пропустим этот затратный этап и ознакомимся просто с текстом в формате .doc
Вот почему авторы не приходят к издателям с той же логикой продажи кота в мешке? Мол, сначала договор и оплата, а потом уж читайте полностью. Если это более эффективная схема...
Думаю, потому, что существует только одна рабочая форма продажи текста: сначала ознакомление, затем покупка. Конечно, можно справедливо заметить, что некоторые успешно продают и кота в мешке в расчете на простака: звонок бодрой девочки по телефону с предложением онлайн-курсов, белорусские духи без пробников и сектор приз на Поле Чудес. Но, по несчастливой случайности, эта техника редко работает с людьми, которые читают книги.
Начинающие авторы не понимают или не хотят понимать, что человек, прочитавший книгу, хотя скорее всего и не купит её, но проходит тот самый необходимый этап ознакомления, после которого будет советовать её другим. Или не будет, если она не годится. Но факт в том, что покупка будет совершена только после этого этапа. Кинга покупают по рекомендации и рекламе, как и подписку на известную газету. А кто купит их, если закрыть пиратов? Только друзья, знакомые и коллеги. По рекомендации...
Согласен полностью. Другое дело - пришёл в книжный, почитал книгу и пошел дальше. Затёр её немного, правда, но я же не специально. Да и всё равно купят, я думаю. А вот это пиратство никому пользы не приносит. Конечно, если бы я то же самое дома сделал - это пиратство и очень плохо.
Человек ведь, когда покупает, он как обычно думает? "Кот в мешке, как здорово, надо купить. Стивен Кинг и Вася Крыжопинский по одной цене, надо дать шанс начинающему автору". А пиратство тут вредит очень сильно - прочитал читатель обе книги бесплатно, утолил жажду, и пойдет на эти деньги теперь покупать пельмени. А иначе вместо пельменей Васин труд бы уважил финансово, это как пить дать!
Правда, я вот думаю, почему ни разу в жизни не купил книгу малоизвестного автора до того, как ознакомиться с ней в "книжном"... может быть, потому, что именно пиратство и даёт читательскую базу этим авторам? И без неё будут они влачить жалкое существование, как 99,9% самиздатчиков в 80-х, когда инета не было? Да не, бред какой-то.
Пример с пельменями и онлайн-книгами очень философский. Физические объекты с затратами на производство и текстовый файл, реплицируемый почти бесконечное количество раз. Предлагаю идею для научной фантастики: человечество научилось создавать еду из ничего, словно файлы, и у каждого есть запасы еды на десять лет вперед. Но фермеры всё ещё требуют платить им за их труд, не понимая, что любые оплаты, идущие им - это теперь по доброте душевной и от восхищения вкусом, а не из необходимости утолить голод, как раньше.
Еще онлайн-переводчики нужно все прикрыть. Натренировались на профессиональных переводах (чужом интеллектуальном труде!) и давай переводить всем желающим - без контекста, порой нелепо, да и вообще без души, что ли. Перевод инструкции к мультиварке, куплета песни, незнакомых выражений - правильно было бы заказывать всё это в переводческом бюро. Да, подождать немного, зато получить качественный результат. Великий переводческий труд вот так взяли и низвергли до обычного запроса, куда это годится? Люди учатся годами, осваивают, а тут ИИ работу забрал, и всё насмарку. Нехорошо!
Это всё от лени и неспособности. Я вот сейчас таксистом подрабатываю и вижу, как все по навигаторам ездят. И даже не стесняются прямо при клиенте подсматривать! Хотя просчёт пути, знание города - это тонкая мозговая настройка, результат пережитого водителем опыта и ошибок. А новички вот так просто клац-клац и поехали, пользуются моментом, пока навигаторы не запретили.
Конечно, ИИ не место в таком тонком и глубоком искусстве, как реклама колы, обложка детектива и комиксы. Мы - за настоящее, за жизнь! Ответ прошу дать письмом, люблю ощущать запах бумаги вместо этих бездушных пикселей. И лучше чернилами, у них особый запах, не искусственный, как от авторучек...
Риторический вопрос: почему каждый раз, когда на хабре подаются псевдонаучные размышления в виде исследования, это всегда лингвистика?
Вы несколько раз во вступлении делаете акцент на уровне С2, упоминая, что международный уровень С2 часто позиционируется как уровень образованного носителя, и подводите к вопросу "Так есть разница или нет?"
Хорошо, давайте возьмём за цель исследования опровержение или подтверждение гипотезы: "С2 – это действительно уровень образованного носителя". Или её же, но развёрнутой на 180: "Между уровнем носителя и уровнем С2 – бездна".
1) Обобщив тексты С1 и С2, вы со старта стреляете исследованию в колено, потому как тексты С1 совершенно не относятся к вашим размышлениям. Уже многократно доказана даже разница между уровнями С1 и С2 сама по себе, поэтому доказывать наличие или отсутствие различия между С1 и уровнем носителя нет совершенно никакого смысла. Таким образом, внедрение текстов С1 в ваш челлендж существенно искажает результаты, подсчитанные вами в метриках, что, в свою очередь, делает невозможным их дальнейшее сравнение с результатами AI.
2) Отсутствует статзначимость. 17 преподавателей, 20 текстов, 24 эссе в валидационной выборке - это подходящие цифры для качественного, но не количественного исследования. "Accuracy = 0.66" и "Accuracy = 0.95" выглядят солидно, но это некорректно. Нельзя просто спросить двух человек с разным мнением, и сделать вывод об Accuracy = 0.5
3) Черри-пикинг. Не устроили результаты датасета Кембриджа, и вы взяли статьи из британских изданий "The Independent, The Guardian, Reader’s Digest UK, The Vogue UK, The Evening Standard". Если бы и они не устроили, можно было продолжать менять статьи в датасете вручную до тех пор, пока не попадётся ожидаемый результат. Почему бы просто не сравнивать эссе и эссе? Ведь в сухом остатке получилось, что вы сравниваете скромные эссе русскоязычных обладателей С1 с профессиональными статьями на Queen's English, и почему-то удивляетесь, что AI безошибочно определяет разницу. Это более чем ожидаемо, удивляет лишь то, что ваши эксперты не смогли это сделать.
4) Квалификация экспертов не подтверждена и основывается на вашем мнении о них. Есть общепринятые экзамены вроде IELTS, который, по статистике, на уровень С2 сдаёт не более 2% испытуемых. Могут ли ваши эксперты выделять разницу между текстами С2 и Native, если этого уровня они сами ещё не достигли? Сколько из 17 имеют реальный С2? Приблизительно представляя коллективный портрет 17 случайных экспертов, выведенных в аудиториях постсоветских лингвистических факультетов, я был бы очень осторожен в оценке, особенно учитывая, что международные сертификаты бывают совершенно разными, как и методы их получения. Например, ваши знакомые могут подготовить других учителей на классический В2, даже обладая таким же В2 или слабым С1, и при этом плохо справиться с вашим заданием. Вы получили бы другие показатели, если бы тексты сравнивались сертифицированными экспертами IELTS или TOEFL.
Мой ответ может показаться недружелюбным, но это просто реакция на позиционирование проведённой вами работы как исследования. Она имеет очень мало общего с исследованиями, и совсем ничего - с заголовком. Однако ваши размышления дают интересную пищу для обмена мнениями и идеями.
Например, для меня ваш эксперимент с AI интересен в разрезе возможности дифференциации диалектов. Можно было бы сравнивать разные датасеты и делать интересную инфографику родства диалектов по мнению AI. Или сравнивать разницу между эссе всех уровней от А2 до С2 среди русскоязычных, определяя, между какими уровнями наблюдается наибольший скачок.
Интересно, почему именно люди, не осилившие правописание "не" с глаголами или слова "работодатель" так отчаянно ратуют за высшее образование