Да, Ваши предположения верны. Но на данный момент существующие системы не могут "предполагать", иначе автоматические системы перевода не допускали бы ошибки в простом примере, основанного на анафорических ссылках, который я привел.
Вы можете считать безграмотной фразу "Яблоко зеленое. Банан красный. Оно спелое", тут ничего не поделать, однако этот фрагмент текста содержит всю необходимую информацию для корректного понимания фразы человеком. Нет правила, определяющего Ваше утверждение необходимость отношения местоимения к последнему существительному.
Возвращаясь к началу беседы - вопрос был, какие словесные конструкции на данный момент небыли корректно решены существующими системами. Да, в теории обучая модели в будущем можно надеяться на какой-то прогресс. Теоретически. А наша система корректно понимает эти конструкции уже сейчас и также может быть дополнена новыми вариантами.
Ошибки были выявлены при попытке обработать, например, фразу "Банана 4. 2 свеклы. Фрукты зеленые крупные, овощи фиолетовые средние. Какого размера бананы?" - в ней 4 понималось как классификация размера или фразу "Две груши, одно яблоко, один банан. Оно зеленое. Он желтый. Какого цвета яблоко?" - цвет яблоку присваивался "красный".
Да, возможно это несовершенство именно русскоязычных адаптаций, однако как мы говорили выше - дополнив библиотеку капчи более экзотическими, но понятными человеку конструкциями, можно сделать ее сложнорешаемой даже для такого монстра, как chatGPT.
Кстати, касательно переводов - они тоже не идеальны и, например, фраза "Яблоко зеленое. Банан красный. Оно спелое" будет переведена и гуглом и deepl как "The apple is green. The banana is red. It's ripe.", что на английском является ошибочным, так как яблоко в англ. языке мужского рода, банан - женского. А свойство "спелый" присваивается какому-то отсутствующему слову среднего рода
Необходимо выбрать все объекты, соответствующие описанию. Справедливо отмечено, что в статье про это не указано, однако данная информация приведена на сайте, между названием и самой капчей.
Мы пробовали различные адаптации chatGPT для русского языка и ни одна не смогла дать однозначно правильный ответ - какого же цвета яблоки во фразе.
Русский язык сложнее английского в части построения фраз, что затрудняет разбор естественного русскоязычного текста решениями, изначально направленными на разбор англоязычных.
И, как указывали в тексте, вариативность фраз, понимаемых человеком и RealAI, можно дополнять и увеличивать, делая возможность обучения других систем для разбора фраз просто бесполезным.
По поводу определения термина "Смысл" - полностью поддержу, одни общие описание, в духе, что "смысл - ну это вообще все в общем, такие дела". Работать или моделировать подобное совершенно невозможно.
У некоторых авторов, кстати, есть достаточно прикладное понимание этого самого "Смысла" - это накопленный результат действий человека и обратной связи, полученной по результатам этих действий.
За, возможно, поверхностным описанием, скрывается глубокий фундамент, основанный на следующем тезисе:
Человек накапливает опыт и получает знания об окружающем мире за счет выполнения базовых действий и получая тот или иной отклик на них. Совокупность действий и откликов и создают индивидуальную, смысловую картину мира, которая представлена не буквально, а именно так, как ее человек воспринял - "осмысленно".
Комментарий можно было бы еще дальше расписывать, но наверное легче сослаться на серию статей, где про это достаточно подробно рассказано - https://habr.com/ru/post/554738/
Перекрытия не сильно спасут от обратной сборки, если они единообразны для всех кусков. Скрипт просто будет накладывать со смещением.
А вот если размер перехлеста плавающий — да, это определенно добавит сложности.
Если я правильно понимаю — даже с поверхности сферы можно будет собрать изображение без проблем. Ключевое решение — неоднородность нарезки и более сложное название.
Но статья точно была бы интереснее, не поспорить
Для начала стоит прочитать статью до конца, это позволит сделать более полный вывод о чем, собственно, речь.
Но боль в комментарии чувствуется даже на расстоянии, это да)
Согласен, что сейчас реализация самая прямолинейная, что позволяет написать обратный скрипт склейки изображений.
Но стоит все картинки отдавать пользователю с одним названием, как пример, выгружая их из разных папок, одна затирая другую на сервере — и все, собрать можно только перебором или решая увлекательный паззл.
Согласен, что кому нужно — так или иначе заберет контент.
А про сбор обратно при помощи скрипта — как я ответил выше, если заменить алгоритм загрузки на более сложный, а не по названию, как сейчас — написать скрипт будет еще сложнее, тем более свой для каждого подобного сайта
100% гарантию от копирования, как я понимаю, на данный момент не дает ничего. А вот добавить препятствий, когда легче пользоваться сервисом согласно правилам — вполне можно.
Обратный сбор картинки легко можно усложнить, изменив название с прямолинейного«строка_столбец».жпг на любой другой алгоритм
Да, демо капчи работает с конструкциями, которые содержат объекты, цвет, размер и количество. Однако само ядро системы - Real AI Семантический Анализатор куда как более гибкое. Например сейчас можно разобрать такие фразы - Мой пакет больших круглых вкусных коричневых спелых грецких орехов и 100 ее пакетов картошки или Корзины с овощами и фруктами на втором стеллаже под полкой с грушами "Конференция"
Демо Real AI Семантический Анализатор мы регулярно обновляем и в следующее обновление планируем внести действия, обозначенные глаголами.
Да, Ваши предположения верны. Но на данный момент существующие системы не могут "предполагать", иначе автоматические системы перевода не допускали бы ошибки в простом примере, основанного на анафорических ссылках, который я привел.
Вы можете считать безграмотной фразу "Яблоко зеленое. Банан красный. Оно спелое", тут ничего не поделать, однако этот фрагмент текста содержит всю необходимую информацию для корректного понимания фразы человеком. Нет правила, определяющего Ваше утверждение необходимость отношения местоимения к последнему существительному.
Возвращаясь к началу беседы - вопрос был, какие словесные конструкции на данный момент небыли корректно решены существующими системами. Да, в теории обучая модели в будущем можно надеяться на какой-то прогресс. Теоретически. А наша система корректно понимает эти конструкции уже сейчас и также может быть дополнена новыми вариантами.
Ошибки были выявлены при попытке обработать, например, фразу "Банана 4. 2 свеклы. Фрукты зеленые крупные, овощи фиолетовые средние. Какого размера бананы?" - в ней 4 понималось как классификация размера или фразу "Две груши, одно яблоко, один банан. Оно зеленое. Он желтый. Какого цвета яблоко?" - цвет яблоку присваивался "красный".
Да, возможно это несовершенство именно русскоязычных адаптаций, однако как мы говорили выше - дополнив библиотеку капчи более экзотическими, но понятными человеку конструкциями, можно сделать ее сложнорешаемой даже для такого монстра, как chatGPT.
Кстати, касательно переводов - они тоже не идеальны и, например, фраза "Яблоко зеленое. Банан красный. Оно спелое" будет переведена и гуглом и deepl как "The apple is green. The banana is red. It's ripe.", что на английском является ошибочным, так как яблоко в англ. языке мужского рода, банан - женского. А свойство "спелый" присваивается какому-то отсутствующему слову среднего рода
Необходимо выбрать все объекты, соответствующие описанию. Справедливо отмечено, что в статье про это не указано, однако данная информация приведена на сайте, между названием и самой капчей.
Мы пробовали различные адаптации chatGPT для русского языка и ни одна не смогла дать однозначно правильный ответ - какого же цвета яблоки во фразе.
Русский язык сложнее английского в части построения фраз, что затрудняет разбор естественного русскоязычного текста решениями, изначально направленными на разбор англоязычных.
И, как указывали в тексте, вариативность фраз, понимаемых человеком и RealAI, можно дополнять и увеличивать, делая возможность обучения других систем для разбора фраз просто бесполезным.
По поводу определения термина "Смысл" - полностью поддержу, одни общие описание, в духе, что "смысл - ну это вообще все в общем, такие дела". Работать или моделировать подобное совершенно невозможно.
У некоторых авторов, кстати, есть достаточно прикладное понимание этого самого "Смысла" - это накопленный результат действий человека и обратной связи, полученной по результатам этих действий.
За, возможно, поверхностным описанием, скрывается глубокий фундамент, основанный на следующем тезисе:
Человек накапливает опыт и получает знания об окружающем мире за счет выполнения базовых действий и получая тот или иной отклик на них. Совокупность действий и откликов и создают индивидуальную, смысловую картину мира, которая представлена не буквально, а именно так, как ее человек воспринял - "осмысленно".
Комментарий можно было бы еще дальше расписывать, но наверное легче сослаться на серию статей, где про это достаточно подробно рассказано - https://habr.com/ru/post/554738/
А вот если размер перехлеста плавающий — да, это определенно добавит сложности.
Но статья точно была бы интереснее, не поспорить
Но боль в комментарии чувствуется даже на расстоянии, это да)
Но стоит все картинки отдавать пользователю с одним названием, как пример, выгружая их из разных папок, одна затирая другую на сервере — и все, собрать можно только перебором или решая увлекательный паззл.
А про сбор обратно при помощи скрипта — как я ответил выше, если заменить алгоритм загрузки на более сложный, а не по названию, как сейчас — написать скрипт будет еще сложнее, тем более свой для каждого подобного сайта
Обратный сбор картинки легко можно усложнить, изменив название с прямолинейного«строка_столбец».жпг на любой другой алгоритм