То есть, в настоящий момент организованного научного подхода к проблеме нет, но есть много частных решений... Жаль.. Однако, кому-то повезёт сделать прорыв, в скором времени, и снизить аппаратные требования до приемлемого уровня. А потом появится куча жестяных говорилок, неотличимых на слух от среднестатистического аборигена)
Тексты с ошибками, кроме простой орфографии - настоящая беда. Даже для мясных переводчиков. Тут уже интуиция требуется, то есть доступ к дополнительной информации за пределами видимого. Вот будет весело, когда машины начнут проявлять зачатки яснознания - нам тогда останется только разнести планету или освободить место более продвинутому виду. У нас-то это дело скорее редкое исключение, чем правило. И даже не сомневаюсь по какому пути ломонёмся всей толпой - не впервой уже, плавали, и тонули, столько раз. И каждый раз забываем...
Ну, чтобы в сетевую приблуду запихнуть что-то, нужно 3 строки кода. А то что на производителей "оказывают давление" и так понятно, им деваться из России некуда.
Однако, это всё не гарантирует "безопасность приложения", написанного добрым дядей для всех, бесплатно и без регистрации, особенно в виде бинариков. Очень немногие согласны угробить несколько недель работы по доброте душевной - все что-то кушают. И то на что они кушают потребителям обычно не нравится...
Интересная у Вас работа... Когда пошла мода на ИИ я прикинул и решил не лезть - неподъёмная задача для полилинейной логики современного оборудования. Тут "однотактовые" операции над образами произвольного размера нужны, хотя бы 2D, а для формирования даже простой геометрической модели нашего слоя мироздания - 3D, да ещё в динамике. Некоторые абстрактные модели требуют и больших мерностей. При структуризации они, конечно, сводятся к полилинейным конструкциям разной сложности, но без слоя, связывающего их с сенсорным или абстрактно-информационным потоком все эти модели - как дерево без почвы - на дрова, разве что, годятся. А как раз слой первообраза в современное оборудование и не лезет...
Тем не менее, отрасль развивается, и уже имеет коммерческий смысл, что отрадно. Особенно интересные перспективы именно у Вашей области, так как все известные живые и искусственные языки в основе своей - уже полилинейны.
Из Вашей статьи я заключил, что обработке подвергаются сырые текстовые данные и их переводы, сделанные мясными переводчиками. Но это же просто гигантский объём информации... Неужели исходные данные предварительно не структурируются? Если бы мясные переводчики действовали таким способом - большинство бы уже лечились у специалистов по установке мозгов на место, по причине перманентных тормозов и глюков)
Эти же хитрые создания всегда вставляют между сырыми данными и понятийным древом структурное древо языка, то есть сжимают без потерь входящие данные на несколько порядков, а заодно минимизируют количество возможных межъязыковых связей, отсекая большую часть шумов ещё на этапе первичной структуризации, не касающейся остальных языков. После такой обработки понятийные деревья различных языков, описывающих один и тот же набор объектов, не просто коррелируют - они выходят идентичными. Чем мясные переводчики (пока ещё) бессовестно пользуются, обставляя кремниевых в некоторых областях вчистую)
Применяется ли подобный приём в современном моделировании естественных языков?
Ну да, бандиты. Потому что иных не нашлось. Где было остальное стадо бесхребетное? Кто сейчас мешает влезть порулить? Кто смог, тот и рулит, а кто не смог - пусть дальше помалкивает, как в девяностые. И как 30 лет до этого.
И потом, для общения со "свободным" западным миром только бандиты и годятся. На Украине не вышло их методами, подкупать и промывать мозги вне России мы еще до такой степени не умеем, а может и не хотим. Сделали как смогли - надо было как-то остановить раздербанивание Славянского мира, скоро от России куски отгрызать начнут.
Что до заклятых друзей - со времен Холодной войны ничего не изменилось, как боялись так и боятся. И ненавидят, с хорошей миной, разумеется. Это генетика, никуда от неё не денешься. Конечно не у каждого первого, но достаточно тех кто рулит ресурсами, а остальному стаду остается только мычать в такт. Вот и мычат, кто как может, своя мычалка дороже.
Я решил вопрос проще - выкинул Ютуп из своей никчёмной жизни. А остальной пендосятиной и не пользовался.
Сразу освободилось 2 часа в день на что-то полезное)
То есть, в настоящий момент организованного научного подхода к проблеме нет, но есть много частных решений... Жаль.. Однако, кому-то повезёт сделать прорыв, в скором времени, и снизить аппаратные требования до приемлемого уровня. А потом появится куча жестяных говорилок, неотличимых на слух от среднестатистического аборигена)
Тексты с ошибками, кроме простой орфографии - настоящая беда. Даже для мясных переводчиков. Тут уже интуиция требуется, то есть доступ к дополнительной информации за пределами видимого. Вот будет весело, когда машины начнут проявлять зачатки яснознания - нам тогда останется только разнести планету или освободить место более продвинутому виду. У нас-то это дело скорее редкое исключение, чем правило. И даже не сомневаюсь по какому пути ломонёмся всей толпой - не впервой уже, плавали, и тонули, столько раз. И каждый раз забываем...
Ну, чтобы в сетевую приблуду запихнуть что-то, нужно 3 строки кода. А то что на производителей "оказывают давление" и так понятно, им деваться из России некуда.
Однако, это всё не гарантирует "безопасность приложения", написанного добрым дядей для всех, бесплатно и без регистрации, особенно в виде бинариков. Очень немногие согласны угробить несколько недель работы по доброте душевной - все что-то кушают. И то на что они кушают потребителям обычно не нравится...
Интересная у Вас работа... Когда пошла мода на ИИ я прикинул и решил не лезть - неподъёмная задача для полилинейной логики современного оборудования. Тут "однотактовые" операции над образами произвольного размера нужны, хотя бы 2D, а для формирования даже простой геометрической модели нашего слоя мироздания - 3D, да ещё в динамике. Некоторые абстрактные модели требуют и больших мерностей. При структуризации они, конечно, сводятся к полилинейным конструкциям разной сложности, но без слоя, связывающего их с сенсорным или абстрактно-информационным потоком все эти модели - как дерево без почвы - на дрова, разве что, годятся. А как раз слой первообраза в современное оборудование и не лезет...
Тем не менее, отрасль развивается, и уже имеет коммерческий смысл, что отрадно. Особенно интересные перспективы именно у Вашей области, так как все известные живые и искусственные языки в основе своей - уже полилинейны.
Из Вашей статьи я заключил, что обработке подвергаются сырые текстовые данные и их переводы, сделанные мясными переводчиками. Но это же просто гигантский объём информации... Неужели исходные данные предварительно не структурируются? Если бы мясные переводчики действовали таким способом - большинство бы уже лечились у специалистов по установке мозгов на место, по причине перманентных тормозов и глюков)
Эти же хитрые создания всегда вставляют между сырыми данными и понятийным древом структурное древо языка, то есть сжимают без потерь входящие данные на несколько порядков, а заодно минимизируют количество возможных межъязыковых связей, отсекая большую часть шумов ещё на этапе первичной структуризации, не касающейся остальных языков. После такой обработки понятийные деревья различных языков, описывающих один и тот же набор объектов, не просто коррелируют - они выходят идентичными. Чем мясные переводчики (пока ещё) бессовестно пользуются, обставляя кремниевых в некоторых областях вчистую)
Применяется ли подобный приём в современном моделировании естественных языков?
Ого, неужто все исходники вычитали перед компиляцией? По мне 100% - это когда тобой писано и компилер проверен...
Каспер же его как-то квалифицировал? Чего-то же в вирусной базе они вынуждены были написать?
Ну да, бандиты. Потому что иных не нашлось. Где было остальное стадо бесхребетное? Кто сейчас мешает влезть порулить? Кто смог, тот и рулит, а кто не смог - пусть дальше помалкивает, как в девяностые. И как 30 лет до этого.
И потом, для общения со "свободным" западным миром только бандиты и годятся. На Украине не вышло их методами, подкупать и промывать мозги вне России мы еще до такой степени не умеем, а может и не хотим. Сделали как смогли - надо было как-то остановить раздербанивание Славянского мира, скоро от России куски отгрызать начнут.
Что до заклятых друзей - со времен Холодной войны ничего не изменилось, как боялись так и боятся. И ненавидят, с хорошей миной, разумеется. Это генетика, никуда от неё не денешься. Конечно не у каждого первого, но достаточно тех кто рулит ресурсами, а остальному стаду остается только мычать в такт. Вот и мычат, кто как может, своя мычалка дороже.