All streams
Search
Write a publication
Pull to refresh
-19
0
Send message
Перефразирую:
Стыдно, считать, что все читатели имеют непосредственное отношение к IT, а имеющие поголовно знают английский хотя бы на базовом уровне. Там всего около 286 слов, их требуется переводить, иначе сбегутся знатоки и заявят, что хамство давать текстовый транскрипт не на русском языке, да и еще в виде статьи.
По идее должно быть типа МРТ, там создается трехмерная структура.
Далее компьютер должен будет эту структуру нарезать на свитки, листы и прочие поверхности. И распознать уже непосредственно текст.
Но то в будущем, они сейчас тренируются на плоских книгах послойно.
Из недостатков 3D сканирования — если закрепить книгу под углом 45 градусов к сканирующей поверхности, то могут быть проблемы с точностью для мелких шрифтов, которые решаются либо несколькими сканерами под разными углами, либо уменьшением ширины слоя, либо одновременно несколько вариантов.
Про закрепление книги под углом — это синтетический тест на распознавание. Те же свитки могут иметь куда более сложную форму, нежели цилиндр, из-за помятости. Например (события выдуманы для примера), шло сражение, боец спешил отнести донесение командиру, в спешке помял свиток, но засунул в тубус. Дальше получил смертельное ранение и остался на поле боя. Через столетия археологи находят скелет и тубус. Конечно, интересно прочитать то послание, т.к. уже не сохранились данные что та битва была. Может то потасовка среди 10 человек? Определить можно, если узнать что написано на свитке. И тут облом — свиток невозможно извлечь, не повредив его. А вот сканер вполне может прочесть. Если, конечно, компьютер сможет определить форму помятого клочка бумаги. После прочтения одним белым пятном станет меньше. Или появятся вопросы по другим периодам и пятен станет больше.
тут другой вопрос должен быть:
— Как монетизировать радиоуглеродный анализ?
И после этого она будет потребительским продуктом. Хотя не факт. Даже на автомобили стоимость не упала ниже некоторого предела, т.к. есть понятие «себестоимость».

Либо будет как с принтерами — дешевый принтер, но дорогие чернила или дорогой принтер и копеечные чернила. Встречаются варианты, когда и принтер, и чернила дорогие. Или одновременно дешевые.
есть лотереи, которые приносят куда больше, нежели забирает у участников. Разница за счет организатора.
Варианты таких лотерей:
1) рекламная акция (конкретно лотерея отдаст больше за счет организатора)
2) благотворительные (разные подарки среди большой аудитории)
3) праздничные (когда ребенок из мешка Деда Мороза достает случайный подарок — тоже лотерея. За счет организатора, т.е. за счет родителей)
4) организационные (так, кто к доске?)
и т.д.
Я молчу про лотереи, где организатор и потенциальный получатель — одно лицо. Кидаем монетку, если выпадет орел — ставим плюсик, если решка — комментируем, если на ребро — идем пить чай, если зависнет в воздухе — ставим минус (просьба космонавтам на МКС участие в подбрасывании монетки не принимать). Хотя некоторые меняют плюс и минус местами.

Даже у создателей сканера своеобразная лотерея — прочитает/распознает или нет? Во сколько обойдется редактура (в случае не распознавания)? Во сколько вообще обойдется стоимость распознавания одного листа? А для определения эффективности сканера можно использовать альтернативные затраты, т.е. сколько денег уйдет на набор текста или использование традиционного постраничного сканера.
Я хочу не включая компьютер прочитать содержимое HDD. Но там другой принцип хранения поэтому текущие разработки могут быть бесполезны. Да и скорость вряд ли будет сопоставима хотя бы с IDE, я молчу про sata и более новые, т.к. часть времени будет тратиться на распознавание.
Извиняюсь, таки меня память подвела. Но не во всем.
Именно Ватсон ругался. Но не из-за обучения кем попало, а из-за словаря с жаргонами.
пруф
А на графе «побочные эффекты» с перечислением негативных последствий в инструкции мед.препарата Ватсон должен будет сделать вывод, что это пишет какой-то таинственный садист?
тут надо различать разные типы ИИ. В одних — это вполне возможно, когда автор из-за субъективной оценки может сделать однобокую модель. Но сюда же может добавиться и физическая недоступность данных по каким-либо причинам (например, огромный объем и необходимость предварительной подготовки или просто патенты, коммерческие права и прочее). Опять же — огромное влияние имеет тип ИИ — деревья решений, генетический алгоритм (для которого были заданы не все варианты) и т.д.
Есть вариант, когда система самостоятельно вырабатывает свое «мнение», независимое от мнения автора. Например — нейросети. Ватсона обучали на огромном количестве данных от разных авторов, поэтому говорить про какое-либо субъективное мнение одного автора не приходится из-за небольшого влияния.
Тут еще добавляется разделение — автор чего? Кода? Автор кода вообще может не иметь собственного мнения по обсуждаемой тематике, т.к. нейросеть создавалась для широкого спектра задач, а сам автор может вообще не знать те вопросы, которые разбирает та же нейросеть. Если говорить про автора учебных материалов, то тут в общем объеме среди других авторов можно потеряться. Так же не исключен вариант, когда нейросеть не замораживается, а продолжает самостоятельно обучаться даже на тех примерах, которые дают ей в качестве задач.
Конечно, если вы создадите на своем компьютере ИИ, то он вполне может быть однобоким. Когда идет речь о ИИ для крупных фирм — тут уже однобокость исключается, зона охвата будет больше. Проблема будет не в авторе, а в мощности нейросети, времени обучения и количестве учебных материалов.
варианты:
— шифровка дополнительных данных (как в рисунках шифровать сообщения разными способами)
— контрольная сумма (но слабовата, т.к. пока не обнаружено свойство, когда из-за изменения даже одного символа в одном месте — другая часть продемонстрирует что было совершена ошибка)
— корректирующие коды (тут другая часть должна даже подсказать как исправить ошибку)
— сообщение для (или от) высокоразвитой расы с некоторыми базовыми наработками для дальнейшего изучения
— слишком случайная случайность (для не любителей задумываться)
— происки мирового правительства (для конспирологов)
Версии на любой вкус и еще можно найти.
тут проблема другая. Можно съехать на ± те же 50 лет. И человек, читая нашу беседу будет из 3016 года (через 1к лет) будет гадать, а какое же значение было. И это будет осложнятся тем, что до того времени могут дожить лишь отдельные фрагменты. Не исключено, что наше время может быть вообще задвинуто в «эпоху камня и пещер», когда люди жили в искусственных пещерах, не умели строить обитаемые межпланетные корабли для обитания целыми поколениями, молчу про межзвездные перелеты. Для расчетов использовали не порядком устаревшие для будущего времени квантовые компьютеры, а настоящие кремниевые камни.
И на тот момент эта же фраза может обозначать:
3016й год: «Киборг, с ярко выраженными мужскими особенностями, в районе звезды „Клуб“ распечатал на принтере (склеил по молекуле) какой-то неопределенный объект, у которого отсутствует возможность идентификации доступными средствами»
2016й год (по мнению ученых из 3016 года): «Биологический объект класса „Человек“ планеты Земля находился в ритуальном здании, где люди ради поклонению неизвестному божеству, употребляли токсичную галлюциногенную жидкость и старательно двигали своим телом. Там этот объект обмазался клеющей субстанцией и прижался к другой особи такого же вида, работа которой состоит в том, чтобы продемонстрировать как выглядит объекты ее вида в другом покрытии из ткани, металла и других материалов. Упомянутое божество, вероятнее всего, было нарисовано на зеленых бумажках и было в обиходе. Данные бумажки обменивались между объектами в качестве некого ритуала»
И деньги вполне могут стать пережитком прошлого (отсылка к Стартреку). А размножение людей — в специальные лабораториях для клонирования (фильм Облачный атлас) или вообще переселение в роботов (фильмы Суррогаты или внутрь компьютера в Матрице) и т.д.
… где компьютеры будут сражаться в дискуссиях какая вера лучше.

А никчемные людишки будут помалкивать, ибо у них не хватает гигафлопсов для оценки — теологический Терминатор
А где в моем примере изменение текста из 4х слов про мальчика? Физически то текст не изменился. А вот значения — могут быть разные. И это только спустя 50 лет! Я молчу про то, что того народа просто не сохранилось в оригинале, максимум потомки, а гарантий про корректное обучение смыслам и звукопроизношение я не видел, т.к. нет корректирующих кодов и прочей современной атрибутики при передаче огромных данных без искажений. Отсюда вывод — искажения будут двух типов — смысловое и звуковое. И только верующие будут уповать на Аллаха, что все [OK], иногда отрицая даже тот факт, что течений мусульманства очень много, т.е. не все поняли оригинал (молчу про переводы).
Это из «Призрак в доспехах»? Давно смотрел, уже начал подзабывать.
Дело в том, что понятие души на данный момент не определено, т.к. научные исследования могут быть поставлены под сомнение и постановлением министра империи Добра (или Зла) признаны антинаучными. Имеем несколько вариантов:
— Выяснится что душу имеет даже камень. Соответственно, тот, кто имеет даже каменное сердце и мозг (процессор из кремния) может анализировать, т.к. наделено душой (про разум умолчим)
— Душа есть только у человека (про животных умолчим). В случае переноса знаний человека в робота, робот может не получит такие же права, как у человека. Но тут остается проблема киборгов, т.к. неизвестна привязка души к телу или к его части.
— Души действительно нет. И тут любые спекуляции будут на руку только мошенникам.

Я не придерживаюсь какого-либо варианта. Но последний вариант, в случае реализации, больно ударит по духовным и «духовным» организациям.
Относительно разума: [sakasm]Многие страны финансируют поиск внеземного Разума. Найти разум на Земле они считают невозможной задачей[/sarkasm]
Даже у компьютера могут быть стереотипы.
Лично я вижу появление связи между позитивностью и женственностью — в процессе обучения нейросети или ее аналога. Особенно, если исходные данные могли быть с таким же разделением, что позитивные статьи получались только от женских авторов. ЕМНИП, у Ватсона был период, когда его могли обучать кто попало, что потом приходилось чуть ли не вручную отучивать ругаться матом.
«Язык не менялся». Спорное утверждение. Проведу аналогию:
«Мальчик в клубе склеил модель»
За последние 50 лет изменилось значение всех 4х слов. Расшифровки:
раньше «Пионер в доме творчества конструировал модель механизма»
сейчас «Парень в ночном клубе встретился с девушкой, у которой модельная внешность»
Хотел при новой расшифровке написать «снял», но у него тоже есть новое значение, не связанное с фотоаппаратами.
Что имеем? Физически текст не изменился. Но можно расшифровать по-разному даже на родном языке!
С книгами может быть еще печальнее, т.к. физически не сохранится человек, который будет помнить изначальный смысл (мы же говорим про века?). Также есть момент, связанный с новыми технологиями, который вынуждает «сменять пластинку» (только вот сами пластинки давно уже не в ходу, только у ценителей), когда живет какое-то семейство нормально, а потом возникает индивидум, из-за которого фамилия того семейства может стать нарицательным ругательством. Вариант — версия происхождения слова «хулиган».
Добавляет к расшифровке еще национальные особенности. Например — девушка считалась распутной в некоторых странах, если она не носит платок (современный аналог в Европе — не носит паранджу в соответствующих кварталах).
Приходим к выводу — при неизменности слов смысл может измениться кардинально. Я молчу про случаи, когда может быть еще добавлен перевод со старого языка на новый, типа с дореволюционного на современный, с утерей разницы между словами миръ (нет войны) и мiръ (окружающая вселенная) с добавлением значений «советская орбитальная станция» и «платежная система»
Десктоп, веб…
Да, я пишу на десктоп. Почему? Смотря какая задача. Иногда и не пишу.
Просто оценим задачу:
1) Эту задачу уже решали? И насколько удовлетворительное решение?
— Я, например, не находил RPG-системы (типа Habbit); образовательные системы. Или цена лицензии в килобаксах для моей дополнительной задачи с ценой в несколько килорублей несовместима — тут либо аутсорсинг, либо отказ от задачи, либо разработка инструмента.
2) Потенциальный пользователь может воспользоваться интернетом?
— Предприятия, бюджетные организации обычно имеют ограничения (или вообще изолированную сеть для безопасности).
3) Какие требования по ресурсам?
— Для тех же игр и ресурсоемких приложений (видеообработка, 3D-моделирование) веб может быть неприемлимым решением, особенно при небольшой скорости канала. Хотя редактирование документов вполне возможно в вебе (выше были примеры).
4) На какие системы? Какой планируемый охват по пользователям? Какова их подкованность?
— Как бы не был симпатичен мне .NET, но необходимость разворачивания на клиенских компьютерах неопытных пользователей приводит к тому, что изначально собирается максимально портабельная система. Задача стоит вообще на Linux делать.

И уже из оценки этих и других параметров выбирается язык, на какие системы, вид приложения (веб, клиент, клиент-сервер, десктоп или другие вариации). Вариант подрядчика не рассматриваю (там как сказали, так и делаем, если это возможно).

Теперь по самой статье:
=> Десктопный софт работает без интернета.
Как плюс: Порвали оптику. Все, я даже локальные копии через онлайн-приложения не смогу редактировать. Онлайн-приложения становятся недоступными. Иногда простой = убытки. А вот десктоп-приложение остается работоспособным.
Как минус: функции интернета могут отсутствовать напрочь, например, недоступность совместного редактирования. Сюда же невозможность расшарить средствами приложения.
=> Лицензирование десктопного софта просто и понятно.
Как плюс: есть типа LGPL и я могу использовать как угодно на свой страх и риск. Или заплатить и получить что нужно, иначе получить обратно свои финансы. И завтра получу тоже самое, что и вчера.
Как минус: есть ShareWare, где я ничтожество, не имеющее никаких прав, да и которое должно еще и заплатить за кота в мешке, а разработчик не несет никакой ответственности. Оно даже может быть трояном (делать вид, что имеет полезную функциональность). У автора — вариант про «тыкву».
=> Декстопный софт выглядит одинаково каждый день
Как плюс: Привыкание и дальнейшее удобство. У автора это описано.
Как минус: приложение не сможет добавить новую или улучшить функциональность. Проблема обновления в win-системах стоит остро, т.к. там каждый использует свой велосипед, а иногда обновление возлагается на пользователя, т.е. вручную. Часто новая версия требует вообще покупки новой лицензии (иногда со скидкой, для владельцев лицензии на старую версию).
=> Десктопный софт доступен для расширения.
>>> «Нет, такое, конечно, по лицензии часто делать нельзя, но если очень надо, вот вопрос жизни и смерти человечества, то это по крайней мере физически возможно.»
Тогда с таким оправданием можно взломать сервер с сайтом, что ли. Хотя да, это сложнее и больше свидетелей, особенно если заявиться с ломом наперевес в дата-центр если удаленно не получается. А так — сам вопрос расширяемости под большим вопросом на коммерческих системах, особенно если там это не предусмотрено лицензией и встроенными средствами. Так же с сайтами. Тут полное равенство.
=> Десктопный софт работает
Как разработчику полный доступ, это конечно, хорошо. Но как отреагирует пользователь на кеулоггер или всякие «дополнительные менеджеры по управлению дополнительными менеджерами»? (доп.софт, который любит ставиться в Windows-системах, если не найти и не удалить секретную галочку).
А вот Flash, Java (особенно второе) требуют как раз системы, которые устанавливаются. Иногда они могут запросить .NET, библиотеки С++ и прочие фреймворки, которые ни разу не устанавливаются вместе с приложением. Хорошо если буду в коплекте в другой папочке, чаще всего вообще просят скачать с оф.сайта, а там offline-установщик не всегда можно найти.
Тут относительное равенство, т.к. обычный сайт не просит ничего дополнительного, как и обычное приложение.
=> С декстопным софтом быстрее начать работать
Как минус: если надо быстро отредактировать документ, то скачивание офиса, его установку — это уйма времени. А онлайн-инструмент сделает это куда быстрее.
Как плюс: если надо редактировать много документов, то использование онлайн-инструмента может быть затруднительно, т.к. это авторизация, маленький канал, пинг. Сайт может вообще перейти на новую версию, а в работе нужна вообще старая версия для совместимости.
=> Десктопный софт можно контролировать.
Внешнее поведение — ни разу. Максимум — запустить в VirtualBox. Установка рекламы не фиксируется антивирусом (особенно 10 рекламных ярлыков или внутренние всплывающие сообщения).
А вот по поводу контроля документов, тут да. Конфендициальность и анонимность может быть гарантирована (если вырубить интернет).

Я удивлю, но многие мобильные и веб-приложения разрабатываются на десктоп-приложениях.
Отступ про делфи (VCL) — постоянно что-то модифицируется, дополняется, открываются новые технологии, поэтому тут тоже не все устаканилось. Часть технологий переходит из других языков, я молчу про переезды с одной парадигмы на другую (с компиляции в асм код на NET, а потом еще куда-нибудь)

Послесловие:
В зависимости от задач выбирается инструмент. А дальше зависит от доступности инструмента. Если слабо доступен, то ищутся люди, которые выбрали инструмент и под него ищут задачи.
Спасибо, посмотрел. Немного напоминает шаблонизаторы для web. По сути ваши маркеры => теги. Задумался над расширением своего квайна. Хотя в моем случае теги явно лишние, т.к. достаточно найти одно из ключевых слов и перед (после) этим ключом вставить нужный мне текст. Ключевых слов для поиска в синтаксисе паскаля не очень много:
+ uses (для вставки библиотеки при необходимости)
+ function, procedure, begin, end (для отслеживания начала подпрограмм или тела основной программы)
+ const, var (для добавления переменных)
При отсутствии ключевого слова (var|const необязательны для программы) достаточно найти место перед первой функцией/процедурой/телом программы. Еще необходимо в парсере записать отличия глобальных переменных от локальных.

В идеале моя программа должена будет найти свой исходник, обработать его до состояния квайна с возможностью вставки/удаления отдельных функций вплоть до расширения функциональности при вызове из командной строки с новыми ключами. При дальнейшем развитии программа станет сама себе SVN, IDE и прочий функционал для повышения ЧСВ программиста.
Я изначально не собирался изобретать велосипед и решил просто ознакомится с Википедией Quine (программирование) и статьями на Хабре о создании квайнов, такие как Мультиквайногенератор (она самая), Как писать квайны, Эстафета из 50-ти квайнов и другие.
В Мультиквайногенераторе хотя и косвенно, но в уравнениях все-таки затронута тема квайнов. Я сократил количество переменных и из Q(F,f,g,h,i,j) получил Q(F,G), где F и G — функции вывода массива A[1,N] в разных представлениях. Для включение режима квайнов достаточно разделить массив A на A1 и A2, где в массиве A1 элементы от 1 до K, в A2 остальные [K+1,N] элементов, получим формулу Q(F(A1),G,F(A2)). Первоначально намеревался написать и развить из одной формулы в другую (описав процесс своего поиска), но в итоге решил что если K = N, тогда A2 = 0, F(0) = 0 и формула «режима Quine» приобретет вид Q(F,G) (на самом деле Q(F,G,0)). Добавить флаги на циклах вывода и у меня получается самая заурядная функция вывода массива байтов в виде текста или в виде HEX-констант.
Для того, чтобы написать квайн, не обязательно писать квайн.

примерно также рассуждал Дж. фон Нейман, в книге «Теория самовоспроизводящихся автоматов.»

Видел отрывочные сведения, когда смотрел информацию по Жизнь (игра) и порассуждал на тему самовоспроизводящихся программ:
Сама игра является удачной попыткой Конвея доказать существование простых самовоспроизводящихся систем.

Для реальных систем это как-то слишком сложно в реализации, а вот для программных единиц вполне реально. Оттуда и перешел к квайнам. А вот тут как раз
аналогия с жизнью: первому способу соответствует синтез белка по последовательности нуклеотидов, а второму репликация последовательности нуклеотидов

Как в реальной жизни — есть программа (организм), есть ДНК/РНК (исходный/исполняемый код). Есть функция Quine, которая выводит свой исходный код (ДНК), остальные функции можно менять по своему усмотрению. Если генные изменения сломает Quine-код — то клетка становится одноразовой (не может давать потомство). В реальной жизни аналогично, хотя и сложнее, как ассемблерный код для непосвященных.
Моя задача — в своей программе Quine-функции и иные системные вещи отладить и вынести в «закрытые» разделы (или даже в отдельную подсистему), остальные функции отдать на откуп генетическим/нейронным алгоритмам или же использовать библиотеки.
Но перед этим придется решить множество других задач по организации рабочего пространства, а конкретно: архитектура, эргономика, мультиязычность и др.
Решения этих задач планирую освещать в том числе на хабре. Надо же с чего-то начинать.
12 ...
15

Information

Rating
Does not participate
Registered
Activity