Search
Write a publication
Pull to refresh
1
0
Антон Крюков @emreu

User

Send message
Спасибо! Это то что нужно!
Надо будет попробовать…
Да, вот какие задачи приходится решать русским учёным. И это при работе с технологией, которая, вроде как, должна была бы упрощать работу с документами (правда pdf не обязан гарантировать возможность скопировать текст, только воспроизводимость на любых устройствах). Интересно, если собрать свой велосипед со встроенным расшифровщиком, то будет ли он пользоваться спросом?
Abby PDF Transformer не пользовался, но он ведь не бесплатный. Пока единственное спасение это FineReader (который тоже не бесплатный), со всеми проблемами потери форматирования и некорректно распознанными символами.
Если будет время покопаюсь в pdf.js, попытаюсь понять как он хэндлит эти заэмбедденые шрифты.
Может кто-нибудь знает как бороться с кодировками в PDF с русским текстом? Особый интерес представляют научные статьи, который, судя по всему, компилятся из tex'а. Ни из одного просмотрщика не удалось скопировать текст, пригодный для вставки в какой-нибудь текстовый процессор, более того, тут даже 2cyr decoder
бессилен.
image

Насколько я понимаю, в PDF может использоваться какая-то кастомная кодировка.
Но знаете что самое интересное? Если просматривать такой проблемный файл в pdf.js вьювере от mozill'ы (который рендерит в html) то текст прекрасно читается на странице, но вот в коде видно всё те же самые "£ÄÇÆÇÐËÇ", при том что у документа указана кодировка utf-8 и никаких выкрутасов со шрифтами не делается. Вот где загадка…
Ваша статья подтверждает то, что подобные идеи витают в воздухе.
Мне кажется, что для наведения порядка в информационном поле необходима в первую очередь удачная платформа или может быть даже просто хорошо проработанная концепция. Что-то в духе unix-way с его набором программ выполняющих одну функцию, но очень хорошо. Или идеей хранить все настройки в системе в виде текстовых конфигов. Потребность в быстром получении актуальных данных достаточно велика, многие компании и отдельные энтузиасты работают сейчас в этом направлении. Так что всё это будет у нас, и, возможно, достаточно скоро!
Напрашивается интересный вывод: можно описывать работу мозга не в терминах взаимодействия отдельных нейронов, а как коллективные процессы распространения и эволюции солитонов активности, эдаких квантов мышления (может быть идей?). А это значит сразу упрощается вычислительная сложность и можно симулировать интеллект на не слишком мощном железе…
Спасибо за статью, ждём продолжения!
А Вы добавьте в начало каждой статьи ссылки на остальные части и тем, кто не с начала читает, будет проще сориентироваться.
Ждём продолжение с нетерпением.
Просто когда читал про HTM, вызывало удивление, как может нейрон помнить свои предыдущие состояния, когда он сам может иметь только два состояния. Точнее не было понятно, как это может быть реализовано в «железе».
Спасибо автору! Очень интересные статьи.
Процесс с возбуждением метаботропных рецепторов — это же прямая реализация временной памяти нейрона из HTM!
Интересно, а можно ли ёмкостный сенсор класть пот толстое покрытие, под кафельную плитку, например?
Интересно, если точный довод прицела осуществлять за счёт акселерометра (не помню есть ли он в вальвовском контроллере), то можно ли достичь той же точности и скорости в шутерах как с мышью?
Можно ведь вместо подтверждения (или вместе с ним) передавать активный план (то есть тот которого собираешься придерживаться). Если получаемый в сообщении план совпадает с твоим собственным — прекращаешь синхронизацию, иначе меняешь свой активный план на полученный и проводишь ещё один шаг синхронизации. Если в линии передачи нет помех, то 2-х передач будет достаточно, иначе после фиксированного числа шагов прекращаешь эту бесперспективную процедуру и откатываешься к предыдущему плану, который был достоверно синхронизирован.
Такое решение конечно не годится, если изменения в плане возникают быстрее чем мы успеваем их синхронизировать.
Да, пожалуй хороший ИИ мог бы нефигово перевернуть весь современный мир. У нас есть прекрасные технологии для хранения и передачи, получения и воспроизведения информации. Да, есть железо из которого можно выжимать петафлопсы, но оно является обычной числомолотилкой, вся функциональность которого ограничивается фантазией программиста. Нам не хватает систем, которые могли бы решать произвольные задачи, сформулированные на естественном языке, условия которых плохо формализованы, а исходные данные не собраны в готовый набор. При этом от ИИ не требуется умения поддерживать философскую беседу или писать картины из своего воображения, но он должен уметь делать то, чем сильны компьютеры — быстро обрабатывать большие массивы информации.
Например найти самое выгодное предложение какого-то конкретного товара, с учётом стоимости доставки, всех скидок по акциям и прочих условий, перерыв все доступные интернет-магазины. Или переформатировать огромный документ, заменив отступы пробелами и кривые переводы строк, попутно применяя стили к соответствующим фрагментам. Или сформировать план на день с учётом всех предстоящих встреч и походов в нужные заведения, подтянув из доступных источников информации данные о режимах работы, а так же расписании транспорта, возможных пробках и т.д.
Согласитесь, что подобные задачи мы можем решать уже сейчас, но для этого придётся написать программу, которая, скорее всего, пригодится всего несколько раз, или, может быть, только конкретному человеку, ввиду специфичных условий отбора или источников информации. Было бы здорово, если бы ИИ мог собирать такие программки на лету, под каждый отдельный случай конкретной задачи. Насколько я знаю, сейчас эта ниша пустует, а очень хотелось бы, чтобы её кто-нибудь заполнил.

Information

Rating
Does not participate
Location
Санкт-Петербург, Санкт-Петербург и область, Россия
Registered
Activity