Комментарии 16
Камень нужно затянуть в студию, дать света и отфоткать с разных точек. Затем составить карту потенциальных символов и начать анализ этой карты. Результат будет лучше.
Добрый день, камней много и они в степи, в студию не занесешь. Карту - у нас называется алфавитом (все возможные классы) составлена. Сейчас скорее проблема в разметке, пока не собрали достаточно большой объем набора размеченных данных. Но постепенно двигаемся. Работа будет продолжаться, но это трудоемкий процесс не на один год. Там много близких алфавитов - где пересечение символов 70-98%. Нужно составлять каждый отдельно и обучать модель для него. Идем по пути Гугл и Яндекс переводчиков...
Поехать в степь с небольшим 3D-сканером, отсканировать поверхность камня в 3D-модель. А тогда уж AI лучше разберется, где там символы, а где просто неровности и сколы.
Скрытый текст

Эх, молодёжь)) Не знаете дедовских способов рисования монет на бумаге. Нужно накрыть монету неплотной бумагой и закрасить её простым карандашом.
Есть современные любители использовать тюркскую рунику. Их творчество тоже наверное можно использовать для обучения. Они конечно не на камнях пишут. Но и люди для того чтобы читать надписи на камнях на русском языке, к примеру, тоже обучаются не на каменных эпитафиях.
Предыдущие знаки как-то влияют на следующие в этой системе письма? Можно ли отмести Ы после Ж и Ш?
Надеюсь через 2 тис лет сверх людям будет интересно разбирать каракули срачей на форумах нынешних обывателей
Их расшифровка началась во второй половине XIX века и остаётся предметом научных исследований и дискуссий
А что, сами тюркские народы утратили способность читать свои же тексты?
А Вы по-старославянски читать умеете? А ведь это куда более современная вещь, чем орхоно-енисейские руны.
Скрытый текст

Старославянский церковно-славянский это никакой не старо-славянский. Это старо-болгарский. Конечно я его читать не умею, с чего бы это?
Эээээ....
Старославянский:
Не лепо ли ны бяшетъ, братие, начяти старыми словесы трудныхъ повестий о пълку Игореве, Игоря Святъславлича? Начати же ся тъй песни по былинамь сего времени, а не по замышлению Бояню!
Боянъ бо вещий, аще кому хотяше песнь творити, то растекашется мыслию по древу, серымъ вълкомъ по земли, шизымъ орломъ подъ облакы, помняшеть бо, рече, първыхъ временъ усобице. Тогда пущашеть 10 соколовь на стадо лебедей, которыи дотечаше, та преди песнь пояше старому Ярославу храброму Мстиславу, иже зареза Редедю предъ пълкы касожьскыми, красному Романови Святъславличю. Боянъ же, братие, не 10 соколовь на стадо лебедей пущаше, нъ своя вещиа пръсты на живая струны въскладаше, они же сами княземъ славу рокотаху.
Церковнославянский:
Зачало Евангелиа Иисуса Христа, Сына Божия, якоже есть писано во пророцех: се, аз посылаю ангела моего пред лицем твоим, иже уготовит путь твой пред тобою. Глас вопиющаго в пустыни: уготовайте путь Господень, правы творите стези его. Бысть иоанн крестяй в пустыни и проповедая крещение покаяния во отпущение грехов. И исхождаше к нему вся иудейская страна и Иерусалимляне: и крещахуся вси во иордане реце от него, исповедающе грехи своя. Бе же иоанн оболчен власы велблужди, и пояс усмен о чреслех его, и ядый акриды и мед дивий. И проповедаше, глаголя: грядет креплий мене вслед мене, емуже несмь достоин преклонься разрешити ремень сапог его: аз убо крестих вы водою: той же крестит вы Духом святым. И бысть во онех днех, прииде Иисус от назарета галилейскаго и крестися от иоанна во иордане. И абие восходя от воды, виде разводящася небеса и Духа яко голубя, сходяща нань. И глас бысть с небесе: ты еси Сын мой возлюбленный, о немже благоволих.
И я, например, и тот, и другой понимаю.
Тут скорее другой пример привести можно.

Если что, это глаголица в хорватской церкви. Вряд ли это можно назвать старославянским.
Судя по рисунку 5, там не bbox детектор нужен, а линии строк детектировать.
Пропущено символах в строках уж очень много.
Постобработка с детекцией строки по детекциям букв, хоть и костыльный, но тоже вариант
А это фонетические руны?
Может не стоит пытаться разделять их на алфавиты? На камне особо не поизгаляешься, редкий извращенец будет на камне много долбить руну 335 из алфавита Кюль-Тегин, поэтому она скорее всего редко встречается, и хуже распознается. Но если она встречается в других алфавитах, то может набраться достаточное количество для более уверенного распознавания.
А вторым уровнем пускать лингвистический анализ. Например, если в надписи больше трёх слов, можно будет с высокой степенью вероятности определить язык.
Хотя, конечно, может специфика какая есть
Распознавание орхоно-енисейских рунических надписей методами машинного обучения