Думаю, это полезная функция, ведь на большинстве сайтов комментарии не нужны. Клиппер пытается определить область контента и отсекает все ненужное. Например, если в блоге на Medium автор злоупотребляет разделителями, клиппер берет кусок контента между первым и вторым дополнительными разделителями, а остальное все воспринимает как ненужную информацию. Я думаю, эти проблемы можно решить написанием шаблона импорта. Клиппер позволяет такое сделать. Но в бете это было неудобно.
Копировать. При копировании-вставке форматирование (по крайней мере переносы строк) сохраняется. Можно написать свой шаблон импорта, там есть такая возможность.
Тоже хотел написать, что уже почти месяц, как выпустили. Хоть и в бете был. Недобросовестно готовятся новости сейчас на Хабре - из всего делается хайп.
Это очень не похоже на описание принципов работы. Нет ни примера, ни понятного алгоритма, ни соглашения о терминологии (должно быть понятно, в каком смысле использованы термины). Если этого не будет в одном-двух абзацах, то и понятно ничего не будет читателю. Читатель изначально должен получить представление, чтобы при желании нанизать на него подробности из пособия. Никто не обязан читать Ваше пособие целиком, пытаясь воссоздать Ваши мысли и понять, что же Вы имели в виду. "Ментальный реверс-инжиниринг" довольно трудозатратен.
Понял. У вас первый пример был с Passive voice, второй (LT to fight passive voice) - "is" + ("gerund") + "infinitive". Я не увидел границы и первоначально понял так, что конструкцию "is ... to" Вы относите к пассивному залогу. Согласен с Вашей мыслью.
Немного не так. Когда есть герундий (глагол с ing-овым окончанием), это уже не может быть пассивным залогом. Формы модального глагола to be совместно с перфектной формой глагола могут образовывать страдательный залог, который очень удобен в безличных конструкциях. А именно безличные конструкции - стандарт в технической и научной речи. "An extraction was performed..., the condition was established..., the reaction product was obtained..., the genome was assembled."
В коммитах любят повелительное наклонение, потому что это самая минималистичная конструкция с чистой основой. Именно такого подхода придерживаются разработчики визуальных интерфейсов: "open the window", а не "by clicking you can open the window". Если говорить о коммитах, "Update README" и "this updates README" отличаются, второй вариант выглядит избыточным.
Полезно и интересно, но в первоначальном перечне все навалено без знаков разделения, и непонятно, к чему относится та часть перечня, которая идёт после скобок и стоит с большой буквы - к новому элементу, или характеризует предыдущий, зачастую в неправильном падеже. Нужен явный разделитель. И элементы перечня или хотя бы подразделы лучше заанкорить в оглавлении, потому что текст длинный, и навигация скроллингом утомляет.
Для создателей контента, колористов и монтажеров особенно интересны те функции, которые не реализованы в альтернативных продуктах. Поэтому автору, помимо описания нововведений в разделе "Neural Engine", стоило также сказать о новшествах в Color, Fusion и Fairlight. Учитывая, что это программа для цветокоррекции и грейдинга, очень странно, что не упомянуты нововведения, связанные с функционалом вкладки Color.
На практике, проекты, созданные в более ранних версиях программы, открывались в 14 -16 Davinci Resolve. BlackMagick примерно раз в год выкатывают новую версию. Там были какие-то моменты с переходом на новые версии, когда проект можно было преобразовать, и он уже не открывался в более ранних версиях. А старые проекты открывались без проблем. Если же у кого-то проблемы с этим - установите старую версию и попробуйте экспорт проекта или альтернативный формат проекта. Должно сработать.
Нет, я писал именно об этой букве. Во всех тюркских языках, которые я слышал и в которых используется аффикс "-арга" для обозначения инфинитива, он произносится как [arγá].
Так вроде IPA это же оно и есть.
В работах, которые я встречал, использовались другие обозначения для гласных. Предполагаю, что это просто видение у разных авторов отличается.
сделать отличный фонемайзер тут - ни разу не просто.
Я думаю, что не нужен отличный. Он должен быть настроен на фонетическую систему языка. Учесть эти правила несложно. А качество возрастет. IMHO, нельзя давать на откуп black box то, что можно контролировать с помощью небольшого набора правил.
юридически мы не имеем права выкладывать аудио дикторов в публичный доступ
Можно взять аудиозапись из публичного доступа, и синтезировать этот же фрагмент речи. А можно попросить волонтеров озвучить абзац из Википедии на якутском, и его же озвучить с помощью модели. Такого сравнения очень не хватало.
носители языка нам скорее всего тут особо не помогут, т.к. они просто говорят не задумываясь. Отсюда получаем замедление релиза на порядок, т.к. надо будет найти носителей языка, которые одновременно и лингвисты.
Люди обычно говорят, не задумываясь. Но когда слышат неправильное произношение, сразу начинают чувсвовать, что что-то тут не то. И в итоге обращают внимание на некоторые из тех нюансо, о которых они не задумывались.
Вами проделана огромная работа. Спасибо, что объяснили Ваши взгляды на разработку модели. Я с Вами согласен отчасти, некоторые вещи не пойму (как, например, зачем в модели синтеза речи на якутском языке настолько качественно реализовывать синтез реи на русском), с некоторыми вещами несогласен. Но уверен, что вы сделали взвешенный и адекватный выбор при поиске подхода. Желаю Вам удачи в развитии вашего проекта.
1) в Вашей статье нет валидации. Модель нужно валидировать на реальную речь. И примеры речи носителей были бы кстати.
2) почему Вы не использовали международное фонетическое письмо при описании алфавита?
3) все гласные группы "и" (i, ï, ü, u, в принятых для описания фонетики тюркских языков символах) в тюркских языках краткие вплоть до редукции. Исключений очень мало (литературный турецкий, гагаузский, в которых эти процессы выражены слабо).
4) в некоторых местах, например, в аффиксе инфинитива "арга" г должна быть ğ (то есть гамма на международном фонетическом алфавите, но у меня на раскладке в телефоне нет этого символа). Так во всех тюркских языках. И звук "ğ" обычно звучит более гортанно, это тоже нужно учитывать. Он не похож на украинское "г" и даже не полностью похож на греческую гамма (более шумный звук по сравнению с украинской "г").
5) в окружении палатальных и глоттализированных аффрикат фонема "а" обычно произносится в более задней позиции.
6) "ы" всегда звучит в более задней позиции (в русском этот звук средний и как бы с более широкой локализацией, а в тюркских языках он всегда задний). Исключение в тюркских языках - гагаузский, говоры крымского языка с румейским (византийским) субстратом, а также понтийские и лазский этнолекты турецкого языка и в некоторой степени современный литературный турецкий. В этих языках "ы" имеет в разной степени среднюю позицию, но в то же время узкую локализацию.
7) концепция ударения в русском языке отличается от таковой в большинстве индоевропейских языков. В русском языке ударение определяется и реализуется в первую очередь удлинением долготы. В других языках - напряжением гортани при произнесении звуков.
8) всё-таки лучше транслировать в фонетический алфавит, а затем синтезировать звук. Алфавит не в полной мере отражает фонетику, и это разные задачи. Лучше декомпозировать и затем отлавливать трудные случаи в каждом слое модели независимо.
>Приложение для заметок Obsidian Note, или как держать всё и сразу, и при этом — ничего не потерять
У меня приложение называется Obsidian. А сам проект, насколько я знаю, Obsidian.md, это же и адрес его сайта. А вот что такое Obsidian Note, я не знаю.
Это не то, по всей видимости, о чем писал автор. Просто ленивые на чтение люди во всех воплощениях семантики или реляционных взаимоотношениях между сущностями в домене управления знаниями видят Zettelkasten. Я здесь тоже, даже приложив усилия, не увидел ничего похожего на Zettelkasten по Луману или в его более обобщенных вариациях типа как видят авторы zettelkasten.de. Если бы автор дал бы контекст и примеры, как можно использовать такой подход, и в каких случаях эта органическая классификация на основе свойств будет хорошо работать, было бы легче понять, зачем нужны yet another отдельная программа и пост.
>вся вода в доме проходит через ионообменный умягчитель натрий (в любых количествах свыше микроконцентраций) и хлор (в избытке) токсичны для растений. Я бы не поливал растения смягченной водой. Вместо этого в водопроводную воду добавляется азотная кислота через инжектор, либо раствор форсфор-содержащего комплексона (но это дороже).
Кощунство. Opesource.org - инициатива серьезная, но решение мне кажется странным.
Кстати, перевод тоже не очень. Не прям, чтобы ужасен, но искажает смысл. Например, Custom Post Type for directors - имеется ввиду дополнительный тип контента для сущности "директор".
removing outdated information and streamlining what remained. This decluttering will make space for new content for the website to be more useful, letting visitors learn what Open Source is and how it can help them. - убрав, а не удалив, неактуальную информацию. Такое приведение к порядку может создать пространство для того, чтобы веб-сайт стал более полезным, ...
Многие устанавливают Obsidian и Logseq в одну папку. Почему бы не попробовать установить туда или линкнуть имеющиеся директории с заметками в папку проекта Reor?
Думаю, это полезная функция, ведь на большинстве сайтов комментарии не нужны. Клиппер пытается определить область контента и отсекает все ненужное. Например, если в блоге на Medium автор злоупотребляет разделителями, клиппер берет кусок контента между первым и вторым дополнительными разделителями, а остальное все воспринимает как ненужную информацию. Я думаю, эти проблемы можно решить написанием шаблона импорта. Клиппер позволяет такое сделать. Но в бете это было неудобно.
Копировать. При копировании-вставке форматирование (по крайней мере переносы строк) сохраняется. Можно написать свой шаблон импорта, там есть такая возможность.
Тоже хотел написать, что уже почти месяц, как выпустили. Хоть и в бете был. Недобросовестно готовятся новости сейчас на Хабре - из всего делается хайп.
Это очень не похоже на описание принципов работы. Нет ни примера, ни понятного алгоритма, ни соглашения о терминологии (должно быть понятно, в каком смысле использованы термины). Если этого не будет в одном-двух абзацах, то и понятно ничего не будет читателю. Читатель изначально должен получить представление, чтобы при желании нанизать на него подробности из пособия. Никто не обязан читать Ваше пособие целиком, пытаясь воссоздать Ваши мысли и понять, что же Вы имели в виду. "Ментальный реверс-инжиниринг" довольно трудозатратен.
Понял. У вас первый пример был с Passive voice, второй (LT to fight passive voice) - "is" + ("gerund") + "infinitive". Я не увидел границы и первоначально понял так, что конструкцию "is ... to" Вы относите к пассивному залогу. Согласен с Вашей мыслью.
Немного не так. Когда есть герундий (глагол с ing-овым окончанием), это уже не может быть пассивным залогом. Формы модального глагола to be совместно с перфектной формой глагола могут образовывать страдательный залог, который очень удобен в безличных конструкциях. А именно безличные конструкции - стандарт в технической и научной речи. "An extraction was performed..., the condition was established..., the reaction product was obtained..., the genome was assembled."
В коммитах любят повелительное наклонение, потому что это самая минималистичная конструкция с чистой основой. Именно такого подхода придерживаются разработчики визуальных интерфейсов: "open the window", а не "by clicking you can open the window". Если говорить о коммитах, "Update README" и "this updates README" отличаются, второй вариант выглядит избыточным.
Полезно и интересно, но в первоначальном перечне все навалено без знаков разделения, и непонятно, к чему относится та часть перечня, которая идёт после скобок и стоит с большой буквы - к новому элементу, или характеризует предыдущий, зачастую в неправильном падеже. Нужен явный разделитель. И элементы перечня или хотя бы подразделы лучше заанкорить в оглавлении, потому что текст длинный, и навигация скроллингом утомляет.
Для создателей контента, колористов и монтажеров особенно интересны те функции, которые не реализованы в альтернативных продуктах. Поэтому автору, помимо описания нововведений в разделе "Neural Engine", стоило также сказать о новшествах в Color, Fusion и Fairlight. Учитывая, что это программа для цветокоррекции и грейдинга, очень странно, что не упомянуты нововведения, связанные с функционалом вкладки Color.
На практике, проекты, созданные в более ранних версиях программы, открывались в 14 -16 Davinci Resolve. BlackMagick примерно раз в год выкатывают новую версию. Там были какие-то моменты с переходом на новые версии, когда проект можно было преобразовать, и он уже не открывался в более ранних версиях. А старые проекты открывались без проблем. Если же у кого-то проблемы с этим - установите старую версию и попробуйте экспорт проекта или альтернативный формат проекта. Должно сработать.
Нет, я писал именно об этой букве. Во всех тюркских языках, которые я слышал и в которых используется аффикс "-арга" для обозначения инфинитива, он произносится как [arγá].
В работах, которые я встречал, использовались другие обозначения для гласных. Предполагаю, что это просто видение у разных авторов отличается.
Я думаю, что не нужен отличный. Он должен быть настроен на фонетическую систему языка. Учесть эти правила несложно. А качество возрастет. IMHO, нельзя давать на откуп black box то, что можно контролировать с помощью небольшого набора правил.
Можно взять аудиозапись из публичного доступа, и синтезировать этот же фрагмент речи. А можно попросить волонтеров озвучить абзац из Википедии на якутском, и его же озвучить с помощью модели. Такого сравнения очень не хватало.
Люди обычно говорят, не задумываясь. Но когда слышат неправильное произношение, сразу начинают чувсвовать, что что-то тут не то. И в итоге обращают внимание на некоторые из тех нюансо, о которых они не задумывались.
Вами проделана огромная работа. Спасибо, что объяснили Ваши взгляды на разработку модели. Я с Вами согласен отчасти, некоторые вещи не пойму (как, например, зачем в модели синтеза речи на якутском языке настолько качественно реализовывать синтез реи на русском), с некоторыми вещами несогласен. Но уверен, что вы сделали взвешенный и адекватный выбор при поиске подхода. Желаю Вам удачи в развитии вашего проекта.
Молодцы, но есть несколько нюансов:
1) в Вашей статье нет валидации. Модель нужно валидировать на реальную речь. И примеры речи носителей были бы кстати.
2) почему Вы не использовали международное фонетическое письмо при описании алфавита?
3) все гласные группы "и" (i, ï, ü, u, в принятых для описания фонетики тюркских языков символах) в тюркских языках краткие вплоть до редукции. Исключений очень мало (литературный турецкий, гагаузский, в которых эти процессы выражены слабо).
4) в некоторых местах, например, в аффиксе инфинитива "арга" г должна быть ğ (то есть гамма на международном фонетическом алфавите, но у меня на раскладке в телефоне нет этого символа). Так во всех тюркских языках. И звук "ğ" обычно звучит более гортанно, это тоже нужно учитывать. Он не похож на украинское "г" и даже не полностью похож на греческую гамма (более шумный звук по сравнению с украинской "г").
5) в окружении палатальных и глоттализированных аффрикат фонема "а" обычно произносится в более задней позиции.
6) "ы" всегда звучит в более задней позиции (в русском этот звук средний и как бы с более широкой локализацией, а в тюркских языках он всегда задний). Исключение в тюркских языках - гагаузский, говоры крымского языка с румейским (византийским) субстратом, а также понтийские и лазский этнолекты турецкого языка и в некоторой степени современный литературный турецкий. В этих языках "ы" имеет в разной степени среднюю позицию, но в то же время узкую локализацию.
7) концепция ударения в русском языке отличается от таковой в большинстве индоевропейских языков. В русском языке ударение определяется и реализуется в первую очередь удлинением долготы. В других языках - напряжением гортани при произнесении звуков.
8) всё-таки лучше транслировать в фонетический алфавит, а затем синтезировать звук. Алфавит не в полной мере отражает фонетику, и это разные задачи. Лучше декомпозировать и затем отлавливать трудные случаи в каждом слое модели независимо.
У Маркова есть отдельная лекция на этот счёт. Разбита на два видео примерно по два часа, в свободном доступе.
>Приложение для заметок Obsidian Note, или как держать всё и сразу, и при этом — ничего не потерять
У меня приложение называется Obsidian. А сам проект, насколько я знаю, Obsidian.md, это же и адрес его сайта. А вот что такое Obsidian Note, я не знаю.
Это не то, по всей видимости, о чем писал автор. Просто ленивые на чтение люди во всех воплощениях семантики или реляционных взаимоотношениях между сущностями в домене управления знаниями видят Zettelkasten. Я здесь тоже, даже приложив усилия, не увидел ничего похожего на Zettelkasten по Луману или в его более обобщенных вариациях типа как видят авторы zettelkasten.de. Если бы автор дал бы контекст и примеры, как можно использовать такой подход, и в каких случаях эта органическая классификация на основе свойств будет хорошо работать, было бы легче понять, зачем нужны yet another отдельная программа и пост.
>сейчас открыла доступ к наиболее мощной из них
К модели Ultra нет открытого доступа. Он есть только по подписке. Вы вводите в заблуждение.
>вся вода в доме проходит через ионообменный умягчитель
натрий (в любых количествах свыше микроконцентраций) и хлор (в избытке) токсичны для растений. Я бы не поливал растения смягченной водой. Вместо этого в водопроводную воду добавляется азотная кислота через инжектор, либо раствор форсфор-содержащего комплексона (но это дороже).
Кощунство. Opesource.org - инициатива серьезная, но решение мне кажется странным.
Кстати, перевод тоже не очень. Не прям, чтобы ужасен, но искажает смысл. Например, Custom Post Type for directors - имеется ввиду дополнительный тип контента для сущности "директор".
removing outdated information and streamlining what remained. This decluttering will make space for new content for the website to be more useful, letting visitors learn what Open Source is and how it can help them. - убрав, а не удалив, неактуальную информацию. Такое приведение к порядку может создать пространство для того, чтобы веб-сайт стал более полезным, ...
Так вроде бы все движки OCR и основаны на машинном обучении.
Многие устанавливают Obsidian и Logseq в одну папку. Почему бы не попробовать установить туда или линкнуть имеющиеся директории с заметками в папку проекта Reor?
Переводная книга?