Я не хочу указывать Вам на недостатки. Вы большой молодец, идеально сделать ни у кого не получится. Здесь много людей указали, как правильно было бы поступить на том или ином этапе, а также привлекли внимание к нескольким важным фундаментальным вопросам. Это конструктив. А критиковать весь технический процесс в деталях, когда к нему есть множество вопросов - не самый лучший способ донести информацию до сведения собеседника. Ну и на счет битрейта - практически ничего плохого с видео не получилось бы, если бы у Вас стояла дискретизация 4:2:2. Вы в любом случае теряее информацию, просто это может быть приемлемой жертвой, кроме того, потери скорее всего затронули область границ, потому что в мультфильме обилия градиентов (другой "уязвимой" для сжатия с потерями группы областей изображения) нет, и в первом случае потери информации сложнее обнаружить, а во втором случае отслеживать практически нечего. Вы писали, что пробовали разные инструменты, но они Вас не удовлетворили. Интрига в том, что Вы не указали, какие именно (по крайней мере при одном из упоминаний об использовании других интрументов). Вот эта информация очень интересна. С Davinci Resolve Вы могли бы обойтись всего одним инструментом вместо 4 (а может быть, и вместо всех).
Пример случая, когда автор не умеет (и не понимает, что, зачем и почему) обрабатывать видео и подробно разъясняет свой рабочий технический процесс. За усидчивость и целеустремленность громадный респект. Несколько базовых вещей, о которых хочется сказать: зерно аналоговой пленки - это не всегда тот вредный "шум", от которого нужно избавляться. Найдите примеры сканирования 8 мм пленки в 4k. Выглядит вполне достойно, учитывая, что это дело снималось на пленку с площадью кадра с половину ногтя мизинца лет так 50-70 назад. В киноиндустрии используется пленка большего размера, притом 16 мм даёт вполне пригодное качество и на ней снято много фильмов и сериалов с хорошей картинкой. Думаю, в этом случае тоже использовалась пленка 16 мм. Именно аналоговое зерно даёт нам возможность нормально воспринимать однородные пространства типа однотонной стены или неба. А без них такие области будут казаться пластилиновыми и неестественными. Давайте просто запомним, что детализация - не критерий качества видео. Если у изображения всё хорошо с другими параметрами - балансом белого, локальной контрастностью, постоянством цветовой схемы на протяжении видеоряда в пределах одной сцены и так далее, то детализация не привнесет много улучшений в изображение, а скорее может даже навредить, так как у нас есть априорные ожидания от изображения, и уровень детализации их несколько завышает (тогда как повлиять на остальные параметры Вы не в силах).
Ну и техническая ремарка - в процессе обработки видео принято использовать "промежуточные" технические кодеки. Если Вы планируете использовать несколько программ последовательно, это позволит Вам избежать потери информации, появления артефактов сжатия и сэкономит время, затраченное на перекодирование.
Ну и вопрос к концу: чем Вам не понравился Davinci Resolve для повышения разрешения и оптической интерполяции? Мне кажется, он очень неплох.
Можно решить с помощью цифровых карточек в Anki. Сначала пишете слова, заполняя ими столбец в табличном процессоре, например, LibreOffice. Затем переводите через какой-либо переводчик или чат-бот, или с помощью API, и вставляете в новый столбец с такими настройками импорта, чтобы каждый перенос строки текста (или иной разделитель) соответствовал переносу строки в таблице. Проверяете соответствие двух столбцов (то есть убеждаетесь, что ничего не съехало), сохраняете это дело в csv и импортирует в Anki. Можно ещё через плагин HyperTTS загрузить синтезированную речь с правильным произношением. Но это только цифровые карточки на компьютере, в веб-интерфейсе и на телефоне. Наверное, есть лёгкий способ сделать из них аналоговые карточки. Ещё проще - прямо из таблицы.
То есть условный BioGPT от Microsoft будет показывать себя лучше при работе с научными текстами медико-биологического домена на английском языке, чем универсальная E5?
На русском языке тоже есть домен-специфичные модели, верно? Насколько они актуальны?
Спасибо за статью. Рад, что эта тема развивается и для датасетов на русском языке. Возник вопрос. Хочу спросить Вашего мнения о том, проигрывают ли универсальные (точнее, многопредметные) языковые модели домен-специфичным аналогам при работе с узконаправленной литературой (я имею в виду BioGPT, PubMedBERT и так далее)?
Не обязательно сок, у растений вторичные метаболиты накапливаются и в некоторых типах ворсинок (например, пельтатных трихомах). В литературе отмечается присутствие кумаринов в эпидермисе (то есть в трихомах - где им еще накапливаться кроме как в трихомах) борщевика.
Ради объективности - устанавливать расширение от сообщества - это уже усложнение системы, а использовать `checkbox` в `Obsidian Markdown` - это использовать нативные функции. Это не навороченная система.
Мне кажется, что вы используете его немного неправильно. H1 - это, как я понимаю, заголовок страницы, он может быть один, потому что логика структуры Markdown спроектирована так, чтобы быть совместимой с XML и HTML, и чтобы был возможен экспорт в этих форматах. Соответственно, все внутренние заголовки должны быть H2 или ниже. Как копирайтера, вам должно быть это известно.
По mind map - удобно использовать Map of Content (MOC), он для этого и создавался. Это встроенная функция. Проповедники Obsidian из Ютуба часто рекомендуют для этой цели один из плагинов, но я пока нужды не испытывал.
Выполнение задач лучше организовать через встроенный функционал markdown-разметки, читайте документацию по Obsidian Markdown. Всегда лучше использовать нативные инструменты и возможности, если только острой нужды их чем-либо заменить нет.
Такая неприкрытая реклама альт-линукса... Притом автор говорит об использовании свободного ПО в фактически проприетарный ОС. И совершенно непонятно, почему не упомянуты другие редакторы. И почему вопрос поставлен таким образом, чтобы не упомянуть проприетарные редакторы, у которых лицензия позволяет их использовать в некоммерческих применениях бесплатно - хотя бы Lightworks и Davinci Resolve. Ну и не упомянуть Blender - преступление...
Ничего. Есть атомы водорода и углерода, из которых состоит метильная группа (то самое, что имелось в виду в статье). А молекула метила - это нечто другое по сравнению с метильной группой (хоть она и имеет те же три атома водорода и один атом улерода в своем составе), потому что обладает другими свойствами.
Ни в коем случае не снобство, просто так, для справки.
Возможно, "генуби" - итализированная транскрипция, как "алгебра". Не знаю, насколько именно в такой версии транскрипция вошла в европейскую традицию. С точки зрения арабского "генуби" - это египетское произношение, в соответствии с литературной нормой будет "дженуби".
Рекомендую внести некоторые правки (пунктуация, грамматика). По стилистике тоже многое следовало бы подправить.
– это Data Scientist. "это" не нужно
(датасаентист), это одно и тоже (датасаентист) - это одно и то же
50% за абсолютную 50% - за абсолютную
решил понять к какой профессии решил понять, к какой профессии
аналитик больших данных кем я работаю аналитик больших данных, кем я работаю
а Data Scientist переводиться как а Data Scientist - как (или оставьте без мягкого знака, "переводится", т.к. глагол отвечает на вопрос Эчто делает?")
специалист по изучению или обработки данных специалист по изучению и обработке данных
Яндекс Практикум дает такую формулировку и разбивает способности на такие критерии Яндекс Практикум дает такое определение, сравнивая необходимые для этих специальностей навыки (критериев в строгом смысле слова здесь нет, как и описания способностей)
Это только первые три абзаца, которые попадают в превью статьи.
Удивляет наивность некоторых комментаторов. Статья основывается на результатах нескольких работ, опубликованных в рецензируемых журналах известных профильных научных издательств. Поэтому вопросы по идее должны быть адресованы не к автору этого обзора, изложенного в весьма вольном стиле, а к MDPI или Springer за их редакционную политику, или же к авторам исходных исследований или обзоров. Возможно, у меня плохо с сарказмом и я не увидел скрытых смыслов в комментариях по поводу закладок в инструменте или фантазиях в жанре "давайте предположим, что изменение логики в аппаратной схеме не приводит к формированию нового функционала, а является всего лишь изменением логики, которая, вероятно, ломает схему, хотя автор со ссылкой на опубликованный источник говорит об обратном".
Я не хочу указывать Вам на недостатки. Вы большой молодец, идеально сделать ни у кого не получится. Здесь много людей указали, как правильно было бы поступить на том или ином этапе, а также привлекли внимание к нескольким важным фундаментальным вопросам. Это конструктив. А критиковать весь технический процесс в деталях, когда к нему есть множество вопросов - не самый лучший способ донести информацию до сведения собеседника.
Ну и на счет битрейта - практически ничего плохого с видео не получилось бы, если бы у Вас стояла дискретизация 4:2:2. Вы в любом случае теряее информацию, просто это может быть приемлемой жертвой, кроме того, потери скорее всего затронули область границ, потому что в мультфильме обилия градиентов (другой "уязвимой" для сжатия с потерями группы областей изображения) нет, и в первом случае потери информации сложнее обнаружить, а во втором случае отслеживать практически нечего.
Вы писали, что пробовали разные инструменты, но они Вас не удовлетворили. Интрига в том, что Вы не указали, какие именно (по крайней мере при одном из упоминаний об использовании других интрументов). Вот эта информация очень интересна. С Davinci Resolve Вы могли бы обойтись всего одним инструментом вместо 4 (а может быть, и вместо всех).
Пример случая, когда автор не умеет (и не понимает, что, зачем и почему) обрабатывать видео и подробно разъясняет свой рабочий технический процесс. За усидчивость и целеустремленность громадный респект. Несколько базовых вещей, о которых хочется сказать: зерно аналоговой пленки - это не всегда тот вредный "шум", от которого нужно избавляться. Найдите примеры сканирования 8 мм пленки в 4k. Выглядит вполне достойно, учитывая, что это дело снималось на пленку с площадью кадра с половину ногтя мизинца лет так 50-70 назад. В киноиндустрии используется пленка большего размера, притом 16 мм даёт вполне пригодное качество и на ней снято много фильмов и сериалов с хорошей картинкой. Думаю, в этом случае тоже использовалась пленка 16 мм. Именно аналоговое зерно даёт нам возможность нормально воспринимать однородные пространства типа однотонной стены или неба. А без них такие области будут казаться пластилиновыми и неестественными. Давайте просто запомним, что детализация - не критерий качества видео. Если у изображения всё хорошо с другими параметрами - балансом белого, локальной контрастностью, постоянством цветовой схемы на протяжении видеоряда в пределах одной сцены и так далее, то детализация не привнесет много улучшений в изображение, а скорее может даже навредить, так как у нас есть априорные ожидания от изображения, и уровень детализации их несколько завышает (тогда как повлиять на остальные параметры Вы не в силах).
Ну и техническая ремарка - в процессе обработки видео принято использовать "промежуточные" технические кодеки. Если Вы планируете использовать несколько программ последовательно, это позволит Вам избежать потери информации, появления артефактов сжатия и сэкономит время, затраченное на перекодирование.
Ну и вопрос к концу: чем Вам не понравился Davinci Resolve для повышения разрешения и оптической интерполяции? Мне кажется, он очень неплох.
НСК пыльный, но в Академгородке с этим получше.
Можно решить с помощью цифровых карточек в Anki. Сначала пишете слова, заполняя ими столбец в табличном процессоре, например, LibreOffice. Затем переводите через какой-либо переводчик или чат-бот, или с помощью API, и вставляете в новый столбец с такими настройками импорта, чтобы каждый перенос строки текста (или иной разделитель) соответствовал переносу строки в таблице. Проверяете соответствие двух столбцов (то есть убеждаетесь, что ничего не съехало), сохраняете это дело в csv и импортирует в Anki. Можно ещё через плагин HyperTTS загрузить синтезированную речь с правильным произношением. Но это только цифровые карточки на компьютере, в веб-интерфейсе и на телефоне. Наверное, есть лёгкий способ сделать из них аналоговые карточки. Ещё проще - прямо из таблицы.
То есть условный BioGPT от Microsoft будет показывать себя лучше при работе с научными текстами медико-биологического домена на английском языке, чем универсальная E5?
На русском языке тоже есть домен-специфичные модели, верно? Насколько они актуальны?
Спасибо за статью. Рад, что эта тема развивается и для датасетов на русском языке. Возник вопрос. Хочу спросить Вашего мнения о том, проигрывают ли универсальные (точнее, многопредметные) языковые модели домен-специфичным аналогам при работе с узконаправленной литературой (я имею в виду BioGPT, PubMedBERT и так далее)?
Не обязательно сок, у растений вторичные метаболиты накапливаются и в некоторых типах ворсинок (например, пельтатных трихомах). В литературе отмечается присутствие кумаринов в эпидермисе (то есть в трихомах - где им еще накапливаться кроме как в трихомах) борщевика.
Ради объективности - устанавливать расширение от сообщества - это уже усложнение системы, а использовать `checkbox` в `Obsidian Markdown` - это использовать нативные функции. Это не навороченная система.
Дорогие авторы, исправьте, пожалуйста
>поставили создания контента
создание
Мне кажется, что вы используете его немного неправильно. H1 - это, как я понимаю, заголовок страницы, он может быть один, потому что логика структуры Markdown спроектирована так, чтобы быть совместимой с XML и HTML, и чтобы был возможен экспорт в этих форматах. Соответственно, все внутренние заголовки должны быть H2 или ниже. Как копирайтера, вам должно быть это известно.
По mind map - удобно использовать Map of Content (MOC), он для этого и создавался. Это встроенная функция. Проповедники Obsidian из Ютуба часто рекомендуют для этой цели один из плагинов, но я пока нужды не испытывал.
Выполнение задач лучше организовать через встроенный функционал markdown-разметки, читайте документацию по Obsidian Markdown. Всегда лучше использовать нативные инструменты и возможности, если только острой нужды их чем-либо заменить нет.
без лишних рассуждений | без отлагательства | сразу же
хотя бы в тексе, который выводится в превью, исправьте ошибку.
Loqseq, Tana, VS Code/ Foam, VS Code / Dendron, Archive, ztlk4 - в качестве примеров конкурентов Obsidian для цеттелькастен.
Такая неприкрытая реклама альт-линукса... Притом автор говорит об использовании свободного ПО в фактически проприетарный ОС. И совершенно непонятно, почему не упомянуты другие редакторы. И почему вопрос поставлен таким образом, чтобы не упомянуть проприетарные редакторы, у которых лицензия позволяет их использовать в некоммерческих применениях бесплатно - хотя бы Lightworks и Davinci Resolve. Ну и не упомянуть Blender - преступление...
Ничего. Есть атомы водорода и углерода, из которых состоит метильная группа (то самое, что имелось в виду в статье). А молекула метила - это нечто другое по сравнению с метильной группой (хоть она и имеет те же три атома водорода и один атом улерода в своем составе), потому что обладает другими свойствами.
Спасибо за статью.
Ни в коем случае не снобство, просто так, для справки.
Возможно, "генуби" - итализированная транскрипция, как "алгебра". Не знаю, насколько именно в такой версии транскрипция вошла в европейскую традицию. С точки зрения арабского "генуби" - это египетское произношение, в соответствии с литературной нормой будет "дженуби".
Что-то у меня Mojo перекликается с Codon и Seq. Не по звучанию, конечно.
Ввиду того, что кто-то минуснул, есть люди, которые предпочитают читать материал с грубыми ошибками.
Рекомендую внести некоторые правки (пунктуация, грамматика). По стилистике тоже многое следовало бы подправить.
– это Data Scientist.
"это" не нужно
(датасаентист), это одно и тоже
(датасаентист) - это одно и то же
50% за абсолютную
50% - за абсолютную
решил понять к какой профессии
решил понять, к какой профессии
аналитик больших данных кем я работаю
аналитик больших данных, кем я работаю
а Data Scientist переводиться как
а Data Scientist - как (или оставьте без мягкого знака, "переводится", т.к. глагол отвечает на вопрос Эчто делает?")
специалист по изучению или обработки данных
специалист по изучению и обработке данных
Яндекс Практикум дает такую формулировку и разбивает способности на такие критерии
Яндекс Практикум дает такое определение, сравнивая необходимые для этих специальностей навыки (критериев в строгом смысле слова здесь нет, как и описания способностей)
Это только первые три абзаца, которые попадают в превью статьи.
Попробуйте формулировать запросы на английском языке. Он предпочитает не переводить, а использовать обученную часть модели в рамках контекста языка.
Удивляет наивность некоторых комментаторов. Статья основывается на результатах нескольких работ, опубликованных в рецензируемых журналах известных профильных научных издательств. Поэтому вопросы по идее должны быть адресованы не к автору этого обзора, изложенного в весьма вольном стиле, а к MDPI или Springer за их редакционную политику, или же к авторам исходных исследований или обзоров. Возможно, у меня плохо с сарказмом и я не увидел скрытых смыслов в комментариях по поводу закладок в инструменте или фантазиях в жанре "давайте предположим, что изменение логики в аппаратной схеме не приводит к формированию нового функционала, а является всего лишь изменением логики, которая, вероятно, ломает схему, хотя автор со ссылкой на опубликованный источник говорит об обратном".