Обновить
4
0

Биолог

Отправить сообщение

Новость не свежая. ДМСО обнаружили не так давно, но интересующиеся сообщество уже успело привыкнуть к этой новости. Автору, если бы он действовал добропорядочно, стоило осветить историю вопроса.

Верно. Стручок - это тип плода, притом плод разделен перегородкой вдоль всего плода (по плоскости растрескивания), как у капусты или редиса, и семена располагаются по обе стороны от перегородки. Читаем про пизонию - семейство Nyctaginaceae. Смотрим тип плода - "пестик один, с верхней одногнёздной завязью; плод — орех, превращающийся в ложную ягоду, после того как часть околоцветника станет мясистой." Теперь ясно - в плоду семя одно, тип плода - орех, внутренних перегородок в нем нет, мякоть может быть мясистая и липкая.

Что касается грамматики в тексте статьи, Вы тоже очень правы в том, что автор оставил двоякую формулировку - то ли птицы прилипли к стручку, то ли стручки налипли на птиц.

Режим Deep Search в интерфейсе Perplexity уже больше месяца. В бесплатном тарифе таких попыток было мало, в платном - неограниченно или очень много. В какой-то степени они предлагали режим углубленного поиска с исследованием ещё два месяца назад.

Resolve группирует клипы на основе присутствующих в них людей уже очень давно. Ничего концептуального нового я в этой новости не вижу. В новости имел бы смысл упомянуть аналогичные решения от конкурентов.

А я все надеялся, что он Оверстриту педаль спаяет и отправит)

К сожалению, Obsidian еще не "завез" аннотирование pdf "из коробки". Нужно устанавливать специальный плагин. В LogSeq же эти вещи доступны в базовой конфигурации, притом сами комментарии можно арранжировать и перетаскивать в заметки. И запрос к базе данных на основе yaml-метаданных реализуются "из коробки", без необходимости устанавливать сторонние плагины. На мой взгляд, сейчас это является одним из самых сильных преимуществ LogSeq перед Obsidian.md в юз-кейсе академических изысканий и работы с литературой.

Думаю, что это уже устоявшийся отраслевой жаргон. А "запрос" - это больше про "query" при работе с базами данных и в веб-технологиях, в клиент-серверной архитектуре, в API и другой коммуникации.

Реконструировать надо в том числе 3Д-структуру генома. В случае, если изучаются признаки с полигенным контролем, трудно ответить на вопросы, выравнивая короткие прочтения на отдаленный референс. Фазирование и данные о метилировании повышают число степеней свободы, но эта информация тоже может быть полезга.

Бояться скорее стоит тех силовых структур, которые ближе. Криминалисты идентификацию преступников осуществляют в основном по STR, профиль STR можно реконструировать из последовательности полного генома. Но проблема в том, что этот метод имеет непростительно высокую долю ложноположительных срабатываний, но притом применяется правоохранителями вполне серьезно. И да, случаи идентификации людей через базы данных (и даже через родственников в базах данных) есть. Но никаких гарантий нет, что криминалисты собрали именно Вашу ДНК (но это уже никого, по-видимому, не волнует).

Полный геном человека занимает более 3 гигабаз (млрд пар азотистых оснований), записан четырехбуквенным алфавитом. Другое дело, что результаты секвенирования записаны вместе со значениями качества прочтения конкретного нуклеотида, и глубина покрытия генома - около 30 крат. Если Вы подразумеваете анализ в дальнейшем, полезны будут именно эти данные (после того, как для медицинских биоинформатиков станут доступны пангеномы разных этнических групп, в том числе той, к которой Вы анцестрально относитесь).

Думаю, это полезная функция, ведь на большинстве сайтов комментарии не нужны. Клиппер пытается определить область контента и отсекает все ненужное. Например, если в блоге на Medium автор злоупотребляет разделителями, клиппер берет кусок контента между первым и вторым дополнительными разделителями, а остальное все воспринимает как ненужную информацию. Я думаю, эти проблемы можно решить написанием шаблона импорта. Клиппер позволяет такое сделать. Но в бете это было неудобно.

Копировать. При копировании-вставке форматирование (по крайней мере переносы строк) сохраняется. Можно написать свой шаблон импорта, там есть такая возможность.

Тоже хотел написать, что уже почти месяц, как выпустили. Хоть и в бете был. Недобросовестно готовятся новости сейчас на Хабре - из всего делается хайп.

Это очень не похоже на описание принципов работы. Нет ни примера, ни понятного алгоритма, ни соглашения о терминологии (должно быть понятно, в каком смысле использованы термины). Если этого не будет в одном-двух абзацах, то и понятно ничего не будет читателю. Читатель изначально должен получить представление, чтобы при желании нанизать на него подробности из пособия. Никто не обязан читать Ваше пособие целиком, пытаясь воссоздать Ваши мысли и понять, что же Вы имели в виду. "Ментальный реверс-инжиниринг" довольно трудозатратен.

Понял. У вас первый пример был с Passive voice, второй (LT to fight passive voice) - "is" + ("gerund") + "infinitive". Я не увидел границы и первоначально понял так, что конструкцию "is ... to" Вы относите к пассивному залогу. Согласен с Вашей мыслью.

Немного не так. Когда есть герундий (глагол с ing-овым окончанием), это уже не может быть пассивным залогом. Формы модального глагола to be совместно с перфектной формой глагола могут образовывать страдательный залог, который очень удобен в безличных конструкциях. А именно безличные конструкции - стандарт в технической и научной речи. "An extraction was performed..., the condition was established..., the reaction product was obtained..., the genome was assembled."

В коммитах любят повелительное наклонение, потому что это самая минималистичная конструкция с чистой основой. Именно такого подхода придерживаются разработчики визуальных интерфейсов: "open the window", а не "by clicking you can open the window". Если говорить о коммитах, "Update README" и "this updates README" отличаются, второй вариант выглядит избыточным.

Полезно и интересно, но в первоначальном перечне все навалено без знаков разделения, и непонятно, к чему относится та часть перечня, которая идёт после скобок и стоит с большой буквы - к новому элементу, или характеризует предыдущий, зачастую в неправильном падеже. Нужен явный разделитель. И элементы перечня или хотя бы подразделы лучше заанкорить в оглавлении, потому что текст длинный, и навигация скроллингом утомляет.

Для создателей контента, колористов и монтажеров особенно интересны те функции, которые не реализованы в альтернативных продуктах. Поэтому автору, помимо описания нововведений в разделе "Neural Engine", стоило также сказать о новшествах в Color, Fusion и Fairlight. Учитывая, что это программа для цветокоррекции и грейдинга, очень странно, что не упомянуты нововведения, связанные с функционалом вкладки Color.

На практике, проекты, созданные в более ранних версиях программы, открывались в 14 -16 Davinci Resolve. BlackMagick примерно раз в год выкатывают новую версию. Там были какие-то моменты с переходом на новые версии, когда проект можно было преобразовать, и он уже не открывался в более ранних версиях. А старые проекты открывались без проблем. Если же у кого-то проблемы с этим - установите старую версию и попробуйте экспорт проекта или альтернативный формат проекта. Должно сработать.

То есть это в некое "дополнение" к букве ҕ ?

Нет, я писал именно об этой букве. Во всех тюркских языках, которые я слышал и в которых используется аффикс "-арга" для обозначения инфинитива, он произносится как [arγá].

Так вроде IPA это же оно и есть.

В работах, которые я встречал, использовались другие обозначения для гласных. Предполагаю, что это просто видение у разных авторов отличается.

сделать отличный фонемайзер тут - ни разу не просто.

Я думаю, что не нужен отличный. Он должен быть настроен на фонетическую систему языка. Учесть эти правила несложно. А качество возрастет. IMHO, нельзя давать на откуп black box то, что можно контролировать с помощью небольшого набора правил.

юридически мы не имеем права выкладывать аудио дикторов в публичный доступ

Можно взять аудиозапись из публичного доступа, и синтезировать этот же фрагмент речи. А можно попросить волонтеров озвучить абзац из Википедии на якутском, и его же озвучить с помощью модели. Такого сравнения очень не хватало.

носители языка нам скорее всего тут особо не помогут, т.к. они просто говорят не задумываясь. Отсюда получаем замедление релиза на порядок, т.к. надо будет найти носителей языка, которые одновременно и лингвисты.

Люди обычно говорят, не задумываясь. Но когда слышат неправильное произношение, сразу начинают чувсвовать, что что-то тут не то. И в итоге обращают внимание на некоторые из тех нюансо, о которых они не задумывались.

Вами проделана огромная работа. Спасибо, что объяснили Ваши взгляды на разработку модели. Я с Вами согласен отчасти, некоторые вещи не пойму (как, например, зачем в модели синтеза речи на якутском языке настолько качественно реализовывать синтез реи на русском), с некоторыми вещами несогласен. Но уверен, что вы сделали взвешенный и адекватный выбор при поиске подхода. Желаю Вам удачи в развитии вашего проекта.

Молодцы, но есть несколько нюансов:

1) в Вашей статье нет валидации. Модель нужно валидировать на реальную речь. И примеры речи носителей были бы кстати.

2) почему Вы не использовали международное фонетическое письмо при описании алфавита?

3) все гласные группы "и" (i, ï, ü, u, в принятых для описания фонетики тюркских языков символах) в тюркских языках краткие вплоть до редукции. Исключений очень мало (литературный турецкий, гагаузский, в которых эти процессы выражены слабо).

4) в некоторых местах, например, в аффиксе инфинитива "арга" г должна быть ğ (то есть гамма на международном фонетическом алфавите, но у меня на раскладке в телефоне нет этого символа). Так во всех тюркских языках. И звук "ğ" обычно звучит более гортанно, это тоже нужно учитывать. Он не похож на украинское "г" и даже не полностью похож на греческую гамма (более шумный звук по сравнению с украинской "г").

5) в окружении палатальных и глоттализированных аффрикат фонема "а" обычно произносится в более задней позиции.

6) "ы" всегда звучит в более задней позиции (в русском этот звук средний и как бы с более широкой локализацией, а в тюркских языках он всегда задний). Исключение в тюркских языках - гагаузский, говоры крымского языка с румейским (византийским) субстратом, а также понтийские и лазский этнолекты турецкого языка и в некоторой степени современный литературный турецкий. В этих языках "ы" имеет в разной степени среднюю позицию, но в то же время узкую локализацию.

7) концепция ударения в русском языке отличается от таковой в большинстве индоевропейских языков. В русском языке ударение определяется и реализуется в первую очередь удлинением долготы. В других языках - напряжением гортани при произнесении звуков.

8) всё-таки лучше транслировать в фонетический алфавит, а затем синтезировать звук. Алфавит не в полной мере отражает фонетику, и это разные задачи. Лучше декомпозировать и затем отлавливать трудные случаи в каждом слое модели независимо.

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность

Специализация

Ученый по данным, Биоинформатик
Средний
Pandas
Jupyter Notebook
NumPy
Computer Science
Базы данных
Английский язык
Научно-исследовательская работа
Алгоритмы и структуры данных