Информация
- В рейтинге
- Не участвует
- Зарегистрирован
- Активность
Специализация
Ученый по данным, Биоинформатик
Средний
Pandas
Jupyter Notebook
NumPy
Computer Science
Базы данных
Английский язык
Научно-исследовательская работа
Алгоритмы и структуры данных
Новость не свежая. ДМСО обнаружили не так давно, но интересующиеся сообщество уже успело привыкнуть к этой новости. Автору, если бы он действовал добропорядочно, стоило осветить историю вопроса.
Верно. Стручок - это тип плода, притом плод разделен перегородкой вдоль всего плода (по плоскости растрескивания), как у капусты или редиса, и семена располагаются по обе стороны от перегородки. Читаем про пизонию - семейство Nyctaginaceae. Смотрим тип плода - "пестик один, с верхней одногнёздной завязью; плод — орех, превращающийся в ложную ягоду, после того как часть околоцветника станет мясистой." Теперь ясно - в плоду семя одно, тип плода - орех, внутренних перегородок в нем нет, мякоть может быть мясистая и липкая.
Что касается грамматики в тексте статьи, Вы тоже очень правы в том, что автор оставил двоякую формулировку - то ли птицы прилипли к стручку, то ли стручки налипли на птиц.
Режим Deep Search в интерфейсе Perplexity уже больше месяца. В бесплатном тарифе таких попыток было мало, в платном - неограниченно или очень много. В какой-то степени они предлагали режим углубленного поиска с исследованием ещё два месяца назад.
Resolve группирует клипы на основе присутствующих в них людей уже очень давно. Ничего концептуального нового я в этой новости не вижу. В новости имел бы смысл упомянуть аналогичные решения от конкурентов.
А я все надеялся, что он Оверстриту педаль спаяет и отправит)
К сожалению, Obsidian еще не "завез" аннотирование pdf "из коробки". Нужно устанавливать специальный плагин. В LogSeq же эти вещи доступны в базовой конфигурации, притом сами комментарии можно арранжировать и перетаскивать в заметки. И запрос к базе данных на основе yaml-метаданных реализуются "из коробки", без необходимости устанавливать сторонние плагины. На мой взгляд, сейчас это является одним из самых сильных преимуществ LogSeq перед Obsidian.md в юз-кейсе академических изысканий и работы с литературой.
Думаю, что это уже устоявшийся отраслевой жаргон. А "запрос" - это больше про "query" при работе с базами данных и в веб-технологиях, в клиент-серверной архитектуре, в API и другой коммуникации.
Реконструировать надо в том числе 3Д-структуру генома. В случае, если изучаются признаки с полигенным контролем, трудно ответить на вопросы, выравнивая короткие прочтения на отдаленный референс. Фазирование и данные о метилировании повышают число степеней свободы, но эта информация тоже может быть полезга.
Бояться скорее стоит тех силовых структур, которые ближе. Криминалисты идентификацию преступников осуществляют в основном по STR, профиль STR можно реконструировать из последовательности полного генома. Но проблема в том, что этот метод имеет непростительно высокую долю ложноположительных срабатываний, но притом применяется правоохранителями вполне серьезно. И да, случаи идентификации людей через базы данных (и даже через родственников в базах данных) есть. Но никаких гарантий нет, что криминалисты собрали именно Вашу ДНК (но это уже никого, по-видимому, не волнует).
Полный геном человека занимает более 3 гигабаз (млрд пар азотистых оснований), записан четырехбуквенным алфавитом. Другое дело, что результаты секвенирования записаны вместе со значениями качества прочтения конкретного нуклеотида, и глубина покрытия генома - около 30 крат. Если Вы подразумеваете анализ в дальнейшем, полезны будут именно эти данные (после того, как для медицинских биоинформатиков станут доступны пангеномы разных этнических групп, в том числе той, к которой Вы анцестрально относитесь).
Думаю, это полезная функция, ведь на большинстве сайтов комментарии не нужны. Клиппер пытается определить область контента и отсекает все ненужное. Например, если в блоге на Medium автор злоупотребляет разделителями, клиппер берет кусок контента между первым и вторым дополнительными разделителями, а остальное все воспринимает как ненужную информацию. Я думаю, эти проблемы можно решить написанием шаблона импорта. Клиппер позволяет такое сделать. Но в бете это было неудобно.
Копировать. При копировании-вставке форматирование (по крайней мере переносы строк) сохраняется. Можно написать свой шаблон импорта, там есть такая возможность.
Тоже хотел написать, что уже почти месяц, как выпустили. Хоть и в бете был. Недобросовестно готовятся новости сейчас на Хабре - из всего делается хайп.
Это очень не похоже на описание принципов работы. Нет ни примера, ни понятного алгоритма, ни соглашения о терминологии (должно быть понятно, в каком смысле использованы термины). Если этого не будет в одном-двух абзацах, то и понятно ничего не будет читателю. Читатель изначально должен получить представление, чтобы при желании нанизать на него подробности из пособия. Никто не обязан читать Ваше пособие целиком, пытаясь воссоздать Ваши мысли и понять, что же Вы имели в виду. "Ментальный реверс-инжиниринг" довольно трудозатратен.
Понял. У вас первый пример был с Passive voice, второй (LT to fight passive voice) - "is" + ("gerund") + "infinitive". Я не увидел границы и первоначально понял так, что конструкцию "is ... to" Вы относите к пассивному залогу. Согласен с Вашей мыслью.
Немного не так. Когда есть герундий (глагол с ing-овым окончанием), это уже не может быть пассивным залогом. Формы модального глагола to be совместно с перфектной формой глагола могут образовывать страдательный залог, который очень удобен в безличных конструкциях. А именно безличные конструкции - стандарт в технической и научной речи. "An extraction was performed..., the condition was established..., the reaction product was obtained..., the genome was assembled."
В коммитах любят повелительное наклонение, потому что это самая минималистичная конструкция с чистой основой. Именно такого подхода придерживаются разработчики визуальных интерфейсов: "open the window", а не "by clicking you can open the window". Если говорить о коммитах, "Update README" и "this updates README" отличаются, второй вариант выглядит избыточным.
Полезно и интересно, но в первоначальном перечне все навалено без знаков разделения, и непонятно, к чему относится та часть перечня, которая идёт после скобок и стоит с большой буквы - к новому элементу, или характеризует предыдущий, зачастую в неправильном падеже. Нужен явный разделитель. И элементы перечня или хотя бы подразделы лучше заанкорить в оглавлении, потому что текст длинный, и навигация скроллингом утомляет.
Для создателей контента, колористов и монтажеров особенно интересны те функции, которые не реализованы в альтернативных продуктах. Поэтому автору, помимо описания нововведений в разделе "Neural Engine", стоило также сказать о новшествах в Color, Fusion и Fairlight. Учитывая, что это программа для цветокоррекции и грейдинга, очень странно, что не упомянуты нововведения, связанные с функционалом вкладки Color.
На практике, проекты, созданные в более ранних версиях программы, открывались в 14 -16 Davinci Resolve. BlackMagick примерно раз в год выкатывают новую версию. Там были какие-то моменты с переходом на новые версии, когда проект можно было преобразовать, и он уже не открывался в более ранних версиях. А старые проекты открывались без проблем. Если же у кого-то проблемы с этим - установите старую версию и попробуйте экспорт проекта или альтернативный формат проекта. Должно сработать.
Нет, я писал именно об этой букве. Во всех тюркских языках, которые я слышал и в которых используется аффикс "-арга" для обозначения инфинитива, он произносится как [arγá].
В работах, которые я встречал, использовались другие обозначения для гласных. Предполагаю, что это просто видение у разных авторов отличается.
Я думаю, что не нужен отличный. Он должен быть настроен на фонетическую систему языка. Учесть эти правила несложно. А качество возрастет. IMHO, нельзя давать на откуп black box то, что можно контролировать с помощью небольшого набора правил.
Можно взять аудиозапись из публичного доступа, и синтезировать этот же фрагмент речи. А можно попросить волонтеров озвучить абзац из Википедии на якутском, и его же озвучить с помощью модели. Такого сравнения очень не хватало.
Люди обычно говорят, не задумываясь. Но когда слышат неправильное произношение, сразу начинают чувсвовать, что что-то тут не то. И в итоге обращают внимание на некоторые из тех нюансо, о которых они не задумывались.
Вами проделана огромная работа. Спасибо, что объяснили Ваши взгляды на разработку модели. Я с Вами согласен отчасти, некоторые вещи не пойму (как, например, зачем в модели синтеза речи на якутском языке настолько качественно реализовывать синтез реи на русском), с некоторыми вещами несогласен. Но уверен, что вы сделали взвешенный и адекватный выбор при поиске подхода. Желаю Вам удачи в развитии вашего проекта.
Молодцы, но есть несколько нюансов:
1) в Вашей статье нет валидации. Модель нужно валидировать на реальную речь. И примеры речи носителей были бы кстати.
2) почему Вы не использовали международное фонетическое письмо при описании алфавита?
3) все гласные группы "и" (i, ï, ü, u, в принятых для описания фонетики тюркских языков символах) в тюркских языках краткие вплоть до редукции. Исключений очень мало (литературный турецкий, гагаузский, в которых эти процессы выражены слабо).
4) в некоторых местах, например, в аффиксе инфинитива "арга" г должна быть ğ (то есть гамма на международном фонетическом алфавите, но у меня на раскладке в телефоне нет этого символа). Так во всех тюркских языках. И звук "ğ" обычно звучит более гортанно, это тоже нужно учитывать. Он не похож на украинское "г" и даже не полностью похож на греческую гамма (более шумный звук по сравнению с украинской "г").
5) в окружении палатальных и глоттализированных аффрикат фонема "а" обычно произносится в более задней позиции.
6) "ы" всегда звучит в более задней позиции (в русском этот звук средний и как бы с более широкой локализацией, а в тюркских языках он всегда задний). Исключение в тюркских языках - гагаузский, говоры крымского языка с румейским (византийским) субстратом, а также понтийские и лазский этнолекты турецкого языка и в некоторой степени современный литературный турецкий. В этих языках "ы" имеет в разной степени среднюю позицию, но в то же время узкую локализацию.
7) концепция ударения в русском языке отличается от таковой в большинстве индоевропейских языков. В русском языке ударение определяется и реализуется в первую очередь удлинением долготы. В других языках - напряжением гортани при произнесении звуков.
8) всё-таки лучше транслировать в фонетический алфавит, а затем синтезировать звук. Алфавит не в полной мере отражает фонетику, и это разные задачи. Лучше декомпозировать и затем отлавливать трудные случаи в каждом слое модели независимо.