Comments / Profile of tlando / Habr

Татьяна@tlando

Пользователь

Subscribers

tlando Mar 20 2020 at 21:30

Сходу не удалось найти адекватный научный источник.
www.thelancet.com/journals/laninf/article/PIIS1473-3099(20)30141-9/fulltext — тут обсуждают потенциальную пользу. В новостях и правда много.
Но для этого как минимум нужно много поправившихся (и молодых) добровольцев, а значит и обширное тестирование и приличное количество случаев.

Как лечат коронавирус?

tlando Mar 20 2020 at 21:03

Вы про Фавипиравир о котором отдельно написан целый абзац? Японцам и корейцам он не нравится — слишком много побочек при далеко не 100% эффективности.

С удовольствием почитаем ваши первоисточники из рецензируемых журналов. Наши ссылки все в тексте.

Как лечат коронавирус?

tlando Mar 20 2020 at 20:33

О, клевый ЖЖ, спасибо!
Старые статьи мы многие уже перелопатили, конкретно про лечение как раз сейчас стало больше поступать. Потому что, увы, больных больше в разных странах.

Как лечат коронавирус?

tlando Mar 20 2020 at 19:53

Вот, например: https://www.medscape.com/viewarticle/927033
Но пока нет окончательных данных.

Как лечат коронавирус?

tlando Mar 20 2020 at 19:49

Тестируют очень много всего, и поступает много адхоковых данных, но далеко не по всему есть достоверные исследования. Уследить за всем довольно сложно, так что если у вас есть хорошая ссылка, мы будем рады дополнить!

Коронавирус: как мы себя обманываем

tlando Mar 18 2020 at 22:10

А еще вот это прокомментируйте, пожалуйста: gfycat.com/neatignorantjunco-coronavirus-rsciences-covid19
Важно ли они умерли от коронавируса или при коронавирусе, если смертей за две недели стало намного больше?

Коронавирус: как мы себя обманываем

tlando Mar 18 2020 at 21:33

Но такое явление не характерно для коронавируса в целом. В Корее, например, основная группа заражённых приходится на возраст от 20 до 29 лет — 29% случаев от общего числа. В Китае около 15% заражённых составляет группа 70+, что почти в два раза меньше, чем в Италии или Франции.

Эти числа надо нормировать на распределение возрастов в популяции. При том именно в тех регионах, где зараженее. Какой процент пожилых живет в Ухане? Может их в 2 раза меньше чем в Италии и Франции просто?

Что такое Томита-парсер, как Яндекс с его помощью понимает естественный язык, и как вы с его помощью сможете извлекать факты из текстов

tlando Nov 18 2014 at 22:03

Такого инструмента нет. Среднестатистический томита-писатель привыкает с notepad++ за неделю-другую. Компилятор обычно довольно внятно описывает ошибки, если они произошли при компиляции. А для отладки выхода грамматик есть pretty output — он описан в документации.

tlando Jun 4 2014 at 09:46

Ну да, это скорее просто именованные сущности, а факт — это именованная сущность + атрибут или несколько именованных сущностей и отношения между ними.
Но Томита подходит для извлечения и того, и другого.

tlando Jun 3 2014 at 19:55

Мне трудно так абстрактно рассуждать, поскольку действительно все зависит от задачи.
Итоговые факты же типизируются априори и выдаются в структурированном виде, это значит, что перепарсивать их уже незачем. Их можно фильтровать, кластеризовать, классифицировать, делать сложные умозаключения и т.д. и т.п.

tlando Jun 3 2014 at 19:53

Публикация была одна, но я не могу ее найти. Есть моя старая лекция: nlpseminar.ru/archive/lecture32/, к сожалению ничего получше не нашлось.

tlando Jun 3 2014 at 14:26

Зависит от задачи.
Когда мы извлекали информацию о персонах из СМИ, то за извлечением фактов стояла огромная машина с кластеризацией, она верифицировала факты из разных источников, склеивала дубли и еще много всего делала.

tlando Jun 2 2014 at 20:15

Конечно производится, постобработка — наше всё. :)
В зависимости от задачи мы тем или иным способом стараемся верифицировать данные, которые принес нам парсер.

Яндекс.Такси вводит новые тарифы

tlando Apr 23 2014 at 12:05

Мне кажется выше спрашивают не про движение по МКАД, а про движение за МКАД в сторону области. С Красногорском такая же история.

tlando Apr 19 2014 at 09:16

Система предназначена для выделения смысловых предописанных цепочек из обычного теста. Ее можно использовать и для выделения команд. Степень соответсвия она не умеет оценивать, для этого нужно будет писать свой постпроцессинг.

tlando Apr 19 2014 at 09:13

Потому что ими можно описать больше, чем регулярными выражениями.

tlando Apr 16 2014 at 11:02

Выбор языков зависит исключительно от имеющейся морфологии. По разным причинам мы не можем отдавать морфологии других языков. Поэтому прямо сейчас сделать что-то осмысленное с французским и голландским не получится.
Когда мы выложим парсер с исходным кодом, там будет возможность подключить любую другую морфологию самостоятельно.

tlando Apr 16 2014 at 08:59

Все зависит от задачи, от возможностей нанять асессоров и т.д. и т.п.
Есть простые типы данных, например адреса, которые проще описать ручными правилами, чем обучать сети на большой разметке. Т.е. правила обойдутся дешевле.
Есть более сложные случаи, когда дешевле и эффективней разметить корпус и обучить на нем.
Иногда имеет смысл делать что-то среднее, простые случаи брать ручными грамматиками, переферийные — обучением.

tlando Apr 15 2014 at 08:32

На очень сложны грамматиках скорость порядка 80 мб/час.

tlando Apr 15 2014 at 06:00

Для английского есть бесконечное количество похожих инструментов. Самый известный, наверное, — это GATE, в составе которого есть язык описания грамматик JAPE. И еще StanfordNLP — пакет машиннообучаемых обработчиков, которые можно тренировать на своих данных.

3 4 5 6 7