Search
Write a publication
Pull to refresh
18
0
Пожарский Александр @alex4321

User

Send message
Ок, верстальщиков заменят чуть раньше.
Где речь о программистах? :-)
А мне — что стоит даже склеивать с прошлым и последующим токеном (впрочем, если данных достаточно — можно заюзать биграммы, а не делать это явно) — или, возможно, инвертировать значение соответсвующей им фичи.
То есть, у нас есть, предположим, 1000 примеров с ответами и еще 100к примеров без ответов. Я могу натравить автоэнкодер на все и получить доп фичи, это понятно.


Полагаю, нужно выкинуть немалую часть старых фич и использовать извлечённые автоэнкодером.
Тогда действия выходят следующими:
  • обучае автоэнкодер на неразмеченной части выборки
  • применяем его к размеченной
  • пытаемся в обучение с учителем уже не на, например, 10000 исходных признаков, а на, условно говоря, сотне извлечённых энкодером


Но это моё мнение дилетанта, который даже не особо учится :-)
Можно внести в выборку искажения (для изображений — например, сжатия, повороты, шум, их комбинации). Хотя — сомневаюсь, что тут нам это даст профит.
Т.е. скоро возникнет проблема с нехваткой данных

Аугментация, не?
Минутка пессимизма (или оптимизма — тут как посмотреть):

«На эту самую эволюцию уже сейчас уже человеки влияют очень сильно»
Только перед этим ему надо возникнуть.

«это же супер-пупер всех технологий»
Или, возможно, вероятнее их хреновое развитие — при сравнимом с людьми временем существования :-)

«а с 200-тыщной историей ну просто же будет все что можно»
Или они таки упрутся в потолок. Впрочем, это пессимистичный взгляд.

«это конечно же бестелесная форма существования»
С чего бы? По идее тут как ни крути — нужен какой-то носитель. Вопрос только в ТТХ носителя. Ну, по крайней мере я бы не стал заранее так экстраполировать.

«У высокоразвитой даже на 20-тыщ лет обогнавшей землян цивилизации»
Ну, 20 тысяч лет времени существования — строго говоря, ещё не гарантия того, что в эти 20 тысяч лет они развивались, а не пытались изобрести земледелие :-) (ну, если современный вид человека до этого дошёл только просуществовав ~40000 лет, то почему кому-то не дойти через 60000).
Ну или обошли, да — но таки по одному примеру врядли можно сказать что является более вероятным.
Так он всё равно должен был где-то появиться впервые.
Ну, если мы не уходим в всякие парадоксы.
«который, кстати говоря, в полном соответствии с классикой пирамид будучи основателем в любой момент может хапнуть большую часть прибыли пирамиды»
И, собственно, как это с технической точки зрения бы могло выглядеть?
Победа в го с помощью ОБЧР?
Это что-то из серии шахмат с голубем, однако.
и обсуждениями

Обсуждения широкой тематики без разделов и тредов? Вы явно знаете толк в извращениях :-)
Очевидно же — количество совпадений регулярки вида "($|[ \r\n\t\,.?-])я(^|[ \r\n\t\,.?-])"
«так как владельцы блокированных DNS могут прописать там любые адреса»
Сделают белый список адресов, находящиеся по которым ресурсы не должны быть блокированы ни при каких обстоятельствах же (или уже пытались?).
Ну вот, теперь ждать вопроса несколько миллионов лет
Кстати, если не секрет — то что именно пилите?
Возможно, зашла бы комбинация speechkit + api.ai (или, возможно, связка из какого-либо классификатора текстов и NER-а).

Это если взаимодействие укладывается в рамки вида «сработал на какое-то триггер — начал распознавать речь с этого момента — классифицировал фразу — обработал в соответствии с текущим состоянием (грубо говоря — контекстом)»

Information

Rating
Does not participate
Date of birth
Registered
Activity