А мне — что стоит даже склеивать с прошлым и последующим токеном (впрочем, если данных достаточно — можно заюзать биграммы, а не делать это явно) — или, возможно, инвертировать значение соответсвующей им фичи.
То есть, у нас есть, предположим, 1000 примеров с ответами и еще 100к примеров без ответов. Я могу натравить автоэнкодер на все и получить доп фичи, это понятно.
Полагаю, нужно выкинуть немалую часть старых фич и использовать извлечённые автоэнкодером.
Тогда действия выходят следующими:
обучае автоэнкодер на неразмеченной части выборки
применяем его к размеченной
пытаемся в обучение с учителем уже не на, например, 10000 исходных признаков, а на, условно говоря, сотне извлечённых энкодером
Но это моё мнение дилетанта, который даже не особо учится :-)
Минутка пессимизма (или оптимизма — тут как посмотреть):
«На эту самую эволюцию уже сейчас уже человеки влияют очень сильно»
Только перед этим ему надо возникнуть.
«это же супер-пупер всех технологий»
Или, возможно, вероятнее их хреновое развитие — при сравнимом с людьми временем существования :-)
«а с 200-тыщной историей ну просто же будет все что можно»
Или они таки упрутся в потолок. Впрочем, это пессимистичный взгляд.
«это конечно же бестелесная форма существования»
С чего бы? По идее тут как ни крути — нужен какой-то носитель. Вопрос только в ТТХ носителя. Ну, по крайней мере я бы не стал заранее так экстраполировать.
«У высокоразвитой даже на 20-тыщ лет обогнавшей землян цивилизации»
Ну, 20 тысяч лет времени существования — строго говоря, ещё не гарантия того, что в эти 20 тысяч лет они развивались, а не пытались изобрести земледелие :-) (ну, если современный вид человека до этого дошёл только просуществовав ~40000 лет, то почему кому-то не дойти через 60000).
Ну или обошли, да — но таки по одному примеру врядли можно сказать что является более вероятным.
«который, кстати говоря, в полном соответствии с классикой пирамид будучи основателем в любой момент может хапнуть большую часть прибыли пирамиды»
И, собственно, как это с технической точки зрения бы могло выглядеть?
«так как владельцы блокированных DNS могут прописать там любые адреса»
Сделают белый список адресов, находящиеся по которым ресурсы не должны быть блокированы ни при каких обстоятельствах же (или уже пытались?).
Возможно, зашла бы комбинация speechkit + api.ai (или, возможно, связка из какого-либо классификатора текстов и NER-а).
Это если взаимодействие укладывается в рамки вида «сработал на какое-то триггер — начал распознавать речь с этого момента — классифицировал фразу — обработал в соответствии с текущим состоянием (грубо говоря — контекстом)»
Где речь о программистах? :-)
Полагаю, нужно выкинуть немалую часть старых фич и использовать извлечённые автоэнкодером.
Тогда действия выходят следующими:
Но это моё мнение дилетанта, который даже не особо учится :-)
Аугментация, не?
«На эту самую эволюцию уже сейчас уже человеки влияют очень сильно»
Только перед этим ему надо возникнуть.
«это же супер-пупер всех технологий»
Или, возможно, вероятнее их хреновое развитие — при сравнимом с людьми временем существования :-)
«а с 200-тыщной историей ну просто же будет все что можно»
Или они таки упрутся в потолок. Впрочем, это пессимистичный взгляд.
«это конечно же бестелесная форма существования»
С чего бы? По идее тут как ни крути — нужен какой-то носитель. Вопрос только в ТТХ носителя. Ну, по крайней мере я бы не стал заранее так экстраполировать.
«У высокоразвитой даже на 20-тыщ лет обогнавшей землян цивилизации»
Ну, 20 тысяч лет времени существования — строго говоря, ещё не гарантия того, что в эти 20 тысяч лет они развивались, а не пытались изобрести земледелие :-) (ну, если современный вид человека до этого дошёл только просуществовав ~40000 лет, то почему кому-то не дойти через 60000).
Ну или обошли, да — но таки по одному примеру врядли можно сказать что является более вероятным.
Ну, если мы не уходим в всякие парадоксы.
И, собственно, как это с технической точки зрения бы могло выглядеть?
Это что-то из серии шахмат с голубем, однако.
Обсуждения широкой тематики без разделов и тредов? Вы явно знаете толк в извращениях :-)
Сделают белый список адресов, находящиеся по которым ресурсы не должны быть блокированы ни при каких обстоятельствах же (или уже пытались?).
Это если взаимодействие укладывается в рамки вида «сработал на какое-то триггер — начал распознавать речь с этого момента — классифицировал фразу — обработал в соответствии с текущим состоянием (грубо говоря — контекстом)»