Будете смеяться, но проблема была в том, что в базе ответов по ошибке была написана латинская «С» в слове «Сталонне». Мне всегда было интересно, о чем думал автор йцукен-раскладки, помещая русскую и латинскую С на одну и ту же клавишу.
Если на секунду забыть про этическую составляющую вопроса, останется еще инженерная.
Например, на мобильном телефоне подслушивание очень быстро съест весь заряд аккумулятора из-за необходимости постоянно стримить речь на сервер распознавания. Я даже больше скажу, мы очень много инженерных усилий тратим на то, чтобы начинать слушать пользователя только в тот момент, когда мы на 100% уверены, что он обратился к Алисе, и, тем самым, экономить заряд аккумулятора. Пользователь, который удалил приложение из-за того, что оно разряжало его телефон, точно не принесет нам денег. А что мы ему прорекламируем на основе обрывков разговоров — это еще бабка надвое сказала.
Стоит также отметить, что нагрузка, которую создаст на сервера распознавания речи постоянный стриминг разговоров пользователей между собой, будет превышать нагрузку от использования Алисы на порядки. Другими словами, подслушивать — дорого. Есть намного более простые, дешевые и надежные способы понять предпочтения пользователя.
Что касается остальных вопросов:
* Я специально выбрал для слайдов сложный шаблон, чтобы проиллюстрировать всю мощь шаблонизатора. На практике большинство шаблонов выглядит как «В Москве сейчас {{form.temparature}} градусов»
** Ну, в шаблонах по большому счету нет логики, только тексты.
*** Нет, мы без особых проблем держим весьма немаленькую нагрузку. Весь действительно CPU-intensive код (например, применение нейросетей) написан не на питоне и вызывается через обертки.
Nearby — это места и события в радиусе 1.5 км. Мы пробовали и больший радиус, но, как показала практика, он уже плохо соответствует понятию пешей доступности.
Tips — это прежде всего советы о том, что стоит и чего не стоит делать в каком-то месте. А вот представьте себе концерт популярной группы. Люди постят фото с разных ракурсов, делятся впечатлениями. А вы можете видеть все это в единой ленте. На концепцию tips это никак не ложится.
Пользователей foursquare сперва нужно научить не просто чекиниться, а еще делиться чем-то с окружающими, постить фото. Впрочем, foursquare, кажется, будут развиваться в эту сторону. Из концепции геосоциальный игры уже выжато все, что можно.
А за предложение по поводу поиска спасибо. Мы тоже думаем в эту сторону.
Ну, попытки заново изобрести Facebook я, например, тоже не одобряю (если, конечно, вы не гугл). Мы же пытались решить значительно более узкую задачу, интересную нам, для решения которой удобных средств для этого не было.
С Google+ я пока близко не знаком, но в facebook есть только возможность отметиться (check-in) в том или ином месте и посмотреть, кто из друзей там был. Нет возможности посмотреть историю этого места. Кто писал здесь что-либо день, неделю или месяц назад. Нет возможности подписаться не на человека, а на конкретное место.
Господа, я попал в дурацкую ситуацию: в процессе переезда между компами я потерял исходники и базу знаний от этого проекта. Не мог бы кто-нибудь из тех, кому я отправлял исходники и базу, переслать мне их обратно? =)
P(<Qj,Ans>|Ai) дословно читается как «вероятность того, что на вопрос Qj был дан ответ Ans при условии, что загадан был Ai. Эту вероятность мы оцениваем на основе предыдущих ответов пользователей как долю ответов Ans на вопрос Qj про Ai среди всех возможных ответов на этот вопрос для Ai.
Некоторые люди склонны считать, что если они столкнулись с каким-то большим (по их мнению) числом, они вправе приплести туда ЗБЧ. Некоторые люди невежественны.
Из области машинного обучения. Тебе даны реализации некоторой функции (в данном случае, релевантности от документов), тебе надо по реализациям научиться считать похожую функцию для новых документов. Как научишься — посчитать и отправить ее значения.
Я все упрощаю, конечно. Кроме pointwise есть еще pairwise и listwise.
Задача про числа Фибоначчи вообще ужасная. Строго говоря, длина числа растет как exp(n), следовательно за O(log n) даже вывести n-e число не получится, не то что посчитать. А если скажут ограничиться, скажем, 64-битными числами, то для них задача решается за O(1) с заранее подготовленной таблицей (чисел там не очень-то много).
А если имеется в виду решение с матрицей
1 1
1 0
(в частности, с ее разложением по собственным значениям), то это, имхо, не очень хороший тест чего-либо. Если вы не знали решение заранее, придумать его на собеседовании будет крайне сложно.
В списке решаемых задач классификация — это слишком узко. Например, незаслуженно забыта регрессия. Я бы предложил заменить на что-то типа «восстановление неизвестной зависимости по ее реализациям».
Все лекции снимаются на видео и выкладываются на закрытую вики. В принципе, это позволяет на лекции особо не ходить, если очень уж тяжело в такое время. Я первый семестр закончил (довольно неплохо), появившись только на открытии школы. Это, впрочем, не надо понимать так, что учиться там легко.
А мне больше нравится " Параллельные миры. Об устройстве мироздания, высших измерениях и будущем Космоса" by Митио Каку. Она несколько полнее, глубже, и при этом все такая же понятная.
Ага, про это как раз и было в статье, на которую я выше дал сссылку (правда, не у всех есть доступ к ACM DL). А еще там было эмпирическое сравнение с описанным в этой статье подходом.