Про классические БД — все так, там CWA везде и всегда.
C LinkedData — тут по прежнему бинарная логика да/нет, так что нельзя сказать, что closed world assumption совсем не применим — если я попрошу ВикиДата посчитать все материки, то он их насчитает 6, а не «не знаю сколько» — ведь у меня нет доказательства, что все остальные объекты не материки (в случае с open world у нас по сути есть вывод как плюса, так и минуса — все, что посередине unknown)
Если глядя на проблему, вы в состоянии провести анализ задачи на степень аппрокисимируемости, сложность вероятностных алгоритмов для распределения средних входных данных или идентифицировать параметрическую сложность задачи и оценить распределение в среднем на своих данных для параметров, то пожалуй вам не нужны вводные гайды «что делать, если ваша задача может быть NP-полной» :)
Подтверждаю, что такие такие ЗП вполне есть на рынке и в целом, наверное, в Бельгии ЗП выше чем в Германии, за исключением Берлина, Мюнхена и ко — но это исключительно мои наблюдения.
Про community рекомендую вступить в Open Data Science — там прям много людей.
А если по материалу — мне кажется наиболее разумным начать с простых вводных материалов на Udacity и потихоньку начинать работать над каким-то своими проектами, которые кажутся интересными — а там потихоньку и к более сложным вещам переходить.
1. Вы хотите сказать, что они не связаны? Сложность модели напрямую влияет на bias/variance trade-off, а как следствие на VC-размерность и способность модели обобщать сложные закономерности (вообще в целом)
2. Нет, это же персональный список того, с чем приходилось столкнуться и с какого угла эти задачи рассматривались
3. Да, тут это в другом смысле, мы говорим white box — когда у нас есть хорошее понимание почему модель себя ведет именно так и мы можем анализировать ее действие, и понять, что на что именно там повлияло. В естественно-научном цикле терминология отличается и это абсолютно нормально
Согласен, но тут я привожу свой список того, с чем приходилось сталкиваться — вполне возможно, что здесь пропущено куда больше — просто это менее популярно, поэтому не приходилось с этим работать напрямую.
Совсем не обязательно, что у вас он будет таким же — здесь все субъективно, но делюсь опытом из жизни.
Опыт же персональный, я прям так и написал, что делюсь тем, что мне помогло:
но тут у меня исключительно субъективный личный опыт, у вас, может быть, все совсем по-другому.
мне часто помогает разложить процесс обработки и data extraction в виде простых операторов в голове и на бумаге, а потом переложить его в код и запросы — если вам не помогает, то у вас просто другой подход, я же не обещал, что это решит все проблемы и поможет всем
Про классические БД — все так, там CWA везде и всегда.
C LinkedData — тут по прежнему бинарная логика да/нет, так что нельзя сказать, что closed world assumption совсем не применим — если я попрошу ВикиДата посчитать все материки, то он их насчитает 6, а не «не знаю сколько» — ведь у меня нет доказательства, что все остальные объекты не материки (в случае с open world у нас по сути есть вывод как плюса, так и минуса — все, что посередине unknown)
Иначе бы этот цикл заметок у меня еще месяцами пылился бы на полке.
А если по материалу — мне кажется наиболее разумным начать с простых вводных материалов на Udacity и потихоньку начинать работать над каким-то своими проектами, которые кажутся интересными — а там потихоньку и к более сложным вещам переходить.
2. Нет, это же персональный список того, с чем приходилось столкнуться и с какого угла эти задачи рассматривались
3. Да, тут это в другом смысле, мы говорим white box — когда у нас есть хорошее понимание почему модель себя ведет именно так и мы можем анализировать ее действие, и понять, что на что именно там повлияло. В естественно-научном цикле терминология отличается и это абсолютно нормально
мне часто помогает разложить процесс обработки и data extraction в виде простых операторов в голове и на бумаге, а потом переложить его в код и запросы — если вам не помогает, то у вас просто другой подход, я же не обещал, что это решит все проблемы и поможет всем