Высокая разрежённость (низкая плотность) данных. Значительная доля фичей , у большинства пользователей будет иметь нулевые (или же пустые) значения, что негативно скажется на обобщающих способностях моделей и возможном переобучение.
В статье пару раз упоминается разреженность фичей. Вопрос: это проблема какого-то конкретного датасета? Или есть какая-то специфика в построении фичей для аплифта, которая и приводит к разреженности?
Кажется, что разреженность фичей - это характеристика которая разнится от задачи к задаче: в коллаборативной фильтрации мы получаем разрнженные данные, а в каком-то классическом датасете с агрегатами над поведением пользователей (частота посещений, клики, глубина скролла, платежи) разреженности может и не быть (если с продуктом все нормально)
РВ настолько огромна, что разные арки комиксов или книг можно уже просто воспринимать как творчество внутри творчества, которое не обязано быть взаимосвязанным и стройным. Хотя единая нить, пронизывающая все сюжктки была бы элегантной и приятной для восприятия, разнородность всего накопленного за 40 лет добра даёт возможность каждому фанату выстроить свой "канон", который ему видится близким.
Комиксы серии "Рыцари старой республики" + "Республика" + "Тёмные времена" + "Наследие" довольно стройно соотносится с трилогией приквелов и оригинальной с одной стороны.
С другой стороны ВК, в отрыве почти от всей РВ, в сочетании с приквелами тоже достойная вещь (начиная с 3-4 сезона, когда из Асоки сделали что-то живое).
Книги постэндора, вторжения вонгов, улья и заварушки Джейсена Соло образуют свой причудливый лор с оригинальной трилогией.
В каком-то смысле можно сказать, что вселенная ЗВ - это такая история из прошлого (кажется, Лукас что-то такое хотел воплотить в журнале уиллов, или как-то так) . Есть множество источников, подчас противоречивых, и варьирование этими источниками в выстратвании восприятия всей картины даёт нам разные трактовки (разные кластеры ЗВ, так сказать) . Какую выбрать? Дело вкуса. Но лично меня этот беспорядок притягивает к ЗВ))
В статье пару раз упоминается разреженность фичей. Вопрос: это проблема какого-то конкретного датасета? Или есть какая-то специфика в построении фичей для аплифта, которая и приводит к разреженности?
Кажется, что разреженность фичей - это характеристика которая разнится от задачи к задаче: в коллаборативной фильтрации мы получаем разрнженные данные, а в каком-то классическом датасете с агрегатами над поведением пользователей (частота посещений, клики, глубина скролла, платежи) разреженности может и не быть (если с продуктом все нормально)
Мысли вслух
РВ настолько огромна, что разные арки комиксов или книг можно уже просто воспринимать как творчество внутри творчества, которое не обязано быть взаимосвязанным и стройным. Хотя единая нить, пронизывающая все сюжктки была бы элегантной и приятной для восприятия, разнородность всего накопленного за 40 лет добра даёт возможность каждому фанату выстроить свой "канон", который ему видится близким.
Комиксы серии "Рыцари старой республики" + "Республика" + "Тёмные времена" + "Наследие" довольно стройно соотносится с трилогией приквелов и оригинальной с одной стороны.
С другой стороны ВК, в отрыве почти от всей РВ, в сочетании с приквелами тоже достойная вещь (начиная с 3-4 сезона, когда из Асоки сделали что-то живое).
Книги постэндора, вторжения вонгов, улья и заварушки Джейсена Соло образуют свой причудливый лор с оригинальной трилогией.
В каком-то смысле можно сказать, что вселенная ЗВ - это такая история из прошлого (кажется, Лукас что-то такое хотел воплотить в журнале уиллов, или как-то так) . Есть множество источников, подчас противоречивых, и варьирование этими источниками в выстратвании восприятия всей картины даёт нам разные трактовки (разные кластеры ЗВ, так сказать) . Какую выбрать? Дело вкуса. Но лично меня этот беспорядок притягивает к ЗВ))