All streams
Search
Write a publication
Pull to refresh
0
0

Middle DS

Send message
  1. Высокая разрежённость (низкая плотность) данных. Значительная доля фичей  X=x, у большинства пользователей будет иметь нулевые (или же пустые) значения, что негативно скажется на обобщающих способностях моделей и возможном переобучение.

В статье пару раз упоминается разреженность фичей. Вопрос: это проблема какого-то конкретного датасета? Или есть какая-то специфика в построении фичей для аплифта, которая и приводит к разреженности?

Кажется, что разреженность фичей - это характеристика которая разнится от задачи к задаче: в коллаборативной фильтрации мы получаем разрнженные данные, а в каком-то классическом датасете с агрегатами над поведением пользователей (частота посещений, клики, глубина скролла, платежи) разреженности может и не быть (если с продуктом все нормально)

Мысли вслух

РВ настолько огромна, что разные арки комиксов или книг можно уже просто воспринимать как творчество внутри творчества, которое не обязано быть взаимосвязанным и стройным. Хотя единая нить, пронизывающая все сюжктки была бы элегантной и приятной для восприятия, разнородность всего накопленного за 40 лет добра даёт возможность каждому фанату выстроить свой "канон", который ему видится близким.

Комиксы серии "Рыцари старой республики" + "Республика" + "Тёмные времена" + "Наследие" довольно стройно соотносится с трилогией приквелов и оригинальной с одной стороны.

С другой стороны ВК, в отрыве почти от всей РВ, в сочетании с приквелами тоже достойная вещь (начиная с 3-4 сезона, когда из Асоки сделали что-то живое).

Книги постэндора, вторжения вонгов, улья и заварушки Джейсена Соло образуют свой причудливый лор с оригинальной трилогией.

В каком-то смысле можно сказать, что вселенная ЗВ - это такая история из прошлого (кажется, Лукас что-то такое хотел воплотить в журнале уиллов, или как-то так) . Есть множество источников, подчас противоречивых, и варьирование этими источниками в выстратвании восприятия всей картины даёт нам разные трактовки (разные кластеры ЗВ, так сказать) . Какую выбрать? Дело вкуса. Но лично меня этот беспорядок притягивает к ЗВ))

Information

Rating
Does not participate
Registered
Activity

Specialization

Data Scientist, ML Engineer
Middle
Machine learning
Deep Learning