Данная операция имеет сходство с ДЕКАРТОВЫМ ПРОИЗВЕДЕНИЕМ. Однако, здесь добавлено условие, согласно которому вместо полного произведения всех строк в результирующее отношение включаются только строки, удовлетворяющие опредленному соотношению между атрибутами соединения (А1,A2) соответствующих отношений.
И да, что у вас там в постгре лежит и почему вы джойните диапазоны ipшников - это конечно отдельный вопрос
я часто использую пакет sqldf, работаю с датафреймами используя ситаксис SQL Так мне не приходится учить синтаксис data.table или dplyr, ну и sql не забываю)
спасибо за статью! Очень прикольная библиотечка, попробовал сделать схему ML модели, мне очень зашло, но руководство захейтило теперь буду рисовать в паэрпоинте.
Как представитель этих самых дата сантистов, имею сказать следующее:
1. Главное не картинки а модель, а точнее поддержка принятия решения
2. Интуицию и экспертное мнение никто не отменял, но подтвердить достоверность при помощи матеши — это аргумент.
3. Пример в статье скорее игрушечно — фановый, в реальной работе ДСа данных намного больше и критериев для выбора решения тоже.
вот кстати интересный вопрос куда лить то что сейчас льют в дата лэйк?
возможно MPP базы и всякие клик хаусы хорошы но ведь они под определенные сценарии использования
Если лить в облако вместо перс данных только ключ — айдишник а перс данные хранить в Россиюшке то тогда норм, хотя юристы пока с фз 152 не знают что делать и трактуют любое слово в любую сторону, так что под отзыв лицензии или еще какую канитель можно попасть и если ты банк или телеком или еще какой авиа перевозчик то шутить с риском потери лицензии не будешь
пока то что я вижу это попытки продать продукт компаниям которые не хотят или не могут нанять дорогой персонал вида дата инжинеров, дата сантистов
а BI который разговаривает с пользователем через Алексу и соотвествено амазон клауд я уже видел и видел растерянные лица СБшников которые не знали как это квалифицировать, когда финансовая инфа компании льется в чужое облако без всяких договоров и НДА
Закат эпохи Big Data прям не заголовок а кликбейт
Генерация информации ускоряется но маркетологи анононсировали загат эпохи больших данных
пожалуй куплю попкорн и подожду когда они выкатят новую эпоху, интересно что это будет:
эпоха громадных данных?
эпоха ту фрекен матч данных?
Решил воспроизвести код
Пока дошел до матрицы
нехватает пары импортов
import numpy as np
import itertools
from itertools import product
from sklearn.metrics import confusion_matrix
А так пост классный плюсанул бы если бы знал как)))
ууу!!! баблищко!!! ууу!!!
Знаешь сколько всего нужно вытерпеть за 200к
Лол
А ты как сюда пролез? 26 тыс это жи не ойти?
Советы уровня тик тока если вы бездомный то посто купите себе дом
ахаха, в голосину
Очень классно, бро
Я даже себе предтавил как ты воинственно стучишь по клаве
чот не понял пора уже Джульку учить для датасаенса или пока дальше на пайспрке себе чилить
Так и хочеться набросить что web девелоперы не могут в алгебру, но собственно вот из учебных материалов:
http://www.mstu.edu.ru/study/materials/zelenkov/ch_4_4.html
СОЕДИНЕНИЕ
Данная операция имеет сходство с ДЕКАРТОВЫМ ПРОИЗВЕДЕНИЕМ. Однако, здесь добавлено условие, согласно которому вместо полного произведения всех строк в результирующее отношение включаются только строки, удовлетворяющие опредленному соотношению между атрибутами соединения (А1,A2) соответствующих отношений.
И да, что у вас там в постгре лежит и почему вы джойните диапазоны ipшников - это конечно отдельный вопрос
lol у нас это называлось постгре аррей. правда он бы строковый но щито поделать?
я часто использую пакет sqldf, работаю с датафреймами используя ситаксис SQL
Так мне не приходится учить синтаксис data.table или dplyr, ну и sql не забываю)
Тест забавный
Заголовок отличный пример кликбейта
Прочитал и непонял зачем, мифы какик то какие мифы?
1. Главное не картинки а модель, а точнее поддержка принятия решения
2. Интуицию и экспертное мнение никто не отменял, но подтвердить достоверность при помощи матеши — это аргумент.
3. Пример в статье скорее игрушечно — фановый, в реальной работе ДСа данных намного больше и критериев для выбора решения тоже.
возможно MPP базы и всякие клик хаусы хорошы но ведь они под определенные сценарии использования
а BI который разговаривает с пользователем через Алексу и соотвествено амазон клауд я уже видел и видел растерянные лица СБшников которые не знали как это квалифицировать, когда финансовая инфа компании льется в чужое облако без всяких договоров и НДА
Генерация информации ускоряется но маркетологи анононсировали загат эпохи больших данных
пожалуй куплю попкорн и подожду когда они выкатят новую эпоху, интересно что это будет:
эпоха громадных данных?
эпоха ту фрекен матч данных?
Пока дошел до матрицы
нехватает пары импортов
import numpy as np
import itertools
from itertools import product
from sklearn.metrics import confusion_matrix
А так пост классный плюсанул бы если бы знал как)))