Объем. Из названия «большие данные» становится понятно, что они содержат в себе много информации. И это действительно так: компании могут ежедневно получать десятки терабайт различных данных, некоторые — сотни петабайт. То есть «большие данные» не были бы таковыми без объема.
Было бы интересно узнать про компании, обрабатывающие сотни петабайт в сутки.
Скорость. Большие данные поступают и обрабатываются из разных источников с высокой скоростью. При отсутствии этого свойства информацию уже нельзя будет назвать «big data». А еще они генерируются без остановки.
Кхм… а если данные не генерируются без остановки? Например, сделали мы снимки всей поверхности Земли и сложили дабы потом их анализировать. Это уже не Big Data, получается? Кажется, важна скорость обработки данных, а не скорость их генерации.
Разнообразие. Большие данные содержат в себе информацию, относящуюся к разным типам. Это одно из главных отличий от простых данных — они всегда структурированы и могут быть сразу сохранены в базе данных.
Я бы посмотрел, как вы «сразу сохраните в базе» петабайт структурированных данных.
В целом есть ощущение, что автор никогда с большими данными не работал.
А то получается что яндекс и майлру под шумок соберут, незаконным способом четко персонализированные данные
Вы правда думаете, что им прям вот очень хотелось в порыве альтруизма добавлять обязательное сканирование qr-кодов? Вообще-то как раз по закону таксисты не имеют права возить людей без пропусков и агрегаторы обязаны это проверять.
Вы, кажется, забыли, что сейчас уже развит стриминг контента, а не скачивание и последующее прослушивание. А bandwidth всё ещё стоит больших денег. Аудио, конечно, не сравнится в объёмах с видео, но это только пока там используют lossy кодеки. Если вы на ютубе захотите раздавать всем видео со звуковой дорожкой в FLAC, то звук станет весить больше, чем картинка.
Кажется, в такие заведения лучше и не устраиваться.
Если речь идёт именно о senior'e, то всегда есть крупные организации в которые стабильно нанимают на высокие позиции даже во время карантина. Но у некоторых возникает проблема, что «гадкие эйчары взяли мидла вместо меня» =)
Я провёл немало технических собеседований и нередко люди с претензией на senior позицию не могут даже простые вещи написать. А на senior претендуют потому что «в своей прошлой организации я делал кучу разных дел и был очень полезен».
Кто достоин большего куска пирога человек который придумал или тот кто кнопки нажимал.
Ну если в деле был ещё и аналитик, то я бы сказал 2:1 в пользу аналитика. Но я в реальной жизни такого ни разу не видел, видел только, что задачу ставят сразу программисту. Поэтому все три куска торта уходят в один рот, и зарплата выглядит такой вкусной.
Это разделение графа на компоненты связности. В простейшем варианте — BFS. Для направленных графов без циклов (такие графы обычно получаются при учёте объектов в памяти) — чуть сложнее, но в целом тоже нехитро (сначала найти корень проходом в обратную сторону против направления рёбер, а оттуда уже BFS).
Он бизнесу больше денег приносит, чем официантка или курьер. Один программист может за пару месяцев написать оптимизацию для логистики и вместо сотни курьеров заказы будут развозить 70 курьеров. Деньги этих 30 курьеров будут сэкономлены — половину получит программист, половину — бизнес. Вроде всё честно.
Интересный комментарий, но я интересовался преимуществами над С++, т.к. Julia (исходя из статьи) претендует на роль языка для высокопроизводительных вычислений.
Было бы интересно посмотреть, как люди с таким подходом запустят спутник в космос. Видимо, методом проб и ошибок, а теория — это всё выдумки, далёкие от жизни =)
Хм… это не совсем правда. Водка, которая получена в спец. лаборатории на хорошей аппаратуре — действительно не будет иметь лишних примесей. Но в магазинах она не такая.
Было бы интересно узнать про компании, обрабатывающие сотни петабайт в сутки.
Кхм… а если данные не генерируются без остановки? Например, сделали мы снимки всей поверхности Земли и сложили дабы потом их анализировать. Это уже не Big Data, получается? Кажется, важна скорость обработки данных, а не скорость их генерации.
Я бы посмотрел, как вы «сразу сохраните в базе» петабайт структурированных данных.
В целом есть ощущение, что автор никогда с большими данными не работал.
Вы правда думаете, что им прям вот очень хотелось в порыве альтруизма добавлять обязательное сканирование qr-кодов? Вообще-то как раз по закону таксисты не имеют права возить людей без пропусков и агрегаторы обязаны это проверять.
Если речь идёт именно о senior'e, то всегда есть крупные организации в которые стабильно нанимают на высокие позиции даже во время карантина. Но у некоторых возникает проблема, что «гадкие эйчары взяли мидла вместо меня» =)
Я провёл немало технических собеседований и нередко люди с претензией на senior позицию не могут даже простые вещи написать. А на senior претендуют потому что «в своей прошлой организации я делал кучу разных дел и был очень полезен».
Ну если в деле был ещё и аналитик, то я бы сказал 2:1 в пользу аналитика. Но я в реальной жизни такого ни разу не видел, видел только, что задачу ставят сразу программисту. Поэтому все три куска торта уходят в один рот, и зарплата выглядит такой вкусной.
А что, убунты на десктопе нет? Если я не могу поставить систему на несколько разных устройств — это минус, а не плюс.
Если не любишь консоль — используй винду. В остальном убунта так же проста.
Убунта не менее готова. Я бы сказал, даже более.
Это чудесно, но я не верю, что у убунты с её огромной командой — поддержка хуже.
В общем, было бы интересно увидеть сравнение, а не воспевание манжары.
Так-то стек лежит надёжно в L1-кэше процессора, а динамическая память — далеко-далеко и её кучу раз придётся доставать.
Он бизнесу больше денег приносит, чем официантка или курьер. Один программист может за пару месяцев написать оптимизацию для логистики и вместо сотни курьеров заказы будут развозить 70 курьеров. Деньги этих 30 курьеров будут сэкономлены — половину получит программист, половину — бизнес. Вроде всё честно.
p.s. Нет смысла измерять что-либо если вы не измеряете при этом погрешность. График некорректный.
Для этого уже существует C++ и пока что никто не смог подвинуть его с королевского места. Какие преимущества есть у Julia над плюсами?