All streams
Search
Write a publication
Pull to refresh
4
0
Дмитрий @zuko3d

Software Scientist

Send message
Объем. Из названия «большие данные» становится понятно, что они содержат в себе много информации. И это действительно так: компании могут ежедневно получать десятки терабайт различных данных, некоторые — сотни петабайт. То есть «большие данные» не были бы таковыми без объема.

Было бы интересно узнать про компании, обрабатывающие сотни петабайт в сутки.

Скорость. Большие данные поступают и обрабатываются из разных источников с высокой скоростью. При отсутствии этого свойства информацию уже нельзя будет назвать «big data». А еще они генерируются без остановки.

Кхм… а если данные не генерируются без остановки? Например, сделали мы снимки всей поверхности Земли и сложили дабы потом их анализировать. Это уже не Big Data, получается? Кажется, важна скорость обработки данных, а не скорость их генерации.

Разнообразие. Большие данные содержат в себе информацию, относящуюся к разным типам. Это одно из главных отличий от простых данных — они всегда структурированы и могут быть сразу сохранены в базе данных.

Я бы посмотрел, как вы «сразу сохраните в базе» петабайт структурированных данных.

В целом есть ощущение, что автор никогда с большими данными не работал.
Несмотря на вашу очень едкую формулировку — несложно. Указ Собянина, п. 6 www.mos.ru/upload/documents/docs/43-YM(2).pdf
А то получается что яндекс и майлру под шумок соберут, незаконным способом четко персонализированные данные

Вы правда думаете, что им прям вот очень хотелось в порыве альтруизма добавлять обязательное сканирование qr-кодов? Вообще-то как раз по закону таксисты не имеют права возить людей без пропусков и агрегаторы обязаны это проверять.
Вы, кажется, забыли, что сейчас уже развит стриминг контента, а не скачивание и последующее прослушивание. А bandwidth всё ещё стоит больших денег. Аудио, конечно, не сравнится в объёмах с видео, но это только пока там используют lossy кодеки. Если вы на ютубе захотите раздавать всем видео со звуковой дорожкой в FLAC, то звук станет весить больше, чем картинка.
Это как сравнивать автомобили по самой большой цифре на спидометре… Некая корреляция есть, но очень слабая.
Кажется, в такие заведения лучше и не устраиваться.
Если речь идёт именно о senior'e, то всегда есть крупные организации в которые стабильно нанимают на высокие позиции даже во время карантина. Но у некоторых возникает проблема, что «гадкие эйчары взяли мидла вместо меня» =)
Я провёл немало технических собеседований и нередко люди с претензией на senior позицию не могут даже простые вещи написать. А на senior претендуют потому что «в своей прошлой организации я делал кучу разных дел и был очень полезен».
Если senior _конкурирует_ с мидлами, значит это не senior, а мидл. Мастер спорта никогда не конкурирует с первым разрядом — он приходит и выигрывает.
Кто достоин большего куска пирога человек который придумал или тот кто кнопки нажимал.

Ну если в деле был ещё и аналитик, то я бы сказал 2:1 в пользу аналитика. Но я в реальной жизни такого ни разу не видел, видел только, что задачу ставят сразу программисту. Поэтому все три куска торта уходят в один рот, и зарплата выглядит такой вкусной.
Это разделение графа на компоненты связности. В простейшем варианте — BFS. Для направленных графов без циклов (такие графы обычно получаются при учёте объектов в памяти) — чуть сложнее, но в целом тоже нехитро (сначала найти корень проходом в обратную сторону против направления рёбер, а оттуда уже BFS).
Какой-то кликбайтный заголовок. Пройдусь по заголовкам разделов.

Чисто для десктопа

А что, убунты на десктопе нет? Если я не могу поставить систему на несколько разных устройств — это минус, а не плюс.

Очень просто пользоваться

Если не любишь консоль — используй винду. В остальном убунта так же проста.

Максимально готовый

Убунта не менее готова. Я бы сказал, даже более.

Хорошая поддержка

Это чудесно, но я не верю, что у убунты с её огромной командой — поддержка хуже.

В общем, было бы интересно увидеть сравнение, а не воспевание манжары.
Оу, да, погорячился. В L1 будет только верхушка, остальное в L2.
Не влияет ну совсем.

Так-то стек лежит надёжно в L1-кэше процессора, а динамическая память — далеко-далеко и её кучу раз придётся доставать.
а чем программист лучше

Он бизнесу больше денег приносит, чем официантка или курьер. Один программист может за пару месяцев написать оптимизацию для логистики и вместо сотни курьеров заказы будут развозить 70 курьеров. Деньги этих 30 курьеров будут сэкономлены — половину получит программист, половину — бизнес. Вроде всё честно.
Как вы на Питоне напишете драйвера для принтера?
В статье по ссылке динамическая типизация преподносится как плюс, хотя даже питон уже хочет отказаться от этого. Дальше читать не вижу смысла.

p.s. Нет смысла измерять что-либо если вы не измеряете при этом погрешность. График некорректный.
Интересный комментарий, но я интересовался преимуществами над С++, т.к. Julia (исходя из статьи) претендует на роль языка для высокопроизводительных вычислений.
В то время как Julia специально создана для решения задач, связанных с высокопроизводительными вычислениями

Для этого уже существует C++ и пока что никто не смог подвинуть его с королевского места. Какие преимущества есть у Julia над плюсами?
Это же прекрасно, когда люди вырастают и перестают верить в сказки. Вселенской справедливости не существует — вселенной достаточно законов физики.
Было бы интересно посмотреть, как люди с таким подходом запустят спутник в космос. Видимо, методом проб и ошибок, а теория — это всё выдумки, далёкие от жизни =)
Хм… это не совсем правда. Водка, которая получена в спец. лаборатории на хорошей аппаратуре — действительно не будет иметь лишних примесей. Но в магазинах она не такая.

Information

Rating
Does not participate
Location
Россия
Registered
Activity