• Каким был спрос на айтишников во второй половине 2020 года
    0
    Кажется, что в данных есть смещение, очень уж сильно текущая ЗП улетает временами от вакансий. Не может быть такой ситуации, что в калькуляторе отмечаются в основном джуны, а в вакансиях требуются сениоры? Понятно, что некоторое смещение всегда будет. На работном сайте чаще ищут инфу по зарплатам те, кто ищет, а ищут часто из-за низкой оплаты. И наоборот. Если уж пишут ЗП в вакансии, то часто это значит, что все горит, человек нужен вчера и ему готовы переплачивать. Но все равно как-то далековато.
  • Почему ты не учишь английский язык?
    0
    https://linguatrip.com/blog/english-levels/ как вариант, такие оценки много где встречал. Насколько я понимаю, как-то так рассчитаны и книжки. 1 книга на семестр или год, в зависимости от интенсивности. Каждая книга на 1 уровень, те самые 100-200 часов. Я думаю, вы себя сильно недооцениваете.
    Ну и еще немного пояснения. Мне кажется, B2 у меня был в конце школы, либо очень близко к тому, ездил на районную олимпиаду :). Меньше лексики и грамматики, зато больше беглости. В ВУЗе держал его же несколько лет. Лексики и грамматики добрал, потерял в беглости. После ВУЗа еще пару раз дотягивал куда-то туда курсами, сейчас сильно упал из-за 0 практики. По словарному запасу вроде как даже выше нормы. Зато просто 0 грамматики, ушло произношение, 0 беглости речи, в сумме недо-B1.
  • Почему ты не учишь английский язык?
    –1
    Точно не 1000, это с нуля можно до С дойти с такими объемами. Много где видел, что на каждую ступеньку английского надо около 100-200 часов. Плюс вспоминать должно быть дешевле, чем с 0 учить. Мне кажется, что при 2 занятиях в неделю + адекватной домашке я за полгода до B2 *в своем представлении* дотянусь. Лексика в пассивном словаре есть, ее надо вытянуть в актив. Натаскать основные конструкции, подчистить произношение, поработать над беглостью речи и письма. И как-то подтянуть грамматику так, чтобы эта работа не убила беглость. На этом я засыпался в предыдущие подходы.
  • Почему ты не учишь английский язык?
    0
    Почему ты не учишь английский язык?
    Потому что это отдельная работа, которая сейчас для меня не в приоритете. Есть миллион вещей, который можно и нужно выучить, чтобы оставаться конкурентоспособным. И честный B2+ не в топе моих личных приоритетов.
    Я прекрасно читаю техническую литературу на английском без обращения к словарям и справочникам. С гуглотранслейтом могу составить кривоватое письмо. И, краснея, пользуясь от силы 1000-2000 слов и простейшей грамматикой, изъясниться устно. Меня поймут, но всем будет неловко.
    Чтобы перейти на честный B2 мне нужно много работать над устной и письменной речью. Ориентировочно, ввалить в это 100ч времени. Что я получу взамен? Эфемерную возможность легкой переписки и речи. Вероятность, что это мне реально понадобится — процентов 5-10.
    За те же условные 100ч можно выучить достаточно практических вещей, которые мне интереснее и с большей вероятностью встретятся в работе.
    Плюс не забываем, что силы не бесконечные. 4 часа на английский в неделю так или иначе идут минусом к основному рабочему времени. Я тупо на 10% больше устаю и соразмерно снижается моя производительность труда. Не уверен, что и я и работодатель этого хотим.
    В общем, у меня изрядно пригорает от того, что невладение идеальным английским сейчас воспринимается исключительно как лень.
  • Как молодой девушке уехать на Яндекс.Такси в лес и пропасть без вести
    +10
    Ну как такси, в том-то и дело. В части регионов это скорее почти профессиональное такси с профессиональными автопарками. В части — шабашащие автовладельцы на своих машинах. Как их там проверяют отбирают мы не знаем. Так что это не такси, а скорее сервис по «своду» клиента и желающего подзаработать автомобилиста. Пока оператору это удобно — они такси. Как только перестает быть удобным — сразу всплывают контрагенты, местные представители и тонна прослоек, а они опять начинают продавать только информационное сопровождение. Т.ч. ЯндексGO такое же такси, как Ebay — магазин.
  • Как молодой девушке уехать на Яндекс.Такси в лес и пропасть без вести
    +7
    Даже странно, что у слова «виктимшейминг» нет прямого аналога в русском языке. 2/3 комментариев в чем-то обвиняют потенциальную жертву, но никак не оператора потенциально опасной услуги. Правда, что мешает иметь отдельный штат операторов для линии безопасности? Чтобы все эти немногочисленные инциденты можно было разбирать максимально быстро и эффективно. В чем проблема? Можно ли решить ее звонком водителю? Если нет, то вызвать полицию по координатам. И в идеале это все решать в режиме звонка (когда это возможно), а не набора текста на телефоне. Понятно, что может быть все что угодно, что в интересах клиента делать все для своей безопасности, что риски невелики, но тем не менее.
  • Если у родителей нет планов на будущее собственного ребенка, они есть у государства
    +8
    Не поддерживаю от начала до конца. Я вот сейчас не могу сказать, хочу я работать условным столяром или не хочу. Я не умею в этой профессии ничего, я ей не учился, я не пробовал этим заниматься для души, я не пробовал этим заниматься за деньги. У меня просто нет знаний чтобы сказать, хочу я этим заниматься или нет. То же самое с 99% профессий кроме тех, в которых я оказался по большому счету случайно. По 1% профессий у меня к 30+ годам есть какое-то смутное ощущение, чем заняты эти люди, что им нравится в их работе, что нет и насколько я похож на этих людей. Кто его знает, может я бы мог плитку класть лучше всех в городе и быть счастливым? После обучения и получения соответствующего опыта, с нормальным инструментом, материалами и заказчиками? Откуда 15-летний подросток может получить знания, чтобы сделать осознанный выбор и разумно подготовиться к поступлению в куда ему там надо? Как он поймет, это он так опыта набирается, или он неправильно выбрал профессию? В общем, осознанный выбор профессии — это какой-то единорог для меня. Было бы круто, если бы он существовал, но я в него не верю.
  • Что вас на самом деле ждёт на курсе про алгоритмы в Яндекс.Практикуме
    +7
    А на тот мегапост был подробный ответ? Просто человек подсветил очень много моментов, не только и не столько проблемы конкретного курса, а системные вещи. Неэтичное ревью, хамство менеджера, неотлаженную систему автопроверки, странный возврат денег, очень много чего. Тут мне кажется проблема не только в программе курса.
  • Как я делал систему оптического трекинга
    +1
    Очень круто. А можете примерно вспомнить, сколько времени заняли этапы? Понятно, что очень примерно, интересует больше порядок чисел.
  • Дети нашли уязвимость в экране блокировки Linux Mint, случайно нажимая клавиши
    +6
    А сама ситуация, при которой сбой в локере позволяет получить доступ к рабочему столу, точно не повод для беспокойства? Это ведь может стать входом и для более осмысленных атак, если я все правильно понимаю.
  • Стилометрия, или как отличить Акунина от Булгакова с помощью 50 строк кода?
    0
    >как найти автора по
    Я бы брал пласт тематических текстов. Т.е. если ищем футпринт автора художественной литературы, то берем художку, причем желательно максимально близкого жанра. Считаем частотность слов и выражений по всему пласту. Затем считаем по отдельным авторам авторскую частотность. Находим разность между авторской частотностью и средней. Пики — авторские словечки. Смотрим, какие слова характерны для конкретного текста и ищем наиболее близкого автора. Хотя, конечно, внутри море подводных камней. Придется искать что-то в духе «автор чаще использует „этот“ чем „который“, „и“ чем „а“ и т.п. Важно не хватануть слов, которые относятся к сюжету, а не самому автору. Т.е. не начать считать, что маркерное для Булгакова слово — »яйцо", тк оно часто встречается в роковых яйцах.
    Я похожим образом в свое время делал модуль автопоиска ключевиков для статьи на сайте. В том приложении работало хорошо.
  • Стилометрия, или как отличить Акунина от Булгакова с помощью 50 строк кода?
    0
    Скорее всего, русскую морфологию не подхватит. Ну и как они сами пишут, одноразовый фан проект, который не поддерживается 6 лет. Но все равно спасибо! Нет идей что-то сделать дополнительно с вашим сабжевым проектом? Ведь наверняка из него можно выжать больше?
  • Стилометрия, или как отличить Акунина от Булгакова с помощью 50 строк кода?
    0
    Интересная заготовка! А можно свести все эти и другие синтетические параметры, полученные по различным книгам одного автора, и построить нормальный такой классификатор. И в теории он сможет определять авторство текста с какой-то вероятностью. Другой вопрос, что фичи придется поискать более сложные. Частотность маркерных слов и словосочетаний, средняя частотность глаголов/существительных/прилагательных/местоимений/… и т.д.
    А еще забавнее было бы прогнать, например, по массиву диссертаций и поискать кластера предположительно одного авторства.
  • Детекция аномалий на снимках с БПЛА
    +1
    Спасибо за интересную статью, мануалов, как начать работать с YOLO, объективно не так много, лишним точно не будет.
    А не поделитесь, каких метрик качества удалось достичь?
    Не думали расширить датасет фотографиями с условных гуглокартинок, хотя бы по самым интересующим и малопредставленным классам? Наверняка же что-то можно найти.
    И еще, мне кажется, детекция аномалий это все-таки про другое, это про поиск «подозрительных, нетипичных» участков на изображениях, по типу головы сфинкса на Марсе. То, что ни на что не похоже. У Вас все-таки более рядовая задача детекции очень редких объектов нескольких классов. Очень похожая задача была подробно разобрана еще для 2/3 версии YOLO — там детектировали полипы/рак кишечника. Тоже очень много однотипных «пустых» изображений без единого объекта класса и редкие, но максимально важные объекты самого класса. И там перед автором вставал вопрос, какой уровень «паники» задавать для модели, чтобы не перегружать врача ложноположительными примерами, но при этом не допускать ложноотрицательных.
  • DVC vs GIT. Почему GIT'а недостаточно в проектах машинного обучения
    0
    Тоже с этого начинали. Системное версионирование, если его разложить на физический уровень, это 2 таблицы. Одна — текущий срез данных, актуальный прямо сейчас. Другая — своеобразная лог таблица, из которой никогда ничего не удаляется, зато в ней присутствует 2 поля — данные валидны С и ПО. Вместо удаления строки просто обновляется ПО на текущее время. В принципе, ничего не мешает повторить эту структуру на неподдерживающем версионирование движке вручную. Единственное — море оберток, триггеров, доп индексов, процедур обновления данных. Для каждой таблицы, если их десятки и сотни, это тяжело поддерживать. Но для некоей итоговой таблицы датасета вполне.
  • DVC vs GIT. Почему GIT'а недостаточно в проектах машинного обучения
    0

    Для многих баз данных есть крутая встроенная похожая штука — temporal tables, они же таблицы с системной версионностью. Работал с ними на MS SQL Server — муторно, но оно того стоит. Можно реально изолировать состояние данных на более менее любую дату. Но весь код обновления и использования данных становится объемным и надо с умом проектировать хранилище, чтобы при каждой заливке свежей порции данных не обновлялась вся таблица. Но действительно появляется возможность прогнать свежий код на старых данных "как тогда" и посмотреть, насколько лучше новая модель.

  • «Летающая табуретка» или идеальный квадрокоптер для перевозки пиццы
    +1
    Круто! А ведь если придать основному отсеку форму крыла, оно полетит еще дальше/лучше/быстрее? Пицца должна легко влезть по-прежнему :) Плюс можно аэродинамически будет управлять в самолетном режиме.
  • Снова о пластике. Кто виноват и что делать
    +4
    Какая-то очень декадансная статья. Не про «оторвать свою точку и рассортировать хоть что-то», а про «никто нигде ничего не делает».
    Как мне кажется, такие вещи эффективно деньгами делаются. В стоимость пакета, бутылки, пробки и памперса должна быть заложена сумма на его переработку. Продал магазин 1000 бутылок, заплатил за это 10 000р целевого налога на развитие переработки и улучшение экологии. Собрал и сдал из них 500 — получил соответствующий вычет. Собрал кто-то дугой — так же получил заработанное, пусть конкурируют за удобство сбора. Но тут важно, чтобы это было именно целевое и максимально местное финансирование. Где мусорят, там и организовывают переработку. И сколько намусорили, столько и истратили.
  • Что не так с коронавирусной статистикой?
    +1
    В теории, тестов делается более чем достаточно, больше чем в большинстве стран Мира. При том в регионах практически невозможно сделать официальный тест вовремя, тк не хватает рук. Первое разумное объяснение, что кто-то делает тесты очень регулярно, в то время как остальные получают эту возможность очень несвоевременно. В итоге у тех, у кого и так все хорошо гора отрицательных тестов, а те, кто реально болеют, тестируются уже в тот момент, когда выявить вирус невозможно. image
  • Что не так с коронавирусной статистикой?
    0
    А можете до кучи вывести число активных случаев (и на миллион жителей), в тч историчное на график? В идеале, хотя бы выборочно, где удастся найти данные, дополнительно вывести коечный фонд региона. Это поможет оценить перегруз здравоохранения и косвенно оценить риски умереть подавившись печенькой, тк все медики в ковидных госпиталях. Плюс возможность скачать сырые данные была бы нужной фичей.
  • Как я победил прокрастинацию, узнал свои истинные желания, поставил четкие цели и достиг их
    +1
    Видимо следующий левел — прокрастинировать за написанием статей про прокрастинацию.
  • Apple представила форк TensorFlow для чипа M1
    0
    В оригинальной новости приводили характеристики, теста, которые намекают на использование GPU AMD для ускорения вычислений. Но для этого, видимо, придется уйти от собственно tensorflow.
    Testing conducted by Apple in October and November 2020 using a preproduction 13-inch MacBook Pro system with Apple M1 chip, 16GB of RAM, and 256GB SSD, as well as a production 1.7GHz quad-core Intel Core i7-based 13-inch MacBook Pro system with Intel Iris Plus Graphics 645, 16GB of RAM, and 2TB SSD. Tested with prerelease macOS Big Sur, TensorFlow 2.3, prerelease TensorFlow 2.4, ResNet50V2 with fine-tuning, CycleGAN, Style Transfer, MobileNetV3, and DenseNet121. Performance tests are conducted using specific computer systems and reflect the approximate performance of MacBook Pro.
    Testing conducted by Apple in October and November 2020 using a production 3.2GHz 16-core Intel Xeon W-based Mac Pro system with 32GB of RAM, AMD Radeon Pro Vega II Duo graphics with 64GB of HBM2, and 256GB SSD. Tested with prerelease macOS Big Sur, TensorFlow 2.3, prerelease TensorFlow 2.4, ResNet50V2 with fine-tuning, CycleGAN, Style Transfer, MobileNetV3, and DenseNet121. Performance tests are conducted using specific computer systems and reflect the approximate performance of Mac Pro.
  • Секрет Великого Искоренителя
    +2
    >Зрительную кору головного мозга можно исхитриться применять не только по прямому назначению
    CUDA, биологический аналог :)
  • Формула 1 и та самая табличка со скоростью пилотов
    +2
    Вот не соглашусь. Оба сокомандника Хэмилтона очень достойно выглядят относительно него в квалификациях. Сливают по паре десятых, но мы все же считаем, что это один из лучших гонщиков в истории. То же самое с Массой/Баррикелло. Оба проигрывали Михаэлю, но проигрывали немного и на машине, которая строилась под Шумахера.
  • Формула 1 и та самая табличка со скоростью пилотов
    0
    Безусловно, подходит — не подходит самая тяжелая вещь. Вроде бы 100% она существует, но как ее отделить от снижения формы/мотивации — ума не приложу. Честно — так и не смог сделать даже более простого: разделить все машины на «аэродинамические» и «прижимные». В теории все просто — делим трассы на медленные и быстрые. Какие машины выделяются на медленных — прижимные, на быстрых — аэродинамические. Но не все так просто :)
  • Формула 1 и та самая табличка со скоростью пилотов
    0
    В том и суть. Берем пары пилотов, которые выступают на одной машине и на одной трассе. Смотрим, кто быстрее. Прокидываем сквозь года — в теории должны получить рейтинг всех времен и народов, который игнорирует разницу в машинах.
  • Говорит и показывает Ишутин
    –2
    Думаю, тут как минимум большие вопросы в плане общечеловеческой этики. Даже если с тз закона никаких проблем, прямое разрешение «жертвы» разбора очень бы не помешало.
  • Что не так с Хабром
    0
    Неимоверное уважение, на самом деле. 20к символов, пока все сходится :). Помогли 4 тысячам человек, прочитавшим статью — это ведь правда круто.
  • Что не так с Хабром
    +5
    Частично согласен:). Длинные статьи лично мне более чем ОК. Лучше проскроллить воду, чем додумывать ненаписанное. Про менеджмент vs программисты — подобное просто пропускаю. Да, хороший код лучше плохого кода, но работающее предприятие намного лучше не открытого. Многих продуктов бы просто не было, если бы в начале не накатали решение на коленке, которое в итоге сполна попило крови в поддержке.
    Но вот комментарии — это боль. У меня категорически нет желания писать на Хабр *заметку* «смотрите, как у меня получилось» или «смотрите, что я нашел» именно из-за страха негатива. Я в курсе, что мой код ужасен и до высоких стандартов его дотягивать только ради публикации я не хочу. Я в курсе, что уже полгода/год/более наверняка есть более эффективное решение, или его можно написать самому. Мне было бы интересно послушать мнения, а не 99% критики. Это культурная дыра в русскоязычном мире, и здесь она видна особенно остро.
    И главное — я правда не могу понять, кто эти люди, пишущие статьи по 10+к символов, с множеством иллюстраций и тп. Мой диплом выглядел много хуже и был всего в несколько раз больше. Это титаническая работа, смысл которой для меня не понятен. Написать 1к символов — дело минут на 30, если знаешь, что писать. Итого только набрать статью — порядка 5-10 часов. Иллюстрации, код, вычитка, правки, примеры, git. Допустим в сумме часов 20. Т.е. целый месяц по часу работать после работы, или потратить пару выходных, чтобы хлебнуть местных комментариев.
  • Не те игрушки: как мы научили нейросеть бороться с порно в стримах
    +3
    А кто знает, насколько легально использовать эти данные для обучения сети? Ну т.е. навряд ли в пользовательском соглашении ютуба и порносайтов оговорено, что они прямо разрешают использовать их контент в посторонних целях, пусть и для автоматизированного деперсонализированного анализа. Может быть какой-нибудь известный актер боится, что его одетые видео теперь будут баниться на одной из платформ в России, т.к. нейросеть переобучится на его бэкграунде? И совершенно не хочет, чтобы его лицо участвовало в обучении нейросетей?
    Понятно, что так делают практически все, но в каком сейчас состоянии законодательство на этот счет?
  • Заметки Дата Сайентиста: как измерить время забега марафона лежа на диване
    +1
    Пункты есть. Есть или не есть непонятно :) С какого-то момента есть уже неохота совсем. А вот надо или не надо — загадка. С гелями вроде как советуют быть осторожным и тоже тренировать организм на них, если начать их принимать уже в гонке возможны сюрпризы. С водой тоже советуют не перебарщивать, бывали случаи, что бегуны перебирали с водой и в обморок грохались. Сколько для этого ее надо выпить не сообщается.
  • Заметки Дата Сайентиста: как измерить время забега марафона лежа на диване
    +2
    Вы как-то совсем забыли про роль пейсмейкеров. Эти ребята собирают вокруг себя толпу и бегут на «ровный» результат, а пейсер на 4 часа — вообще суперзвезда марафона. Но и вокруг других «ровных» времен должны быть свои пики. И у меня есть ощущение, что в категории >4 часов то ли разные времена для пейсмейкеров были в разные годы, то ли кто-то из пейсов перестарался/наоборот отстал.
    Можно посмотреть, за счет каких половозрастных групп прибавилось число участников от года к году.
    На средний темп также очень влияет погода. Каждый градус, минимальная разница в облачности и осадках.
    Марафон вообще ни на что не похож, если вы, конечно, не бегаете 30+км регулярно.
    По всем прикидкам я должен был пробежать свой марафон из 4 часов легко, но было жарко, а опыта столь длинного бега не было. И в итоге первая 20-ка за 1:54, 30-ка за 2:55, а следующие 10км уже за 1:10. Последние 2км скорость была 8-9км/ч, чаще шел чем бежал. Итого 4:20.
    На последней десятке работают те мышцы, о которых просто не знаешь. Например, жутко болел пресс, потому что спина отболела и перестала держать еще после 30км. Плюс очень непонятно, что делать с водой и едой.
  • Идеальный график отпусков. Естественные алгоритмы. Поведение роя пчёл
    0
    Интересно, что когда я учился, алгоритм PSO у нас чаще называли стайным. Хотя в оригинале да, рой агентов. Разницы по сути мало, но сам факт. Представлять пчел, наверное, приятнее, чем волков :)
  • «Breakout-YOLO»: знакомимся с шустрой object-detection моделью, играя в классический «Арканоид»
    +1

    А ведь хороший проект! Вернее, из него можно быстренько сделать фреймворк для создания жестового управления буквально к чему угодно. Комбо из жестов можно даже вместо ключа-пароля использовать на любом утюга с вебкой:)
    Отдельное спасибо за рабочую цепочку транслятлров весов модели, очень намаялся с этим, когда работал с YOLO.

  • В чем разница между Data Analytics и статистикой
    0

    Если вы так же как и я не поняли разделения и противопоставления, Кейси сама начинает свои статьи с тезиса, что настоящих сайентистов настолько мало, что она придумала делить их на подвиды по исполняемым функциям. И идеальный сайентист в её представлении это аналитик+статистик+ML/AI экспертиз.
    Разумно, но вообще не принято, особенно в русскоязычном комьюнити.

  • Как мы организовали анализ и обработку данных в ДомКлик
    +4
    Если честно, всю статью ждал, что вы хоть немного расскажете про задачи перед командами, но нет :)
    По вашему профилю классифаеда скорее ожидаешь увидеть команду DS аналитики в плане оценки жилья, антифрода и прочего, а не CV и NLP. Очень интересно, какие основные проекты, наверняка есть о чем рассказать.
  • Детекция кашля на Intel NUC
    0

    Молодцы, если заработает — позволит разгрузить и людей и аппаратуру, уменьшит очереди где они не нужны.
    А каких объемов был датасет? Сами собирали-размечали? Давали примеры с некашляющими людьми? Брали людей разных полов, национальностей и возрастов?
    Ну и самый очевидный вопрос — не проще использовать звук? :)

  • Data Engineer и Data Scientist: что умеют и сколько зарабатывают
    0

    А как откликались, если не секрет? Отдельно под каждую компанию резюме под нужды каждой? Лично писали или через стандартные формы? У вас какая-то запредельная конверсия откликов в ответы, хочется узнать секрет успеха :)
    Профиль крутой, но все же.
    И ещё вопрос, если можно. Не ощущаете ETL после DS скучным?

  • Как уволиться правильно, чтобы потом не…
    +1
    Вот не раз встречал именно такую трактовку. Что максимум молодец еще в момент начала поисков предупредит руководителя. Максимально удобную трактовку для руководителя, которому лень раз в квартал просто поговорить со своими подчиненными и попытаться понять назревшие проблемы до того, как человек пустится во все тяжкие.
    С одной стороны, я вполне понимаю, что часто люди просто выгорают и шансов удержать все равно нет. Ну нет в компании других задач, подходов и руководителей. Часто к этой точке уже и удерживать не хочется, человек все равно еле работает. С другой, это не значит что надо сидеть i'm fine до того момента, как человек посреди проекта принесет заявление.
    У нас был случай, когда уволился разработчик, который только что перенял огромный и критичный блок у другого только что уволившегося. И эта передача явно подтолкнула его быть сговорчивее при переходе. Было шумно, расстались плохо, но в общем и целом все живы.
  • Как уволиться правильно, чтобы потом не…
    0
    Не могу понять пункта про «Знает ли руководитель, что вы собираетесь уволиться?». Я не представляю, как с этим можно адекватно работать, особенно, если от тебя что-то всерьез зависит. Эта информация с большей вероятностью тебе навредит, чем поможет что-то исправить. Ничего серьезного уже не доверят, а троллить регулярно будут. Опять же, если слишком долго будешь искать после того как расскажешь, возникнут очевидные вопросы, почему ты никому не нужен.