Как стать автором
Обновить
0
Юлия Муравьева @yulinuleiread⁠-⁠only

Пользователь

Отправить сообщение

Интерфейс рецептов

Время на прочтение3 мин
Количество просмотров31K


Первый месяц самостоятельной жизни в Москве я готовил жареную картошку и яичницу. Потом пришло понимание, что можно делать и другие вещи, и пришлось учиться немного готовить. Первое, что я сделал — решил сварить суп из фасоли и картошки. Открыл рецепт, начал читать, а там сюрприз.

«Варить до полуготовности». Ну чёрт побери, откуда я знаю, сколько это? То есть мне надо приготовить одну порцию, засечь время, потом выкинуть её и сделать вторую, да? Отличный план.

Тесто для пиццы — «соль и сахар по вкусу». Ну спасибо, чуваки. Когда пицца испечётся, я не смогу посыпать её сверху сахарком или солью. Причём сахар там вообще для дрожжей, а я не знаю, сколько нужно на их вкус.
Читать дальше →
Всего голосов 117: ↑108 и ↓9+99
Комментарии578

Анализ публикаций на Хабрахабре за последние полгода. Статистика, полезные находки и рейтинги

Время на прочтение3 мин
Количество просмотров18K
Давненько никто не собирал статистику о постах на Хабрахабре. Мы в Cloud4Y решили узнать какие изменения произошли за последние полгода. Нас интересовало:

  • В какой день недели и время суток лучше всего публиковаться?
  • Есть ли зависимость между числом подписчиков и популярностью постов?
  • Каких постов больше: обучающих материалов, переводов или прочих?

И многое другое…



Что мы сделали?


24 апреля 2017 года была собрана статистика по всем последним публикациям на Хабрахабре. Оказалось, что в период с 20 сентября 2016 года по 22 апреля 2017 года:
Читать дальше →
Всего голосов 75: ↑69 и ↓6+63
Комментарии37

Спортивный анализ данных, или как стать специалистом по data science

Время на прочтение17 мин
Количество просмотров60K
Меня зовут Пётр Ромов, я — data scientist в Yandex Data Factory. В этом посте я предложу сравнительно простой и надежный способ начать карьеру аналитика данных.

Многие из вас наверняка знают или хотя бы слышали про Kaggle. Для тех, кто не слышал: Kaggle — это площадка, на которой компании проводят конкурсы по созданию прогнозирующих моделей. Её популярность столь велика, что часто под «кэглами» специалисты понимают сами конкурсы. Победитель каждого соревнования определяется автоматически — по метрике, которую назначил организатор. Среди прочих, Kaggle в разное время опробовали Facebook, Microsoft и нынешний владелец площадки — Google. Яндекс тоже несколько раз отметился. Как правило, Kaggle-сообществу дают решать задачи, довольно близкие к реальным: это, с одной стороны, делает конкурс интересным, а с другой — продвигает компанию как работодателя с солидными задачами. Впрочем, если вам скажут, что компания-организатор конкурса задействовала в своём сервисе алгоритм одного из победителей, — не верьте. Обычно решения из топа слишком сложны и недостаточно производительны, а погони за тысячными долями значения метрики не настолько и нужны на практике. Поэтому организаторов больше интересуют подходы и идейная часть алгоритмов.



Kaggle — не единственная площадка с соревнованиями по анализу данных. Существуют и другие: DrivenData, DataScience.net, CodaLab. Кроме того, конкурсы проводятся в рамках научных конференций, связанных с машинным обучением: SIGKDD, RecSys, CIKM.

Для успешного решения нужно, с одной стороны, изучить теорию, а с другой — начать практиковать использование различных подходов и моделей. Другими словами, участие в «кэглах» вполне способно сделать из вас аналитика данных. Вопрос — как научиться в них участвовать?
Хардкор
Всего голосов 71: ↑66 и ↓5+61
Комментарии13

Нейросеть Google Translate составила единую базу смыслов человеческих слов

Время на прочтение4 мин
Количество просмотров97K

«Универсальный язык» нейронной сети Google Neural Machine Translation (GNMT). На левой иллюстрации разными цветами показаны кластеры значений каждого слова, справа внизу — смыслы слова, полученные для него из разных человеческих языков: английского, корейского и японского

За последние десять лет система автоматического перевода текстов Google Translate выросла с нескольких языков до 103, а сейчас она переводит 140 млрд слов ежедневно. В сентябре сообщалось, что разработчики приняли решение полностью перевести сервис Google Translate на глубинное обучение. У этого подхода есть много преимуществ. Перевод становится гораздо лучше. Более того, система может переводить тексты на языки, для которых никогда не видела переводов, то есть не обучалась специально для этой языковой пары.
Читать дальше →
Всего голосов 55: ↑51 и ↓4+47
Комментарии164

Сравнение аналитических in-memory баз данных

Время на прочтение19 мин
Количество просмотров41K
В последние два месяца лета в управлении хранилищ данных (Data Warehouse, DWH) Тинькофф Банка появилась новая тема для кухонных споров.

Всё это время мы проводили масштабное тестирование нескольких in-memory СУБД. Любой разговор с администраторами DWH в это время можно было начать с фразы «Ну как, кто лидирует?», и не прогадать. В ответ люди получали длинную и очень эмоциональную тираду о сложностях тестирования, премудростях общения с доселе неизвестными вендорами и недостатках отдельных испытуемых.

Подробности, результаты и некое подобие выводов из тестирования — под катом.
Читать дальше →
Всего голосов 47: ↑44 и ↓3+41
Комментарии56

Сложный квест для хабравчан: 25 уровней

Время на прочтение1 мин
Количество просмотров105K


Всем привет, меня зовут Влад, я программист в Mail.Ru Group. В 2010 году я делал квест для хабраюзеров и его прошло более 10 тысяч человек. На этот день программиста я решил сделать что-то похожее, но немного не успел: усложнял квест и не смог остановиться. (-:

Решать головоломку здесь: puzzle.mail.ru

Призы! Первому, кто ответит на все 25 вопросов, мы подарим Raspberry Pi 3 от DIY-сообщества Mail.Ru Group. Еще есть промежуточный приз: тот, кто первым пройдет 15-й уровень, получит от меня инвайт на Хабр.
Читать дальше
Всего голосов 123: ↑115 и ↓8+107
Комментарии716

Почему я не понимаю продукцию Apple

Время на прочтение5 мин
Количество просмотров111K


Из года в год, иногда раз в несколько лет, мир оглушает новость: компания Apple выпустила новый продукт. И каждый раз он, этот самый продукт, вызывает массу споров. У компании есть огромное число адептов и обожателей, точно так же как и есть огромное количество ненавистников. Кто-то плотно сидит на iPhone и Mac, кто-то предпочитает Android. У всех вкусы разные, с этим не поспоришь. Но следуя концепции свободного мира, свободы выбора сложно отрицать факт того, что Apple именно диктует свои правила, пользуясь статусом «законодателя моды».

Данный текст — исключительно субъективное мнение о происходящем, выводы стороннего наблюдателя, который еще в нулевых с восторгом наблюдал становление «Империи Apple», а сейчас понимает, что занять нейтральную позицию как ранее у него не выходит. Потому что восторженных отзывов вокруг становится все больше и больше, а восхищаться начинают даже очень спорными решениями.

Что такое смартфон? Давайте не обманывать себя и примем за аксиому, что смартфон — это инструмент, который позволяет человеку находиться онлайн, где бы он ни был, в пределах сотовой сети, конечно же. Смартфон — это не отражение сути личности, это — костыль, которым мы все, его владельцы, пользуемся ежедневно.
Читать дальше →
Всего голосов 228: ↑148 и ↓80+68
Комментарии870

Синтез изображений с помощью глубоких нейросетей. Лекция в Яндексе

Время на прочтение15 мин
Количество просмотров49K
Пусть в блоге Яндекса на Хабрахабре эта неделя пройдет под знаком нейронных сетей. Как мы видим, нейросети сейчас начинают использоваться в очень многих областях, включая поиск. Кажется, что «модно» искать для них новые сферы применения, а в тех сферах, где они работают уже какое-то время, процессы не такие интересные.

Однако события в мире синтеза визуальных образов доказывают обратное. Да, компании еще несколько лет назад начали использовать нейросети для операций с изображениями — но это был не конец пути, а его начало. Недавно руководитель группы компьютерного зрения «Сколтеха» и большой друг Яндекса и ШАДа Виктор Лемпицкий рассказал о нескольких новых способах применения сетей к изображениям. Поскольку сегодняшняя лекция — про картинки, то она очень наглядная.


Под катом — расшифровка и большинство слайдов.

Всего голосов 87: ↑84 и ↓3+81
Комментарии10

Рак. Что с этим делать и чего делать не надо. Личный опыт

Время на прочтение5 мин
Количество просмотров254K
Примерно год назад я расширенно ответил на статью о раке. Это вызвало массу комментариев и неподдельный интерес к теме. Я долго не писал, потому что я не был уверен, что все закончится в итоге хорошо. К сожалению, хорошо не закончилось. Эта статья в основном, о том чего делать не надо.
Читать дальше →
Всего голосов 170: ↑146 и ↓24+122
Комментарии332

Правила хорошего вкуса от Линуса Торвальдса. Делаем код быстрее, проще и понятнее

Время на прочтение5 мин
Количество просмотров48K
«Вкус — это способность судить о прекрасном»
И. Кант

Дирк Хондел, один из тех, кто стоял у истоков Linux, однажды сказал о создателе Linux Линусе Торвальдсе: «Линус не только блестящий программист: у него хороший вкус. Торвальдс находит простые и разумные пути решения проблем, умеет всё «разложить по полочкам». Сложные вещи он делает простыми. По-моему, это и есть главное отличие превосходного программиста от просто хорошего».

image

В недавнем интервью, примерно на 14-й минуте, Линус Торвальдс коснулся темы «хорошего вкуса в программировании». Хороший вкус? Ведущий попросил его остановиться на этом подробнее, и Линус, пришедший не с пустыми руками, показал пару слайдов.
Читать дальше →
Всего голосов 70: ↑57 и ↓13+44
Комментарии145

Ускорение библиотеки HeatonResearchNeural (нейросети) в 30 раз

Время на прочтение4 мин
Количество просмотров7.3K
Всем привет! Хочу поделиться небольшой историей допиливания HeatonResearchNeural — библиотеки разнообразных нейросетей. Сразу оговорюсь, что работаю аналитиком, а честным программистом перестал быть лет 10 назад.

Однако у меня есть собственный проект на C#, который развиваю в свободное время. Чтобы не заморачиваться написанием велосипеда когда-то скачал HeatonResearchNeural прикрутил скотчем и спокойно гонял тесты, дорабатывал логику своего кода и т.д. Для максимального ускорения заложил в архитектуру решения параллелизацию выполнения расчетов и глядя на загрузку CPU по 80-90% по телу разливалось приятное хозяйское тепло — все пашут, все при деле!
Читать дальше →
Всего голосов 44: ↑43 и ↓1+42
Комментарии22

Техника безопасности при работе с PostgreSQL

Время на прочтение7 мин
Количество просмотров27K
Так получилось, что я начал работать с PostgreSQL три года назад и за это время умудрился методично собрать все возможные грабли, которые можно вообразить. И сказать по правде, если бы была возможность поделиться с собой трехлетней давности нынешним горьким опытом, моя жизнь была бы куда проще и нервные клетки целее. Именно поэтому я решил написать абсолютно субъективную статью со сводом правил, которых придерживаюсь при разработке на PostgreSQL. Возможно, кому-то эта статья поможет обойти собранные мной грабли (и наступить на другие, ха-ха!).


Читать дальше →
Всего голосов 75: ↑71 и ↓4+67
Комментарии43

Всё, что вы знали о холестерине, оказалось неправдой

Время на прочтение11 мин
Количество просмотров192K


В 2013 году, когда я опубликовал результаты моего эксперимента по увеличению уровня тестостерона, многие комментаторы обругали меня за рекомендации диет с высоким содержанием жира и холестерина. Если верить им, я рекламировал опасную диету, ведущую к проблемам с сердцем и ожирением, несмотря на то, что я публиковал результаты анализа моей крови, показавшие высокое содержание холестерина.

Я не виню их за критику. В большинстве своём они, подобно мне, росли в 80-х и 90-х годах, когда считалось, что диеты с высоким содержанием холестерина и жира приведут к заболеваниям сердца и другим проблемам.

Но все, что люди знают по поводу холестерина, оказалось неправдой. Это включает и меня, и то, что я находил однозначной связью между этой липофильной молекулой и тестостероном.

Г-н Холестерин – не злодей. Его просто неверно поняли. Сегодня мы поделимся всем, что нужно знать про г-на Холестерина и раскроем все секретные сведения по поводу этого хорошего парня.
Читать дальше →
Всего голосов 79: ↑70 и ↓9+61
Комментарии227

Бинарные (файловые) хранилища, страшная сказка с мрачным концом

Время на прочтение17 мин
Количество просмотров40K


Даниил Подольский (Git in Sky)


Доклад мой называется «Бинарные, они же файловые, хранилища», но, на самом деле, мы имеем дело со страшной сказкой. Проблема в том (и это тезис моего доклада), что сейчас не существует не то что хорошей, а хотя бы приемлемой системы хранения файлов.

Что такое файл? Файл – это кусок данных с именем. Что важно? Почему файл – это не строка в базе данных?

Файл слишком большой, чтоб можно было обращаться с ним как с одним куском. Почему? Есть у вас сервис, раз у нас HighLoad конференция, у вас сервис, который держит одновременно 100 тыс. соединений. Это не так уж много, если по каждому из соединений мы отдаем файл в 1 Мбайт размером, но нам нужно примерно 100 Гбайт памяти для буферов под эти файлы.
Всего голосов 69: ↑57 и ↓12+45
Комментарии43

Утки, Таиланд и T-SQL… или что может подстерегать программистов при работе с SQL Server?

Время на прочтение33 мин
Количество просмотров48K

Все начиналось довольно обыденно… Зачитывался Рихтером и усиленно штудировал Шилдта. Думал, что буду заниматься разработкой под .NET, но судьба на первом месяце работы распорядилась иначе. Один из сотрудников неожиданно покинул проект и во вновь образовавшуюся дыру докинули свежего людского материала. Именно тогда и началось мое знакомство с SQL Server.

С тех пор прошло чуть меньше 6 лет и вспомнить можно многое…

Про бывшего клиента Джозефа из Англии, который переосмыслил жизнь, за время отпуска в Таиланде, и в моем скайпе стал подписываться Жозефиной. Про веселых соседей по офису, с которыми приходилось сидеть в одной комнате: один страдал от аллергии на свежий воздух, а другой маялся от неразделенной любви к С++ дополняя это аллергией на солнечный свет. Один раз по команде свыше пришлось на время стать Александром отцом двух детей, чтобы изображать из себя обросшего скилами сениора по JS.
Подробнее
Всего голосов 76: ↑73 и ↓3+70
Комментарии48

Жульничество во «всемирный день шопинга» наглядно

Время на прочтение2 мин
Количество просмотров66K

На этой неделе на Geektimes была публикация со статистическим анализом изменения цены товара на AliExpress во «всемирный день шопинга» 11.11. По ней с честной скидкой продавалась только четверть товаров. А я случайно заглянул туда меньше, чем за сутки до начала распродажи, и заметил сразу несколько способов обмана невнимательных покупателей.
Читать дальше →
Всего голосов 60: ↑55 и ↓5+50
Комментарии134

«Радиоактивный бойскаут» умер в возрасте 39 лет. Необычная история юного физика-ядерщика

Время на прочтение4 мин
Количество просмотров115K

Дэвид после возвращения из армии

Дэвид Хан (David Hahn) прославился, как человек, который пытался построить самодельный ядерный реактор-размножитель у себя дома. Точнее, создание объекта велось не в самом доме (строение располагалось на окраине Детройта), а в сарае неподалеку.

Изначально Хан просто увлекался химией. Его настольной книгой, как утверждается, была «Золотая книга химических экспериментов». Он очень хотел получить все элементы из периодической таблицы Менделеева для своей коллекции, причем в их число входили и радиоактивные элементы. Кроме того, Хан стал скаутом, и начал зарабатывать значки. Один из значков, которые были доступны для получения скаутом — символ знатока ядерной энергии. Его-то мальчик и решил получить.
Читать дальше →
Всего голосов 79: ↑76 и ↓3+73
Комментарии214

Как управляется вертикаль небоскреба «Лахта центр»?

Время на прочтение6 мин
Количество просмотров40K
Очевидец, побывавший на стройплощадке и понаблюдавший за работой геодезистов, развенчивает миф о легкости их бытия и рассказывает о том, как предотвратить превращение небоскреба в «пизанскую башню».

Работа этой команды не столь наглядна как деятельность самих строителей, однако цена ошибки чрезвычайно высока, особенно при возведении высотных объектов. Речь идет о геодезистах – их на стройке «Лахте центра» работает несколько десятков. Их технологическая оснащенность поражает воображение: строить небоскреб в буквальном смысле помогают из космоса.


Всего голосов 106: ↑103 и ↓3+100
Комментарии86

Онкология. Моя история. Часть первая

Время на прочтение4 мин
Количество просмотров115K
Сказать по правде писать статью на одном из сайтов ТМ до сего дня не входило в мои планы. Зарегистрировался то я с оказией где-то в 2012 году, то ли ответить на какую то статью, то ли задать вопрос автору оной. Ни то, ни другое сделать у меня не вышло из-за read-only, вот и не логинился я с тех самых пор. Сегодня же в почтовой рассылке обнаружил ссылку на статью Isma «Рак. Что с этим делать и чего делать не надо. Личный опыт.».

Прочитал очень внимательно, включая комментарии и не смог сдержать в себе желания поделиться собственным опытом в данном вопросе. Не приведи **** окажется кому-то полезным.

image

Что это?
Срез спиральной компьютерной томографии.
Кто найдёт «белое пятно» из статьи ниже, тому пирожок с полочки, за то, что они нашли, а два бестолковых рентгенолога не нашли.

Интересно?
Читать дальше →
Всего голосов 120: ↑117 и ↓3+114
Комментарии276

Дешевые авиабилеты… Сеть мошеннических сайтов, ворующих деньги с карт. Второе расследование. При чём тут Промсвязьбанк?

Время на прочтение41 мин
Количество просмотров55K


Около месяца назад я опубликовал на Geektimes статью «Дешевые авиабилеты… Или сеть мошеннических сайтов, ворующих деньги с карт. Мое расследование.» Публикация получила большой отклик и неожиданное продолжение…

Напомню для тех, кто первую часть не читал. В публикации на основе реальных случаев были описаны схемы, с помощью которых мошенники воруют деньги с карт покупателей авиабилетов, которые имели неосторожность попасть на поддельный сайт по продаже билетов. Количество таких мошеннических сайтов по продаже авиабилетов в рунете исчисляется десятками и сотнями (с учетом закрытых). На таких сайтах пользователю сначала показывается реальная информация об авиарейсах, предлагается оформить заказ и оплатить его банковской картой. Всё выглядит красиво, пока покупатели авиабилетов не обнаруживают, что остались и без денег, и без билетов.

Во всех обнаруженных случаях для кражи денег такие сайты используют сервисы банков для перевода денег с карты на карту (P2P). В первой части был подробно разобран механизм того, как страница Банка Тинькова для оплаты с карты на карту маскируется и встраивается на мошеннические сайты, так, чтобы «покупатель» ничего не заметил. Также упоминался Промсвязьбанк, — именно через него были украдены деньги с карты потерпевшего в истории, которая была описана. И если с банком ТКС вопросов не осталось, то в случае с Промсвязьбанком было непонятно, как именно выводятся деньги. Основной скрипт, служащий для воровства денег, выполнялся на стороне сервера и без исходных кодов можно было только стоить предположения, что именно он делает.

И вот один из пользователей Geektimes связался со мной и прислал тот самый скрипт payp2p.php, который использовался в последнее время на большой части мошеннических сайтов по продаже авиабилетов. Скрипт этот использует сервис Промсвязьбанка для перевода с карты на карту. И на мой взгляд, Промсвязьбанк, предоставляя свой сервис, который было легко обмануть, способствовал росту количества интернет-мошенников.
Читать дальше →
Всего голосов 98: ↑96 и ↓2+94
Комментарии87
1
23 ...

Информация

В рейтинге
Не участвует
Откуда
Москва, Москва и Московская обл., Россия
Дата рождения
Зарегистрирована
Активность