Articles / Bookmarks / Profile of Old_tutor / Habr

How to become an author

Данила @Old_tutor

User

Profile Publications 10Comments 1Bookmarks 168

skillfactory_school Nov 11 2020 at 14:30

Как «подружить» инженеров и дата-сайентистов с помощью одной библиотеки

5 min

2.4K

Skillfactory corporate blogMachine learning*Compilers*Artificial IntelligenceOpen source*

Translation

Представьте, что у вас имеется большой проект по машинному обучению. Естественно, сначала над ним работали дата-сайентисты, а затем инженеры-программисты, которые оптимизировали модель для быстрого выполнения на определенных GPU. В итоге модель изменилась так сильно, что дата-сайентисты перестали в ней что-либо понимать. Специально к старту нового потока курса «Профессия Data Scientist» делимся материалом именно о том, как решить эту проблему. Конечно же, нужно буквально предоставить дата-сайентистам и инженерам общий язык. Подробности под катом.

Приятного чтения!

+11

skillfactory_school Nov 11 2020 at 16:15

Готовим console.log() правильно

7 min

18K

Skillfactory corporate blogWebsite development*JavaScript*CSS*

Translation

Специально к старту нового потока курса «Frontend-разработчик» делимся с вами полезным переводом. Автор рассказывает, как использует методы логирования в производственной среде собственного проекта и в чём именно они помогают. Кроме того, нас знакомят с платформой AppSignal, созданной, чтобы напрямую уведомлять разработчика о возникающих у пользователя исключениях в приложении. Подробности под катом.

Приятного чтения!

+19

skillfactory_school Nov 10 2020 at 18:28

20 небольших, но вдохновляющих вызовов веб-разработчику

7 min

21K

Skillfactory corporate blogCSS*HTML*JavaScript*Website development*

Translation

Специально к старту нового потока курса «Frontend-разработчик» делимся переводом подборки с 20 проектами для освоения фронтенда. Эта подборка хорошо подходит, если вы хорошо знакомы с какой-то областью разработки ПО и хотите глубже копнуть во фронтенд. Также она прекрасно подходит людям, которые не хотят начинать знакомство с фронтендом со стандартных проектов. Проекты довольно небольшие, и у каждого указан уровень сложности. С помощью этих проектов вы ознакомитесь с Tone.js — обёрткой над Web Audio, освоите необычно мягкую смену темы со светлой на темную, и наоборот, а почти в конце ждёт самое вкусное — управляемая голосом векторная графика SVG.

Приятного чтения!

+28

skillfactory_school Nov 10 2020 at 16:02

Статистика в Data Science — исчерпывающий гид для амбициозных практиков ML

9 min

29K

Skillfactory corporate blogIT careerMathematics*Machine learning*Studying in IT

Translation

В преддверии старта нового потока курса «Machine Learning Pro + Deep Learning» представляем вашему вниманию пост, который смело можно класть в закладки, — гид по статистике для амбициозных практиков машинного обучения. От ответа на вопрос, что такое статистика, до весьма подробных списков понятий, которые нужно усвоить, чтобы овладеть используемой в работе с проектами ML статистикой. Кроме того, в посте вы найдёте рекомендации литературы.

Приятного чтения!

+13

skillfactory_school Nov 9 2020 at 15:15

Вокенизация — новый прорыв в области здравого смысла ИИ?

7 min

4.5K

Skillfactory corporate blogArtificial IntelligenceThe future is hereAlgorithms*Natural Language Processing*

Translation

В преддверии старта нового потока курса «Machine Learning Pro + Deep Learning», делимся с вами статьей о вокенизации — новом методе на основе неконтролируемого обучения, который позволяет масштабировать современные небольшие визуально-языковые наборы данных, подобные MS COCO, до размеров английской Википедии, то есть миллиардов записей. В сущности гигантские языковые модели учатся видеть мир. Подробности о том, что из себя представляет метод, как он работает и как может изменить искусственный интеллект, как всегда, под катом.

Приятного чтения!

+19

skillfactory_school Nov 9 2020 at 17:17

Как разобраться в дереве принятия решений и сделать его на Python

5 min

30K

Skillfactory corporate blogPython*Artificial IntelligenceMathematics*Machine learning*

Tutorial

Translation

Совсем скоро, 20 ноября, у нас стартует новый поток «Математика и Machine Learning для Data Science», и в преддверии этого мы делимся с вами полезным переводом с подробным, иллюстрированным объяснением дерева решений, разъяснением энтропии дерева решений с формулами и простыми примерами, вводом понятия «информационный выигрыш», которое игнорируется большинством умозрительно-простых туториалов. Статья рассчитана на любящих математику новичков, которые хотят больше разобраться в работе дерева принятия решений. Для полной ясности взят совсем маленький набор данных. В конце статьи — ссылка на код на Github.

Приятного чтения!

+18

skillfactory_school Nov 5 2020 at 16:36

21 канал на YouTube, где вы можете бесплатно изучить ИИ, машинное обучение и Data Science

5 min

26K

Skillfactory corporate blogArtificial IntelligencePython*Data Engineering*Machine learning*

Translation

Мы уже не раз делились в своем блоге полезными материалами для развития (их список можно найти в конце этого поста). Сегодня продолжаем это начинание и специально перед стартом новых потоков курсов по Data Analytics и Data Science представляем подборку YT-каналов по Data Science, искусственному интеллекту и машинному обучению, существование многих из которых неочевидно: например, представлен канал ArXiv Insights, посвящённый научным работам, и Google Cloud Platform.

Приятного чтения!

+17

skillfactory_school Nov 4 2020 at 18:18

Raspberry Pi 400 — настольный компьютер дешевле 100$

12 min

39K

Skillfactory corporate blogDIYComputer hardwareLifehacks for geeksElectronics for beginners

Translation

Кто не знает о семействе одноплатных компьютеров Raspberry Pi, на основе которых было сделано бесчисленное множество самоделок. Сегодня хотим с вами поделиться переводом обзора Raspberry Pi 400 — не очень мощного, но настольного компьютера, менее чем за 100$. Под катом — множество фото, тесты и все как вы любите.

Приятного чтения!

+16

skillfactory_school Nov 4 2020 at 16:45

Как сделать CI на Github для современного фронтенда

14 min

12K

Skillfactory corporate blogGitHub*Lifehacks for geeksProgramming*Website development*

Tutorial

Translation

Совсем скоро, 6 и 18 ноября, у нас стартуют новые потоки курса по JavaScript и
курса «Профессия Веб-разработчик», специально к их старту делимся с вами полезным туториалом, как настроить Github Actions для реальных проектов в области фронтенда со множеством линтеров и тестированием UI, а также уведомлениями о рабочем процессе в Slack. Подробности и репозиторий под катом.

Приятного чтения!

+19

skillfactory_school Nov 3 2020 at 18:52

Развертывание интерактивных визуализаций данных в реальном времени на Flask и Bokeh

14 min

9.6K

Skillfactory corporate blogWebsite development*Data visualization*Python*Flask*

Tutorial

Translation

Сегодня, в преддверии старта нового потока курса «Python для веб-разработки», делимся с вами полезным переводом статьи о небольшой интерактивной визуализации, для исследований данных о фильмах. Автор использует не только Flask и Bokeh, но и задействуя бесплатную облачную платформу баз данных easybase.io. Все подробности и демонстрации вы найдёте под катом.

Приятного чтения!

+18

skillfactory_school Nov 3 2020 at 16:57

Как мы создали вкладку WebAuthn в Chrome DevTools

8 min

2.5K

Skillfactory corporate blogGoogle ChromeJavaScript*Website development*

Translation

Сегодня, в преддверии старта нового потока курса по JavaScript, делимся с вами полезным переводом статьи о том, как разрабатывалась вкладка WebAuthn в Chrome DevTools, какие решения принимались и почему, с какой проблемой столкнулись разработчики.

Приятного чтения!

+12

skillfactory_school Nov 2 2020 at 17:47

Как искусственный интеллект борется с вредителями

9 min

2.4K

Skillfactory corporate blogBig Data*Python*Artificial Intelligence

Translation

Сегодня, в преддверии старта набора на новый поток курса «Machine Learning», делимся с вами переводом поста из блога PyTorch, в котором рассказывается о работе ИИ для борьбы с вредителями, который анализирует ситуацию по фотографиям феромоновых ловушек в условиях индийской глубинки, где выращивают хлопок, о применении PyTorch Mobile для развертывания моделей прямо на смартфоне в оффлайне, о сжатии моделей и, конечно, немного о том, как работать с аномальными изображениями, которые отправляют индийские фермеры.

Приятного чтения!

+16

skillfactory_school Nov 2 2020 at 20:00

Папа может в си, или Простая и аккуратная кодогенерация для SQLite

4 min

3.2K

Skillfactory corporate blogC*Open source*SQLite*Programming*

Translation

Совсем скоро, 4 и 5 ноября, у нас стартуют новые потоки курсов SQL для анализа данных и C++ разработчик, специально к их старту мы подготовили этот перевод из блога Facebook Engineering с обзором полезного инструмента.

SQLite используется широко, но написание хорошо протестированных и поддерживаемых уровней доступа к данным в лучшем случае может стать сложной задачей. Многие команды применяют некую генерацию кода, чтобы избежать необходимости менять десятки порядковых номеров каждый раз, когда добавляется столбец, но такой подход приводит к ошибкам. Компилятор CQL в CG/SQL позволяет создавать сложные хранимые процедуры с большими запросами, а с помощью комбинаций синтаксических хелперов и сильной типизации эти процедуры гораздо проще получить и сохранить. Сочетание сильной типизации в языке и средства для хорошего юнит-тестирования может дать уверенность в том, что даже очень сложная логика корректна.

Приятного чтения!

+1

skillfactory_school Oct 30 2020 at 13:31

Стресс-тестер для соревнований по программированию

6 min

5.3K

Skillfactory corporate blogPython*Programming*Sport programming*IT systems testing*

Tutorial

Translation

Во-первых, не бойтесь названия «стресс-тестер». Это просто модный термин для написанного мной служебного инструмента для соревнований по программированию. Вместо того чтобы просто дать вам код, я расскажу о стратегии и плане, которые у меня были, когда я писал этот инструмент.

Приятного чтения!

+8

skillfactory_school Oct 30 2020 at 17:42

Вдохновляющие портфолио Data Science

6 min

11K

Skillfactory corporate blogLifehacks for geeksIT careerData Engineering*

Translation

Data Science — сложная область знания. Она в равной степени сочетает в себе математику и статистику, информатику и черную магию. С середины 2020 года Data Science быстро растет, многочисленные соискатели роятся над каждым объявлением о приеме на работу. Кроме того, бушующая пандемия, в дополнение ко всему, тянет вниз.

Старания в получении списка сертификатов об окончании курсов не продвинут вас далеко, если только у вас нет добросовестно заслуженных дипломов магистра или PhD (кандидата наук). Сертификаты массовых открытых онлайн-курсов, таких как на Coursera или eDx, хороши, но у меня нет свидетельств их большой значимости. Kaggle тоже уже не тот: его открытые соревнования — кладбище переобученных моделей, а настоящие соревнования выигрывают команды, с которыми трудно соревноваться, более того, такие соревнования в любом случае ограничены в смысле личного портфолио.

Выход всё же есть — делать собственные интересные проекты и из них собирать портфолио, которое выгодно представит вас. В данном материале представлены вдохновляющие примеры таких портфолио. Используйте их для улучшения вашего собственного портфолио Data Science, изучения новых навыков или чтобы открыть для себя интересные проекты.

Приятного чтения!

+12

klimensky Oct 29 2020 at 18:29

Этичный хакинг: как взламывать системы и при этом зарабатывать легально

10 min

47K

Skillfactory corporate blogWeb services testing*IT systems testing*Information Security*

Кто такой хакер? Большинство людей, которые далеки от программирования, представляют перед собой злостного преступника, взламывающего системы безопасности банков, чтобы украсть деньги. Что-то вроде героя Хью Джекмана из фильма «Пароль — “Рыба-меч”», который взламывает шифр Вернама, чтобы украсть из правительственного фонда 9,5 млрд. долларов. Здесь сосредоточимся на правовой стороне взлома, а если ваши представления навеяны именно фильмами, для вас мы подготовили подробный обзор профессии специалиста по кибербезопасности.

Хакером можно быть и легально. Легальных хакеров называют пентестеры, или «этичные хакеры». Вот только нужно хорошо знать, что можно делать во время тестирования системы на проникновение, а что — нельзя. Иначе можно получить вполне реальные проблемы с законом. Совсем недавно мы запустили курс «Этичный хакер», и в этой статье мы поговорим, как заниматься хакингом, зарабатывать на этом неплохие деньги и при этом не иметь проблем с законом. Поехали.

Приятного чтения!

+11

skillfactory_school Oct 28 2020 at 15:41

Необходимый инструмент для каждого дата-сайентиста

5 min

3.8K

Skillfactory corporate blogMachine learning*TensorFlow*Python*Open source*

Tutorial

Translation

Давайте посмотрим правде в глаза: обучение модели машинного обучения отнимает много времени, даже с учетом развития вычислительной техники за последние несколько лет. Даже самые тривиальные модели имеют более миллиона параметров. В масштабе крупнее у моделей бывает более миллиарда параметров — у GPT-3 их более 175 миллиардов! и обучение этих моделей занимает дни, а то и недели. Как дата-сайентисты мы хотели бы следить за метриками модели, чтобы знать, работает ли она, как мы того ожидаем. Но нет смысла сидеть рядом с компьютером, часами отслеживая показатели. Хорошо было бы получить все эти данные на телефон.

Эту задачу можно решить с помощью TensorDash — инструмента удаленного мониторинга ваших моделей машинного обучения с открытым исходным кодом, о котором и пойдет речь дальше. Под катом примеры применения TensorDash с TensorFlow, Keras, PyTorch и Fast.ai.

Приятного чтения!

+7

skillfactory_school Oct 27 2020 at 11:11

Адаптивный дизайн высоты

7 min

30K

Skillfactory corporate blogCSS*Web design*Website development*

Tutorial

Translation

Возможно, вы думаете о том, почему я выбрал такой заголовок. Адаптивный дизайн высоты, серьезно? Ну, термин адаптивный веб-дизайн часто описывается как проверка браузера на нескольких вариантах ширины области просмотра и размеров устройств. Сайт всегда тестируется горизонтально — на уменьшение ширины, но я редко вижу какие-то соображения для тестирования вертикально — на уменьшение высоты. В глубине вашего сознания возникает вопрос: нужно ли уменьшать высоту браузера? Да, и я буду убеждать вас в этом здесь. Когда мы работаем над реализацией веб-сайта, делать предположения вне зависимости от данных реального мира нехорошо. Крайне важно взять на себя ответственность за тестирование как по горизонтали, так и по вертикали.

Приятного чтения!

+14

skillfactory_school Oct 26 2020 at 19:01

Почему нам нужно больше Open Source Data Science

8 min

2.9K

Skillfactory corporate blogData Engineering*Open source*Reading room

Translation

Почти все мы пользуемся ПО с открытым исходным кодом (Open Source Software или OSS), это часть нашей жизни. Коллективное сотрудничество в создании программного обеспечения изменило мир разработки ПО и мир вообще. Но мы не видим тех же действий в области data science. В DAGsHub мы проводим много времени, думая о open source data science (OSDS) и разговаривая с дата-сайентистами. Эта статья представляет собой краткое изложение некоторых таких бесед в нашем сообществе. Цель этой статьи — сформулировать, почему открытый исходный код является важной частью разработки программного обеспечения сегодня и выдвинуть аргумент о том, что открытость источников будет важной частью data science в ближайшем будущем.

Приятного чтения!

+13

skillfactory_school Oct 23 2020 at 16:37

Как стать успешным дата-сайентистом и аналитиком данных

7 min

11K

Skillfactory corporate blogBig Data*Data Engineering*IT career

Translation

Есть много статей о навыках, необходимых, чтобы быть хорошим дата-сайентистом, или аналитиком данных, но лишь в немногих статьях пишут о навыках, необходимых для успеха — будь то исключительная оценка работы, похвала от руководства, повышение, или все вышеперечисленное. Сегодня мы представляем вам материал, автор которого хотела бы поделиться своим личным опытом работы в качестве дата-сайентиста и аналитика данных, а также тем, чему она научилась ради достижения успеха.

Приятного чтения!

+11

1 2 ...

7