Articles / Bookmarks / Profile of hmelni / Habr

@hmelni

User

Profile Publications Comments 24Bookmarks 256

glphmedia Dec 23 2018 at 19:00

Нужно просто «брать и делать»: новый подкаст о редакторских проектах и карьере в медиа

7 min

3.3K

vscextv corporate blogGTD*Content-marketing*Biography of geeksMedia management*

Это — подкаст с теми, кто пишет, редактирует, снимает фото, видео и руководит созданием контента. Сегодня мы подготовили для вас текстовую версию шестого выпуска.

Его гость — Иван Sourvillo (Sourvillo) — журналист, редактор и издатель авторской email-рассылки. Мы говорим о личных проектах Ивана, карьере и творческих инсайтах.

Roaming Dec 18 2018 at 12:22

О чем говорит YouTube

7 min

11K

Python*Artificial IntelligenceMachine learning*

Tutorial

На заре машинного обучения большинство решений выглядели очень странно, обособленно и необычно. Сегодня множество ML алгоритмов уже выстраиваются в привычный для программиста набор фреймворков и тулкитов, с которыми можно работать, не вдаваясь в детали их реализации.

К слову, я противник такого поверхностного подхода, но для своих коллег хотел бы показать, что эта отрасль движется семимильными шагами и нет ничего сложного, чтобы применять ее наработки в продакшен проектах.

Для примера я покажу, как можно помочь пользователю найти нужный видеоматериал среди сотен других в нашем сервисе документооборота.

В моем проекте пользователи создают и обмениваются сотнями различных материалов: текстом, картинками, видеороликами, статьями, документами в различных форматах.

Поиск по документам представляется достаточно просто. Но что делать с поиском по мультимедиа контенту? Для полноценного сервиса пользователя надо обязать заполнить описание, дать название видеоролику или картинке, не помешает несколько тегов. К сожалению, далеко не все хотят тратить время на подобные улучшения контента. Обычно пользователь загружает ссылку на youtube, сообщает что это новое видео и нажимает сохранить. Что же делать сервису с таким “серым” контентом. Первая идея — спросить у YouTube? Но YouTube тоже наполняют пользователи (часто это один и тот же пользователь). Часто видеоматериал может быть и не с Youtube сервиса.
Так мне пришла идея научить наш сервис “слушать” видеоролик и самостоятельно “понимать”, о чем он.

Читать дальше →

+18

toshiba_ru Dec 18 2018 at 16:01

Топ-5 сфер применения систем распознавания объектов

5 min

15K

Toshiba corporate blogThe future is hereArtificial IntelligenceMachine learning*

Попытки научить различные системы видеть и понимать мир так же, как это делает человек, начались несколько десятилетий назад, но уже сейчас эти технологии стали настолько совершенны, что активно используются во многих сферах нашей жизни. На Хабре уже есть подробные статьи о машинном зрении, нейросетях и алгоритмах распознавания, поэтому мы не будем углубляться и вновь описывать эти сложные технологии, мы расскажем о практическом использовании этих систем в реальном мире.

Alexey_mosc Dec 14 2018 at 17:59

Можно ли обучить с подкреплением агента для торговли на рынке акций? Реализация на языке R

6 min

9.5K

Machine learning*R*

Tutorial

Давайте создадим прототип агента обучения с подкреплением (RL), который овладеет навыком трейдинга.

Учитывая, что реализация прототипа работает на языке R, я призываю пользователей и программистов R приблизиться к идеям, изложенным в этом материале.

Это перевод моей англоязычной статьи: Can Reinforcement Learning Trade Stock? Implementation in R.

Хочу предупредить код-хантеров, что в этой заметке есть только код нейронной сети, адаптированной под R.

Если я не отличился хорошим русским языком, укажите на ошибки (текст готовился с подмогой автоматического переводчика).

Читать дальше →

ChePeter Dec 17 2018 at 14:00

Небольшое исследование свойств простой U-net, классической сверточной сети для сегментации

18 min

23K

Open Data Science corporate blogImage processing*Machine learning*Artificial IntelligenceEntertaining tasks

Recovery Mode

Cтатья написана по анализу и изучению материалов соревнования по поиску корабликов на море.

Попробуем понять, как и что ищет сеть и что находит. Статья эта есть просто результат любопытства и праздного интереса, ничего из нее в практике не встречается и для практических задач тут нет ничего для копипастинга. Но результат не совсем ожидаем. В интернете полно описаний работы сетей в которых красиво и с картинками авторы рассказывают, как сети детерминируют примитивы — углы, круги, усы, хвосты и т.п., потом их разыскивают для сегментирования/классификации. Многие соревнования выигрываются с помощью весов с других больших и широких сетей. Интересно понять и посмотреть как и какие примитивы строит сеть.

Читать дальше →

+29

fokus-lop Dec 13 2018 at 13:52

Зачем маркетологам учиться программированию

4 min

4.8K

Skillbox corporate blogProgramming*Studying in IT

От переводчика: публикуем для вас статью Шона Амстера, маркетолога со специализацией в цифровом маркетинге. В статье Шон объясняет, почему его коллегам было бы полезно научиться программированию — хотя бы и на базовом уровне.

Хорошему маркетологу нужно огромное количество разнообразных скиллов. Один из них, который часто недооценивают, — программирование. Все потому, что наш мир становится все более и более цифровым по своей природе.

Может быть, вы отнесетесь к этой идее с определенной долей скептицизма, это ваше право. Но я считаю, что любой из нас может научиться программировать и получить определенный профит. В статье я указываю причины, по которым маркетологу стоит изучать программирование.

Читать дальше →

+20

MaxRokatansky Dec 13 2018 at 18:41

Открытый урок «Feature Engineering на примере классического датасета Титаника»

5 min

OTUS corporate blogProgramming*Data Mining*Big Data*

И снова привет!

В декабре у нас стартует обучение очередной группы «Data scientist», поэтому открытых уроков и прочих активностей становится всё больше. Например, буквально на днях прошёл вебинар под длинным названием «Feature Engineering на примере классического датасета Титаника». Его провёл Александр Сизов — опытный разработчик, кандидат технических наук, эксперт по Machine/Deep learning и участник различных коммерческих международных проектов, связанных с искусственным интеллектом и анализом данных.

Открытый урок занял около полутора часов. В ходе вебинара преподаватель рассказал про подбор признаков, преобразование исходных данных (кодирование, масштабирование), настройку параметров, обучение модели и много чего ещё. В процессе проведения урока участникам показывалась тетрадь Jupyter Notebook. Для работы использовались открытые данные с платформы Kaggle (классический датасет про «Титаник», с которого многие начинают знакомство с Data Science). Ниже предлагаем видео и транскрипт прошедшего мероприятия, а тут можно забрать презентацию и коды в юпитеровском ноутбуке.

+14

sismetanin Dec 14 2018 at 12:51

Google News и Лев Толстой: визуализация векторных представлений слов с помощью t-SNE

6 min

11K

VK corporate blogMachine learning*Data visualization*Python*Big Data*

Каждый из нас воспринимает тексты по-своему, будь это новости в интернете, поэзия или классические романы. То же касается алгоритмов и методов машинного обучения, которые, как правило, воспринимают тексты в математической в форме, в виде многомерного векторного пространства.

Статья посвящена визуализации при помощи t-SNE рассчитанных Word2Vec многомерных векторных представлений слов. Визуализация позволит полнее понять принцип работы Word2Vec и то, как следует интерпретировать отношения между векторами слов перед дальнейшем использованием в нейросетях и других алгоритмах машинного обучения. В статье акцентируется внимание именно на визуализации, дальнейшее исследование и анализ данных не рассматриваются. В качестве источника данных мы задействуем статьи из Google News и классические произведения Л.Н. Толстого. Код будем писать на Python в Jupyter Notebook.

Читать дальше →

+26

2vlad Dec 11 2018 at 15:38

Шесть бесплатных автоматизированных платформ для изучения программирования

3 min

108K

Хекслет corporate blogStudying in ITProgramming*PHP*JavaScript*

Привет, сообщество! Мы в Хекслете составили список из пяти бесплатных автоматизированных онлайн-платформ для новичков.

На русском:

HTML Academy
«Академия» учит верстать сайты. Основной контент в формате подписки (390 рублей в месяц) и интенсивов (от 12500 рублей), но есть несколько бесплатных автоматизированных курсов по основам HTML, CSS и JavaScript.

В HTML Academy не столько задания для прокачки в программировании, сколько для знакомства с основами веб-разработки. Но это идеальный формат для тех, кто никогда не писал код и хочет попробовать. Большое количество веб-разработчиков начинало путь именно здесь.

Code Basics
Это новый бесплатный сервис от Хекслета. Его основная идея — через решение простых заданий прямо в браузере погружать новичков в основы программирования. Сейчас есть уроки по PHP, JavaScript и Python, ближайшее время появятся — новые. Платформа подойдет лучше всего для изучения основ синтаксиса, и меньше — для прокачки алгоритмов.

Обучение построено вокруг чередования небольших порций теории (3-4 абзаца) и закрепления практики в тренажере. У каждого практического задания есть решение учителя, которое можно сравнить со своим после успешного прохождения и раздел для обсуждения задания.

Читать дальше →

+43

Masha_IT Dec 11 2018 at 16:37

Зарплаты в ИИ: где больше денег и кого ищут в России

5 min

48K

Binary District corporate blogArtificial IntelligenceResearch and forecasts in IT*Machine learning*

Специалистам по искусственному интеллекту платят почти в два раза больше, чем другим профессионалам в сфере IT. Мы разобрались, на какую зарплату можно рассчитывать в разных областях ИИ в России, кого ищут «Яндекс», ABBYY и «Сбербанк», и какие курсы можно использовать для обучения в этой сфере.

Читать дальше →

+13

robofreak Dec 11 2018 at 22:40

Ноам Хомский: где искусственный интеллект пошел не туда?

36 min

56K

Translation

Комментарий переводчика: Подробное интервью с легендарным лингвистом, вышедшее 6 лет назад, но ничуть не утратившее своей актуальности. Ноам Хомский — «современный Эйнштейн», как его называют, делится своими соображениями об устройстве человеческого мышления и языка, искусственном интеллекте, состоянии современных наук. На днях ему исполнилось 90 лет, и это кажется достаточным поводом для публикации статьи. Интервью ведет молодой учёный-когнитивист Ярден Кац, он сам прекрасно разбирается в предмете, поэтому беседа очень содержательна, а вопросы столь же интересны, как и ответы.

Читать дальше →

+49

arbochkarev Dec 12 2018 at 11:07

Векторные представления товаров, или еще одно применение модели Word2Vec

6 min

14K

Ozon Tech corporate blogMachine learning*Development for e-commerce*

Каждый день полтора миллиона людей ищут на Ozon самые разные товары, и к каждому из них сервис должен подбирать похожие (если пылесос все-таки нужен помощней) или сопутствующие (если к поющему динозавру нужны батарейки). Когда видов товаров тоже много, решить задачу помогает модель Word2Vec. Разбираемся, как она работает и как создавать векторные представления для произвольных объектов.

Читать дальше →

+35

pushtaev Dec 12 2018 at 11:59

Подборка @pythonetc, ноябрь 2018

3 min

7.3K

VK corporate blogPython*Programming*

Это шестая подборка советов про Python и программирование из моего авторского канала @pythonetc.

Предыдущие подборки:

Читать дальше →

+28

RUSONYX Dec 12 2018 at 14:39

Очень простой чат-бот для Telegram для самых маленьких

3 min

36K

Rusonyx corporate blogPython*Microservices*Cloud computing*Cloud services*

Есть 100500 способов и инструментов создать простого serverless чат-бота для телеграм. А наш все-равно будет проще, хотя бы по числу кликов в интерфейсе. Сам бот будет написан на Python, а выполнятся будет на serverless движке Swifty.

Читать дальше →

+18

vlad_radziuk Dec 10 2018 at 14:42

Расширяйте кругозор, Холмс! Или зачем физикам скрипка и кулинарные навыки

10 min

12K

Reading roomStudying in ITBrainIT careerBiography of geeks

Уотсон — о Холмсе:
Его невежество было не менее поразительным, чем его эрудиция. О современной литературе, философии и политике он, по-видимому, не знал почти ничего.… Однако мое изумление достигло апогея, когда я случайно обнаружил, что он не знаком с теорией Коперника и не представляет себе, как устроена Солнечная система.… «Но не знать о Солнечной системе!» — возразил я. «Да на кой черт она мне сдалась?» — нетерпеливо перебил он. «Вы говорите, что мы вертимся вокруг Солнца. Но если бы мы вертелись вокруг Луны, это ровным счетом ничего не изменило бы ни для меня, ни для моей работы.»
Сэр Артур Конан Дойл, «Этюд в багровых тонах»

Доктор Уотсон (или, по-нашински, Ватсон) искренне удивлялся тому, как великий сыщик Шерлок Холмс не интересовался ничем, кроме своей работы. После того, как Холмс без всякого зазрения совести сообщил, что в гробу видал Коперника с его гелиоцентрической системой мира, поражённый Ватсон опустошённым опустился в кресло и в раздумьях накатал список того, в чём Холмс более-менее разбирается. Список выглядел следующим образом:

+18

kirtsar Dec 10 2018 at 15:43

Дорожная карта математических дисциплин для машинного обучения, часть 1

6 min

98K

Mathematics*Machine learning*Studying in IT

Tutorial

Вместо предисловия

Допустим, сидя вечерком в теплом кресле вам вдруг пришла в голову шальная мысль: «Хм, а почему бы мне вместо случайного подбора гиперпараметров модели не узнать, а почему оно всё работает?»

Читать дальше →

+38

MagisterLudi Dec 10 2018 at 18:22

Дуглас Энгельбарт: Усиление «коллективных IQ» общества

5 min

4.3K

проект «Энгельбарт» corporate blogReading roomProfessional literature*CrowdsourcingInterfaces*

Translation

Сложность и срочность вопросов, стоящих перед лицом человечества, растут гораздо быстрее, чем наши способности совместного их понимания и решения. Это очень опасная проблема, но есть стратегические действия, которые мы можем предпринять, коллективно.

Введем «коллективный IQ» как показатель способности сообщества решать сложные вопросы: точно их понимать, выявлять наилучшие варианты решений, оценивать ресурсы и оперативные возможности, выбирать подходящее решение, эффективно организовывать и контролировать его исполнение, быстро и точно справляться с непредвиденными затруднениями.

Я утверждаю, что стратегия «содействия эволюции» коллективного IQ наших сообществ и есть наилучшая стратегия.

Гипертекст будет иметь принципиальное значение, а SIGWeb должна быть лидером.

«Коллективный IQ» – это сборка коллективных способностей из основных способностей человека, таких как ощущение, восприятие, познание, движение и т.д.

+15

Kaspersky_Lab Dec 10 2018 at 19:01

Security Week 50: прогнозы на 2019 год

4 min

3.7K

«Лаборатория Касперского» corporate blogInformation Security*

В конце года «Лаборатория Касперского» выпускает традиционный набор отчетов, подводя итоги уходящего года и прогнозируя развитие киберугроз на следующий. Сегодня — краткая выжимка из документов, полные версии которых можно почитать по ссылкам:

Выделим основные темы: эволюция целевых атак, появление новых APT-группировок с достаточно простым (но действенным) вредоносным арсеналом; использование IoT и для таргетированных атак, и для массовых; снижение количества атак с целью майнинга криптовалют вслед за падением обменного курса. Направления развития киберугроз: сложные для обнаружения атаки на «железо» с получением максимально широкого доступа, эволюция фишинга с применением персональных данных жертв, попытки скомпрометировать систему защиты мобильных устройств.

Читать дальше →

+16

glphmedia Dec 9 2018 at 21:53

«Когда ты — главный редактор Rusbase»: новый подкаст о работе с контентом и карьере в технологических медиа

8 min

vscextv corporate blogMedia management*IT careerContent-marketing*Biography of geeks

Это — подкаст с теми, кто пишет, редактирует, снимает фото, видео и руководит созданием контента. Сегодня мы подготовили для вас текстовую версию пятого выпуска.

Его гость — Светлана Зыкова — главный редактор Rusbase — издания о технологиях и бизнесе. Мы говорим о карьере, рабочих инсайтах, «кухне» и новых проектах издания.

+11

andrey665 Dec 5 2018 at 14:16

Еще одна реализация Обработки Данных

2 min

3.6K

Angular*Django*Open source*Python*

Представьте себе инструмент, с помощью которого вы можете трансформировать любые данные в… любые данные.

Самый доступный пример — Изображения. Что если я хочу получить картинку определенного размера и поставить где-нибудь водяную марку (тоже определенного размера).

И вот один из примеров как это может выглядеть:

P.S.: Это обзорная статья, если будет интересно, дальше опишу подходы детальнее.

Читать дальше →

+14

3 4 ...

12 13