Статьи / Закладки / Профиль LazyTalent / Хабр

Дмитрий @LazyTalent

Python, DE

Профиль Статьи 1Посты Новости Комментарии 109

sgkryvenko 3 мар 2022 в 00:10

Анализ финансовых ботов, можно ли заработать?

10 мин

73K

Программирование*Машинное обучение*Алгоритмы*Финансы в IT

Разбираю разные подходы к созданию ботов и смотрю на их эффективность

Заработает ли бот достаточно денег?
Будет ли стабильный заработок?
Достигнет ли он когда-нибудь годового дохода в $100,000?

В этом посте я отвечу на эти вопросы и дам вам несколько советов, как двигаться дальше.

+10

NewTechAudit 1 мар 2022 в 13:42

Сбор данных с обходом капчи посредством PYAUTOGUI, KERAS и TENSORFLOW

5 мин

7.4K

Python*Программирование*Машинное обучение*Читальный зал

Существует большое количество методов для автоматического сбора и обработки больших объемов данных из веб-ресурсов. Однако иногда недоступно извлечение данных с помощью автоматизированного кода, выполняющего GET-запросы с последующим парсингом HTML-кода, и его преобразованием в необходимый формат, также, как и все смежные методы. В таких случаях на помощь может прийти эмулятор действия пользователя («кликер», «бот», «робот»).

RationalAnswer 25 фев 2022 в 14:01

Паника на российской бирже: почему ETF продают по искаженной цене

9 мин

50K

Финансы в IT

В мире происходят страшные события, и фондовый рынок в каком-то смысле является их отражением. В этой статье я объясняю некоторые происходящие сейчас на рынке явления — возможно, эта информация поможет вам избежать убытков от продажи активов по несправедливой цене.

+108

112

AyratGil 23 фев 2022 в 20:53

Простые модификации для улучшения табличных нейронных сетей

25 мин

3.7K

Машинное обучение*

Перевод

Simple Modifications to Improve Tabular Neural Networks

Растет интерес к архитектуре нейронных сетей для табличных данных. В последнее время появилось множество табличных моделей глубокого обучения общего назначения, вычислительная мощность которых иногда соперничает с возможностями деревьев решений с градиентным бустингом (GBDT - gradient boosted decision trees). Последние модели черпают вдохновение из различных источников, включая GBDT, машины факторизации и нейронные сети из других областей применения. Предыдущие табличные нейронные сети также используются, но, возможно, недостаточно учтены, особенно для моделей, связанных с конкретными табличными задачами. В данной статье основное внимание уделяется нескольким таким моделям и предлагаются модификации для повышения их производительности. Показано, что при модификации эти модели конкурируют с ведущими табличными моделями общего назначения, включая GBDT.

Введение

В последнее время многие архитектуры нейронных сетей были представлены в качестве табличных решений общего назначения. Некоторые примеры: Tabnet (Арик и Пфистер 2020), TabTransformer (Хуан и др. 2020), NODE (Попов, Морозов и Бабенко 2019), DNF-сеть (Абутбул и др. 2020). Внедрение этих и других моделей демонстрирует растущий интерес к применению глубокого обучения к табличным данным. Это не связано с отсутствием решений, выходящих за пределы возможностей глубокого обучения. Деревья решений с градиентным бустингом (GBDT) являются классом очень хороших моделей общего назначения и фактически часто используются табличными моделями глубокого обучения – как в качестве источника вдохновения, так и в качестве стандарта по производительности.

kazakovmaksim 23 фев 2022 в 14:52

Тычем палкой в итераторы

5 мин

11K

Python*

Из песочницы

Итераторы – мощные и очень полезные составляющие Python. Цель этой статьи в их изучении подручными инструментами. Сразу предупреждаю, что в исследовательском арсенале у меня не швейцарский нож, а палка-копалка. Как известно, она предназначена для разрыхления почвы, но для нескольких любопытных находок достаточно и этого.

+11

NewTechAudit 21 фев 2022 в 22:33

Обнаружение новизны изображений с помощью Python и библиотеки scikit-learn

3 мин

4.1K

Программирование*Обработка изображений*Визуализация данных*Читальный зал

В статье я расскажу, как с помощью библиотек scikit-learn, opencv, numpy, imutilsс выявить новизну входных изображений. Многие программы требуют наличия возможности решить, принадлежит ли новый объект тому же распределению, что и существующие объекты (это промежуточный результат), или его следует рассматривать как новизну. Часто эта возможность используется для очистки реальных наборов данных.

Pornosenok 16 фев 2022 в 21:45

Как сделать QR код с картинкой на Python

3 мин

19K

Python*

Из песочницы

Как сделать QR код с картинкой на Python

Как поместить полноценное изображение на фон QR кода с помощью Python (быстро, без регистрации и смс).

Подробнее

+17

megabax 16 фев 2022 в 19:51

Уроки компьютерного зрения на Python + OpenCV с самых азов. Часть 2

2 мин

21K

Python*Обработка изображений*

Туториал

Продолжим изучение компьютерного зрения, которое мы начали на прошлом уроке. Напомню кратко, что там было:

• Этапы обработки и анализа изображений.

• Установка OpenCV.

• Простая программа на OpenCV – отображения картинки в окне.

• Изменение размеров картинки.

• Преобразование из цветного формата в черно-белый.

Как я уже писал в первой части, для того, чтобы удалить из изображения различные шумы, применяют размытие изображение. Например, вот так:

DimaFromMai 15 фев 2022 в 16:41

Как я решил стать трейдером и проигрался, а потом отыгрался, потому, что я программист. Мой опыт

10 мин

169K

Лайфхаки для гиковФинансы в ITЧитальный зал

Технотекст 2022

Таким я себя видел в своих мечтах. Freepik

Здравствуйте дорогие хабровчане, в этом небольшом посте я хочу рассказать про свой опыт в торговле на бирже. Под катом я написал о том, как я пошёл тем же путём, что и все, и как и все (или как подавляющее большинство) проигрался, затем хорошенько задумался, напрограммировал свои инструменты и отыгрался обратно.

Предупреждение! Статья не является призывом к чему-либо, тем более к торговле на бирже. Скорее всего, будет интересна начинающим трейдерам и всем интересующимся данной темой. Постарался написать простым и доступным языком без сложных терминов и кода.

Читать дальше →

+82

230

Marat1980 15 фев 2022 в 10:12

О практической пользе transformer для торговли на бирже

24 мин

6.1K

Python*Машинное обучение*Венчурные инвестицииИскусственный интеллект

Многие datascientists, желающие использовать ML на финансовых рынках, прочитали толстые книжки об инвестировании, может даже создавали модели с учетом прочитанного. И наверняка знают как правильно оценить полученные модели с точки зрения ML. Разобраться с этим необходимо, чтобы не было мучительно больно, когда прекрасная модель на бумаге, превращается в генератор убытков при практическом использовании.

Stantin 14 фев 2022 в 08:16

Анализ стадий волейбольной игры с помощью искуственного интеллекта

2 мин

3.9K

TensorFlow*Искусственный интеллектМашинное обучение*Обработка изображений*Python*

Распознаем стадии волебольной игры на основе детектора игроков.

ferluht 13 фев 2022 в 18:43

Рисуем генеративные грибы на javascript

8 мин

18K

Ненормальное программирование*JavaScript*Работа с 3D-графикой*Графический дизайн*Криптовалюты

Туториал

Продолжаю делиться своим опытом погружения в мир генарта и nft, на этот раз при помощи генеративных грибов. Для тех кто не совсем в теме хотя бы одного из этих слов, предлагаю сначала посмотреть мою предыдущую публикацию, а в этой статье я постараюсь больше сосредоточиться не на философии того, что вообще происходит, а на технической реализации процедурной 3д графики в three js.

+85

stranger777 13 фев 2022 в 22:59

Что будет, если объединить трансформер и дерево решений

8 мин

Блог компании SkillfactoryНаучно-популярноеМашинное обучение*Программирование*Python*

Перевод

Исследователи добились значительного прогресса в скорости конвергенции, точности и интерпретируемости решений визуального трансформера. За подробностями приглашаем под кат. Материалом из блога Google Research делимся к старту флагманского курса по Data Science.

EnjiRouz 24 ноя 2020 в 11:47

Пишем голосового ассистента на Python

16 мин

181K

Python*Голосовые интерфейсы*Машинное обучение*Разработка под Windows*

Туториал

Из песочницы

Введение

Технологии в области машинного обучения за последний год развиваются с потрясающей скоростью. Всё больше компаний делятся своими наработками, тем самым открывая новые возможности для создания умных цифровых помощников.

В рамках данной статьи я хочу поделиться своим опытом реализации голосового ассистента и предложить вам несколько идей для того, чтобы сделать его ещё умнее и полезнее.

Читать дальше →

+12

Hiro_Protagonist 4 фев 2022 в 15:02

Классика фантастики и фэнтези, которая лишь недавно добралась до русскоязычного читателя

6 мин

58K

Научная фантастика

В фэнтези и фантастике есть целый пласт произведений, которые уже давно считаются классическими и хорошо известны читателям. Большая часть таких книг давно переведена на русский язык, ведь в 90-х годах в наших палестинах очень активно издавались книги популярных фантастов. Однако некоторые романы, по праву имеющие на Западе статус классических, на русском языке впервые увидели совсем недавно. Иногда из-за того, что пик их популярности пришелся на время до распада Советского Союза, когда с переводами западной фантастики все было гораздо сложнее, иногда из-за неформатности или предполагаемой сложности для читателя, иногда по финансовым причинам. Рассказываем о нескольких таких произведениях, с которыми русскоязычные читатели смогли познакомиться только в последнее время.

+111

MaximML 2 фев 2022 в 12:01

Куда поехать в пятницу вечером, если ты в Питере. Сравнение алгоритмов геокластеризации

7 мин

6.3K

Блог компании СитимобилМашинное обучение*Геоинформационные сервисы*Алгоритмы*

Всем привет, меня зовут Максим Шаланкин, в Ситимобил я занимаюсь машинным обучением. Мы постоянно принимаем решения на основе больших данных. Даже в пятницу вечером мы доверяем алгоритмам выбор места отдыха. А кто же, если не наши клиенты, лучше всего знают, где в Санкт-Петербурге можно хорошо отдохнуть?

Врууум

+26

alex_golubev13 28 янв 2022 в 10:59

Векторное представление товаров Prod2Vec: как мы улучшили матчинг и избавились от кучи эмбеддингов

5 мин

19K

Блог компании Ozon TechData Mining*Natural Language Processing*Машинное обучение*Обработка изображений*

Привет! Меня зовут Александр, я работаю в команде матчинга Ozon. Ежедневно мы имеем дело с десятками миллионов товаров, и наша задача — поиск и сопоставление одинаковых предложений (нахождение матчей) на нашей площадке, чтобы вы не видели бесконечную ленту одинаковых товаров.
На странице любого товара на Ozon есть картинки, заголовок, описание и дополнительные атрибуты. Всю эту информацию мы хотим извлекать и обрабатывать для решения разных задач. И особенно она важна для команды матчинга.
Чтобы извлекать признаки из товара, мы строим его векторные представления (эмбеддинги), используя различные текстовые модели (fastText, трансформеры) для описаний и заголовков и целый набор архитектур свёрточных сетей (ResNet, Effnet, NFNet) — для картинок. Далее эти векторы используются для генерации фичей и товарного сопоставления.
На Ozon ежедневно появляются миллионы обновлений — и считать эмбеддинги для всех моделей становится проблематично. А что, если вместо этого (где каждый вектор описывает отдельную часть товара) мы получим один вектор для всего товара сразу? Звучит неплохо, только как бы это грамотно реализовать…

Читать дальше →

+30

Marat1980 27 янв 2022 в 10:28

Нейросети (на примере трансформеров) на фондовом рынке. Коды, «граали», финансовый результат

13 мин

11K

Python*Искусственный интеллектМашинное обучение*Венчурные инвестиции

Пост в помощь тем кто интересуется практической пользой от применения нейросетей на фондовом рынке.

+12

NewTechAudit 18 янв 2022 в 08:41

Анализ тональности текста с использованием фреймворка Lightautoml

6 мин

5.4K

Программирование*Машинное обучение*Natural Language Processing*

Сентиментный анализ (анализ тональности) – это область компьютерной лингвистики, занимающаяся изучением эмоций в текстовых документах, в основе которой лежит машинное обучение.

В этой статье я покажу, как мы использовали для этих целей внутреннюю разработку компании – фреймворк LightAutoML, в котором имеется всё для решения поставленной задачи – предобученные готовые векторные представления слов FastText и готовые текстовые пресеты, в которых необходимо только указать гиперпараметры.

Задача

При возникновении трудностей в работе с автоматизированными системами внутренние клиенты оставляют обращения нейтрального или же негативного характера (положительный не учитывается по причине того, что таких обращений очень мало).

Анализ тональности текста позволит понять, что в обращении пытается донести пользователь – что-то нейтральное или негативное. Нас интересуют случаи, где напрямую описываются проблемы в автоматизированной системе и на что требуется внимание и проведение дальнейшего анализа.

OlegSivchenko 17 янв 2022 в 16:44

Киберпанк, кольщик и Q-пола. Ранняя история умных татуировок

11 мин

7.6K

ГаджетыКиберпанкНаучно-популярноеНосимая электроникаБудущее здесь

Неспокойная обстановка нашего ковидного времени (подумать только, менее одиннадцати месяцев прошло с тех пор, как я впервые вакцинировался «Спутником-V») возродила практику шуток и теорию заговоров по поводу всеобщего чипирования. А еще не так давно мы с коллегой по Хабру обсуждали технологическую наивность сюжета «Джонни-Мнемоника» – и коллега заметил, что «можно было просто флешку в виде зубного протеза ему сделать и всего делов». Такой информационный фон вновь вернул меня к идее написать статью об умных татуировках, которые могли бы использоваться в качестве как датчиков, так и информационных носителей. Это и есть самый реальный и интересный вариант массового чипирования, который я могу себе представить.

Ни одной татуировки у меня нет

+17

1 2 ...

13 14

16 17 18 19 20

Анализ финансовых ботов, можно ли заработать?

Сбор данных с обходом капчи посредством PYAUTOGUI, KERAS и TENSORFLOW

Паника на российской бирже: почему ETF продают по искаженной цене

Простые модификации для улучшения табличных нейронных сетей

Тычем палкой в итераторы

Обнаружение новизны изображений с помощью Python и библиотеки scikit-learn

Как сделать QR код с картинкой на Python

Уроки компьютерного зрения на Python + OpenCV с самых азов. Часть 2

Как я решил стать трейдером и проигрался, а потом отыгрался, потому, что я программист. Мой опыт

О практической пользе transformer для торговли на бирже

Анализ стадий волейбольной игры с помощью искуственного интеллекта

Рисуем генеративные грибы на javascript

Что будет, если объединить трансформер и дерево решений

Пишем голосового ассистента на Python

Введение

Классика фантастики и фэнтези, которая лишь недавно добралась до русскоязычного читателя

Куда поехать в пятницу вечером, если ты в Питере. Сравнение алгоритмов геокластеризации

Векторное представление товаров Prod2Vec: как мы улучшили матчинг и избавились от кучи эмбеддингов

Нейросети (на примере трансформеров) на фондовом рынке. Коды, «граали», финансовый результат

Анализ тональности текста с использованием фреймворка Lightautoml

Киберпанк, кольщик и Q-пола. Ранняя история умных татуировок

Информация

Специализация