Как стать автором
Обновить
3
0
Александр @Spree

Преподаватель

Отправить сообщение

Категориальные признаки

Время на прочтение8 мин
Количество просмотров59K

Не одним One-Hot единым...

В данной статье разберемся с кодированием категориальных данных. В профессиональной среде нередко о существовании чего-то кроме OH или Label Encoder не догадываются не только рядовые Junior DS, но и даже Middle, а иногда и Senior. Исправить данную несправедливость и призвана данная статья.

Читать далее
Всего голосов 4: ↑3 и ↓1+2
Комментарии0

Использование ИИ и векторного поиска в Azure Cosmos DB для MongoDB vCore

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров352

Недавно Microsoft объявила о внедрении функциональности векторного поиска в Azure Cosmos DB для MongoDB vCore. Эта функция расширяет возможности Cosmos DB, позволяя разработчикам выполнять сложные поиски по сходству в многомерных данных, что особенно полезно в приложениях на основе RAG , системах рекомендаций, поиске изображений и документов и т. д.

В этой статье я рассмотрю детали этой новой функциональности, варианты ее использования и предоставим пример реализации с использованием Python .

Что такое векторный магазин?

Векторные хранилища (или векторные базы данных ) предназначены для хранения и управления векторными вложениями . Эти вложения являются математическими представлениями данных в многомерном пространстве. Каждое измерение соответствует свойству данных, и для представления сложных данных могут использоваться десятки тысяч измерений. Например, слова, фразы, целые документы, изображения, аудио и другие типы данных могут быть векторизованы. Проще говоря, векторные вложения — это список чисел, которые могут представлять внутри многомерного пространства любые сложные данные.

Пример

Pen: [0.6715,0.5562,0.3566,0.9787]

Теперь мы можем представить ручку внутри многомерного пространства, а затем использовать алгоритмы векторного поиска для выполнения поиска по сходству и извлечения наиболее совпадающих элементов.

Как работает векторный индекс?

В векторном хранилище алгоритмы векторного поиска используются для индексации и запроса вложений. Векторная индексация — это метод, используемый в машинном обучении и анализе данных для эффективного поиска и извлечения информации из больших наборов данных. Некоторые известные алгоритмы включают:

Читать далее
Всего голосов 2: ↑1 и ↓1+2
Комментарии0

Telegram bot, взаимодействующий с API OpenAI без проксирования. Разработка на Python

Уровень сложностиСложный
Время на прочтение7 мин
Количество просмотров8.1K

Создадим бота, использующего API OpenAI. И так развернем его на сервере, чтобы не настраивать проксирование запросов к API OpenAI (который заблокирован для пользователей из России), и не использовать иностранные VPS.

Читать далее
Всего голосов 21: ↑14 и ↓7+9
Комментарии14

Логистическая регрессия на Python

Время на прочтение10 мин
Количество просмотров38K


Логистическая регрессия — это алгоритм классификации в машинном обучении для прогнозирования вероятности категориально зависимой переменной. В логистической регрессии зависимые переменные — это двоичные (бинарные) переменные, содержащие 1 (да, успех, и так далее) или 0 — нет, неудача, и так далее. Другими словами, логистическая регрессия прогнозирует P(Y=1) как функцию от X. Подробный и ясный пример — к старту нашего флагманского курса по Data Science.

Читать дальше →
Всего голосов 6: ↑4 и ↓2+2
Комментарии0

Использование диаграммы классов UML при проектировании и документировании программного обеспечения

Время на прочтение19 мин
Количество просмотров174K

В этой статье я постарался подробно рассказать о том, как использовать диаграмму классов UML на практике. В качестве основного примера был взять мой проект "Построитель графиков функций". Помимо этого статья наполнена множеством маленьких примеров, поясняющих отдельные элементы диаграммы.

Читать далее
Всего голосов 5: ↑5 и ↓0+5
Комментарии4

Реализация паттерна MVC для PyQt

Время на прочтение6 мин
Количество просмотров35K
Всем доброго времени суток!
В статье описывается реализация паттерна проектирования MVC для приложений использующих PyQt, на примере программы сложения двух чисел. Помимо описания реализации паттерна приводится описание процесса создания приложения.

Читать дальше →
Всего голосов 24: ↑20 и ↓4+16
Комментарии16

Крадущийся тигр, затаившийся SQLAlchemy. Основы

Время на прочтение8 мин
Количество просмотров123K


Доброго дня.


Сегодня хочу рассказать про ORM SQLAlchemy. Поговорим о том, что это, про его возможности и гибкость, а также рассмотрим случаи, которые не всегда понятно описаны.


Данная ORM имеет порог вхождения выше среднего, поэтому я попытаюсь объяснить всё простым языком и с примерами. Статья будет полезна тем, кто уже работает с sqlalchemy и хочет прокачать свои навыки или только знакомится с этой библиотекой.

Читать дальше →
Всего голосов 10: ↑9 и ↓1+8
Комментарии10

Реализация взаимодействия с БД через Middleware в Telegram-ботах

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров6.8K

Когда я начинал писать своих первых ботов с использованием базы данных, их код был очень плохим: он расходовал лишние ресурсы, а также была плохая архитектура проекта. Поэтому я хочу поделиться с вами своими знаниями, чтобы вы не наступали на те грабли, на которые наступал я. В проекте бота, который будет использован в качестве примера в данной статье, я использовал такие технологии, как aiogram, SQLAlchemy, alembic и Docker. В качестве СУБД выступает PostgreSQL. Приятного чтения!

Читать далее
Всего голосов 8: ↑6 и ↓2+6
Комментарии7

Разработка Desktop приложений на Python и библиотеки PySide6/PyQt6. Часть 2. Знакомство с виджетами и Qt Designer

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров16K

Мы продолжаем изучать PySide6/PyQt6 и сейчас мы с Вами познакомимся с виджетами, компоновкой и Qt Designer

Ссылка на 1 урок с установкой PySide6 и создания первого приложения.

PySide6 включают в себя довольно большое количество встроенных виджетов. Вы можете найти более подробную информацию в официальной документации PySide6.

Читать далее
Всего голосов 4: ↑4 и ↓0+4
Комментарии8

Замыкания и декораторы в Python: часть 2 — декораторы

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров8.8K

Уважаемые читатели, рад вас приветствовать в новой статье. Этот материал является продолжением предыдущей публикации, посвященной замыканиям. В данной части обзора мы углубимся в тему декораторов.

Эта статья написана в первую очередь для тех, кто только начинает свой путь в программировании или начал изучать Python. Потому здесь я не буду рассматривать декораторы классов, чтобы сделать материал более доступным для новичков. Тем не менее, для тех, кто изучит данную статью, не составит труда разобраться в декораторах классов, так как они не имеют существенных отличий от рассматриваемых здесь декораторов функций.

Читать далее
Всего голосов 10: ↑8 и ↓2+7
Комментарии4

Знакомство с FastAPI

Время на прочтение5 мин
Количество просмотров196K
Вместо предисловия

В нашей команде бытует хорошая практика фиксировать все изменения, которые отправляются в продакшен в гитхабовских релизах. Однако, не вся наша команда имеет доступ в гитхаб, а о релизах хочется знать всем. Так сложилась традиция релиз из гитхаба дублировать в рабочем чате команды в телеграме. Что хорошо, гитхаб позволяет с помощь маркдауна красиво оформить релиз с разделением на секции и ссылками на задачи, которые отправляются на выкатку. Что плохо, простым copy/paste всю эту красоту в телеграм не перенесёшь и приходится тратить время на довольно нудную работу по повторному оформлению релиза, но уже в телеграме. Ну а посколько программисты народ ленивый, я решил этот процесс автоматизировать.
 


Исходные данные:

  • Гитхаб умеет сообщать обо всём, что происходит в репозитории с помощью вебхуков
  • Вся необходимая для формирования релиза информация содержится в теле запроса, который кидает вебхук
  • Авторизация идёт через подпись запроса секретом, который проставляется в настройках вебхука

Соответственно, задача заключается в том, чтобы поднять HTTP API, который сможет принять POST запрос, проверить подпись, извлечь нужную информацию из тела запроса и передать её дальше по инстанции. Как тут не попробовать FastAPI, на который я давно глаз положил?


Кто такой FastAPI?


FastAPI — это фреймворк для создания лаконичных и довольно быстрых HTTP API-серверов со встроенными валидацией, сериализацией и асинхронностью,
что называется, из коробки. Стоит он на плечах двух других фреймворков: работой с web в FastAPI занимается Starlette, а за валидацию отвечает Pydantic.


Комбайн получился легким, неперегруженным и более, чем достаточным по функционалу.

Читать дальше →
Всего голосов 14: ↑12 и ↓2+14
Комментарии58

Платформа для исследования вовлеченности персонала

Время на прочтение8 мин
Количество просмотров2.2K

В мире, где успех компании напрямую зависит от уровня мотивации и вовлеченности ее сотрудников, ключевую роль играет регулярный мониторинг этих показателей. Вовлеченность персонала не только повышает производительность и качество работы, но и способствует снижению текучести кадров, улучшению корпоративной культуры и повышению общей удовлетворенности работой. В этом контексте онлайн-платформы для проведения опросов выступают как незаменимый инструмент для сбора обратной связи от сотрудников, позволяя HR-специалистам и управленцам получать достоверные данные о том, насколько их команды вовлечены в рабочий процесс и корпоративную жизнь.

Платформа Тестограф предлагает уникальные возможности для создания индивидуализированных опросов, тестов и голосований, которые могут быть нацелены на изучение различных аспектов вовлеченности персонала. Благодаря широкому спектру настроек, включая различные ограничения доступности опроса, рандомизацию вопросов и ответов, настройку логики переходов между вопросами, а также возможность брендирования и интеграции с другими системами через API, Тестограф обеспечивает высокую гибкость и эффективность исследований.

Эта статья будет полезна не только HR-специалистам и менеджерам по персоналу, но и всем руководителям, стремящимся улучшить вовлеченность своих сотрудников. Здесь мы поделимся примерами опросов, которые помогут выявить ключевые факторы вовлеченности, а также рассмотрим, как анализ полученных данных может стать основой для разработки стратегий по улучшению рабочей атмосферы и повышению общей эффективности работы команды.

Читать далее
Всего голосов 30: ↑14 и ↓160
Комментарии1

PyQt6 — полное руководство для новичков

Время на прочтение30 мин
Количество просмотров342K

К старту курса по разработке на Python делимся детальным руководством по работе с современным PyQt для новичков. Чтобы читать было удобнее, мы объединили несколько статей в одну:

1. Первое приложение

2. Слоты и сигналы

3. Виджеты

За подробностями приглашаем под кат.

Читать далее
Всего голосов 23: ↑22 и ↓1+26
Комментарии14

10 терминов ИИ, которые все должны знать (по версии мелкомягких)

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров15K

ИИ безусловно вокруг нас, это ключ к диджитализации мира, Microsoft собрал 10 ключевых терминов ИИ, предлагаю вашему вниманию дословный перевод и инфографику.

Читать далее
Всего голосов 19: ↑12 и ↓7+9
Комментарии1

Изучаем математическую статистику — гайд для новичков

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров32K

Я искренне считаю, что математическая статистика должна стать базовым навыком каждого маркетолога и продакта. Сейчас, к сожалению, это не так. Поэтому и написал «путеводитель» по статистике, для тех, кому тяжело подступиться к изучению данного раздела математики и, тем более, сделать его «навыком».

Все представленные ниже материалы основаны на моём опыте изучения математической статистики.

Читать далее
Всего голосов 26: ↑23 и ↓3+25
Комментарии2

Математика для Data Science и машинного обучения за 8 месяцев. Подробный план обучения

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров91K

Беспилотные автомобили, продвинутые голосовые ассистенты, рекомендательные системы – это только малая часть тех классных продуктов, которые создаются с помощью инженеров по машинному обучению и, думаю, не для кого не секрет, что за кулисами сего чуда стоит математика. Именно она играет главную роль в понимании алгоритмов машинного и глубокого обучения.

Машинное обучение держится на трёх основных столпах:

Читать далее
Всего голосов 19: ↑18 и ↓1+22
Комментарии45

15+ полезных ссылок для начинающего специалиста по Data Science

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров13K

Привет, Хабр! Меня зовут Раф. Сейчас я работаю аналитиком ценообразования в Яндекс Лавке, куда попал после стажировки в команде аналитики Яндекс Браузера. Параллельно учусь в НИУ ВШЭ и уже успел пройти курс «Специалист по Data Science» в Практикуме.

В этой статье я собрал полезные материалы, курсы и ролики, которые помогут освоить анализ данных с нуля. Статья пригодится новичкам в аналитике и Data Science.

Читать далее
Всего голосов 13: ↑12 и ↓1+13
Комментарии5

Моделирование данных: обзор

Время на прочтение5 мин
Количество просмотров100K

В работе мы с коллегами часто видим как компании сталкиваются с проблемой управления данными – когда таблиц и запросов становится сильно много и управлять всем этим очень сложно. В таких ситуациях мы рекомендуем моделировать данные. Чтобы разобраться, что это такое – я перевела статью-обзор про моделирование данных от Towards Data Science, в которой кроме основных терминов и понятий можно найти наглядный пример использования моделирования данных в ритейле. Вперед под кат!

Читать далее
Всего голосов 4: ↑3 и ↓1+3
Комментарии1

Как преодолеть Intermediate Plateau: 5 советов преподавателя

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров6.8K

Intermediate Plateau, или «плато среднего уровня» — это период замедления в обучении, когда вы хорошо освоили базу и средний уровень, но не можете перейти к продвинутому уровню, хотя продолжаете много заниматься. Такое в большей или меньшей степени случается со всеми и во всех областях, но я расскажу на примере английского языка, потому что я его изучаю и преподаю. А вы напишите в комментариях примеры из своей сферы, работы или хобби.

Читать далее
Всего голосов 5: ↑4 и ↓1+3
Комментарии20

8 фактов о бразильском ИТ и интернет-рынке от местного

Время на прочтение7 мин
Количество просмотров14K
До выхода в Бразилию с нашим продуктом, мы знали только, что эта страна — родина языка Lua, которым мы делаем свои "модные" логи.


Распределение тем на португалоязычной, преимущественно бразильской, версии Stack Overflow (изначально вместо pt. в урле даже было br.)

А потом в нашей команде появился Карлос — бывший химик, который нашел по сети большую российскую любовь, переехал Москву и прошел путь от эникейщика до менеджера по локализации конструктора сайтов. Придя к нам, он разрушил пару мифов о Бразилии и рассказал много интересного о том, как живут его знакомые в бразильских ИТ-компаниях — ведь когда-то он учился в одном из главных технических вузов своей страны.

Факт 1. У бразильских айтишников есть самобытные комиксы


Один из популярных комиксов называется “Жизнь программиста”, и по стилю похож на то, как если бы Дилберт был разработчиком.
Вот пара примеров
Всего голосов 10: ↑10 и ↓0+10
Комментарии24
1
23 ...

Информация

В рейтинге
Не участвует
Откуда
Дубна, Москва и Московская обл., Россия
Зарегистрирован
Активность