Как стать автором
Обновить
74
0
Алексеев Сергей @Tontu

Пользователь

Отправить сообщение

Кластеризация в ML: от теоретических основ популярных алгоритмов к их реализации с нуля на Python

Уровень сложностиСложный
Время на прочтение34 мин
Количество просмотров20K

Кластеризация — это набор методов без учителя для группировки данных по определённым критериям в так называемые кластеры, что позволяет выявлять сходства и различия между объектами, а также упрощать их анализ и визуализацию. Из-за частичного сходства в постановке задач с классификацией кластеризацию ещё называют unsupervised classification.

В данной статье описан не только принцип работы популярных алгоритмов кластеризации от простых к более продвинутым, но а также представлены их упрощённые реализации с нуля на Python, отражающие основную идею. Помимо этого, в конце каждого раздела указаны дополнительные источники для более глубокого ознакомления.

Читать далее
Всего голосов 36: ↑36 и ↓0+36
Комментарии3

Персонифицированные чат боты. Краткое руководство разработчика

Время на прочтение9 мин
Количество просмотров6.3K

В этой статье мы поговорим о ранжирующих (retrieval) моделях диалоговых систем, и методах их персонификации.

Данный текст не является подробной и всеобъемлющей, пошаговой инструкцией по созданию диалогового агента и не претендует на большую научную ценность. Эта статья, скорее, представляет собой краткий обзор существующих методов и инструментов, применяющихся в наши дни и единственная ее задача - заинтересовать читателя и дать начальное представление о такого рода моделях оставив большой простор для собственных экспериментов.

Краткий список всего необходимого: базовое знания Python и PyTorch (если вы являетесь адептом TensorFlow, не пугайтесь, здесь будут показаны общие приемы, которые легко реализовать в других библиотеках), желательно знание библиотеки transformers, а также полезным будет минимальный опыт написания ботов для telegram (это, совершенно, не обязательно, ведь, с ботом можно общаться и в терминале) Ну что ж если вы готовы, то мы отправляемся в наше небольшое путешествие по миру диалоговых моделей.

Читать далее
Всего голосов 10: ↑10 и ↓0+10
Комментарии0

Анализ аудиоданных (часть 1)

Время на прочтение8 мин
Количество просмотров22K

Каждый аудиосигнал содержит характеристики. Из MFCC (Мел-кепстральных коэффициентов), Spectral Centroid (Спектрального центроида) и Spectral Rolloff (Спектрального спада) я провела анализ аудиоданных и извлекла характеристики в виде среднего значения, стандартного отклонения и skew (наклон) с помощью библиотеки librosa.

Для классификации “живого” голоса (класс 1) и его отделению от синтетического/конвертированного/перезаписанного голоса (класс 2) я использовала алгоритм машинного обучения - SVM (Support Vector Machines) / машины опорных векторов. SVM работает путем сопоставления данных с многомерным пространством функций, чтобы точки данных можно было классифицировать, даже если данные не могут быть линейно разделены иным образом. Для работы я использовала математическую функцию, используемой для преобразования (известна как функция ядра) - RBF (радиальную базисную функцию).

В первой части анализа аудиоданных разберем:

Читать далее
Всего голосов 8: ↑8 и ↓0+8
Комментарии9

Спорт не поможет вам похудеть. Как антрополог Герман Понцер развенчивает мифы о сжигании калорий

Время на прочтение13 мин
Количество просмотров48K

Утром в среду Герман Понцер надевает помятый лабораторный халат и направляется в свою лабораторию в Университете Дьюка. Его студентка Кристина отдыхает на лабораторном столе, положив голову в прозрачный пластиковый колпак. Понцер приступает к проверенному временем методу повышения кровяного давления: он дает ей устный тест по математике.

«Начните с числа 1022 и вычитайте 13, пока не дойдете до нуля. Если вы сделаете ошибку, мы начнем сначала. Вы готовы?»

Студентка пробует и доходит до 997, пробует снова и доходит уже до 889. Это происходит снова и снова. Затем Понцер просит её вслух умножить 505 на 117. К этому моменту она сжимает пальцы ног в носках.

Еще два помощника следят за частотой её сердцебиения и количеством углекислого газа (CO2), который она выдыхает в вытяжку. Затем Понцер задает ряд вопросов, призванных повысить уровень стресса студентки: Какова работа её мечты, и что именно она собирается делать после окончания университета?

Таким образом, Понцер и его студенты измеряют, сколько энергии затрачивают люди, когда испытывают стресс, занимаются спортом или вырабатывают иммунный ответ на вакцину, среди прочих состояний. Измеряя содержание CO2 в дыхании Кристины, он выясняет, сколько энергии она сожгла, пока справлялась с математической тревогой.

Миссия Понцера — понять, как человеку, единственному среди человекообразных обезьян, хватает энергии на всё, что у нас есть: большой мозг, продолжительное детство, много детей и относительно долгая жизнь.

Энергетический бюджет, необходимый для поддержания всего этого, включает в себя компромиссы между энергией, затрачиваемой на физические упражнения, размножение, стресс, болезни и жизненно важные функции.

Пытаясь разгадать эти компромиссы, с помощью метода, разработанного физиологами, изучающими ожирение, Понцер и его коллеги систематически измеряют общее количество энергии, потребляемой в день животными и людьми в различных сферах жизни.

Приятного чтения!
Всего голосов 73: ↑59 и ↓14+65
Комментарии236

Создание и опыт использования клавиатуры Dactyl LightCycle

Время на прочтение6 мин
Количество просмотров15K

Если вы работаете за клавиатурой целыми днями, скорее всего, вам знакома ноющая боль в запястьях, которая постепенно перерастает в адские муки. Всему виной примитивная, неэргономичная форма клавиатуры, которая вынуждает вас держать кисти в неестественном и неудобном положении. Это не только негативно сказывается на физическом состоянии, но и существенно влияет на скорость набора текста.

На самом деле решение проблемы лежит на поверхности. Но производители клавиатур, к сожалению, не хотят уделять должного внимания эргономике.

Клавиатур «правильного» форм-фактора крайне мало. Есть хороший вариант Kinesis Advantage, но это редкость даже за рубежом, а в России их раздобыть практически невозможно. Поэтому я решил взять производство в свои руки. И вот что из этого получилось.

Читать далее
Всего голосов 49: ↑48 и ↓1+58
Комментарии44

Тайная жизнь лазерных граверов

Время на прочтение13 мин
Количество просмотров34K

Хоть мы и не видим их на каждом углу, результаты их труда окружают нас повсеместно. Качество и скорость работы, обеспечиваемые лазерными станками, на многих производствах остаются недостижимыми для традиционных методов обработки. Лазерные маркёры, гравёры, аппараты сварки и резки металлов и т.д. Список действительно огромен и лазеры продолжают захватывать мир.


Но, Петька, есть нюанс(с). Как и все наукоёмкие истории, лазерная техника уже достаточно успела обрасти слухами и мифами о своих безграничных возможностях. Возможностей там действительно вагон (или два), но физику никто не отменял.


Вооружившись острым желанием узнать, как это всё работает, было принято решение направиться за комментариями в питерский офис компании "Лазерный Центр". Они занимаются разработкой лазерных граверов и маркёров уже 15 лет и, вероятно, что-то в них понимают.



Много фотографий под катом.

Читать дальше →
Всего голосов 49: ↑48 и ↓1+47
Комментарии69

Информация

В рейтинге
Не участвует
Откуда
Балашов, Саратовская обл., Россия
Дата рождения
Зарегистрирован
Активность