Статьи / Закладки / Профиль ni-co / Хабр

@ni-co^{read⁠-⁠only}

Пользователь

Профиль Комментарии 789Закладки 340

evaclick 28 дек 2023 в 14:28

100 вопросов для подготовки к собесу Data Science

Средний

98 мин

52K

Python*SQL*Математика*Визуализация данных*

Доброго времени суток!

Представляю вашему вниманию чек-лист из 100 вопросов по Data Science. Вопросы покрывают 5 областей: SQL, Python, Machine Learning, статистику и собственно саму DS.

Кому это вообще может быть полезно?

+13

Andrey_Biryukov 29 июн 2023 в 16:44

Разворачиваем MPI кластер на Linux

4 мин

4.6K

Настройка Linux*Блог компании OTUS

Сейчас любое серьезное приложение, работающее в продуктивной среде требует обеспечение высокого уровня надежности функционирования. Обеспечение такой надежности требует использования ряда средств, таких как отказоустойчивые каналы связи, наличие дублирования источников питания и т. д. Но наиболее важным элементом обеспечения надежности является создание отказоустойчивой конфигурации серверов, на которых работает данное приложение.

Совершенно очевидно, что если приложение запущено на одном сервере, то в случае его отказа приложение будет недоступно до тех пор, пока не будет исправлен сбой сервера. Основная задача кластеризации это устранение данной ситуации с помощью своевременного, обнаружения аппаратных и программных сбоев и немедленно переключение на другой узел кластера – это процесс, известный как отработка отказа.

Существует много различных вариантов создания кластеров под Linux. Мы будем использовать MPI (Message Passing Interface) для обеспечения взаимодействия между узлами нашего кластера.

+10

rebuilder 9 июн 2023 в 22:17

Задача коммивояжёра — ещё немного больше, ещё немного быстрее

Средний

16 мин

7.7K

Python*Алгоритмы*

И снова здравствуйте, уважаемые читатели Хабра. Мы продолжаем наше путешествие в мир алгоритмов поиска оптимального пути.

В прошлой работе мы уже узнали, как можно найти оптимальный путь в графе в несколько сотен вершин. В данной работе хочу более подробно остановится на сути метода, а также разобрать возможность по его ускорению на графах от тысячи элементов.

+23

HIPER-POWER 26 янв 2023 в 18:05

Как будем обогревать умную дачу?

8 мин

20K

Умный домDIY или Сделай самБлог компании HIPER

Мнение

За окном январь и холодно. Но весна уже скоро, и в голову приходят мысли о том, что хочется сделать на даче. В первое дачное межсезонье я был озабочен покупкой необходимых устройств – инструментов, насосной станции и косилки. Во второе озаботился нормальным забором (у нас тогда была покосившаяся рабица). Сейчас – третье, и больше всего меня волнует, что на даче нет отопления. А я бы с удовольствием провел на ней рождественские каникулы ☹.

Важно: сегодня я пишу не о том, что сделано, а о том, что предстоит сделать. Все это – пока проекты в голове и на бумаге, и я буду весьма признателен за конструктивную критику идей.

+13

126

ivanuzzo 16 июл 2022 в 12:33

Умная консоль для WoW 3.3.5a

1 мин

5.4K

Open source*Программирование*Rust*Реверс-инжиниринг*

Начну с того, что я написал на Rust консольный клиент для WoW. В текущий момент он работает в режиме прослушки пакетов и может быть использован, как бот. В дальнейшем планируется усовершенствовать ручную отправку пакетов. Что именно на данный момент реализовано...

vldmrvslv 5 июл 2022 в 17:07

Введение в извлечение сущностей из текста и NER

3 мин

8.1K

Python*Natural Language Processing*

Туториал

Извлечение информации означает создание структурированных данных из неструктурированного текста. На практике задача может выглядеть так: нужно автоматически создать запись в календаре исходя из текста письма, как на рисунке ниже.

snakers4 6 июн 2022 в 20:35

Теперь наш синтез на 20 языках

7 мин

12K

Машинное обучение*DIY или Сделай самЗвукNatural Language Processing*Голосовые интерфейсы*

Победитель Технотекст 2022

hero_image

В нашей прошлой статье мы ускорили наши модели в 10 раз, добавили новые высококачественные голоса и управление с помощью SSML, возможность генерировать аудио с разной частотой дискретизации и много других фишек.

В этот раз мы добавили:

1 высококачественный голос на русском языке (eugeny);
Синтез на 20 языках, 174 голоса;
В список языков входят 5 языков народов СНГ: калмыцкий, русский, татарский, узбекский и украинский;
В список языков входят 5 вариаций на тему романо-германских языков: английский, индийский английский, испанский, немецкий, французский;
Также в список языков входят 10 языков народов Индии;
Новую значительно улучшенную модель для простановки ударений и буквы ё со словарем в 4 миллиона слов и точностью 100% (но естественно с рядом оговорок);
Все модели наследуют все "фишки" прошлого релиза, кроме автоматической простановки ударений для языков отличных от русского;

Пока улучшение интерфейсов мы отложили на некоторое время. Ускорить модели еще в 3+ раза мы тоже смогли, но пока с потерей качества, что не позволило нам обновить их прямо в этом релизе.

Попробовать модель как обычно можно в нашем репозитории и в колабе.

Читать дальше →

+61

Al-Kharba 11 дек 2021 в 23:13

Нейронные сети в кибербезопасности — текстовая модель с низкой задержкой, сохраняющая конфиденциальность

4 мин

3.4K

Информационная безопасность*Машинное обучение*

Для начала пару слов об обработке текстовой информации, рекуррентных сетях и методах защиты конфиденциальности пользователя.

Рекуррентные нейронные сети (Recurrent Neural Networks, RNNs) — популярные модели, используемые в обработке естественного языка (NLP). Идея RNN - в последовательном использовании информации. В классических нейронных сетях имеется ввиду, что все входы и выходы автономны. Но для предсказания следующего слова необходимо иметь представление о предыдущем - для этого отлично подходят RNNs, которые выполняют одинаковые задачи для каждого элемента последовательности (или грубо говоря сети с "памятью", которая учитывает прошлую информацию).

+23

NewTechAudit 25 авг 2021 в 09:29

Построение тепловой карты именованных сущностей

3 мин

1.6K

Python*

Именованные сущности – это слово или сочетание, обозначающее объект либо явление определенной категории. Говоря о таких объектах в контексте анализа данных, чаще всего имеют в виду ограниченный набор видов: имя (псевдоним), дата, должность (роль), адрес, денежная сумма, название организации и др.

Расположение данных объектов в строгой структуре документа формирует отдельное признаковое пространство визуальной стороны страницы и может повысить качество классификации (или кластеризации). Предлагаем разобраться, как можно получить и использовать координаты именованных сущностей в документе.

Возьмем бланк одностраничного согласия на обработку персональных данных

steanlab 23 июл 2021 в 14:58

Ядовитые декоративные растения в саду и огороде. Справочник

16 мин

44K

Туториал

Внимательный читатель уже успел поискать цикуту на близлежащих водоемах и прикинуть опасность, которой подвергался, покупая с рук весной черемшу. Теперь пришло время заглянуть в собственный огород и палисадник. Ибо пока мы за своими компьютерами с ужасом думаем "как страшно жить из-за этих ядовитых растений", на даче бабушка тихо себе выращивает «цветочки», токсинам которых могут позавидовать многие дикорастущие позиции из справочника «Ядовитые растения ~~и животные~~ СССР»… Так что, продолжаем идентификацию фитотоксинов с Telegram-лабораторией LAB-66 и читаем под катом про садово-огородные «декоративные» яды.

Прошерстить палисадник!

+32

ritchie_kyoto 19 июл 2021 в 16:35

Алгоритмы сортировки NumPy (и танцы, и мемы)

5 мин

6.4K

Python*Алгоритмы*

Вместо предисловия:

Да, наверное, нет более избитой темы, чем алгоритмы сортировки. Однако, меня в свое время так увлек процесс разбора того, какие алгоритмы задействованы в NumPy, что захотелось всем об этом рассказать. Возможно, слишком мелкая вещь, возможно, занудство какое-то, но тешу себя надеждой, что материал может быть полезным для тех, кто тему только начал! Особенно для таких же людей, как я, перешедших из смежных сфер (из телекома, например), где алгоритмы и структуры данных могут попросту не изучаться (бывает и такое). Если где-то что-то напутал (или наоборот материал оказался для вас полезным), буду рад обратной связи!

ultramarie 16 июл 2021 в 15:08

Портативные вычисления: самые известные советские калькуляторы

6 мин

30K

Блог компании SelectelГаджетыИстория ITСтарое железо

Привет, Хабр! Недавно вспомнила, что мое знакомство с электронно-вычислительными приборами началось с момента, когда я пришла к маме на работу. Она была инженером в одном из НИИ, и у нее был очень классный рабочий стол. Там было много всяких штук, но одна мне запомнилась больше всего — это был калькулятор.

То есть это сейчас я знаю, что это был калькулятор, но тогда я не знала ничего о вычислительных приборах. Но он, этот прибор, меня поразил. Во-первых, калькулятор казался огромным. Во-вторых, у него было множество кнопок. В-третьих, на передней панели светились циферки, и они реагировали на нажатие кнопок. Сейчас я понимаю, что это была одна из моделей серии «Электроника». Потом появились и другие интересные калькуляторы. Обо всем этом и поговорим под катом.

Читать дальше →

+75

skillfactory_school 6 ноя 2020 в 15:30

Отец искусственного интеллекта Джефф Хинтон: «Глубокое обучение сможет делать всё»

5 мин

8.7K

Блог компании SkillfactoryМашинное обучение*История ITИскусственный интеллектИнтервью

Перевод

В преддверии старта нового потока курса «Machine Learning Pro + Deep Learning», делимся с вами переводом интервью MIT Technology Review с профессором Джеффри Хинтоном, который в 2012 году со своими студентами победил на ImageNet, применив глубокое обучение и добившись таким образом невероятного отрыва от соперников. В своё время его взгляды были противоположны взглядам большинства. Теперь всё иначе. Что профессор думает о развитии искусственного интеллекта, о различных подходах к нему? Об этом под катом.

Приятного чтения!

+17

honyaki 29 июн 2021 в 18:18

Наглядно о том, как работает свёрточная нейронная сеть

6 мин

40K

Обработка изображений*Блог компании SkillfactoryЧитальный залНаучно-популярноеИскусственный интеллект

Перевод

К старту курса о машинном и глубоком обучении мы решили поделиться переводом статьи с наглядным объяснением того, как работают CNN — сети, основанные на принципах работы визуальной коры человеческого мозга. Ненавязчиво, как бы между строк, автор наталкивает на размышления о причинах эффективности CNN и на простых примерах разъясняет происходящие внутри этих нейронных сетей преобразования.

+11

stranger777 23 июн 2021 в 16:16

Наглядно о том, как работает NumPy

8 мин

30K

Python*Программирование*Математика*Блог компании Skillfactory

Туториал

Перевод

Есть тексты, похожие на вино или динамит: с годами они не стареют, а напротив приобретают вес и значимость. Сегодня, к старту флагманского курса о Data Science, мы решили поделиться переводом визуального учебного руководства о NumPy 2019 года, прочитав которое даже не слишком близкий к математике человек поймёт, как работает эта библиотека Python. Если вы не хотите долго объяснять NumPy, но делать это всё равно приходится, положите статью в закладки и она сэкономит ваше время.

+18

Bright_Translate 20 июн 2021 в 13:04

Мы стоим на пороге кризиса «Фальшивой науки»

9 мин

54K

Блог компании RUVDS.comКонтент и копирайтинг*Читальный залНаучно-популярное

Перевод

Журналы все чаще отзывают научные статьи, потому что оказывается, что написаны они не теми, кем заявлено. Необходимо выработать более эффективные способы решения проблемы, в противном случае мы рискуем полностью утерять общественное доверие к науке.

Читать дальше →

+70

372

sahsAGU 20 мая 2021 в 12:36

Языковой сервер Pylance вышел в релиз

4 мин

14K

Python*Программирование*.NET*Блог компании MicrosoftVisual Studio*

Мы рады объявить, что Pylance, наша быстрая и многофункциональная языковая поддержка Python в Visual Studio Code, официально вышла из предварительной версии и достигла своего первого стабильного выпуска.

Ранее на этой неделе мы объявили, что, начиная с майского выпуска расширения Python, Pylance теперь также является сервером языка Python по умолчанию в Visual Studio Code. Pylance также теперь включен в пакет расширения ядра Python в качестве дополнительной зависимости, что означает, что мы автоматически установим его для вас, но у вас есть возможность использовать другой языковой сервер по вашему выбору.

MaxRokatansky 20 мая 2021 в 18:40

Топ 6 библиотек Python для визуализации: какую и когда лучше использовать?

13 мин

62K

Python*Машинное обучение*Блог компании OTUS

Перевод

Если вы только собираетесь начать работу с визуализацией в Python, количество библиотек и решений вас определенно поразит:

- Matplotlib

- Seaborn

- Plotly

- Bokeh

- Altair

- Folium

Но какую из этих библиотек лучше выбрать для визуализации DataFrame? Некоторые библиотеки имеют больше преимуществ для использования в некоторых конкретных случаях. В этой статье приведены плюсы и минусы каждой из них. Прочитав эту статью, вы будете разбираться в функционале каждой библиотеки и будете способны подбирать для ваших потребностей оптимальную.

+19

MaxRokatansky 18 мая 2021 в 18:39

Почему машинному обучению с трудом дается причинно-следственная связь?

10 мин

6.8K

Машинное обучение*Блог компании OTUS

Перевод

Эта статья является частью наших обзоров исследовательских работ в области ИИ, серии публикаций, в которых исследуются последние открытия в области искусственного интеллекта.

Просматривая следующую короткую видеопоследовательность, вы естественным образом можете сделать выводы о причинно-следственных связях между различными элементами в ней. Например, вы можете наблюдать, как бита и рука бейсболиста движутся в унисон, и вы знаете, что именно рука игрока вызывает движение биты, а не наоборот. Вам также не нужно объяснять, что это бита вызывает резкое изменение траектории мяча.

Точно так же вы можете представить альтернативные сценарии, например, что произошло бы, если бы мяч пролетел немного выше и не попал в биту.

DunRoam 15 мая 2021 в 16:34

Матрица-Перематрица

10 мин

8.1K

Python*Математика*Машинное обучение*

Из песочницы

Работа нейронной сети основана на манипуляциях с матрицами. Для обучения используются разнообразные методы, многие из которых выросли из метода градиентного спуска, где необходимо умение обращаться с матрицами, вычислять градиенты (производные по матрицам). Если заглянуть “под капот” нейронной сети, можно увидеть цепочки из матриц, выглядящие зачастую устрашающе. Проще говоря, “нас всех подстерегает матрица”. Пора познакомиться поближе.

Для этого сделаем следующие шаги:

рассмотрим манипуляции с матрицами : транспонирование, умножение, градиент;

построим игрушечную нейронную сеть;

познакомимся с методом обратного распространения ошибки с использованием метода градиентного спуска.

Все шаги сопровождаются примерами кода с использованием только NumPy . Вычисления, не выходящие, впрочем, за рамки элементарной математики, приведены подробно. За индексами придется внимательно следить, но не отчаивайтесь, просто представьте, что каждый индекс - винтик, который надо закрутить, следуя простым правилам, но не пропустить. Если вдруг не разберетесь, ничего страшного - одно из двух: либо сбой в матрице, либо одно из двух.

Red pill

2 3 ...

16 17