Статьи / Закладки / Профиль Volkov_Timm / Хабр

Как стать автором

@Volkov_Timm^{read⁠-⁠only}

Пользователь

ПрофильЗакладки107

Kisel_n 6 июн 2024 в 15:12

Celery: разбираемся с Celery Beat

Простой

10 мин

15K

Туториал

Это продолжение цикла статей про Celery. Первая часть тут.
Сегодня мы более глубоко разберем работу с Celery. Узнаем как работает Celery Beat внутри, научимся настраивать и создавать периодические задачи. И конечно же коснемся практических вопросов.

Роль Celery Beat проста: это планировщик и он запускает задачи с установленными интервалами. Эти задачи затем выполняются доступными рабочими узлами.
Для начала нам нужно разобраться с основными компонентами и названиями, которые будут использоваться в дальнейшем.

Читать далее

+10

troitskii 7 июн 2024 в 07:03

Что такое векторизация текста в NLP и какая она бывает: One-hot encoding, Bag of words, TF-IDF, Word2Vec, BERT и другие

Средний

7 мин

8.7K

Big Data * Искусственный интеллектPython *

Обзор

Привет, Хабр! Меня зовут Александр Троицкий, я автор канала AI для чайников, и в этой статье я расскажу про разные способы векторизации текстов.

Всем привет! Вдохновившись прикольной и понятной статьей на английском языке, и не найдя сходу чего-то похожего в русскоязычном сегменте интернета, решил написать о том, как обрабатывается текст перед тем, как на нем начинают применять разные модели ИИ. Эту статью я напишу нетехническим языком, потому что сам не технарь и не математик. Надеюсь, что она поможет узнать о NLP тем, кто не сталкивается с AI в продуктах на ежедневной основе.

О чем эта статья:

Читать далее

+2

yakvenalex 7 июн 2024 в 09:00

Новый Selenium Python: стелс-режим, профиль, скрытая автоматизация

Средний

7 мин

17K

Туториал

Привет всем! У меня отличные новости: работа с Selenium стала еще проще. Больше никаких танцев с вебдрайверами — теперь всё работает "из коробки"!

В честь этих изменений я хочу поделиться своим опытом работы с этой замечательной библиотекой.

Читать далее

+8

R0n1n_i 7 июн 2024 в 09:13

aiogram bot для вуза и куча всего остального

Средний

9 мин

6.1K

Кейс

Краткий обзор изнутри нашего технологичного помощника в студенческих тяжбах. Проект для студентов, в котором мы помогаем им получать расписание ,отправлять жалобы и еще много всего. А также показано как это все реализовано с любимой асинхронностью, а точнее aiogram, aiohttp, asyncpg .

Читать далее

+3

makrushin 7 июн 2024 в 11:59

Обзор перспективных security-исследований

7 мин

1.6K

Блог компании МТСИнформационная безопасность *

Всем привет! Меня зовут Денис Макрушин, я отвечаю за создание технологий кибербезопасности в MTC RED и возглавляю команду перспективных исследований МТС RED ART (Advanced Research Team).

Сегодня проведу разбор самых интересных исследований первого квартала 2024. Под катом — новые методы поиска уязвимостей и секретов в исходном коде, инструменты и принципы построения безопасной разработки и многое другое.

Читать далее

+8

Back6pace 8 июн 2024 в 07:30

Gcov/Lcov — покрытие кода и отчет по нему

Средний

3 мин

9.1K

C * HTML * Визуализация данных *

Из песочницы

Рассказываю о том, как сделать отчет о покрытии кода

Gcov — свободно распространяемая утилита для исследования покрытия кода. Gcov генерирует точное количество исполнений для каждого оператора в программе и позволяет добавить аннотации к исходному коду. Gcov поставляется как стандартная утилита в составе пакета GCC.

Lcov — графический интерфейс для gcov. Он собирает файлы gcov для нескольких файлов с исходниками и создает комплект HTML-страниц с кодом и сведениями о покрытии. Также генерируются страницы для упрощения навигации. Lcov поддерживает покрытие строк, функций, ветвлений.^[6]

Читать далее

+6

nikks 8 июн 2024 в 08:30

Как мы сломали языковой барьер с помощью одной модели?

8 мин

8.3K

Python * Машинное обучение * Natural Language Processing *

Из песочницы

В этой статье я расскажу о реализации моего бесшовного модуля мультиязычности. Технологии, способной преодолевать языковые барьеры.

Виртуальный ассистент поддерживает 109 языков, понимает на каком языке к нему обратились и генерирует ответ уже на этом языке. И все это благодаря пайплайну на основе языковой модели LaBSE (Language-agnostic BERT Sentence Embedding) и фреймворка RASA.

Читать далее

+6

troitskii 8 июн 2024 в 12:18

Простыми словами про метрики в ИИ. Классификация. Confusion matrix, Accuracy, Precision, Recall, F-score, ROC-AUC

Средний

5 мин

11K

Поисковые технологии * Big Data * Открытые данные * Поисковая оптимизация * Искусственный интеллект

Туториал

Привет, Хабр! Меня зовут Александр Троицкий, я автор канала AI для чайников, и я расскажу про метрики классификации! Само собой, в интернете очень много материала про эти метрики, но я попробую описать их максимально простым языком с простыми примерами.

Зачем вообще нужны метрики в моделях ИИ? Чаще всего их используют, чтобы сравнивать модели между собой, абстрагируясь от бизнес метрик. Если вы будете смотреть только на бизнес-метрики (например, NPS клиентов или выручка), то можете упустить из-за чего реально произошло снижение или повышение показателей вашего бизнеса. Например, вы сделали новую версию модели лучше предыдущей (метрики модели лучше), но в то же самое время пришёл экономический кризис и люди перестали покупать ваш продукт (упала выручка). Если бы в этой ситуации вы не замеряли показатели модели, то могли бы подумать, что из-за новой версии модели упала выручка, хотя упала она не из-за модели. Пример довольно простой, но хорошо описывает почему нужно разделять метрики модели и бизнеса.

Для начала надо сказать, что метрики моделей бывают двух типов в зависимости от решаемой задачи:

1. Классификации - это когда вы предсказываете к чему именно относится то или иное наблюдение. Например, перед вами картинка и вы должны понять, что на ней, а ответа может быть три: это либо собачка, либо кошечка, либо мышка.

К одному из под-методов классификации относится бинарная классификация: либо единичка, либо нолик. То есть мы предсказываем либо перед нами кошечка, либо это не кошечка.

Читать далее

+3

Adm1ngmz 31 мая 2024 в 10:40

Автоматизация поиска аккаунта в телеграм через номер. Простой поиск людей через телеграм

4 мин

22K

Информационная безопасность *

Введение

Рады снова приветствовать дорогих читателей! Продолжаем рубрику статей "ШХ" в которой мы рассматриваем методы и инструменты OSINT. В этой статье хотим рассмотреть очередной перечень инструментов которые могут значительно упростить жизнь сетевым разведчикам.

Дисклеймер: Все данные, предоставленные статье, взяты из открытых источников, не призывают к действию и являются только лишь для ознакомления, и изучения механизмов используемых технологий.

Читать далее

+3

badcasedaily1 31 мая 2024 в 10:47

Как создать волшебника в Django: многошаговые формы

Простой

7 мин

6.8K

Блог компании OTUSВеб-разработка * Python * Программирование * Django *

Обзор

Сегодня мы поговорим о магии, но не той, что преподают в Хогвартсе. Речь пойдет о создании волшебника, точнее многошагового мастера форм в Django, который позволяет пользователю шаг за шагом продвигаться к желаемому результату. Эта статья расскажет, как использовать django-formtools для реализации волшебства на вашем сайте.

А причем тут магия? Узнаете чуть позже.

Читать далее

+9

kdduha 31 мая 2024 в 12:00

Прогнозируем движение льда в Арктике с помощью фреймворка автоматически собираемых сверток

17 мин

5.5K

Блог компании SelectelOpen source * Машинное обучение * Научно-популярноеПрограммирование *

Привет! Меня зовут Андрей, я студент ИТМО. В вузе есть NSS-лаборатория, в которой создают AutoML-решения и моделируют природные процессы, например, прогнозируют концентрацию и толщину льда в Арктике. Но выводы и результаты таких исследований могут жить не только в кровавом энтерпрайзе.

В этой статье я покажу, как сделать свой первый ML-проект, используя только свертки CNN-моделей. И сделаю это на примере небольшой библиотеки, которую я написал как раз в рамках вузовской практики в лаборатории.

Читать дальше →

+32

mikhailpautov 31 мая 2024 в 16:48

Как защититься от кражи нейронной сети: устойчивые цифровые водяные знаки

Сложный

8 мин

4.7K

Блог компании AIRIИнформационная безопасность * Алгоритмы * Машинное обучение * Искусственный интеллект

Кейс

Привет, Хабр! Меня зовут Миша Паутов, я аспирант Сколтеха и научный сотрудник группы Доверенные и безопасные интеллектуальные системы Института AIRI. Совсем недавно вместе коллегами мы предложили новый метод создания цифровых водяных знаков для нейронных сетей. Такие объекты, по-другому называемые ватермарками, можно использовать для определения того, что вашу нейросеть кто-то скопировал и выдаёт за свою. Здесь я расскажу, в чем состоит идея предложенного метода, а более детально о нем можно почитать в препринте статьи, принятой на международную конференцию IJCAI.

Читать далее

+2

luffity 31 мая 2024 в 17:53

Тутор: как нажать на кнопку. Продвинутые техники работы с веб-элементами для Selenium

Простой

3 мин

5.5K

Python * Программирование * БраузерыТестирование веб-сервисов *

Туториал

Привет!)
Возникали ситуации, когда стандартных методов поиска веб-элементов не хватало для полноценной автоматизации? То кнопка не нажимается, то элемент перекрывается, то не подгружается. У всего этого есть разные причины и самые разные решения.
В этой статье как раз таки рассмотрим некоторые из таких проблем.

Читать далее

+4

Sivchenko_translate 31 мая 2024 в 20:33

Все числа равны, но некоторые равнее. Как в Python сравниваются Int и Float

17 мин

17K

Математика * C * Алгоритмы * Программирование * Python *

Перевод

Ещё одна причуда Python, исследование её подноготной и попытка понять, почему так случается.

Недавно в сети X был популярен этот твит (см. скриншот), и я обратил внимание. Это очередной сюрприз в Python, связанный с характерными для него уникальными деталями реализации.

Читать далее

+46

TheScienceVictor200 1 июн 2024 в 07:21

Нейросеть для генерации текста

Средний

4 мин

7.1K

Python * Программирование * Машинное обучение *

Из песочницы

Как я и ChatGPT писали текстовый генератор. Есть несколько изюминок

Модель нейросети больше, чем предложил чат-бот и она обучается нестандартным способом.

Читать далее

+6

maslyaev 2 июн 2024 в 11:46

Не только ORM (NoORM)

Простой

8 мин

8.2K

SQLite * SQL * PostgreSQL * Python * MySQL *

Привет, Хабр! Хочу поделиться самодельной питонской библиотекой, существенно упрощающей взаимодествие с базами данных.

«Написать свой собственный ORM» – неплохая задачка для тех, кто решил поглубже изучить некоторые языковые особенности Питона, но в данном случае задача была другая – написать не ORM, а не-ORM. Механизм, упорядочивающий и облегчающий доступ к базам данных, но который сам по себе ни в коей мере не является ORM-ом.

Читать далее

+6

efreelancer 2 июн 2024 в 14:31

Enbeddrus — обучение независящей от языка эмбеддинг-модели

Средний

11 мин

5.2K

Natural Language Processing * Искусственный интеллектМашинное обучение * Python *

Туториал

Приветствую, хабровчане!

Сегодня хочу рассказать вам историю о том, как я обучил простую и компактную независящую от языка модель-эмбеддер, которая умеет работать с техническими текстами о PHP и способна извлекать схожие эмбеддинги для параллельных текстов на английском и русском языках.

Основная причина, по которой я решил заняться этим проектом, заключается в том, что мои заметки, код и документация, накопленные за более чем десять лет практики, представляют собой солянку текстов о разных технологиях, языках программирования, пометки о настройке серверов Linux и т.д. на русском и английском языках. Поэтому мне захотелось сделать Retrieval-Augmented Generation (RAG) помогалку, которая сможет принимать запросы пользователя (меня) и эффективно находить информацию в столь разношерстой базе данных, независимо от того на каком языке я сделал запрос и на каком языке написана документация.

Для достижения этой цели необходима независимая от языка модель-эмбеддер, которая будет одинаково хорошо работать с техническими текстами на русском и английском языках.

Ещё одним важным аспектом было то, чтобы модель потребляла как можно меньше ресурсов и, если возможно, чтобы её можно было преобразовать в формат GGUF.

Читать далее

+16

GlobalSign_admin 2 июн 2024 в 18:20

Режим «инкогнито» в браузере помогает следить за пользователями

3 мин

73K

Блог компании GlobalSignGoogle ChromeБраузерыЗаконодательство в ITИнформационная безопасность *

Долгие годы ходили слухи, что режим «инкогнито» в браузерах, даже в защищённом Chrome, работает совсем не так, как задумывалось. Якобы всё равно некая информация о пользователе собирается и просачивается в этом режиме. Она доступна и для владельцев сайта, и для разработчиков браузера. На это указывали многочисленные свидетельства.

Читать дальше →

+52

gromyko21 31 мая 2024 в 06:22

Подготовка к техническому собеседованию Senior/Team Lead backend

Средний

3 мин

26K

Python * Программирование * Качество кода * SQL *

Роадмэп

Недавно появились мысли походить на собеседования чем я успешно занялся. Если конкретно - смотрел лидовскую/сеньерскую позиции на Python и Golang(но статья может пригодиться backend разработчикам в целом). Не ставлю целью статьи объять все не объятное и дать какие-то гарантии. Я лишь зафиксирую данные для себя на будущее.

Вообще ходить на собеседования неплохой навык - в моем случае удается неплохо прокачать технические скилы и узнать запросы рынка на текущий момент(ведь может случиться так, что твои навыки перестанут быть актуальными).

Сразу сделаю пометку, что некоторые навыки/ресурсы специфичны(по типу нарешивания Leetcode), но отталкиваемся от текущих реалий рынка.

Читать далее

+22

Aleron75 30 мая 2024 в 12:21

Midjourney и промпты для пиксельных артов

2 мин

5.6K

Data Engineering * Big Data * UML Design * Data Mining *

Кейс

Привет, чемпионы!

Часто ли вы обращаетесь к Midjourney или Stable Diffusion, чтобы нарисовать фантастический арт? Я да - нравится позалипать пару минут на фантастический арт. Давайте сегодня учиться генерировать подобные пикчи за пару кликов:

Посмотреть промпты

+4

3