Все потоки

Python *

Высокоуровневый язык программирования

672,39

Рейтинг

СтатьиПостыНовостиАвторыКомпании

Demir_Uzun 7 июн 2023 в 10:58

Сингулярность, в результате которой ИИ сам сделает себя умнее людей. GPT-4 играет в Minecraft и самообучается

Средний

15 мин

6.2K

Python * Машинное обучение * Data Engineering *

Обзор

Recovery Mode

Перевод

В этой статье речь пойдет об эксперименте Voyager: An Open-Ended Embodied Agent with Large Language Models, в котором группа исследователей (Guanzhi Wang, Yuqi Xie, Yunfan Jiang, Ajay Mandlekar, Chaowei Xiao, Yuke Zhu, Linxi Fan, Anima Anandkumar ) дала GPT-4 поиграть в Minecraft.

В этом видео есть объяснение на английском языке. Оригинал текста на английском языке находится здесь.

Новость не кажется чем-то громким, но есть нюанс: нейросеть сама учила себя играть. Она принимала решения, но также обучалась разным действиям вроде «срубить дерево» или «убить паука». ИИ сталкивался с проблемами и самостоятельно учился их решать, добавляя скиллы в свою библиотеку. Проще говоря, GPT-4 теперь пишет код, проверяет его и совершенствует.

Именно с такого начинается так называемая сингулярность, в результате которой ИИ сам сделает себя умнее людей. Сингулярость Майнкрафта.

Читать далее

+8

SN4KEBYTE 7 июн 2023 в 09:21

Poetry: from zero to hero

Простой

13 мин

102K

Из песочницы

Привет, Хабр! Меня зовут Тимур, я тружусь ML-инженером в одной сибирской IT-компании.

Данная статья представляет собой руководство по Poetry. Я постарался покрыть все основные сценарии использования и возможности данного инструмента: создание проекта, работа с зависимостями из различных источников, управление виртуальными окружениями, сборка и публикация.

В качестве бонусов - готовая GitLab CI джоба для сборки и публикации пакетов, а также шаблон Dockerfile для multi-stage сборки образов в проектах с использованием Poetry.

Добро пожаловать под кат!

Читать далее

+4

NewTechAudit 7 июн 2023 в 05:32

Заставляем трансформеров отвечать на вопросы

Средний

10 мин

10K

Python * Программирование * Машинное обучение * Natural Language Processing *

Кейс

Привет, Хабр!

Меня зовут Владислав Малеев, я участник профессионального сообщества NTA.

Интеллектуальные системы призваны облегчать жизнь человека, выполняя за него рутинные задачи. Одной из таких задач является поиск информации в большом количестве текста. Возможно ли и эту задачу перенести на плечи интеллектуальных систем? Этим вопросом я решил задаться.

Что ответили трансформеры

+5

drlight17 6 июн 2023 в 21:31

Парсинг, хранение и отображение логов 3-х разных агентов доставки электронной почты. MTA Log Parser

3 мин

7.7K

Системное администрирование * Python * VueJS * Flask *

Обзор

Из песочницы

Эта моя первая коротенькая статейка на Хабре в попытке сделать проект, который делал для себя в целях самообразования и применения на работе, полезным кому-то еще. Можно было бы написать больше букв, но ввиду особенностей профессиональной деятельности, времени на это мягко говоря не очень много. Кто заинтересуется, всегда может подробности почерпнуть самостоятельно на гитхабе.

Читать далее

+8

FirstJohn 6 июн 2023 в 09:00

Приложение BAI Chat на GTK4 и Python

Простой

8 мин

22K

Блог компании FirstVDSPython * Программирование * Linux *

В последнее время все большей популярностью пользуются различные чаты на основе ChatGPT. Они доступны не только в формате веб-версий или telegram-ботов, но и в виде отдельных приложений для разных платформ.

В один прекрасный день я наткнулся на новое приложение под названием Bavarder, но интерфейс показался мне не очень удобным и наглядным, и я решил создать на основе этого приложения своё.

Читать далее

+1

Txanxs 6 июн 2023 в 05:48

Оптимизация выборок в больших коллекциях MongoDB

7 мин

4.1K

Блог компании Специальный Технологический ЦентрPython * MongoDB * Big Data *

Кейс

При работе с большими коллекциями в MongoDB, размер которых превышал десятки миллионов записей, возникла необходимость формировать случайные выборки уникальных значений полей, принадлежащих документам этой коллекции.

Для такой операции, в MongoDB штатно предусмотрена функция $sample, которую можно использовать в составе pipeline при проведении агрегации данных. Однако, как показала практика, выполнение выборки полей таким образом на большой коллекции может занимать весьма ощутимое время. Чтобы сократить время выполнения таких выборок, потребовалось разработать собственный алгоритм, который на порядки увеличил скорость работы. Ниже приведен подход и вариант реализации данного алгоритма.

Читать далее

+3

Scalser 6 июн 2023 в 05:03

Разбираемся с основами автотестирования: пошаговая инструкция по созданию собственного фреймворка для проверки API

Простой

11 мин

20K

Блог компании Петрович-ТехТестирование IT-систем * Python * Тестирование веб-сервисов *

Туториал

Привет, я Алексей, QA Automation Engineer в команде «Интеграции» в Петрович-ТЕХ. Занимаюсь разработкой фреймворка автоматизированного тестирования сервисов интеграции, для REST и SOAP.

Наблюдение: когда приходишь на собеседование на должность Junior QA Automation, то обязательно просят разработать автотесты для API. Звучит логично, но не так уж и просто: когда только начинаешь свой путь в автотестировании, тебе не всегда очевидно, как должен выглядеть рабочий тестовый фреймворк, из чего он должен состоять, как правильно написать тесты, а к ним тестовые данные. «Сырые» тесты, которые описывают в книгах и разных источниках – не всегда выручают.

В этой статье расскажу о разработке типового фреймворка для тестирования API – на Python, с нуля, шаг за шагом. В итоге получим полностью готовый тестовый фреймворк – надеюсь, с его помощью вы сможете сделать тестовое задание для собеседования или просто улучшить ваш уже действующий тестовый фреймворк.

Надеюсь, статья будет интересна начинающим авто-тестировщикам и тем, кто уже разрабатывает автотесты для API.

Читать далее

+5

Amir_Aizatulin 5 июн 2023 в 22:45

Детекция и классификация заданных предметов по изображениям с разделением модели и данных

Средний

9 мин

10K

Машинное обучение * Python * Искусственный интеллект

Из песочницы

Целью данной статьи является описание моей квалификационной работы при получении профессии Data Scientist. Поскольку профессиональная деятельность до этого не была прямо связана с направлением ML, тема итоговой работы получилась несколько академической.

Как известно, для успешной работы системы детекции и классификации (СДК) с применением технологии компьютерного зрения необходим большой объем данных, в том числе разметка объектов на изображении. Такая предварительная подготовка трудоемка и длительна. До сих пор работа по разметке объектов для создания обучающей выборки проводится в ручном режиме, хотя уже применяется и определенная автоматизация. Один из возможных вариантов такой автоматизации и был рассмотрен в работе.

Читать далее

0

crazyfrogspb1 5 июн 2023 в 11:18

Все DETRы мира: denoising queries и positive anchors. Часть 2

12 мин

3.4K

Python * Big Data * Машинное обучение * Искусственный интеллект

Cезон big data

В прошлой части мы поговорили про эволюцию DETR. А это значит, что сегодня самая пора поговорить про другие варианты исполнения архитектуры и их нюансы.

Материал для ТГ-канала “Варим ML”

Читать далее

+8

skaynet4788 4 июн 2023 в 19:35

Парсинг заголовков объявлений

3 мин

5.4K

Python * Программирование *

Туториал

Доброго времени суток, уважаемое Habr-сообщество!

Я не являюсь профессионалом в сфере парсинга данных, лишь учусь этому ремеслу в свободное время и посредством производства подобного рода инструкций, хотел бы оставлять для себя же подробные объяснения, что и как работает. Этот материал будет полезен, как мне, так и тем людям, которым также интерес парсинг.

Буду благодарен любой критике, ваша обратная связь поможет мне делать дальнейший материал лучше.

Читать далее

-21

Bright_Translate 4 июн 2023 в 10:00

Сколько памяти нужно для запуска 1 миллиона конкурирующих задач?

Средний

6 мин

24K

Блог компании RUVDS.comGo * Java * Python * Rust *

Аналитика

Перевод

В этой статье я углублённо сравню потребление памяти между асинхронными и многопоточными программами популярных языков вроде Rust, Go, Java, C#, Python, Node.js и Elixir.

Недавно я проводил сравнение производительности нескольких программ, предназначенных для обработки большого количества сетевых подключений. В итоге я увидел огромную разницу в потреблении этими программами памяти, порой в 20 раз и больше. Некоторые потребляли при 10К подключений чуть более 100 МБ в то время, как другие занимали почти 3 ГБ. К сожалению, эти программы были довольно сложными и также отличались своим функционалом, поэтому было бы трудно сравнить их непосредственно и сделать какие-то осмысленные выводы. Тут то у меня и возникла идея создать специальный синтетический бенчмарк.

Читать дальше →

+48

Angelina_Kurgak 2 июн 2023 в 16:51

Применение Python для сбора и предобработки данных цифрового следа

Простой

6 мин

9.2K

Поисковая оптимизация * Big Data * Google ChromePython * Поисковые технологии *

Обзор

Из песочницы

Python для сбора и предобработки данных цифрового следа.

Про цифровой след обычно говорят лишь в общих чертах, и описание программирования для работы с ним лишь упоминают. В данной статье рассмотрен набор библиотек Python и приемов, которые можно использовать для сбора и предобработки данных цифрового следа.

Читать далее

+2

qwertyforce 2 июн 2023 в 14:39

Автоматический майнинг изображений

Средний

6 мин

5K

Поисковые технологии * Python * Обработка изображений * Машинное обучение * Искусственный интеллект

Кейс

В предыдущих статьях мы рассказали, как создать фотогалерею с собственной поисковой системой [1,2]¹. Но где нам найти изображения для нашей галереи? Нам придется вручную искать источники «хороших» изображений, а затем вручную проверять, является ли каждое изображение «хорошим». Можно ли автоматизировать обе эти задачи? Ответ — да.

Читать далее

+11

alenapoliakova 2 июн 2023 в 05:06

Решаем задачу сетевого планирования с помощью Python

Средний

5 мин

14K

Python * Алгоритмы * Математика *

Из песочницы

Приветствую, меня зовут Алёна. Недавно на математический основах информатики в университете мы проходили задачу сетевого планирования, с помощью которой можно смоделировать процесс производства изделий. Мне была интересна данная тема и я решила поделиться с вами, как решить задачу сетевого планирования с использованием языка Python.

Читать далее

+6

freeam 1 июн 2023 в 18:36

Менеджер контекста это просто

Средний

5 мин

75K

Из песочницы

В статье рассматриваются возможности контекстного менеджера языка Python, его роль в управлении ресурсами и обеспечении безопасного выполнения кода. Приводятся примеры использования контекстных менеджеров для работы с файлами, базами данных, потоками и сетевыми соединениями. Также обсуждается возможность создания собственных контекстных менеджеров и приводятся примеры простого и асинхронного контекстных менеджеров.

Читать далее

+6

Coppermine 1 июн 2023 в 17:59

Повторяй за мной или двигаем виртуальной камерой like a pro

Средний

8 мин

5.2K

CGI (графика) * Компьютерная анимация * Программирование * Python *

DVD – как много в этой аббревиатуре! Уверен, что вы наверняка помните такое явление, как ларьки и палатки с дисками, исчезнувшие только к началу 2010-х годов (по крайней мере так было в столице). В один из таких ларьков в конце 2009-го заглянул десятилетний я, внимание которого тут же привлекла коробка с надписью «3D Studio Max 2010»... Аниматором я, увы, так и не стал, однако интерес к области визуальных эффектов сохранился надолго.

В поисках обучающих материалов с англо-русским словарём наперевес в один прекрасный день я забрёл на Videocopilot. В одном из уроков автор с помощью неведомой волшебной софтины под названием Boujou показал, как отследить движение камеры в отснятом материале для его дальнейшего совмещения с трёхмерной графикой, что в подростковом мозгу произвело эффект разорвавшейся бомбы. Много позже, курсе на втором-третьем, меня всё чаще посещала навязчивая мысль – а как это вообще работает?

В данной статье мне бы хотелось рассмотреть математический аппарат, при-меняемый в данном классе задач, а также сдобрить её щепоткой практики. Приятного чтения!

Читать далее

+4

DirtyHornet 1 июн 2023 в 11:01

Как я библиотеку для Дневника МЭШ писал

Простой

3 мин

11K

Python * Проектирование API *

Обзор

Как я писал библиотеку для Дневника МЭШ? Сколько проблем было? Как долго я хранил идею? Сколько времени понадобилось? Вы все узнаете в этой статье. Я постарался уместить кратко и понятно.

Читать далее

+12

DirtyHornet 1 июн 2023 в 08:18

Как я вникал в Linux с 4 класса? Все по полочкам

Простой

3 мин

14K

Настройка Linux * *nix * Linux * Python *

Из песочницы

Давно, когда мне было 4-5 лет, бабушка разрешила пользоваться ее компьютером (стааарым, очень). Я так был рад, ведь мог теперь в него играть. Ну и началось. Вирусняки, неподдерживаемые файлы и т. д., и т. п. После, в доме появился Mac Mini 2010 года (мы с отцом хотим из него NAS сделать). Меня за него посадил папа с такой фразой: «Вот тебе Scratch, делай».

Читать далее

+19

Seleditor 31 мая 2023 в 13:33

Создаем блог на Django с опросами и тестами. Краткая инструкция. Часть 2

6 мин

16K

Блог компании SelectelDjango * Python * Веб-разработка *

Туториал

В предыдущей части мы частично разобрали шаблон для нашего блога, выбрали виртуальную машину и запустили на ней нативный веб-сервер Django. Однако он предназначен только для тестирования и запуска приложений во время разработки. Для обработки запросов в продакшене нужно настроить Nginx и WSGI Gunicorn. В этой статье показываем, как это сделать.

Читать дальше →

+45

GregTMJ 31 мая 2023 в 13:26

Битва медведей: Pandas против Polars

8 мин

16K

Блог компании SpectrИскусственный интеллектМашинное обучение * Big Data * Python *

Обзор

Привет! На связи Грегори Салиба из Spectr.

Возможно, вы прочитали название статьи и подумали, что попали на программу «В мире животных». Но нет, речь пойдет о сравнении двух гигантов аналитики данных в Python: Pandas и Polars. В этой статье мы подробно рассмотрим вопрос быстродействия этих двух решений в части работы с файлами больших объемов.

В статье мы сравним скорость обработки на примере конкретной задачи одного из проектов, разработку которого ведет наша команда.

Читать далее

+13

1 2 ...

204

205 206 ...