Articles / Bookmarks / Profile of ideological / Habr

@ideological

Интересуюсь природой вещей

ProfileArticlesPostsNewsComments340

kirill702b Jul 25 2023 at 15:09

Как сделать свой AnythingGPT, отвечающий на вопросы так, как вам это необходимо (Python, OpenAI Embeddings, ChatGPT API)

Medium

17 min

19K

Data Engineering*Artificial IntelligenceData Mining*Python*

Tutorial

Всем привет! Недавно я на практике применил одно интересное решение, которое давно хотел попробовать, и теперь готов рассказать, как своими руками такое можно сделать для любой другой аналогичной задачи. Речь пойдет о создании своей кастомизированной версии ChatGPT, которая отвечает на вопросы, учитывая большую базу знаний, которая по длине не ограничивается размером промта (то есть вы бы не смогли просто добавить всю информацию перед каждым вопросом к ChatGPT). Для этого будем использовать контекстные эмбеддинги от OpenAI (для действительно качественного поиска релеватных вопросов из базы знаний) и сам СhatGPT API (для оборачивания ответов в натуральный человеческие ответы). При этом, также предполагается, что ассистент может отвечать не только на прямо указанные в Q&A вопросы, но и на такие вопросы, на которые смог бы отвечать человек, который ознакомился с Q&A. Кому интересно научиться делать простых ботов, отвечающих по большой базе знаний, добро пожаловать под кат.

Под кат

+12

stml Jul 25 2023 at 07:55

Как я сделал светящийся шар, который может всякое

Medium

12 min

15K

Programming microcontrollers*DIYElectronics for beginners

DIY season

Шар с выбором цвета вращением. Почти бесполезная, но красивая игрушка. Идея, реализация, опыт разработки, ёлка и котик. Ведь все любят котиков. И ёлки.

+60

SvetBolgova Jan 21 2021 at 08:25

CRISPR для чайников, или Краткая справка по быстрому редактированию ДНК

12 min

106K

Leader-ID corporate blogThe future is hereHealthBiotechnologiesPopular science

Возможность изменять фрагменты ДНК всегда была святым Граалем биотехнологии и медицины. CRISPR позволяет делать это с невиданной ранее скоростью и эффективностью. Считайте, что биологи раньше работали на пишущей машинке, а благодаря CRISPR в одночасье пересели на MacBook. Не зря открытие этого метода в 2020 году удостоилось Нобелевской премии по химии.

Под катом — рассказ о появлении CRISPR, принципах работы и применении в настоящем и будущем. Да, вы все верно поняли, это про редактирование коров, синюю клубнику и арбузы размером со сливу с Aliexpress.

+46

RyabovA Jul 6 2023 at 10:25

Дальняя радиосвязь с LoRa на одноплатных микрокомпьютерах Repka Pi

20 min

39K

Development for Raspberry Pi*Programming microcontrollers*Development for Linux*Development of communication systems*Wireless technologies*

Tutorial

Если вы занимаетесь сбором данных на обширной территории, да еще не охваченной интернетом, возникает задача передачи данных на расстояния, исчисляемые километрами без использования WiFi и сети Ethernet.

В решении этой задачи вам помогут радиомодули, передающие данные с использованием технологии связи на большие расстояния (Long Range, LoRa). Эта технология запатентована компанией Semtech и реализована в микросхемах приемо‑передатчиков (трансиверов), таких как SX1268, SX1276, SX1278.

В зависимости от выходной мощности передатчика, типа антенны, рабочей частоты, наличия прямой видимости или препятствий для прохождения радиоволн в виде домов, леса, помех со стороны других источников радиоизлучения и других факторов дальность может составлять от сотен метров до десятков километров.

К сожалению, скорость передачи данных LoRa невелика, порядка 2400–19 200 бит/c. Однако этого достаточно, например, для систем телеметрии и удаленного контроля, систем умного дома или других подобных систем.

+21

MaxRokatansky Jul 6 2023 at 13:02

Квантовые вычисления и их математические основы

7 min

22K

OTUS corporate blogMathematics*Quantum technologies

Автор статьи: Артем Михайлов

Квантовые вычисления представляют собой новую парадигму в области информационных технологий, основанную на принципах квантовой механики. В отличие от классических вычислений, которые основаны на использовании двоичной системы счисления и логических операций над битами (единицами и нулями), квантовые вычисления оперируют с квантовыми системами и используют кубиты, которые могут находиться в состоянии суперпозиции и обладать квантовой взаимосвязью между собой — квантовой запутанностью.

honsour72 Jul 4 2023 at 22:38

Шпаргалка по SQL (postgres), которая выручает меня на собесах

Easy

8 min

234K

PostgreSQL*SQL*Database Administration*IT TerminologyInterview

From sandbox

Привет, Хабр!

Я решил посвятить свою первую статью SQL. Вопросы, рассмотренные ниже мне задавали на собеседованиях на позицию python-разработчика. Естественно отвечать правильно получалось не всегда, а если точнее то чаще не правильно, однако проведя N часов в рефлексии я составил перечень ответов, которыми пользуюсь до сих пор.

Данная информация предполагает знание основ языка запросов и я надеюсь, она окажется полезной для разработчиков, которые сейчас активно ищут работу а также, что ты прочитаешь этот текст до конца и добавишь свой вопрос к перечню (ну или поправишь неточности в существующих)

+177

178

devozerov Jun 29 2023 at 20:17

Почему Trino такой быстрый: архитектура оптимизатора SQL-запросов

12 min

38K

CedrusData corporate blogSQL*Big Data*Data Engineering*

Аналитические системы должны эффективно обрабатывать сложные пользовательские запросы к десяткам и сотням терабайт данных (пета-?). Продвинутый оптимизатор запросов является важнейшим компонентом любого big data движка. В данной статье мы рассмотрим, как устроен оптимизатор запросов в массивно-параллельном аналитическом SQL-движке Trino.

И как же он устроен?

+14

PUMOVETZ Jun 18 2023 at 20:28

Поиск объектов на изображении. Часть 1

Hard

3 min

25K

Python*Desktop environments*

Case

From sandbox

Компьютерное зрение - удивительная область, которая позволяет компьютерам видеть и понимать мир через обработку изображений и видео. Одним из наиболее популярных инструментов для работы с компьютерным зрением является библиотека OpenCV. В этой статье мы рассмотрим, как использовать OpenCV для распознавания обьектов на изображении.

Допустим мы хотим найти карты из игры Дурак онлайн. Вот такое изображение мы будем обрабатывать.

+10

SolarDozor Sep 29 2021 at 07:00

Распознавание печатей: нейронные сети против SIFT, и причем тут Госзакупки

18 min

6.8K

Солар corporate blogMachine learning*Image processing*Algorithms*Information Security*

Tutorial

Привет, Хабр! Сегодня мы расскажем, как делали в нашей группе анализа данных прототип для уже успешно работающего внутри DLP-системы Solar Dozor движка детектирования графических объектов на изображениях. Покажем это на примере одного его представителя - оттисков печатей на изображениях документов. Вспомним о противоречивых требованиях к решению задачи и очертим бизнес-метрики, определяющие успешное решение. В процессе подберем фильтр наличия печатей из арсенала компьютерного зрения и сравним подходы к детектированию объектов - популярных движках CNN, SIFT и их вариациях. А также поведаем об интересных находках в части создания датасетов. Здесь, как оказалось, немало места для творчества и экспериментов. В общем, запасайтесь попкорном.

Читать дальше →

gorodex Jun 12 2023 at 20:15

cv3 — делаем OpenCV питоничным

Easy

13 min

12K

Working with video*Python*Image processing*Machine learning*Artificial Intelligence

From sandbox

cv3 - это более питоничный интерфейс к OpenCV. Он упрощает работу с этой библиотекой, расширяет его синтаксические возможности, а также ускоряет исследования в области компьютерного зрения и выполнение задач по обработке изображений, при этом сохраняя гибкость и функциональность OpenCV.

+34

Eth_Moses May 30 2023 at 07:48

Контекст, награда, много рук. Многорукие бандиты как метод принятия решений

Medium

12 min

10K

Ozon Tech corporate blogAlgorithms*Mathematics*Machine learning*Statistics in IT

Tutorial

Всем привет! В предыдущих двух статьях мы подробно рассмотрели технические и методологические аспекты A/B-тестирования в Ozon. А сейчас время перейти к не менее интересным темам. Так как наша команда занимается не только A/B-тестами, но и в целом развитием методов принятия решений с помощью causal inference, стоит уделить внимание многоруким бандитам.

В этой статье мы рассмотрим методологию и границы применимости классических многоруких и контекстуальных бандитов, а также реализуем контекстного бандита, в основе которого будут сэмплирование Томпсона и нейронная сеть. Ну и, конечно, мы постараемся ответить на главный вопрос: могут ли многорукие бандиты заменить A/B-тесты?

+33

Top3DShop Dec 6 2018 at 19:26

Мастер-класс: вакуумное литье пластмасс в силикон

4 min

22K

Top 3D Shop corporate blog3D printers

Для тех, кто не смог посетить Top 3D Expo, рассказываем о мелкосерийном производстве пластиковых деталей методом вакуумного литья в силикон, мастер-класс по которому был организован на конференции с помощью наших друзей из «Фолипласт».

DimkoChe Sep 24 2010 at 23:21

Использование коэффициента Танимото для поиска людей с одинаковыми предпочтениями

3 min

13K

Algorithms*

From sandbox

Решая упражнения к книге «Программируем коллективный разум», я решил поделиться реализацией одного из алгоритмов упомянутого в этой книге (Глава 2 — Упражнение 1).

Исходные условия следующие: пусть мы имеем словарь с оценками критиков:

critics={'Lisa Rose': {'Superman Returns': 3.5, 'You, Me and Dupree': 2.5, 'The Night Listener': 3.0},
'Gene Seymour': {'Superman Returns': 5.0, 'The Night Listener': 3.5, 'You, Me and Dupree': 3.5}}

Чем выше оценка, тем больше нравится фильм.
Надо вычислить: насколько схожи интересы критиков для того, например, чтобы можно было на основе оценок одного рекомендовать фильмы другому?

Читать дальше →

+91

redhatrussia Mar 26 2020 at 15:30

OpenShift как корпоративная версия Kubernetes

12 min

122K

Red Hat corporate blogIT Infrastructure*Open source*Virtualization*Configuring Linux*

«В чем разница между Kubernetes и OpenShift?» – этот вопрос возникает с завидным постоянством. Хотя на самом деле это все равно что спрашивать, чем автомобиль отличается от двигателя. Если продолжить аналогию, то автомобиль – это готовый продукт, им можно пользоваться сразу же, буквально: сел и поехал. С другой стороны, чтобы двигатель вас куда-то повез, его сначала надо дополнить массой других вещей, чтобы в итоге получить все тот же автомобиль.

Поэтому Kubernetes – это такой двигатель, вокруг которого собран автомобиль (платформа) марки OpenShift, который и везет вас к цели.

Читать дальше: OpenShift как корпоративная версия Kubernetes. Часть 1

+12

jm_sub Dec 16 2020 at 13:33

Занятное мини-интервью с основными контрибьюторами PHP 8

4 min

5.1K

Skyeng corporate blogPHP*InterviewProgramming*

Несколько недель назад русскоязычное PHP-сообщество проводило стрим по случаю выхода мажорной версии языка. По ходу трансляции зрители могли задать вопрос Никите Попову и Дмитрию Стогову, — а в конце те подключились и ответили на часть из них (остальные ответы мы опубликуем письменно, просто не успели уложить почти 100 вопросов в 40 минут — следите за постами pronskiy).

Вы можете посмотреть видеоверсию интервью тут.

Часть ответов уже разлетелась по чатам в виде цитат («Я все языки не люблю, но меньше других — Rust», «Когда вcе заговорили о PHP++, я задумался о PHP+-»), а остальные яркие моменты мы решили сложить в этот пост.

Читать дальше →

+21

MaxRokatansky Nov 11 2020 at 14:59

Быстрый градиентный бустинг с CatBoost

5 min

90K

OTUS corporate blogPython*Machine learning*Programming*

Translation

Привет, хабровчане! Подготовили перевод статьи для будущих учеников базового курса Machine Learning.

В градиентном бустинге прогнозы делаются на основе ансамбля слабых обучающих алгоритмов. В отличие от случайного леса, который создает дерево решений для каждой выборки, в градиентном бустинге деревья создаются последовательно. Предыдущие деревья в модели не изменяются. Результаты предыдущего дерева используются для улучшения последующего. В этой статье мы подробнее познакомимся с библиотекой градиентного бустинга под названием CatBoost.

Источник

Читать дальше →

rfveskin Jul 11 2021 at 16:31

Модели глубоких нейронных сетей sequence-to-sequence на PyTorch (Часть 1)

24 min

22K

Python*Machine learning*

Tutorial

From sandbox

Translation

Этот туториал содержит материалы полезные для понимания работы глубоких нейронных сетей sequence-to-sequence (seq2seq) и реализации этих моделей с помощью PyTorch 1.8, torchtext 0.9 и spaCy 3.0, под Python 3.8. Материалы расположены в эволюционном порядке: от простой и неточной модели к сложной и обладающей наибольшей точностью.

NIX_Solutions Sep 18 2018 at 11:05

Создаём простую нейросеть

9 min

208K

NIX corporate blogAlgorithms*Machine learning*

Tutorial

Translation

Перевод Making a Simple Neural Network

Что мы будем делать? Мы попробуем создать простую и совсем маленькую нейронную сеть, которую мы объясним и научим что-нибудь различать. При этом не будем вдаваться в историю и математические дебри (такую информацию найти очень легко) — вместо этого постараемся объяснить задачу (не факт, что удастся) вам и самим себе рисунками и кодом.

Начнем.

+33

madrugado Jul 17 2017 at 11:03

Чудесный мир Word Embeddings: какие они бывают и зачем нужны?

19 min

146K

Open Data Science corporate blogData Mining*Python*Machine learning*Search engines*

Начать стоит от печки, то есть с постановки задачи. Откуда берется сама задача word embedding?
Лирическое отступление: К сожалению, русскоязычное сообщество еще не выработало единого термина для этого понятия, поэтому мы будем использовать англоязычный.
Сам по себе embedding — это сопоставление произвольной сущности (например, узла в графе или кусочка картинки) некоторому вектору.

Читать дальше →

+36

stalkermustang Mar 6 2023 at 05:26

Как работает ChatGPT: объясняем на простом русском эволюцию языковых моделей с T9 до чуда

Easy

30 min

504K

Open Data Science corporate blogMachine learning*Artificial IntelligenceThe future is hereNatural Language Processing*

Review

Technotext Winner 2023

В последнее время нам почти каждый день рассказывают в новостях, какие очередные вершины покорили языковые нейросетки, и почему они уже через месяц совершенно точно оставят лично вас без работы. При этом мало кто понимает — а как вообще нейросети вроде ChatGPT работают внутри? Так вот, устраивайтесь поудобнее: в этой статье мы наконец объясним всё так, чтобы понял даже шестилетний гуманитарий!

Погнали →

+344

283

1 2 ...

12 13

15 16 ...

28 29