Articles / Profile of ovsale / Habr

Александр @ovsale

Пользователь

ProfileArticles6PostsNewsComments225

ovsale Jun 5 at 09:01

Сверхспособность LLM в понимании документа, сконвертированного в текст с ошибками — или почему наш RAG работает

Easy

3 min

3.9K

Artificial IntelligenceNatural Language Processing *

Case

Недавно я столкнулся с интересным поведением языковой модели, которое меня по-настоящему удивило, и хочу поделиться этим наблюдением с сообществом.

ovsale Jan 12 2024 at 09:13

CodebaseGPT = ChatGPT для целого программного проекта

Easy

10 min

8.1K

Open source * Python * Artificial IntelligenceNatural Language Processing *

Tutorial

CodebaseGPT — это приложение, которое позволяет разработчикам "общаться" с полной кодовой базой программного проекта.

Главная особенность CodebaseGPT заключается в том, что он создает краткие описания каждого файла проекта и предоставляет эти описания LLM в первом системном промпте. Таким образом, модель имеет обобщенную информацию обо всем проекте в своем контексте на каждом этапе общения с пользователем.

ovsale Oct 13 2023 at 11:37

Классификация комментариев к Youtube видео с помощью GPT моделей. Точность и ее цена

Easy

7 min

2.9K

Natural Language Processing * Artificial IntelligenceNode.JS *

Tutorial

Добрый день
В этой статье я бы хотел поделиться моим опытом классификации комментариев к Youtube видео при помощи OpenAI моделей gpt-3.5 и gpt-4.

Насколько они это могут?

ovsale Aug 1 2023 at 07:41

25000 лучших фильмов, или еще один сервис для кино поиска

Easy

3 min

6.3K

Website development * Interfaces * Artificial Intelligence

Case

В прошлой статье я описывал, как безуспешно пытался применить алгоритмы коллаборативной фильтрации для практически ценной рекомендации фильмов. Однако в процессе экспериментов обнаружилось, что простое усреднение оценок фильма пользователями сервиса (рейтинг IMDB, Кинопоиска и т.д.) является очень неплохим предсказателем оценки фильма новым зрителем, что было продемонстрировано математически. Это, в частности, объясняет, почему все знают рейтинг Кинопоиска, а о рекомендациях Кинопоиска никто не слышал, хотя такой сервис у них есть.

Любите кино? Добро пожаловать!

+10

ovsale Jul 28 2023 at 11:29

Коллаборативная фильтрация vs Рейтинг фильма на Кинопоиске. Мой опыт написания кино рекомендательной системы

Medium

6 min

2.3K

Big Data * Artificial Intelligence

Tutorial

Некоторое время назад я решил написать рекомендательную систему для фильмов. Подобные системы умеют предсказывать оценку фильма, который пользователь еще не смотрел, на основании его оценок других, ранее просмотренных фильмов.

И результаты меня удивили

ovsale Apr 24 2023 at 12:36

GPT агент для запросов к большим структурированным документам с «пошаговым сохранением информации»

Easy

3 min

5.1K

Machine learning * Artificial IntelligenceNatural Language Processing *

Opinion

Хотел бы продемонстрировать сообществу экспериментальный подход к решению проблемы ограниченного размера контекста в GPT-4. Модель GPT-4 имеет ограничение в 8 тысяч токенов (32 тысячи токенов пока еще недоступны?), что эквивалентно примерно 32 Кбайт английского текста (128 Кбайт для 32 тысяч токенов). Это ограничение подразумевает, что суммарный размер вашего запроса и ответа модели должен быть в пределах этих ограничений. В результате модель не может отвечать на вопросы о больших документах (или обширных программных проектах), так как они не умещаются в контексте модели.