Articles / Profile of perfect

Roman Abramov@perfect_startup

PhD Munich, NLP

ProfileArticles4PostsNewsComments5

perfect_startup May 6 2025 at 06:13

Как я обошел современные GPT модели с помощью GPT2-small на задачах рассуждения

Easy

9 min

4.2K

Machine learning * Artificial IntelligencePopular science

Review

Не так давно я уже писал статью по такому необычному явлению, как гроккинг - отложенная генерализация. Если долго тренировать модель на наборе данных, то тестовая точность достигнет 100% и модель станет безошибочно решать задачу. Звучит круто! Но вот проблема - никто до сих пор не мог применить гроккинг на задачах из реального мира, а мы это сделали и сейчас публикуемся на крупнейшей МЛ конференции. Если интересно, как мы этого достигли, то прошу под кат.

+22

perfect_startup Nov 22 2024 at 05:00

Hippo-RAG: Долговременная память для LLM, вдохновленная нейробиологией

Medium

5 min

3.1K

Artificial IntelligenceMachine learning * Biology

Review

Ученые часто вдохновляется нашими или животными биологическими структурами: CNN, MLP, Backprop, и для многих других исследований можно найти сходства в реальном мире. Недавно вышла статья, которая делает то же самое, но для RAG (Retrieval-Augmented Generation). В некотором роде, это недостающая современным LLM долгосрочная память. Это понятно, а причем тут неокортекст, гиппокамп и другие сложные слова? Давайте посмотрим.

+10

perfect_startup Oct 13 2024 at 16:05

Сервис за выходные, или обзор AI-инструментов для создания продукта

Easy

5 min

2.6K

Product Management * Artificial IntelligenceNatural Language Processing * IT Infrastructure * HTML *

Сейчас пытаются автоматизировать с помощью ИИ вообще все: от программистов до консультантов, и врачей. Количество стартапов и сервисов для этого становится больше год к году. Насколько эти инструменты хороши и можно ли уже отказаться от продуктовой команды, заменив ее на пару сервисов за 20$ в месяц? Давайте попробуем!

perfect_startup Sep 1 2024 at 11:56

Могут ли трансформеры «думать»

Medium

21 min

4.3K

Artificial IntelligenceMachine learning * Python *

Недавние исследования показывают, что модели трансформеров способны почти безошибочно решать задачи, требующие нескольких логических шагов. Например, из утверждения А вывести Б и дойти логически до В. И что удивительно, это достигается без использования Chain-of-Thought или особых промптов — только классический GPT-2. Давайте посмотрим, как трансформеры «думают» при решении задач рассуждения, и напишем для этого код с использованием библиотеки Hugging Face.

+12