Комментарии / Профиль Verbasik / Хабр

@Verbasik

Tech Lead Ai Agents, Engineer Ai, Researcher

Подписчики

ПрофильСтатьи25ПостыНовостиКомментарии14

Kimi-K2

Verbasik 20 июл 2025 в 13:12

P.S.

Ну а насчет промпта, не обессудьте, я его придумал и итеративно улучшал, когда RL только появлялся и не очень хотел бы, что бы кто нибудь кроме меня его использовал...

-2

Kimi-K2

Verbasik 20 июл 2025 в 12:03

Как говорится, не мечите бисер перед свиньями – если человек, видя решение, всё равно отрицает его, значит, он просто не хочет понимать. А не хочет – значит, невежество сильнее разума.

Kimi-K2

Verbasik 20 июл 2025 в 11:31

Туда же, смотри результат ниже 👇

Kimi-K2

Verbasik 20 июл 2025 в 11:22

Учи prompt engineering.

P.S.
Сам промпт скрыл, личный - универсальный, созданный на основе многолетнего опыта.

SakanaAi: как CTM переосмысливает нейросети через биологию

Verbasik 19 мая 2025 в 08:27

Учту, спасибо и вам удачи!

SakanaAi: как CTM переосмысливает нейросети через биологию

Verbasik 19 мая 2025 в 07:15

Чекнул ваш ТГ, вижу вы тоже занимаетесь на стыке прикладного CS в области нейробиологии. Какова конечная цель исследований?

SakanaAi: как CTM переосмысливает нейросети через биологию

Verbasik 19 мая 2025 в 06:43

В целом занимаюсь задачей в области BCI устройств.

SakanaAi: как CTM переосмысливает нейросети через биологию

Verbasik 19 мая 2025 в 06:42

Я разбирал CTM с целью понять, насколько хорошо данная архитектура ложится под задачу: обучение на размеченных ЭЭГ данных с целью формирования модели EEG_to_Text. В данной момент это моя научная работа для маги 😅

SakanaAi: как CTM переосмысливает нейросети через биологию

Verbasik 18 мая 2025 в 16:03

CTM расширяет классические идеи памяти и спайковой динамики и вносит три ключевых отличия:
1. Внутреннее рекуррентное время, независимое от длины входной последовательности, позволяющее модели «думать» произвольное число тиков;
2. Neuron-Level Models — индивидуальные MLP-функции, которые учатся на собственной временной истории нейрона и реализуют адаптивную фильтрацию, недоступную ни LSTM, ни трансформерам;
3. Матрица синхронности используется как прямое латентное пространство, так что сама ко-активация нейронов становится признаками для вывода.

В совокупности это превращает временную корреляцию из побочного эффекта (как в SNN) в управляемый вычислительный ресурс и обеспечивает интерпретируемую глубину рассуждения — то, чего нет у существующих архитектур. Поэтому работа CTM скорее — шаг к конвергенции биологического и искусственного интеллекта, чем «ещё одна память в RNN».

Преемник BERT: ModernBERT

Verbasik 11 мар 2025 в 13:11

Знаете, когда люди говорят, что мои обзоры "просто написаны LLM", это всё равно, что сказать хирургу: "Да вы не лечите, у вас просто хороший скальпель!"

В мире, где объем научной информации удваивается каждые несколько лет, отказываться от таких инструментов — это всё равно что настаивать на счетах вместо калькулятора. Использование LLM не делает нас менее настоящим ученым, а скорее показывает, что мы умеем эффективно работать с современными технологиями. В конце концов, важен результат и его ценность, а не то, какой карандаш вы использовали для записи своих мыслей.

Native Sparse Attention: новый вид разреженного внимания от DeepSeek

Verbasik 2 мар 2025 в 10:05

Китайцы вообще молодцы, в условиях дефицита железа, они придумывают новые технологии оптимизации, что в свою очередь порождает технический прогресс. Чего только стоит Multi-Head Latent Attention (MLA).

От генерации к рассуждению: эволюция языковых моделей от GPT до RL

Verbasik 22 фев 2025 в 15:38

Нет, две недели сидел, писал. Понятное дело не без помощи ИИ, но в целом, тяжелый-кропотливый труд.

Преемник BERT: ModernBERT

Verbasik 17 фев 2025 в 09:06

Вот похожей пример на классической архитектуре БЕРТА: https://github.com/Verbasik/ML_projects/tree/main/Classification_of_text

Думаю, что modernBERT может справиться лучше.

Насколько хорошо? С архитектурной стороны в любом случае лучше... 😁

Преемник BERT: ModernBERT

Verbasik 11 фев 2025 в 06:24

https://huggingface.co/clapAI/modernBERT-large-multilingual-sentiment

В рейтинге: Не участвует

Зарегистрирован: 5 июля 2022

Активность: 5 февраля в 14:44

Ученый по данным, Разработчик приложений

Ведущий

Математика

Прикладная математика

Python

Алгоритмы и структуры данных

Объектно-ориентированное проектирование

Разработка программного обеспечения

Оптимизация кода

Visual Studio

Git

Linux

Информация

Специализация