"""способность видеть неочевидные зависимости в многомерных данных""". AUTOENCODER пометил как аномальные все точки, амплитуда которых на порядок больше амплитуд не аномальных точек. Очень оригинальное решение. Наверное подглядывал...
"""Богаче и шире, но не глубже """ - это вопрос формирования соответствующих датасетов и я уже начал синтез, для тех кто любит погорячее, пардон, погрубже. (Сарказм)
"""Представь, что нужно разложить тысячи статей по категориям без единого человека.
Звучит как магия?""". Трудно сказать как звучит, но написано не на русском языке. Уважаемый Автор! На Хабре на тему эмбеддингов опубликовано несколько десятков нормальных статей. Пожалуйста начните вторую часть с обзора, что уже опубликовано и что нового Вы расскажите миру. Иначе вторая часть, также как и первая, превратиться в шум. И еще, поясните пожалуйста, зачем в заголовке присутствует слово "машина", например, с точки зрения векторизации этого слова. Можно также предварительно подумать для какой аудитории Вы все это пишите. Ждем вторую часть.
Такое ощущение, что встретил сельского паренька, который ничего слаще морковки в жизни не пробовал. Вдруг ему дали шоколадную конфетку (Клода) и все жизненные ценности у паренька сдвинулись и жизнь дала пребольшую трещину. И что самое интересное, что паренек искренне считает, что и мы слаще морковки ничего не ели. Кто кого жалеет, парнишка нас или мы парнишку?
Правильно всё описано. Этому надо в уже школе учить. Больше всего понравилось: """И йогурт берите с нормальным сроком, а не первый попавшийся.""" - очень человеколюбивое предложение
"""В частности, документ впервые закрепляет на законодательном уровне само понятие искусственного интеллекта""". А медики молодцы - впереди всех: """Национальный стандарт РФ ГОСТ Р 72484-2025 "Системы искусственного интеллекта в здравоохранении. Термины и определения. Классификация" (утв. и введен в действие приказом Федерального агентства по техническому регулированию и метрологии от 25 декабря 2025 г. N 1812-ст)""".
"Эксперименты проводились с несколькими типами моделей:" и "Для классификации были протестированы несколько алгоритмов:" - это надо поаккуратнее раскрыть
"И главное — перплексия оказалась бесполезной для оценки рассуждений". Copilot на вопрос о перплексии отдельно выделил: """ Ограничения перплексии: Не измеряет смысл: модель может иметь низкую перплексию, но генерировать бессмысленный, хотя и статистически правдоподобный текст."""
"квантовая теория описывает не саму реальность" в вузовских учебниках этот вопрос раскрыт однозначно, почитайте о спектре водорода. Для школьников советую начать с лекций А. Семихатова
УРА!!!. Открыли (переписали) то, что раньше называлось "поиск гиперпараметров по решётке ( grid/random search) с Байесовской оптимизацией (Bayesian Optimization)".
"""Она рассеивает векторы одного кластера, разрушая его компактность. """. Логично предположить, что предложенный алгоритм зашумляет пространство эмбеддингов. Логичнее не рассеивать, а занулять?
Лайфхаки просты: сначала формулируешь и потом с двумя-тремя LLM обсуждаешь задачу. Суть обсуждения - найди три противоречия и\или ошибки. После обсуждения предлагаешь написать код. Запускаешь код и анализируешь результаты. Если сам ошибок и противоречий не видишь, то предлагаешь двум-трем LLM найти ошибки\противоречия в результатах. Если ошибок\противоречий никто не нашёл, этап принимается, документируется. Обсуждаешь с двумя-тремя LLM развитие функционала. И так по кругу и до бесконечности...
Абсолютно уверен, что сейчас осознание кода это большая и не нужная потеря времени. Если б я начал бы разбираться в каждой строчке, то не сделал бы и сотой части того, что сделано. В одних CUDA можно закопаться всерьёз и надолго. После перехода с машинных кодов и ассемблера на нынешние языки программирования "лёд тронулся, господа присяжные заседатели"
"""способность видеть неочевидные зависимости в многомерных данных""". AUTOENCODER пометил как аномальные все точки, амплитуда которых на порядок больше амплитуд не аномальных точек. Очень оригинальное решение. Наверное подглядывал...
Результаты тестов интересно посмотреть. Также интересно продолжение: графы и кластеры графов
Какие файлы надо обрабатывать (анализ, суммаризация и тд), такие и загружайте
Спасибо, что поделились результатом своей работы. Относительно галлюцинаций.
"""
А потом просто назначаете ему роль — и получаете идеального промпт‑инженера, который:
никогда не галлюцинирует (потому что опирается только на ваши источники);""". Однако в Google NotebookLM | ИИ-помощник в анализе данных и исследованиях указано, что """У NotebookLM есть несколько ключевых достоинств:
Прямой контроль над источниками. Документы и данные для NotebookLM предоставляете вы, поэтому ответы основаны на вашей базе знаний.
Меньше галлюцинаций. ИИ использует только загруженные вами источники, поэтому риск того, что он сгенерирует неточную информацию, снижается.
""". Поясните пожалуйста расхождение
Повторы уберите из текста
"АИ ХАБ" - первая буква А означает АВТОМАТИЧЕСКИЙ?
"""Богаче и шире, но не глубже """ - это вопрос формирования соответствующих датасетов и я уже начал синтез, для тех кто любит погорячее, пардон, погрубже. (Сарказм)
"""Представь, что нужно разложить тысячи статей по категориям без единого человека.
Звучит как магия?""". Трудно сказать как звучит, но написано не на русском языке. Уважаемый Автор! На Хабре на тему эмбеддингов опубликовано несколько десятков нормальных статей. Пожалуйста начните вторую часть с обзора, что уже опубликовано и что нового Вы расскажите миру. Иначе вторая часть, также как и первая, превратиться в шум. И еще, поясните пожалуйста, зачем в заголовке присутствует слово "машина", например, с точки зрения векторизации этого слова. Можно также предварительно подумать для какой аудитории Вы все это пишите. Ждем вторую часть.
Такое ощущение, что встретил сельского паренька, который ничего слаще морковки в жизни не пробовал. Вдруг ему дали шоколадную конфетку (Клода) и все жизненные ценности у паренька сдвинулись и жизнь дала пребольшую трещину. И что самое интересное, что паренек искренне считает, что и мы слаще морковки ничего не ели. Кто кого жалеет, парнишка нас или мы парнишку?
Правильно всё описано. Этому надо в уже школе учить. Больше всего понравилось: """И йогурт берите с нормальным сроком, а не первый попавшийся.""" - очень человеколюбивое предложение
"""В частности, документ впервые закрепляет на законодательном уровне само понятие искусственного интеллекта""". А медики молодцы - впереди всех: """Национальный стандарт РФ ГОСТ Р 72484-2025 "Системы искусственного интеллекта в здравоохранении. Термины и определения. Классификация" (утв. и введен в действие приказом Федерального агентства по техническому регулированию и метрологии от 25 декабря 2025 г. N 1812-ст)""".
Спасибо, интересно, не тривиально
"Эксперименты проводились с несколькими типами моделей:" и "Для классификации были протестированы несколько алгоритмов:" - это надо поаккуратнее раскрыть
Возраст интересно протестировать на произведениях классиков: Толстой, Тургенев, Достоевский и т.д.
"И главное — перплексия оказалась бесполезной для оценки рассуждений". Copilot на вопрос о перплексии отдельно выделил: """ Ограничения перплексии: Не измеряет смысл: модель может иметь низкую перплексию, но генерировать бессмысленный, хотя и статистически правдоподобный текст."""
"квантовая теория описывает не саму реальность" в вузовских учебниках этот вопрос раскрыт однозначно, почитайте о спектре водорода. Для школьников советую начать с лекций А. Семихатова
УРА!!!. Открыли (переписали) то, что раньше называлось "поиск гиперпараметров по решётке ( grid/random search) с Байесовской оптимизацией (Bayesian Optimization)".
"""Она рассеивает векторы одного кластера, разрушая его компактность. """. Логично предположить, что предложенный алгоритм зашумляет пространство эмбеддингов. Логичнее не рассеивать, а занулять?
Лайфхаки просты: сначала формулируешь и потом с двумя-тремя LLM обсуждаешь задачу. Суть обсуждения - найди три противоречия и\или ошибки. После обсуждения предлагаешь написать код. Запускаешь код и анализируешь результаты. Если сам ошибок и противоречий не видишь, то предлагаешь двум-трем LLM найти ошибки\противоречия в результатах. Если ошибок\противоречий никто не нашёл, этап принимается, документируется. Обсуждаешь с двумя-тремя LLM развитие функционала. И так по кругу и до бесконечности...
Абсолютно уверен, что сейчас осознание кода это большая и не нужная потеря времени. Если б я начал бы разбираться в каждой строчке, то не сделал бы и сотой части того, что сделано. В одних CUDA можно закопаться всерьёз и надолго. После перехода с машинных кодов и ассемблера на нынешние языки программирования "лёд тронулся, господа присяжные заседатели"
"А вы? " и мы тоже - уже год как генерю код не глядя, а осмысливаю только результат.
Жду, когда ИИ сам и ТЗ писать будет и тесты проверять, а мы будем радоваться жизни!