leadVSK 21 мар в 15:01

Тестирование платформы DeepSeek для проверки гипотез по анализу данных

Простой

3 мин

5.2K

Блог компании Страховой Дом ВСКМашинное обучение*Тестирование IT-систем*Big Data*Искусственный интеллект

Обзор

+15

Комментарии 2

kokanov 21 мар в 21:37

Не обижайтесь, но прямо страшно становится от такого использования llm.

Это вероятностная модель, а в проверке гипотез должна быть воспроизводимость. Хотите добиться воспроизводимости - генерируйте код, проверяйте, запускайте, результаты снова проверяйте, просите llm сгенерировать код для преобразования результатов в удобный формат, проверяйте, запускайте, просите llm + rag + websearch + CoT +... объяснить результаты, проверяйте, трижды просите улучшить свой ответ. 1-2 раза из 10 может что-то действительно полезное выдать, а 8-9 раз из 10 просто обычный, но правильный ответ.

OLZ1 22 мар в 09:42

Не парься.) После прочтения обзора ясно, что "ребята" не хотели полностью заменить анализ, а просто использовали БЯМ для ускорения категоризации запросов. При этом они сами правят ответы БЯМ, а значит, проводят ручную проверку и анализ. То есть, БЯМ использовали для быстрой первичной категоризации, а потом уже вручную проверяли и анализировали результаты. Всё нормально, видно, что работают бывалые.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий