TestForge | 📊 Plogger ✍️ Blog 📚 Docs
TestForge Blog

AI DevOps Korea

AI 서비스 운영과 성능개선을 위한 실전 허브

aidevops.kr에서 LLMOps, RAG, AI Agent, 평가, 관측성, 비용-성능 튜닝을 운영팀 관점으로 정리합니다.

← 모든 태그

#evaluation

3개의 포스트

LLM 운영 지표 설계 - 모델을 바꾸기 전에 봐야 할 것들

AI 제품이 데모에서 끝나지 않으려면 모델 성능 비교보다 운영 지표 설계가 먼저입니다. 어떤 지표를 기준선으로 삼을지, 실패 케이스를 어떻게 분류할지, 품질 저하를 언제 감지할지 실무 기준으로 정리합니다.