FastAPI로 AI 추론 서버 구축하기 — LLM API 서빙 실전 가이드 FastAPI + uvicorn으로 AI 모델 추론 서버를 구축하고 비동기 처리, 배치 추론, GPU 활용까지 프로덕션 수준으로 올리는 방법. 2026년 4월 1일