#ai

27개의 포스트

LLM 운영 지표 설계 - 모델을 바꾸기 전에 봐야 할 것들

AI 제품이 데모에서 끝나지 않으려면 모델 성능 비교보다 운영 지표 설계가 먼저입니다. 어떤 지표를 기준선으로 삼을지, 실패 케이스를 어떻게 분류할지, 품질 저하를 언제 감지할지 실무 기준으로 정리합니다.

2026년 5월 8일

주간 기술 브리핑 - 2026년 5월 2주 Cloud·AI·DevOps 최신동향

2026년 5월 2주차에 주목할 Cloud, AI, DevOps, Backend, Architecture, Incident 분야의 흐름을 한 번에 정리합니다. 새 기능보다 설계와 운영에 어떤 신호를 주는지 중심으로 봅니다.

2026년 5월 8일

LLM 평가 데이터셋 설계 플레이북 - 정답셋보다 중요한 운영 기준선 만들기

LLM 서비스 품질을 안정적으로 관리하려면 평가 데이터셋을 어떻게 구성해야 하는지, 단순 Q&A 정답셋을 넘어서 실제 실패 패턴과 운영 기준선을 어떻게 정의해야 하는지 정리합니다.

2026년 4월 22일

주간 기술 브리핑 - 2026년 4월 4주 Cloud · AI · DevOps 최신동향

2026년 4월 4주차에 주목할 Cloud, AI, DevOps, Backend, Architecture, Incident 분야의 흐름을 한 번에 정리합니다. 기능 소식보다 실제 설계와 운영에 어떤 신호를 주는지 중심으로 봅니다.

2026년 4월 22일

AI Agent 스트리밍 응답 설계 - SSE와 WebSocket 중 무엇을 선택할까

AI Agent는 최종 답변만 빠른 것이 아니라 처리 중 상태를 어떻게 보여주느냐가 중요합니다. 이 글에서는 토큰 스트리밍, 단계 상태 표시, 툴 실행 이벤트, 중간 결과 전송을 기준으로 SSE와 WebSocket을 비교하고 실무적인 선택 기준을 정리합니다.

2026년 4월 19일

AI Agent UI/UX 설계 - 질문 입력부터 결과 표시까지 어떤 형태로 구현할까

AI Agent 서비스를 만들 때 사용자의 질문을 어떻게 입력받고, 처리 상태와 근거, 최종 결과를 어떤 화면 구조로 보여줄지 정리합니다. 채팅형, 워크스페이스형, 대시보드형 UX와 Next.js, SSE, WebSocket 같은 구현 기술 선택 기준까지 실무 관점으로 설명합니다.

2026년 4월 19일

OpenAI Responses API와 Agents SDK 공개가 보여준 2026 AI Agent 개발 표준

2025년 3월 11일 OpenAI는 Responses API와 Agents SDK를 공개했습니다. 2026년 현재 AI Agent 제품 설계에서 이 발표가 왜 기준점이 되었는지, 어떤 개발 방식 변화로 이어졌는지 정리합니다.

2026년 4월 19일

Grafana Observability Survey 2026으로 보는 AI 기반 Incident 대응의 현실

Grafana Labs가 2026년 3월 18일 공개한 Observability Survey는 AI가 incident 대응에 어떤 방식으로 기대되고, 또 어디까지 신뢰받고 있는지 보여줍니다. Incident 카테고리 관점에서 핵심 시사점을 정리합니다.

2026년 4월 19일

월간 기술 동향 리포트 - 2026년 4월 Cloud · AI · DevOps 실무 변화 정리

2026년 4월 기준으로 Cloud, AI, DevOps, Backend, Architecture, Incident 분야에서 실무자가 주목해야 할 기술 변화와 다음 달 체크포인트를 정리한 월간 기술 동향 리포트입니다.

2026년 4월 19일

주간 기술 브리핑 - 2026년 4월 셋째 주 Cloud · AI · DevOps 최신동향

2026년 4월 셋째 주 기준으로 Cloud, AI, DevOps, Backend, Architecture, Incident 분야에서 실무자가 꼭 봐야 할 최신 기술 동향을 한 번에 정리합니다.

2026년 4월 19일

AI Agent 서비스 설계 패턴 - 도구 호출, 상태관리, 안전장치까지

AI Agent를 실제 서비스로 만들 때 필요한 설계 기준을 정리합니다. Tool Calling, Planner/Executor 분리, 세션 상태관리, Human-in-the-loop, 장애 대응과 비용 통제까지 제품 개발 관점으로 설명합니다.

2026년 4월 18일

RAG 아키텍처 설계 가이드 - 검색 품질부터 답변 생성까지

RAG 시스템을 만들 때 많이 놓치는 설계 포인트를 정리합니다. 문서 수집, 청킹, 임베딩, 벡터 검색, 리랭킹, 프롬프트 구성, 평가 방법까지 실제 서비스 개발 관점에서 설명합니다.

2026년 4월 18일

RAG 개발 1편 - 문서 수집과 데이터 정제 파이프라인 설계

RAG 품질의 출발점은 모델이 아니라 데이터입니다. 어떤 문서를 수집해야 하는지, HTML/PDF/위키 데이터를 어떻게 정제하고 메타데이터를 붙여야 하는지, 실무용 수집 파이프라인 관점에서 설명합니다.

2026년 4월 18일

RAG 개발 2편 - Chunking과 Embedding 전략, 검색 품질의 기초

RAG에서 청킹과 임베딩은 검색 품질의 핵심입니다. chunk 크기, overlap, 제목 보존, 코드 블록 처리, 임베딩 모델 선택과 인덱싱 전략까지 실무 기준으로 깊게 설명합니다.

2026년 4월 18일

RAG 개발 3편 - Retrieval, Hybrid Search, Reranking으로 검색 품질 높이기

RAG에서 검색 품질은 답변 품질을 거의 결정합니다. dense retrieval, BM25, hybrid search, query rewrite, metadata filtering, reranking을 어떻게 조합해야 하는지 단계별로 설명합니다.

2026년 4월 18일

RAG 개발 4편 - 답변 생성, 프롬프트 설계, 출처 표시를 어떻게 만들까

검색이 끝났다고 RAG가 끝난 것은 아닙니다. 어떤 문서를 어떤 형식으로 LLM에 넣을지, 출처를 어떻게 표시할지, 모를 때는 어떻게 답하게 할지, 답변 생성 단계의 핵심 설계 포인트를 설명합니다.

2026년 4월 18일

RAG 개발 5편 - 평가, 관측성, 운영 안정화까지 프로덕션 관점으로 보기

RAG를 운영 단계로 올리려면 답변 품질을 어떻게 평가하고 어떤 로그를 남기며 어디서 병목이 나는지 봐야 합니다. retrieval 평가, groundedness, latency, feedback loop, 운영 체크리스트까지 정리합니다.

2026년 4월 18일

RAG 기반 AI 주식 투자 Agent 1편 - 요구사항 정의와 전체 아키텍처 설계

추상적인 AI Agent가 아니라 실제로 개발 가능한 RAG 기반 AI 주식 투자 Agent를 설계합니다. 제품 목표, 사용자 시나리오, 시스템 경계, 핵심 컴포넌트, 데이터 흐름까지 구체적인 아키텍처 관점에서 정리합니다.

2026년 4월 18일

RAG 기반 AI 주식 투자 Agent 2편 - 시장 데이터, 뉴스, 공시를 RAG 지식베이스로 만드는 방법

주식 투자 Agent의 핵심은 최신 문맥입니다. 시세, 뉴스, SEC 공시, 실적 발표 transcript를 어떻게 수집하고 정규화하며, 종목 중심 RAG 검색이 가능하도록 적재할지 데이터 파이프라인 관점에서 설명합니다.

2026년 4월 18일

RAG 기반 AI 주식 투자 Agent 3편 - Agent Workflow, Tool Calling, 분석 체인 설계

주식 투자 Agent는 LLM 하나로 끝나지 않습니다. 종목 스크리너, 뉴스/공시 검색기, 정량 분석기, 리스크 평가기, 응답 생성기를 어떻게 나눌지와 도구 호출 흐름을 실제 시스템 설계 기준으로 설명합니다.

2026년 4월 18일

RAG 기반 AI 주식 투자 Agent 4편 - 포트폴리오 구성, 리스크 룰, 백테스트 설계

좋은 종목 분석만으로는 투자 Agent가 완성되지 않습니다. 포지션 크기, 섹터 집중도, 손실 한도, 이벤트 리스크, 백테스트와 paper trading까지 포함한 실제 투자 시스템 관점의 설계를 설명합니다.

2026년 4월 18일

RAG 기반 AI 주식 투자 Agent 5편 - FastAPI, PostgreSQL, pgvector로 실제 서비스 구조 만들기

이제 아키텍처를 코드 구조로 내려봅니다. FastAPI API 계층, PostgreSQL/pgvector 스키마, Redis 캐시, 비동기 작업 큐, 분석 실행 흐름, 핵심 모듈 분리까지 실제 개발 가능한 서비스 구조를 설명합니다.

2026년 4월 18일

RAG 기반 AI 주식 투자 Agent 6편 - Paper Trading, 모니터링, 운영 안전장치 설계

이제 시스템을 운영 단계로 올려봅니다. paper trading workflow, 사람 승인, 실패 대응, 관측성, 알림, 감사 로그, 안전장치를 어떻게 설계해야 하는지 투자 Agent 운영 관점에서 정리합니다.

2026년 4월 18일

FastAPI로 AI 추론 서버 구축하기 — LLM API 서빙 실전 가이드

FastAPI + uvicorn으로 AI 모델 추론 서버를 구축하고 비동기 처리, 배치 추론, GPU 활용까지 프로덕션 수준으로 올리는 방법.

2026년 4월 1일

AI Agent 아키텍처 설계 — ReAct부터 Multi-Agent까지

프로덕션 AI Agent 시스템 설계 방법. ReAct 패턴, Tool Use, Memory 관리, Multi-Agent 오케스트레이션, 안전성 설계까지 실전 가이드.

2026년 3월 13일

LLM 서비스 운영 방법 — 프로덕션 AI 서비스 안정화 가이드

LLM 기반 서비스를 프로덕션에서 안정적으로 운영하는 방법. 비용 관리, 레이턴시 최적화, 장애 대응, 모니터링까지 실전 경험 정리.

2026년 3월 11일

AI 서비스 운영과 성능개선을 위한 실전 허브

#ai

LLM 운영 지표 설계 - 모델을 바꾸기 전에 봐야 할 것들

주간 기술 브리핑 - 2026년 5월 2주 Cloud·AI·DevOps 최신동향

LLM 평가 데이터셋 설계 플레이북 - 정답셋보다 중요한 운영 기준선 만들기

주간 기술 브리핑 - 2026년 4월 4주 Cloud · AI · DevOps 최신동향

AI Agent 스트리밍 응답 설계 - SSE와 WebSocket 중 무엇을 선택할까

AI Agent UI/UX 설계 - 질문 입력부터 결과 표시까지 어떤 형태로 구현할까

OpenAI Responses API와 Agents SDK 공개가 보여준 2026 AI Agent 개발 표준

Grafana Observability Survey 2026으로 보는 AI 기반 Incident 대응의 현실

최신동향 카테고리를 시작합니다 - Cloud, AI, DevOps 변화 흐름을 빠르게 정리하는 코너

월간 기술 동향 리포트 - 2026년 4월 Cloud · AI · DevOps 실무 변화 정리

주간 기술 브리핑 - 2026년 4월 셋째 주 Cloud · AI · DevOps 최신동향

AI Agent 서비스 설계 패턴 - 도구 호출, 상태관리, 안전장치까지

RAG 아키텍처 설계 가이드 - 검색 품질부터 답변 생성까지

RAG 개발 1편 - 문서 수집과 데이터 정제 파이프라인 설계

RAG 개발 2편 - Chunking과 Embedding 전략, 검색 품질의 기초

RAG 개발 3편 - Retrieval, Hybrid Search, Reranking으로 검색 품질 높이기

RAG 개발 4편 - 답변 생성, 프롬프트 설계, 출처 표시를 어떻게 만들까

RAG 개발 5편 - 평가, 관측성, 운영 안정화까지 프로덕션 관점으로 보기

RAG 기반 AI 주식 투자 Agent 1편 - 요구사항 정의와 전체 아키텍처 설계

RAG 기반 AI 주식 투자 Agent 2편 - 시장 데이터, 뉴스, 공시를 RAG 지식베이스로 만드는 방법

RAG 기반 AI 주식 투자 Agent 3편 - Agent Workflow, Tool Calling, 분석 체인 설계

RAG 기반 AI 주식 투자 Agent 4편 - 포트폴리오 구성, 리스크 룰, 백테스트 설계

RAG 기반 AI 주식 투자 Agent 5편 - FastAPI, PostgreSQL, pgvector로 실제 서비스 구조 만들기

RAG 기반 AI 주식 투자 Agent 6편 - Paper Trading, 모니터링, 운영 안전장치 설계

FastAPI로 AI 추론 서버 구축하기 — LLM API 서빙 실전 가이드

AI Agent 아키텍처 설계 — ReAct부터 Multi-Agent까지

LLM 서비스 운영 방법 — 프로덕션 AI 서비스 안정화 가이드