Ray를 활용한 GPU Util 100% MLOps: 배치처리부터 모델 서빙까지
엔지니어링데이 2025 · YouTube
소개
네이버 사내 기술 교류 행사인 NAVER ENGINEERING DAY 2025(5월)에서 발표되었던 세션을 공개합니다. [발표 내용] AI/ML 분산 처리 프레임워크인 Ray를 활용하여 GPU Util 100%를 달성한 배치처리 기법과 확장 가능한 모델 서빙 아키텍처를 소개합니다. [발표 대상] 배치 파이프라인 설계와 모델 서빙 자동화를 담당하는 분 Ray 기반 인프라 운영 및 GPU 클러스터 관리 업무를 수행하는 분 Ray Serve를 활용해 고성능 모델 서빙 API를 설계·배포·운영하는 분 Ray LLM(vLLM) 기반 LLM 추론 파이프라인을 구성·확장하고, 내부 모델 레지스트리를 연동하는 분 [목차] 1. Introduction to Ray - Ray에 대한 소개 및 Core Architecture에 대한 이해 2. Ray Data: GPU Util 100% Bach Inference를 위한 수난기 - 기존 구조와 도입된 구조 비교 - TroubleShooti...
유사한 리소스
[팀네이버 컨퍼런스 DAN25] MLXP: GPU 효율화를 선도하는 대규모 MLOps 플랫폼
DAN 2025 · YouTube
AI와 함께하는 프로젝트 자동화 : 더 빠르고, 더 스마트하게
엔지니어링데이 2025 · YouTube
ARC로 확장가능한 GPU 서비스 개발 인프라 구축하기
엔지니어링데이 2025 · YouTube
레거시 GPU에 날개 달기: 극한의 서빙 최적화 가이드
엔지니어링데이 2025 · YouTube
Kubernetes GPU 클러스터에서 AI 서비스 오토스케일링하기
엔지니어링데이 2025 · YouTube
Windowing 기법을 적용한 대용량 고성능 표 컴포넌트 개발기
엔지니어링데이 2025 · YouTube