메시지 광고 추천 딥러닝 인퍼런스 서버 개선 -Jvm Onnx Runtime에서 Nvidia Triton도입까지 / if(kakaoAI)2024
if kakao · YouTube
소개
메시지 광고 추천 시스템은 일별 500개 이상의 모델을 실시간으로 서빙합니다. 이번 발표에서는 LLM 모델 서빙 속도를 높이기 위해 JVM 기반 인퍼런스 서버를 Nvidia Triton으로 교체한 경험을 공유합니다. #AI #DNN #Model_Inference #MLOps 광고추천개발의 Hendo입니다. 모델 인퍼런스 & 서빙에 관심이 많습니다. 광고추천개발의 Jaylene입니다. 실시간 모델 인퍼런스와 서빙 작업을 담당하고 있습니다. 발표자료 보기 👉 https://speakerdeck.com/kakao/ifkakao24-18 if(kakaoAI)2024에 대한 자세한 정보는 👉 https://if.kakao.com #카카오 #이프카카오 #개발자컨퍼런스 #AI #기술 #개발 #ifkakaoAI2024
유사한 리소스
‘선물하기 와인 탐험’ LLM 대화형 서비스 개발기 / if(kakaoAI)2024
if kakao · YouTube
AI 기반 광고 콘텐츠 모니터링 기술 개발기 / if(kakaoAI)2024
if kakao · YouTube
AI 기반 광고 추천 파이프라인에서 스파크 스트리밍의 배포 및 모니터링 전략 / if(kakaoAI)2024
if kakao · YouTube
카카오 광고 AI 추천 MLOps 아키텍처 - Feature Store 편 / if(kakaoAI)2024
if kakao · YouTube
그래프 기반 악성 유저군 탐지: 온라인 광고 도메인에서의 적용 / if(kakaoAI)2024
if kakao · YouTube
Preview AI_1 @if(kakao)2021
if kakao · YouTube