Prompt Attack에 대항하는 공든 요새 쌓기: lab.fortress
if kakao · YouTube
소개
if(kakao)25 안전한 AI 서비스를 출시하기 위해 다양한 프롬프트 공격을 탐지하고 차단할 수 있는 가드레일 모델인 lab.fortress를 개발한 경험을 공유합니다. 초기 리서치 단계에서 얻은 인사이트를 바탕으로 데이터 구축부터 최종 모델 개발까지의 전체 프로세스를 설명합니다. 또한, 실제 서비스 도입 후의 현황과 산학협력을 통해 확장된 노하우를 전달합니다. #TECH #AI #Security 카카오뱅크에서 AI의 안전한 활용을 위한 기술을 연구하고, 이를 서비스로 구현하는 손정민(elena.son)입니다. 발표자료 보기 📍https://if.kakao.com/2025/session?sessionId=37 📍if.kakao.com if(kakao)25 홈페이지 : https://if.kakao.com/2025 #카카오 #kakao #이프카카오25
유사한 리소스
AI Safety & Quality 성과리더 이상호 : 안전한 AI를 위한 카카오의 노력 | if(kakao)25 Day2
if kakao · YouTube
GenAI를 위한 Gateway
if kakao · YouTube
AI를 활용한 자동 게임보안 검수 시스템
if kakao · YouTube
사용자 발화에서 응답까지: 그래프 기반 에이전트로 동작하는 AI 서비스
if kakao · YouTube
카나나 앱 메이트 개발기
if kakao · YouTube
필요한 순간 먼저 말을 걸어주는 온디바이스 AI
if kakao · YouTube