눈으로 보고, 귀로 듣고, 입으로 말하는 AI – 통합 멀티모달 언어모델 Kanana-o 개발기
if kakao · YouTube
소개
if(kakao)25 텍스트만 이해하던 AI는 이제 사람처럼 ‘보고’, ‘듣고’, ‘말’합니다. 텍스트·이미지·오디오를 입력받아 텍스트와 음성으로 응답하는 통합 멀티모달 언어모델 Kanana-o의 개발 과정 및 결과를 공유합니다. #TECH #AI #Multimodal 카카오에서 멀티모달 언어모델을 연구·개발하고 있는 노병석(peter.brain)입니다. 발표자료 보기 📍https://if.kakao.com/2025/session?sessionId=50 📍if.kakao.com if(kakao)25 홈페이지 : https://if.kakao.com/2025 #카카오 #kakao #이프카카오25
유사한 리소스
Kanana 성과리더 김병학 : Agentic AI를 향한 카나나 모델의 진화 | if(kakao)25 Day2
if kakao · YouTube
화면을 이해하고 행동하는 AI - GUI Agent 개발기
if kakao · YouTube
LLM은 있지만 다시 학습하고 싶어 - Kanana-2 개발기 (~ing)
if kakao · YouTube
카나나 앱 메이트 개발기
if kakao · YouTube
필요한 순간 먼저 말을 걸어주는 온디바이스 AI
if kakao · YouTube
카카오는 어떻게 AI를 일상의 언어로 만들까? | if(kakaoAI)2024
if kakao · YouTube