[논문]다중 모달 모델 GPT-4V의 탐구: 기능, 응용 및 미래 연구 방향
The Dawn of LMMs: Preliminary Explorations with GPT-4V(ision) PDF Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models 초록 대형 다중 모달 모델(LMM, Large multimodal models)은 시각적 이해와 같은 다중 감각 능력을 가진 대형 언어 모델(LLMs, large language models)을 확장하여 더욱 강력한 일반 지능을 달성합니다. 이 논문에서는 GPT-4V(ision)1과 같은 최신 모델을 분석하여 LMM에 대한…