지난 2월, 강원도 홍천 소노벨비발디파크 컨벤션센터에서 HCI KOREA 2024 학술대회가 개최됐다. ‘HCI’란 ‘인간과 컴퓨터 간의 상호관계(Human Computer Interaction)’의 영문 약자로 이러한 관계에 관한 다양한 현상을 탐구하는 학문 분야다.
1990년 카이스트(KAIST) 인공지능 연구센터 소속의 연구 모임으로 출발한 HCI 연구회는 1991년 심포지움을 개최하며 컴퓨터, 디자인, 인간 공학, 건축, 예술, 사회학, 심리학 등 다양한 분야를 융합한 학술대회를 진행해왔다. 2005년 공식적으로 정보통신부에 법인 등록을 하여 ‘한국HCI학회’로서 출발, 인간과 컴퓨터 또는 사이버 공간과의 상호작용에 대한 현상 및 기술을 연구하는 국내 최대 규모의 학제 간 학술대회를 개최하고 있다.
최근 MICE산업은 새로운 과학 기술의 등장으로 서비스의 대대적 전환이 이루어지고 있다. HCI 학술대회에서 발표된 다양한 연구 중, 최근 MICE산업이 고민하고 있는 인공지능의 서비스화, 증강현실 및 가상현실 환경의 최적화 등에 관한 주제도 있어 업계 관계자들에게 새로운 관점을 안겨줄 수 있을 것으로 보인다.
이에 본 고는 HCI KOREA 2024 학술대회에서 발표된 논문들 중 MICE산업과 연관성이 높은 주요 연구결과를 살펴보고자 한다. 이를 통해 MICE를 둘러싼 이해관계자들이 기술과의 상호작용을 더욱 원활하게 영위할 수 있도록 하면서 의미 있는 방식의 행사 경험을 기획할 수 있는 토대를 마련코자 한다.
HCI2024 ① 생성형 AI의 시각 커뮤니케이션 도구로서 가능성 탐구
커뮤니케이션의 시각화는 인간 본능에 의한 것
과거 공상과학 영화에서나 상상해보던 상황들이 오늘날 현실이 되어가고 있다. 인공지능 기술 덕분이다. MICE 행사에서 발생할 법한 상황을 가정해보겠다. 컨퍼런스에서 유명한 연사가 발표하고 있다. 그런데 발표하는 주제가 이해하기 어려워 도통 무슨 말을 하는지 모르겠다. 연사의 머릿속을 들여다볼 수 있다면 좀 이해하기 쉬워질까? 생성형 AI의 등장은 필요한 이미지를 즉시 생성하여 함께 공유할 수 있는 시대를 기대하게 만든다.
HCI KOREA 2024 학술대회에서 국민대학교 TED(테크노디자인전문대학원)팀이 발표한 ‘생성형 AI의 시각 커뮤니케이션 도구로서 가능성 탐구’는 화자가 이야기하고자 하는 내용을 생성형 AI가 즉시 시각적인 자료로 구성하는 모습을 구현했다. 즉, 정보수집의 많은 부분을 청각에 기대던 행사 현장을 시각적 보조자료를 추가로 제공함으로써 원활한 커뮤니케이션을 지원한 것이다. 시각 커뮤니케이션이란 시각적인 요소를 사용하여 정보를 전달하고 교류하는 과정으로써 이미지, 색상, 형태, 레이아웃 등의 시각적인 요소를 통해 메시지를 표현하고 전달하여 사람들 간의 의사소통과 이해력을 촉진하는 역할을 한다.
이러한 연구는 인지 측면에서 텍스트 정보에 비해 시각적인 형태나 이미지를 통해 복잡한 개념이나 데이터를 훨씬 쉽고 빠르게 처리하는 인간의 특성에 기인했다. 어떤 발표든 그래프나 사진 등 시각적인 요소가 뒤따르는 것이 바로 그 이유다. 또한, 언어와 문화 장벽을 넘어 다양한 사람과의 소통도 가능케 한다. 저자는 시각 커뮤니케이션 도구가 복잡한 개념, 아이디어, 데이터를 색상, 형태, 레이아웃 등의 시각적 요소로 재조합하여 사용자들 간의 상호작용을 용이하게끔 하여 정보의 교류와 피드백의 순환을 원활하게 한다고 강조했다.
각기 다른 알고리즘으로 그림도 특징 있게 구현
인간은 원시사회의 동굴벽화부터 회화, 조각, 인쇄, 그래픽에 이르기까지 오랜 시간에 걸쳐 시각 커뮤니케이션을 이용해왔다. 국민대학교의 TED팀은 시각 커뮤니케이션의 시대가 또 다른 영역에 이르렀다고 주장하고 있다. 생성형AI(Text-to-Image)가 시각 커뮤니케이션의 새로운 도구로 떠오르고 있다는 것이다. 해당 기술은 사용자가 원하는 텍스트를 입력하면 그에 맞는 이미지를 생성하는 기술로, 디자인 분야의 큰 혁신을 이끌어낼 것으로 주목받고 있다. 물론, 생성형 AI모델은 개발사에 따라 생성 방식(알고리즘)이 다르다. 동일한 텍스트를 입력하더라도 AI 모델에 따라 다른 느낌의 이미지가 생성된다. 이러한 차이는 최근 가장 인기 있는 이미지 생성 AI 모델인 달리 3(Dall-E 3)와 미드저니(Midjourney)에서도 쉽게 확인할 수 있다. 인공지능 분야 전문가에 따르면, 모델별 각기 다른 알고리즘이 적용되며 달리 3의 경우 일러스트레이션 이미지에 적합하고 미드저니는 사실적이고 응집력 있는 사진을 만들어 낸다. 두 기술의 공통점은 더 복잡하고 구체적인 명령어를 입력한다면 더욱 명확한 결과물을 내놓을 수 있다.
참고자료 달리 3(Dall-E 3) vs 미드저니(Midjourney)
달리 3은 챗지피티(ChatGPT)를 만든 오픈에이아이(OpenAI)에서 선보인 이미지 생성형 AI모델이다. 기존에 선보였던 달리 2를 업그레이드 한 모델로, 챗지피티에 내장되어 대화창 내에서 사용이 가능하다. 특히, 이미지 생성 및 편집, 해상도 업스케일까지 작업이 가능하다는 점이 주된 특징이다. 가장 주목받는 강점은 사용자가 입력한 명령어를 높은 수준으로 이해하여 디테일이 훌륭하다는 평을 받고 있다. 일러스트레이션 이미지를 완벽하게 구현해내 인기를 얻고 있다. 미드저니는 인공지능 연구소에서 제작한 이미지 생성형 AI모델로 챗지피티와 기능이 유사하지만, 일반 유저들의 접근이 어렵고 아직 베타버전을 공개한 상태다. 달리 3보다는 명령어의 이해도가 떨어지지만, 사실적이고 응집력 있는 사진을 생성하여 현실에 가까운 이미지를 만들어 낸다.
연사와 청중의 커뮤니케이션을 돕는 인공지능 기술