• 최종편집 2024-05-01(수)
  • 로그인
  • 회원가입
  • 지면보기
  • 전체기사보기
 
0002616954_001_20240119121030994.jpg
문자와 이미지를 동시에 학습하고 연산할 수 있는 복합정보처리(멀티모달) 언어모델(MLLM)인 카카오 ‘허니비’ 사용 예시. 개와 고양이가 등장하는 사진을 올린 뒤, 두 동물 간의 대화를 만들어 달라고 하자 인공지능(AI)이 상황에 맞는 대화를 만들어냈다. 카카오브레인 제공

 

AI(인공지능)는 현시대의 핵심 요소로 자리하고 있다. 인제는 AI가 일상에 들어와 인간의 삶에 많은 변화를 만들고 있다. 자가 학습을 통해 발전해 가는 AI의 기술이 과연 인간에게는 어떠한 영향을 미칠까도 고민해야 한다. 이미 테슬라는 ‘옵티모스2’라는 휴머노이드형 로봇을 공개했다. 옵티모스2는 깨지기 쉬운 달걀을 다루는 것은 물론 자연스러운 동작으로 스쿼트도 해 내고 있다.

과학기술정보통신부는 여의동 FKI타워에서 19일 제5차 인공지능 최고위 전략대화를 개최했다. 참석한 카카오 계열사인 카카오브레인은 멀티모달 언어모델(MLLM)의 오픈소스 (누구나 기술에 액세스할 수 있어 수정하고 공유할 수 있는 분산형 프로덕션 모델)로 ‘허니비’를 깃허브(분산형 저장소)에 전격 공개했다. 

일반적으로 많이 알려진 챗GPT와 같은 텍스트 전용 대규모 언어모델(LLM) 이라 말한다. 그리고 비전, 오디오 멀티모달 데이터까지 모두 취급하는 MLLM(Multimodal Large Language Model)이라 부른다.

이처럼 MLLM 기반의 ‘허니비’는 앞으로 오감을 통해 보고 듣고 말하는 것이 가능할 것이다. 이미지와 텍스트를 모두 입력할 수 있고 이미지나 장면 묘사, 이미지와 텍스트가 섞인 콘텐츠에 AI가 이해하고 답할 수 있다.

카카오브레인(이하 ‘카브’)는 “직접 서비스 계획은 없다. 공개한 허니비는 높은 수준의 오픈 소스로 각 개발사가 며칠 만에도 이미지 인식으로 대화가 되는 AI를 만들 수 있다.”라고 밝혔다. MLLM의 연구는 공개 모델 수도 적고 학습 방법도 자세히 공개되지 않아 개발이 쉽지 않다. MLLM 발전과 생태계 조성을 위해 ‘허니비’ 소스코드를 공개했다고 설명했다.

과학기술정보통신부는 우리나라 AI의 글로벌 경쟁력 확보를 위해 민간과 함께 △AI 플랫폼 확산 및 생태계 조성 △ 온 디바이스(내장형) AI 확산 △전통산업의 AI 융합 활성화 △AI 기업 양성 및 해외 진출 지원 확대 등을 추진하기로 했다.

이날 행사에는 네이버, 카카오, 등 IT 기업과 LG, KT, 아모레퍼시픽, 삼성전자 영상디스플레이, 두산로보틱스 등 첨단 제조 기업들이 대거 참가했다.
태그
비밀번호 :
메일보내기닫기
기사제목
‘오감 AI’ … 카카오 ‘허니비’ 소스코드 공개
보내는 분 이메일
받는 분 이메일