네이버(NAVER)의 AI(인공지능) LLM(거대언어모델) '하이퍼클로바X'가 대부분 성능 평가에서 글로벌 오픈소스 모델보다 높은 점수를 받았다.
네이버클라우드는 전날 발표된 하이퍼클로바X의 테크니컬 리포트에서 이 같은 결과가 나왔다고 4일 밝혔다. 테크니컬 리포트는 학습 방법이나 성능 등 AI 모델의 세부 정보를 소개하는 논문이다. 오픈AI, 구글 등 빅테크도 자사 AI의 특징을 테크니컬 리포트를 통해 설명하고 있다.
리포트에 따르면 하이퍼클로바X는 성능 평가에서 글로벌 오픈소스 모델보다 높은 종합 점수를 획득했다. 비교군은 오픈AI의 '챗GPT4'와 메타의 '라마2', 아랍에미리트 기술혁신연구소의 '팰컨' 등이다.
특히 한국어, 일반상식, 수학, 코딩 부문에서는 리포트에서 비교 평가를 위해 선정한 14개 모델 중 1위를 기록했다. 특정 국가 언어 능력뿐 아니라 보편 지식, 프로그래밍 등 다양한 분야 문제 해결력까지 갖춘 소버린 AI로서의 경쟁력을 입증했다는 평가다.
폐쇄형으로 개발된 모델들과의 비교에서도 하이퍼클로바X는 우수한 점수를 획득했다. 한국어 능력 부문에서는 세계 최고 수준 모델을 포함해 비교 평가를 위해 리포트에서 선정한 4개 모델 중 1위에 올랐고, 영어 능력 분야에서도 같은 모델 중 2위를 기록했다.
리포트에서 강조된 하이퍼클로바X의 또 다른 특징은 '다국어 능력'이다. 학습 데이터의 대부분을 차지하는 한국어와 영어 정보를 활용해 제3의 언어로 추론하는 능력을 갖춘 것이 확인됐다. 일본어, 아랍어, 힌디어, 베트남어를 비롯한 아시아 국가 언어 능력을 평가했을 때, 하이퍼클로바X는 주요 오픈소스 모델을 포함해 리포트에서 선정한 9개 모델 중 가장 높은 점수를 획득했으며, 중국어에서만 같은 모델들 중 2위를 기록했다.
기계 번역 평가에서도 하이퍼클로바X의 다국어 능력이 입증됐다. 한국어를 일본어로, 일본어를 한국어로 번역하는 능력은 실제 서비스 중인 번역 모델 등 리포트에서 선정한 10개의 모델 중 1위를 기록했으며, 영어를 한국어로 번역하는 정확도도 동일한 10개 모델 중 가장 높은 점수를 기록했다.
테크니컬 리포트의 연구 부문을 이끈 유강민 네이버클라우드 리더는 "하이퍼클로바X의 다국어 추론, 기계 번역 능력을 측정한 실험은 지역 또는 문화권 특화 목적으로 개발한 AI가 해당 국가 언어 외에도 여러 언어에서 일정 수준 이상의 능력을 갖출 수 있음을 실증한 것"이라며 "특정 문화권에 더 적합한 배경 지식과 다국어 능력까지 보유해 한층 활용도가 높은 소버린 AI의 가능성을 하이퍼클로바X가 보여주고 있다"고 말했다.
댓글목록
등록된 댓글이 없습니다.