미국 샌프란시스코에서 개최 중인 '게임 개발자 콘퍼런스 2025'에서 Algomatic의 DMM 게임 번역 노다 카츠키 제너럴 매니저와 야자와 류타 수석 번역가가 'Faster, Cheaper, Smarter: Revolutionizing Game Localization with AI Agents(더 빠르고, 더 저렴하고, 더 스마트하게: AI 에이전트를 통한 게임 현지화 혁신)'라는 주제로 강연을 진행했다.
이 강연에서는 DMM 그룹의 AI 전문 기업 Algomatic이 전개하는 DMM 게임 번역이 AI 에이전트를 활용하여 게임 현지화의 상식을 뒤집는 노력에 대해 자세히 설명하였다.
■ AI 주도의 게임 현지화가 지향하는 것
자신이 CXO(Chief Experience Officer) 겸 공동 창업자라고 소개한 노다는 DMM 게임 번역의 비전에 대해 '게임 현지화의 민주화'를 내세웠다.
그는 “오늘날 게임 업계에서는 글로벌 출시가 표준이 되었지만, 현지화는 여전히 비용이 많이 들고, 시간이 걸리며, 많은 장벽이 있다. 우리는 AI를 사용해 이러한 장벽을 없애 더 빠르고, 더 저렴하고, 일관되게 높은 품질의 번역을 실현하는 것을 목표로 하고 있다"고 설명했다.
구체적으로 다음 세 가지를 실현하고 싶다고 밝혔다.
1. AAA 게임의 현지화 비용을 획기적으로 절감하고 대응 언어를 확대한다.
2. 인디 개발자들이 보다 쉽게 글로벌 시장에 진출할 수 있도록 한다.
3. 이를 통해 게임 생태계 전체에 활력을 불어넣는다.
“간단히 말해서, 우리는 게임 현지화에 혁명을 일으키려고 한다. 모든 번역을 AI 에이전트로 완성하는 것을 목표로 하고 있다. 기존의 MT(기계번역)+PE(포스트에디팅)와 같은 접근방식이 아니다"라고 노다는 말했다. 그는 이 개념을 자율주행차에 비유하며 “완전 자율형 번역 서비스, 말하자면 현지화 버전의 웨이모(Waymo)를 목표로 하고 있다”고 표현했다.
■ 기계번역의 역사와 과제 - 왜 게임 번역은 AI에게 어려운가?
지난 25년 이상 게임 현지화에 종사해 온 야자와는 기계번역의 진화 역사를 돌아보며 강연을 시작했다.
“기계 번역은 극적으로 진화해 왔습니다. 첫 번째는 규칙 기반 번역이었고, 바벨 피쉬(Babel Fish)를 기억하시는 분들도 계실 겁니다"라고 웃음을 자아내며, 기계 번역의 3단계 진화를 설명했다.
1. 규칙 기반 번역(1990년대~)
문법 규칙을 사용한 번역. 품질은 그다지 높지 않지만 대략적인 의미를 이해하는 데 도움이 되었다.
2. 통계적 기계번역(SMT) (2006년~)
초창기 구글 번역에서 사용되던 기술. 기존 번역 데이터를 대량으로 사용하여 통계적으로 정확한 번역을 찾아낸다. 품질은 크게 향상되었지만, “이 태그는 번역하지 마세요”와 같은 지시를 내릴 수 없었다.
3. 신경망 기계번역(NMT) (2016년~)
불과 6~7년 전부터 널리 사용되기 시작했다. 현재 구글 번역과 DeepL이 기술을 사용하고 있다.
“NMT는 일상적인 대화나 일반 문서 번역에는 매우 유용하지만, 게임 번역은 여전히 어려운 것으로 알려져 있다. 왜 그럴까?” 야자와는 그 이유를 다음과 같이 분석했다.
야자와: 비디오 게임은 독특한 가상 세계를 가진 대화형 소프트웨어로, 깊은 설정과 방대한 역사가 있다. 소프트웨어로서 번역은 적절한 기능을 보장하기 위해 특정 규칙을 따라야 한다. 그리고 게임의 스토리는 또 다른 복잡성을 가져온다. 책이나 영화와 달리 게임은 엄격하게 선형적이지 않다. 대신 대화 라인, UI 요소, 아이템 설명과 같은 단편화된 텍스트를 다루고 있다. 따라서 의미는 문맥에 크게 의존합니다.
그는 “충분한 맥락이 없는 번역은 인간에게도 AI에도 어려운 과제”라고 강조했다.
야자와는 게임 번역의 특수성으로 '용어집과 스타일 가이드라인 준수'를 꼽았다. 기존의 기계 번역으로는 이것이 어려웠다는 설명이다.
전문 CAT(Computer-Assisted Translation) 툴조차도 동사의 활용(do, does, doing, done 등)과 단수/복수의 구분에 어려움을 겪었다고 한다. 반면, 현재의 LLM(대규모 언어 모델)은 이러한 문제를 처리할 수 있게 되었다고 한다.
“LLM은 문맥을 제공하면 'apple'이 과일을 가리키는지, 기술 기업을 가리키는지 구분할 수 있다"며, "AI는 태그, 숫자 변수, 줄 바꿈, 문자 제한, 자리 표시자 등의 규칙을 준수하는 데도 놀라울 정도로 잘 처리할 수 있다"고 말했다.
그러나 야자와는 “제대로 설정하지 않으면 지금의 LLM도 실패할 수 있다”고 경고하며, “적절한 설정이 있다면 AI가 실제로 용어집과 스타일 가이드라인을 준수할 수 있다는 사실에 여전히 많은 사람들이 놀라워하고 있다”고 덧붙였다.
■ 게임 번역에서 '문맥'의 중요성 - 매크로 문맥과 마이크로 문맥
야자와 대표는 “게임 번역은 모두 문맥을 마스터하는 것과 관련이 있다”고 강조하며, 문맥을 두 가지 범주로 분류해 설명했다.
“게임 현지화에 참여한 경험이 있는 사람이라면 누구나 '문맥을 좀 더 제공해 주세요'라는 메시지를 300만 번 정도 쓰거나 읽은 적이 있을 것"이라고 말해 장내 웃음을 자아낸 뒤, 다음과 같이 말했다.
야자와: 일반적으로 문맥은 등장인물, 대화의 목적, 주제 등을 의미한다. 숙련된 인간 번역가는 경험을 통해 직관적으로 문맥을 읽어내지만, LLM은 확률적으로 작동하기 때문에 명확한 지시가 없는 한 어떤 해석도 배제하지 않는다.
즉, 생성 AI는 인간처럼 '이것이 정답일 것이다'라고 문맥을 추측하지 않으며, 오히려 그렇게 하지 않는 것이 바람직하다. 왜냐하면, 우리가 정확한 문맥 정보를 제공해야 더 정확한 번역이 가능하기 때문이다.
이 문제를 해결하기 위해 야자와는 문맥을 다음과 같이 두 가지로 분류했다.
1. 매크로 문맥
'이 세계란 무엇인가'라는 질문에 답하는 모든 정보.
- 게임 세계의 설정
- 규칙
- 게임 내 수정
- 어떤 국가가 존재하는지 등
2. 마이크로 문맥
'지금 여기서 무슨 일이 일어나고 있는가'라는 질문에 답하는 모든 정보.
- 이 캐릭터는 누구인가?
- 주인공의 주변에는 무엇이 있는지
- 누가 누구에게 말을 걸고 있는지 등
“매크로 문맥이 왜 그렇게 중요한 것인가?"라고 야자와는 물었다. 그는 “인간은 텍스트를 읽거나 장면을 볼 때 무의식적으로 세계 설정을 가정한다. 하지만 무수한 장르와 도메인으로 훈련된 AI는 명시적으로 지시하지 않는 한 스스로를 제한하는 데 어려움을 겪는다"고 설명했다.
AI가 캐릭터의 성별조차 결정하지 못하는 문제를 예로 들며 “‘그'가 종종 ’그들'이 되는 경우를 경험한 사람들도 많을 것이다. 그들은 캐릭터의 성별을 결정하고 싶지 않은 것이다"라고 말했다. 더 극단적인 예로 “기술적으로는 AI가 하이 판타지 이야기를 읽다가 갑자기 돌격소총이 등장할 가능성을 완전히 배제할 수는 없을 것이다. 여전히 가능성으로 남아 있는 것이다"라고 설명했다.
이 문제를 해결하기 위한 간단한 방법으로 야자와는 프롬프팅을 제안했다. 세계 설정 구축 문서나 요약된 스토리의 세부 사항을 제공하고, '이 세계 설정만 고려하라'고 명시함으로써 AI의 범위를 좁힐 수 있다고 한다.
마이크로 문맥에 대해서는 '누가 어떤 상황에서 누가 무엇을 하고 있는지'를 명확히 하는 것이 중요하다고 지적했다. 캐릭터의 배경 정보와 장면의 상세 정보를 AI에 제공함으로써 번역의 품질이 향상된다고 한다.
야자와: 전문 번역가로서 인정하지만, AI는 이 데이터를 인간보다 더 빨리, 때로는 더 철저하게 참조하여 처리할 수 있다. 중요한 것은 AI가 화자의 이름과 장면의 세부 정보를 즉시 사용할 수 있어야 한다는 것이다. 이것이 없으면 AI는 최고 품질의 결과를 제공할 수 없다.
■ 문맥 이해의 중요성을 보여주는 구체적인 사례
야자와는 문맥의 중요성을 보여주는 구체적인 예로 'I saw her duck'이라는 문장을 들었다. 추가 문맥이 없으면 '그녀의 오리를 보았다'인지 '그녀가 몸을 굽히는 것을 보았다'인지 정답률은 약 50%에 불과하다. 그러나 앞뒤의 대화를 읽게 함으로써 AI는 장면에 오리가 존재하는지 여부를 이해할 수 있다고 한다. 또한, 매크로 문맥이 게임 설정에 오리가 존재하지 않는 경우(예: 멸종했거나 쥐로 진화한 경우 등), AI는 그 문장이 '그녀가 몸을 숙였다'는 것을 의미한다는 것을 더욱 확신할 수 있다고 한다.
야자와는 미묘한 문맥의 예로 다음과 같은 사례를 들었다.
1. 다의성
'fire'는 여러 가지 일본어로 번역할 수 있다(화재, 발사, 해고 등). 문맥이 없으면 구글 번역보다 더 좋은 결과를 얻을 수 없다.
2. 1인칭 대명사의 다양성
일본어의 '나'만 해도 십여 가지 이상의 선택지가 있으며, 적절한 것을 선택하려면 문맥이 필요하다. 야자와는 “왜 일본어 팀이 다른 언어 팀보다 번역에 대해 더 불평하는 것처럼 보이는지 궁금하지 않나? 이것이 그 이유일지도 모른다"라고 농담처럼 언급했다.
3. 동아시아 언어의 특수성
많은 동아시아 언어에는 문법적 복수형이 없다. 예를 들어 일본어의 '卵(타마고)'이 하나의 알을 가리키는지, 여러 개의 알을 가리키는지 구분이 없다. 또한, 형제를 언급할 때 형제가 나이가 많은지 적은지를 명시할 필요가 있다. 즉, 'I have a brother'라는 영어 문장을 동아시아 언어로 번역하려면 그 형제가 나이가 많은지 적은지 알아야 한다.
가장 인상적인 예로 야자와는 LLM의 능력을 보여주는 '숨은 메시지'의 예를 소개했다. 각 행의 첫 글자가 '도와주세요'(help)라는 단어를 형성하고, 영어 번역에서는 'Help me'로 읽히는 예다.
“솔직히 말해서, 이런 일이 가능하다는 사실에 나 자신도 놀랐다. 왜냐하면, 수동으로 사람의 개입이 필요하다고 항상 생각했기 때문이다"라고 말하며, "이것은 단순히 버튼을 누르는 것만으로 얻은 것이 아니라 엔지니어와 협력하여 사전 번역 분석을 수행한 결과이다"라고 덧붙였다.
■ DMM 게임 번역의 혁신적인 접근 방식 - 'Neo-Localization Company'란?
노다는 야자와의 발표에 이어 DMM 게임 번역의 비즈니스 모델과 실제 워크플로우에 대해 자세히 설명했다.
“여러분은 앞서 설명한 내용 때문에 우리가 모든 것을 다 하는 AI 번역 SaaS 솔루션을 제공한다고 생각할 수도 있다. 하지만 분명히 말씀드리고 싶은 것은, 우리는 단순한 AI 번역 SaaS 서비스를 제공하는 것이 아니다"라고 강조하며 다음과 같이 설명했다.
노다: 야자와가 언급한 문제를 해결하기 위해 우리는 AI 네이티브 번역 회사를 구축하고 있다. 이것은 일본에서 우리가 선도적으로 추진하고 있는 'Neo-Localization Company'라는 개념이다. 구체적으로는 기존의 번역회사를 AI로 혁신하는 것이 아니라, AI 에이전트를 중심으로 새로운 워크플로우를 처음부터 설계하고 있다.
노다는 먼저 'AI 에이전트'에 대해 설명하면서 Anthropic의 개념도를 참고하여 “간단히 말해, 인간이 LLM에게 목표를 제공하고 LLM이 자율적으로 작업을 분해하여 환경과 상호작용해 지속적인 피드백을 제공하면서 작업을 완료하도록 유도하는 것”이라고 정의했다.
번역의 경우, 목표는 특정 콘텐츠를 현지화하는 것이지만, 필요한 작업은 상황에 따라(기존 용어집의 사용 가능 여부, 문맥 데이터의 양, 데이터의 청결 여부 등) 크게 달라질 수 있다고 한다.
“우리는 이러한 변화하는 조건에 따라 작업을 동적으로 조정하여 각 프로젝트를 독자적이고 유기적으로 처리하고 있다"라고 설명했다.
현재 DMM 게임 번역에서는 워크플로우의 약 절반 정도에서 AI 에이전트를 활용하고 있다고 한다. “다양한 게임 개발 데이터를 하나의 AI로 관리하는 것은 근본적으로 어렵기 때문에 SaaS 솔루션은 채택하지 않고 있다"고 이유를 밝혔다.
■ 실제 워크플로우 - AI와 인간의 협업
노다는 실제 워크플로우를 자세히 설명했다. 먼저 고객사로부터 개발 데이터를 받는다. 이는 스프레드시트 형식이나 텍스트 형식으로 추출된 게임 데이터를 가정하고 있다.
노다: 우리는 먼저 이 개발 데이터를 AI 에이전트에 입력하고, 어떤 데이터가 필요한지 평가한다. LLM의 미세 조정에 최적화되어 있는지 확인하고, 웹 검색이나 용어집 생성이 필요한지 여부를 결정한다.
노다는 이 준비 단계가 매우 중요하다고 강조했다. “AI와 인간의 협업을 포함한 이 준비는 기본이며, 이를 통해 게임 타이틀에 특화된 번역 AI 패밀리가 만들어진다”
문맥과 데이터가 준비되면 애플리케이션은 캐릭터의 성격, 장면의 맥락, 대화 상대에 따라 모든 스크립트를 효율적으로 번역하고 즉시 번역 텍스트 파일을 생성한다. 야자와 같은 번역 전문가는 문맥의 적절성, 용어집, 스타일 번역, 번역 프롬프트 엔지니어링에 대한 피드백을 제공한다. “번역가가 자신의 AI를 관리하는 이 접근 방식은 현재로서는 최적의 결과를 가져오고 있다"고 노다는 말했다.
타임라인에 기반한 워크플로우에서는 고객이 선호도와 요구사항을 입력하면 AI 에이전트가 이를 해석하여 데이터 준비, AI 훈련, 용어집 적용, 번역 검토를 수행한다. “물론 고객의 검토는 우리의 범위를 넘어서는 결정에 필수적이며, 우리는 고객과 AI 에이전트를 연결하는 인간 중개자의 역할을 하고 있다”고 설명했다.
번역 자체는 매우 빠르게 이루어지며, 100만 단어의 번역도 단 몇 시간 만에 완료되는 경우가 많다고 한다. “우리의 세심한 준비와 설정으로 AI가 최고 성능으로 작동하여 전례 없는 품질과 속도를 실현하고 있다"라고 말했다.
“단순하고 직접적인 프로세스처럼 들릴 수 있지만, 이 인간과 AI의 피드백 루프가 가장 중요하고 복잡한 요소다"라고 노다는 강조했다. 따라서 프로세스의 절반만 AI 에이전트를 기반으로 한다고 설명한다.
노다: 종종 처음에는 AI 없이 일부 작업을 처리하고, 그런 다음 점차 AI로 전환하고 있다. 이러한 실습 접근 방식이 필요한 이유는 게임 번역이 상황, 제목, 타이밍, 회사마다 크게 다르기 때문이다. 따라서 하나의 워크플로우로 모든 것을 해결할 수 없다.
■ 기존 번역회사와의 차이점과 성과
“전통적인 번역회사와 우리는 무엇이 다를까? 나는 그것을 네오 번역 회사라고 부른다"라고 노다는 주요 차이점을 다음과 같이 설명한다.
1. AI가 번역의 대부분을 담당
말 그대로 대부분의 번역은 MT 포스트에디팅과 같은 전통적인 방법이 아닌, 사람이 직접 번역을 한다.
2. 초고속 번역 처리
AI가 설정되면 100만 단어도 초인적인 속도로 번역을 완료한다.
3. 문맥 지식의 영구적 저장
중요한 문맥 데이터는 더 이상 개별 번역가에게 의존하지 않으며, AI는 잊어버리거나 퇴사하지 않기 때문에 문맥적 지식은 말 그대로 영원히 저장된다.
단점은 “초기 설정이 중요하고 시간이 오래 걸린다는 것이다. 게임별 번역 데이터는 데이터 형식에 대한 미세 조정이 필요하다"고 설명한 노다는 "하지만 현재는 1~2주 만에 세팅을 완료해 비교할 수 없는 번역 속도를 구현하고 있다"고 덧붙였다.
구체적인 성과로 다음과 같은 KPI를 소개했다.
▲ AI 에이전트 설정 후 1일 만에 100만 단어 납품
▲ 최저 3센트/단어부터 시작하는 경쟁력 있는 요금 설정
▲ 서비스 시작 후 6개월 만에 50개 타이틀 번역 완료
▲ 일본어를 제외한 10개 이상의 언어 지원
▲ 포스트에디팅 없이 AI 번역을 그대로 릴리스하는 클라이언트도 존재함
■ 번역가의 미래와 게임 현지화의 전망
강연의 마지막에 노다와 야자와는 번역가의 미래와 게임 현지화의 전망에 대해 의견을 나눴다.
야자와는 번역이라는 일이 두 가지 부분으로 구성되어 있다고 설명했다. “먼저, 텍스트를 A언어에서 B언어로 변환한다. 그다음, 그것을 발행한다. 지금까지는 한 사람의 머릿속에서 이루어졌다. 하지만 이제 AI는 변환 부분을 인상적인 정확도와 엄청난 속도로 처리할 수 있으며, 이는 계속 개선되고 있다"라고 말했다.
“AI가 변환 부분을 맡는 것은 사실상 피할 수 없는 일"이라고 인정하면서도, "그렇다고 해서 인간 번역가에게 남은 것은 다듬는 일만 남는 것은 아니며, 언어 능력은 AI와 협업할 때 강력한 자산이 될 수 있다"고 강조했다.
번역가라는 직업이 재정의되고 완전히 새로운 역할이 진화할 것이라고 야자와는 예측한다. “많은 번역가가 어떤 의미에서 현지화 디렉터로 진화할 것으로 생각한다. 또 어떤 사람들은 독립적으로 일하면서 자신이 정말 좋아하는 게임에만 집중하는 것을 선택할 수도 있다"라고 낙관적인 전망을 내비쳤다.
게임 현지화의 미래에 대해 야자와는 “현지화 비용이 판매를 정당화할 수 있느냐는 문제는 곧 과거의 일이 될 것”이라고 예측했다. 그리고 “조금 소박하게 들릴지 모르지만, 지루하고 반복적인 작업을 줄이고 정말 중요한 부분에만 시간을 할애하는 것이 저의 목표"라고 말했다.
이에 대해 노다는 “AI는 단순히 저렴한 번역을 제공할 뿐만 아니라, 번역가들이 보다 본질적인 작업에 집중할 수 있게 함으로써 현지화되는 게임의 수와 지원되는 언어가 크게 증가하여 게임 현지화의 민주화로 이어질 것이라고 믿는다”고 말했다.
■ 게임 현지화의 미래를 바꾸는 AI 에이전트
DMM 게임 번역의 강연은 단순한 기계 번역의 개선에 그치지 않고 AI 에이전트를 활용한 게임 현지화의 새로운 패러다임을 제시하는 자리였다.
기존의 기계번역+포스트에디팅 방식에서 벗어나 AI와 인간의 협업을 통한 'Neo-Localization Company'로서 새로운 비즈니스 모델을 구축했다. 매크로 문맥(세계 설정)과 마이크로 문맥(개별 장면이나 상황)을 AI가 적절히 이해하도록 하는 방법을 확립하여 게임 번역 특유의 복잡한 요구사항에 대응하고 있다는 점이 획기적이다.
'완전 자율형 번역 서비스'라는 미래상을 향해 꾸준히 나아가고 있는 DMM 게임 번역의 노력은 게임 개발자들에게 더 많은 언어에 대한 현지화를 저렴한 비용으로 실현할 수 있는 가능성을 제시하고 있다. 이는 한정된 자원으로 세계 시장을 목표로 하는 인디 개발자들에게 중요한 의미를 가질 것이다.
한편, 번역가의 역할은 '텍스트를 변환하는 사람'에서 '번역 프로세스와 AI를 관리하는 디렉터'로 변화할 것으로 예상된다. 이러한 변화를 받아들이고, 인간과 AI가 각자의 강점을 살려 협업함으로써 게임 현지화의 미래는 더 빠르고, 더 저렴하고, 더 높은 품질로 나아갈 수 있을 것이다.
저작권자 © 게임뷰 무단전재 및 재배포 금지
