안녕하세요. 오토소장 입니다.
지난 글에서는 실시간 AI OCR을 이용하여 일본어를 인식하고 Text로 변환하는 작업을 진행했었는데요. 이번 시간은 수집된 일본어 단어 및 문장들은 네이버 파파고(Papago)를 사용하여 번역하였습니다. 이를 통해 만든 단어집(WordBook) DB와 유사도 비교 알고리즘 적용을 통해 번역의 정확성을 기존보다 크게 향상시켰습니다.
또한 한식구 네이버 카페의 낙월옥량님이 예전에 롬 분석을 해서 정리해놓은 랑그릿사 대사집 관련 강의글과 대사 추출 파일이 있는데요. 이 자료와 네이버 Papago 번역기 API를 이용해서 WordBook DB를 만들었습니다[1].
사실 AI OCR과 AI 번역기의 조합으로는 정확한 번역을 하는데에 한계점이 많습니다. 매번 같은 대사에서 다르게 번역될 가능성이 높기 때문입니다. 그래서 실험적으로 롬 분석을 통해 수집된 대사집을 추가적으로 이용하는 방법을 생각해보았습니다.
개인적으로는 훨씬 만족도가 높은 결과물이 나온것 같습니다. WordBook DB의 번역된 한글을 사람이 조금만 더 다듬어 주면 현재보다 높은 품질의 대사를 만들 수 있습니다.
이번 프로젝트를 통해 롬 분석의 세계에 대해서 알게 되었으며 제가 또 하나 정복해야 되는 산이라는 것을 알게 되었네요.
PS. 일본어 번역은 네이버 파파고보다 Kakao i 번역이 더 자연스러워보이는건 저만 그런가요^^?
실험 환경 구성
- 닌텐도 슈퍼 패미컴 (SFC, SNES) 및 랑그릿사 (Der Langrisser)
- 파운드(Pound) AV to HDMI 영상 변환기
- 에버미디어(EverMedia) GC311 영상 & 음성 캡쳐 장비
- COLORFUL 지포스 RTX 3060 토마호크 D6 12GB LHR
참고 자료
[1] 낙월옥량. "[SFC] 데어랑그릿사 – 대사편(마지막)". 한식구 : 한글화를 하는 사람들의 모임, 2023-03-16, 2023-09-21 접속 확인.
GVT(GameVisionTranslator)는 현재 연구개발 단계입니다. 배포 가능한 품질을 확보한 v1.0이 만들어지면 베타 테스트를 위한 신청자를 모집하여 선택적으로 배포 예정입니다. 툴 자체는 무료 배포이나 게임 번역 DB는 유/무료로 구분되어 서비스될 수 있습니다. 참고부탁드립니다.