거시기 머시기... 짧게 씀으로써 오히려 더 선명하게 전달될 수도 있습니다.
서울칼럼니스트 모임 필자들만 글을 올릴 수 있습니다.           목록 홈으로


2004/12/25 (17:44) from 211.209.29.114' of 211.209.29.114' Article Number : 98
Delete Modify 홍순훈 Access : 8610 , Lines : 18
번역 시스템 업그레이드하기
아래 <1> 문장은, 12월 20일자 칼럼 '괴기한 북한의 유골 조작' 앞 부분이다. <2> 문장은, 화면 오른쪽 '일본어판 칼럼니스트'를 클릭하여 <1> 문장을 번역한 것이다. 문장 중 {  }로 묶은 부분은 잘못 번역된 것들로, 아래 설명을 위해 표시했다.

<1> 최근 NHK{의} 위성방송인 BS{가}, 일본 {수상}을 비롯한 여러 사람들이 분개하는 모습을 계속 보여줬다. 북한이 1977년에 납치한 사람의 유골이라고 일본에 보낸 것이 '가짜'라는 것이다. 불에 탄 뼛조각들이었지만 DNA{감정}을 {해 보니}, 납치됐던 사람의 것이 아님은 물론 2 사람의 뼈를 합한 것이었다고 한다.
<2> 最近 NHK{義} 衛星放送である BS{街}, 日本 {受賞}を 含めた 色? 人?が 憤慨する 姿を 引き?き 見せてくれた. 北朝鮮が 1977年に 拉致した 人の 遺骨だと 日本に 送った のが 'にせ物'という のだ. 火に ? 骨片たちだったが DNA{感情}を {日 見}たら, 拉致された 人の のが ないことは 勿論 2 人の 骨を 合わせた のだったと する.

몇 년 전부터 일본의 인터넷신문들이 위와 같은 형태로 한국어판을 서비스하고 있다. 한국과 중국 몇몇 언론사도 외국어판을 내고 있다. 이런 새로운 움직임에서 중추 역할을 하는 것이 번역 시스템일 텐데, 위에 표시한 오류의 내용들이 시스템의 문제점이라 볼 수 있다. 이 문제점을 해결하는 데 다음과 같은 생각도 참조됐으면 한다.

첫째, NHK 등 영문 뒤에 붙은 '의', '가'란 토씨(조사)가, 한국어 발음 그대로 '義', '街'란 한자로 바뀌었다. 특수한 상황에서는 토씨가 그렇게 변환되도록 프로그래밍된 것 같다. 그런데  한국어나 일본어는 토씨를 정확히 붙이지 않거나 생략해도 의사 전달에 큰 지장이 없다. 위와 같은 상황에서는 번역될 부분을 번역시키지 말고, 그냥 빈 칸으로 남겨 주는 것이 문장 이해에 더 효과적일 것 같다.

둘째, 首相이 受賞으로, 鑑定이 感情으로 번역되어, 독자는 뭐가 뭔지 이해할 수 없게 되고 번역 자체가 무의미해진다. 이렇게 되는 까닭은, 컴퓨터 한자 표기 자판에만도 '수상'은 25 종류, '감정'은 9 종류나 서로 다른 뜻의 낱말들이 실려 있다. 이 중에서 맞는 낱말을 컴퓨터가 골라내게 하는 것이 현재는 불가능하기 때문일 것이다. 이것이 가능하려면, 번역 시스템이 사람과 같은 수준의 지능을 가져야 한다. 즉 글 전체 내용을 파악하고, 거기에 맞는 한자 낱말을 취사 선택할 수 있어야 된다.
언젠가는 그런 기술 수준이 되겠지만 우선은, 하나의 발음에 몇 개(예를 들면 3개) 이상의 한자 낱말이 있다면, 굳이 한자로 변환시킬 필요가 없다. 그 발음만을 '가나' 문자나 영문으로 글자체를 구별하여 적어 주면 될 것 같다. 현재 일본어에서 외래어를 표기하는 방식이다. 한자 낱말에 대한 발음이 한국어나 일본어나 비슷하므로, 독자는 문장 속에서 그런 구별된 문자가 무슨 뜻인지 쉽게 알아 챌 수 있다. 알아 채지 못하더라도 전혀 다른 뜻의 한자 낱말이 들어간 것보다는 문장을 이해하는 데 더 유효하다.

셋째, 감정을 '해 보니'가, '日(해) 見(보니)'로 번역된 것은 옛날 이두 문자꼴로, 내용은 재미 있다. 그러나 물론 잘못된 번역인데, 번역 시스템이 품사를 구별 못하고, 동사의 어간이나 어미의 복잡한 변화를 인식 못한 결과다. 동시에 일본어를 한국어로 번역하는 시스템을, 아무 조정 없이 거꾸로만 작동시킨 결과로도 보인다.
이런 형태로 시스템을 작동시켜 번역을 100% 성공시키려면, 한국어의 품사와 그 변화가 일본어와 꼭 같아야 된다. '하다'라는 동사만 해도, 하니, 하여야, 해서, 해 보니 등 아마 수백 가지도 더 분화 파생될 것이다. 이런 변화가 일본어에서도 일어나야만 된다는 것이다.
여기서 발상의 전환이 필요하다. 일본어를 비롯한 대부분의 외국어는 한국어에 비해 낱말 변화가 복잡하지 않다. 따라서 상호간에 100% 번역이 가능하지도 않고, 이를 추구하면 할수록 더 많은 오류를 발생시킨다. 그러므로 번역의 주체인 한국어가 객체인 일본어에 맞춰, 간추리고 규격화된 낱말의 틀로 번역 시스템을 만들어 일본어를 찍어내는 수밖에 없다. 예를 들어 '감정을 해 보니'는, '감정했다 그러니'로 시스템이 인식하고 처리하게 만들어야 된다는 것이다. 낱말이 스타카토식으로 따로따로 놀고, 그 낱말을 이리저리 옮겨 놓음으로써 내용을 변화시키는 유럽의 언어들을 생각해 보면 위에 쓴 뜻을 쉽게 이해할 수 있을 것이다.

-2004.12.25

Backward Forward Post Reply List