경고: 이 글은 듀오링고 에스페란토 한국어 코스가 왜 불가능한가에 대한 글입니다.

 

경고: 매우 긴 글입니다.

 

왜 듀오링고(Duolingo)인가?

 

듀오링고(Duolingo)는 언어를 배우기 위한 좋은 학습도구입니다.

 

Duolingo가 좋은 이유는 매우 높은 품질을 보장하고, 지속적으로 학습자들의 학습을 관찰하고 분석하여, 더 좋은 학습 커리큘럼을 만들려고 치열하게 개선하기 때문입니다. Duolingo는 특정 언어쌍, 예를 들어 "한국어 화자를 위한 영어" 이런 식으로 특정 언어 화자와 대살 언어에 최적화된 학습 코스를 제공합니다.

 

그래서 전세계 젊은이들 사이에 Duolingo로 에스페란토를 배웠다는 사람이 지속적으로 늘고 있습니다. 스마트폰으로 편리하게 학습할 수 있고, 학습자 스스로가 다른 사람의 도움 없이 직접 학습할 수 있기 때문에, 에스페란토 보급하는데 이보다 더 좋은 도구가 없습니다. 지금까지 100년의 에스페란토 역사 중에, 에스페란토 학습자를 Duolingo 만큼 많이 양산해 낸 학습 코스가 없습니다

 

영어가 되는 사람은 Duolingo를 이용해서 영어로 Esperanto를 배우는 것이 가장 좋습니다.

 

Duolingo의 기능적인 장점은 아주 많습니다. (1) 인기가 높아서 쉽게 전파 가능, (2) 스마트폰으로 쉽게 학습 가능, (3) 특정 언어에 맞는 최적화된 콘텐츠, (4) 단순 암기가 아닌 다양한 변형을 응용하는 학습, (5) 소리, 문법, 단어 종합적인 학습, (6) 게임하듯이 다양한 방식으로 문제를 맞춰 가는 방식 ...

 

그런데...

 

왜 듀오링고(Duolingo)가 문제인가?

 

문제는 고품질에 따른 희생이 발생한다는 것입니다. Duolingo는 최상의 콘텐츠를 만들기 위해서, 어중이 떠중이 콘텐츠는 과감하게 포기합니다. 새로 학습코스를 만들 때에도, 철저하게 콘텐츠를 검증하고 하기 때문에, 학습 코스 하나 만드는데 2년 가까이 걸립니다.

 

2019년 5월 현재, 영어 외에, 스페인어 화자를 위한 에스페란토 코스가 일반 공개된 상태이고, 포르투갈어 사용자를 위한 에스페란토 코스가  개발 중에 있습니다.  자세한 내역은 https://incubator.duolingo.com/ 에 가시면, 듀오링고에서 제공하는 모든 언어 쌍을 볼 수 있습니다. 일반공개 79개, 개발중 26가지... 약 100개 정도의 최상급 품질의 외국어 코스가 있습니다. 코스가 많은 것 같지만, 그렇지 않습니다. 어느 언어를 위한 어느 언어 학습 코스, 이런 식으로 한쌍으로 표현되기 때문에, 100개 언어 화자를 위한 100개언어 코스를 다 만들려면, 1만개 코스가 필요합니다. 전체 수요 대비 1% 도 안 되는 것이죠. 

 

Duolingo에서는 배우려는 사람이 얼마나 많은지 그 수요를 감안해서 코스를 만듭니다. 한국어의 경우, 한국어로 영어를 배우는 코스와, 영어로 한국어를 배우는 코스는 있습니다. 중국어로 한국어를 배우는 코스가 현재 개발 중에 있습니다.

 

생각해 보면, Duolingo가 이런 정책을 지속적으로 유지하는 한, "한국어 화자를 위한 에스페란토 코스"는 만들어질 가능성이 거의 없다는 것을 알 수 있습니다. 한국어용 에스페란토 학습 코스는 아무리 높게 잡아도, 1000번째 이내 순번에 들어가지 않을 것입니다. 따라서 가까운 시일에 듀오링고 한국어용 에스페란토 학습 코스는 만날 가능성이 없습니다.

 

듀오링고에 콘텐츠를 올리는 것이 과연 얼마나 어려운 일인가?

 

Duolingo에 콘텐츠를 올리는 것이 얼마나 어려운 지를 볼 수 있는 수치적인 자료가 있습니다.

참고: https://duolingo.fandom.com/wiki/Course_list


※ 에스페란토/영어는 최종 공개되기까지 1단계+2단계 다 통과하는데 560일 걸렸고, 에스페란토/스페인어는 두단계 통과하는데 619일 걸렸고, 에스페란토/포르투갈어는 1단계에서 428일 이상 소요되었지만 아직 2단계로 넘어가지 못한 상태입니다.
 

영어/한국어는 833일 걸렸고, 한국어/영어는 677일 걸렸습니다.  2~3년 걸리는 어려운 일인 것이죠.

 

 

그럼 포기해야 하는가? 대안은 무엇인가?

 

만약에 Duolingo와 유사한 학습 코스를 Duolingo가 아닌 다른 방식으로 만들 수만 있다면, 그것도 괜찮은 방법이라고 생각합니다.

 

쉽게 생각해 볼 수 있는 방법은 "Duolingo 에스페란토/영어" 코스와 동일하게 동작하는 앱(App)을 직접 하나 만들면 안될까? 입니다. 뭐... 소프트웨어 동작이 그리 복잡하지도 않으니, 제대로 계획해서 개발에 나선다면 못할 것도 없지... 라고 생각했지만, 개발 비용이 10 Man/Month 이상 들 것이고, 소프트웨어 개발비 산정법으로 따지자면 대략 1억원 정도 예산이 필요한 규모입니다. 유사하게 동작한는 "에스페란토/한국어" 학습 코스를 만들 수 있을 것이고, 겉모양도 콘텐츠도 현재 Duolingo와 거의 동일한 복사본을 만들 수 있지 않을까 싶습니다.

 

예산 부족으로 포기.

 

Duolingo와 유사하게 동작하는 외국어 학습 도구에, Duolingo 콘텐츠를 이식하는 방식도 생각해 볼 수 있습니다.

 

 

인터넷 언어 학습 커뮤니티에서 "무료 외국어 학습 도구"라는 키워드로 검색해 보면, 최상위에 항상 등장하는 도구가 멤라이즈(Memrise)라는 것입니다. 순위로 따지면 Duolingo 다음 2등 정도 됩니다.

 

상위권 10위 내에 들어가는 외국어 학습 도구 중에서, Duolingo 대안으로 쓸 수 있는 게 3개 있습니다. 멤라이즈(Memrise), 퀴즈렛(Quizlet), 안키(Anki)입니다.

 

콘텐츠 저작과 사용법에 있어서 퀴즈렛(Quizlet)이 가장 간단합니다. 그래서 처음에는 Quizlet을 이용해서, 에스페란토 콘텐츠 저작을 시도했었습니다만... 결과적으로 적합하지 않다는 것이 드러났습니다.  가장 큰 문제는, 반복간격 학습법("Spaced Repetition")이라는 개념이 없기 때문이었습니다.

 

언어 학습에서 간격반복 학습법(Spaced Repetition)이란 무엇인가?

 

망각 곡선을 고려한 학습입니다. 어떤 것은 쉽게 외워 지고, 어떤 것은 죽어도 안 외워 지는 것을 누구나 경험했을 것입니다. 쉽게 외워 지는 것은 가끔씩 반복해도 잊혀지지 않습니다만, 안외워지는 것은 자주 반복 학습함으로써 기억에 남게 한다는 개념입니다. 개별 단어나 개별 표현 각각이 서로 다른 '최적의 반복 주기'가 있습니다.  단어마다 다르고, 또 사람마다 다릅니다.  그렇기 때문에, 학습 내용과 각 개인의 학습 진도에 맞춰져야 하기 때문에, 간격반복 학습(Spaced Repetition)을 실현하려면 컴퓨터의 도움이 필수적입니다.

 

요즘 나오는 인공지능(AI)을 이용한 수학 학습 사이트들에 들어 있는 핵심 기능이 "간격을 조절하는 반복학습"입니다. 학습자가 틀린 문제는 좀더 자주 풀어 보는 방식이죠. (오답노트 + 주기조절)

 

간격조절 학습법(Spaced Repetition)을 할 수만 있다면, 외국어 학습을 가장 효율적으로 할 수 있다는 것은 이미 증명된 사실이고, 그것을 구현한 소프트웨어가 여러 개가 있습니다.

 

안키(Anki)라는 앱(App)은 간격조절 반복 학습 방식(Spaced Repetition)이라는 개념을 실현하여 유명해진 소프트웨어이고, 특히 '단어암기' 분야에서 상당기간 1등 했던 앱입니다만... 문제가 있습니다. 안키(Anki)는 구식 소프트웨어라는 사실이죠. 딱 봐도 안 예쁩니다. 사용자들이 뭔가 써 보려고 하면, 절차도 복잡하고 사용 방법도 좀 어려운 편에 속합니다.

 

그래서 나온 것이 멤라이즈(Memrise)입니다.

 

멤라이즈(Memrise)라는 앱은 안키(Anki)의 대안으로 나온 앱입니다. 간격조절 반복 방식(Spaced Repetition)을 충실하게 구현하되, 사용자들이 친근하게 사용할 수 있도록 만들어진 좀더 현대화된 도구입니다.

 

Duolingo는 콘텐츠에 대한 품질을 위해서, 일반 사용자들이 콘텐츠 올리는 것을 허용하지 않습니다만, 멤라이즈(Memrise)나 안키(Anki)는 사용자가 콘텐츠 생성/업로드 하여 자가 학습하는 것을 허용합니다.

 

Memrise는 기본적으로 단어/어구를 암기하기 위해서 만들어진 도구입니다. (Anki 의 대안으로 나왔기 때문입니다.) 다만 좀더 현대화된 도구라서, Anki 보다는 더 다양한 방식으로 게임하듯 학습을 할 수 있다는 점에서 Duolingo와 유사한 면이 있습니다.

 

Duolingo 에스페란토 강좌 유사품을 Memrise를 이용해서 만들기

 

Memrise에 새로운 사용자 콘텐츠를 올리는 것은 비교적 간단합니다. (1) 학습할 에스페란토 단어/어구, (2) 우리말 표현, (3) 음성 녹음 3가지를 목록으로 업로드 해 주면, Memrise가 알아서 적절히 가이드해 줍니다. 따라서 콘텐츠 공급만 잘 해 주면 된다는 뜻입니다.

 

(1) 단순 단어/어구 학습만으로, Duolingo와 유사한 효과를 노릴 수 있는가?

 

Duolingo는 문법과 언어 구조를 학습시키는 기능이 있습니다. 같은 어구에 서로 다른 단어를 계속 대입 시켜서, 다양한 훈련을 할 수 있도록 콘텐츠가 제시되기 때문에, 사실상 학습을 완료한 사람이 다시 봐도 미묘하게 다르게 생성된 어구나 문장이 계속 나옵니다. Duolingo의 묘미라고 할 수 있습니다.  같은 의미의 유사한 다른 표현들도 같은 의미로 묶어서 동일하게 취급해 주는 기능도 있어서, 매우 현실적인 언어 학습을 가능하게 해 줍니다.

 

불행히도 멤라이즈(Memrise)나 안키(Anki) 같은 단순 암기 도구만으로는 그런 문법/어구 활용을 무한하게 학습하는 것은 불가능합니다.

 

그럼에도 불구하고, 유사한 효과를 노려볼 수는 있습니다. 

 

제가 생각하는 방법은 이렇습니다. 서로 다른 단어를 대입해서 생길 수 있는 무한한 변형이 있는 어구라 할 지라도, 그 뼈대가 되는 구조인 3~5단어만 익숙하게 연습하고, 몇가지 사례를 보여주면, 나머지 변형은 사람들이 알아서 스스로 머릿속으로 채워 넣을 것이라는 거이죠. 휴먼 인텔리전스를 믿어 보자는 것입니다.

 

따라서 3~4 단어의 뼈대 구조를 잘 제안해 보자는 것입니다.

 

예를 들면 이렇습니다. 

 

  • diras
  • diras, ke
  • hieraux diris, ke
  • parolas pri

 

이런 표현들은 뼈대에 해당합니다. 문법적으로는 주어 목적어 등이 생략되어 있지만, 이에 덧붙여 표현되는 몇가지 사례를 더 보여 주면 사람들이 자연스럽게 저 뼈대를 습득하게 될 것이라는 생각입니다.

 

(2) Duolingo는 완벽한 음성을 제공하는데, 음성은 어떻게 할 것인가?

 

Duolingo 이후로 전세계 모든 사람들이 동의하는 단 한가지 발음 모델이 생겼습니다. Duolingo 처럼 발음하면 됩니다. 그게 모범입니다. Duolingo 발음에 대해서 불평하는 사람을 본 적이 없습니다.

 

Duolingo 에스페란토 음성은 전문적인 훈련을 받은 전문 에스페란토 성우가 매우 높은 품질의 녹음장치를 이용해서 녹음한 것이라서, 상당한 비용을 들이지 않으면 얻기 힘든 콘텐츠입니다. 전문 성우를 사용하는 비용을 고려해 봤을 때, 수천만원 들여도 그정도 분량과 품질을 얻기 힘들 것으로 생각됩니다. 이것만 봐도, Duolingo 콘텐츠 품질이 얼마나 높은 지 짐작하실 수 있을 것입니다. 어설프게 모방할 수 있는 수준은 절대 아니라는 것입니다.

 

Duolingo 음성 자료는 받아낼 수는 있지만, 받아 봐야 소프트웨어 구조가 달라서, Memrise에 이식하기 쉽지 않을 것입니다. 따라서 Memrise에 적합한 콘텐츠를 새로 만들어야 하고, 그에 맞는 음성 녹음도 새로 필요하다는 것이 제 결론입니다.

 

문제는 콘텐츠가 실험을 거쳐서 1년이상 천천히 완성될 것이라는 것입니다. 콘텐츠가 미묘하게 달라질 때마다 일정한 품질로 녹음을 새로 해 내려면, 사람이 해서는 안 되고 자동화된 방법을 사용해야 할 것입니다. 자동으로 에스페란토 텍스트를 읽어주는 툴을 찾아낸 것이 두가지가 있습니다.

 

(a) www.vocalware.com 에스페란토 음성 읽어 주기

 

www.vocalware.com은 에스페란토를 깨끗하게 읽어주는 전세계에 존재하는 딱 두개 소프트웨어 중에 하나입니다. Ludoviko라는 가상의 목소리로 읽어 주는데, 기계로 생성하는 음성 치고는 매우 모범적인 발음을 제공하고 있습니다. www.vocalware.com 만으로 충분할 것이라고 생각했는데, 결정적인 문제가 한가지 있습니다.

 

www.vocalware.com 은 'ho', 'ha', 'hu' 를 잘못 발음합니다. 'do', 'da', 'du' 로 발음합니다. 아마도 소프트웨어 개발자들이 개발하는 과정에서 버그가 들어간 것 같은데, 몇년동안 고쳐지지 않고 있습니다.

 

(다른 음성 생성 소프트웨어로는, 유명한 스포멘카(Spomenka) 여사의 음성을 이용해서 만든 소프트웨어가 있습니다. 품질이 vocalware보다는 더 좋지만, PC에 설치해야 하는 번거로움이 있고, 인터넷으로 쉽게 접근하기 어렵습니다.)

 

'ho', 'ha', 'hu'를 잘못 읽는 것 때문에, 몇년동안 www.vocalware.com이 있음에도 불구하고, 본격적인 학습 코스를 만드는 것은 시도하지 않고 있었습니다.

 

 

하지만...

 

(b) translate.google.com 의 다른 유럽언어 (에스토니아어, 이탈리아어, 루마니아어) 활용하기

 

에스페란토 음성은 루마니아어와 매우 유사하게 들립니다. 일부 www.vocalware.com으로 표현하기 어려운 음성은, 구글 번역기의 에스토니아어나 이탈리아어 음성 읽어주는 기능으로 대신할 수 있을 것이라는 생각이 듭니다.

 

그래서 시험 코스를 하나 만들어 봤습니다. 멤라이즈에 만들어 놓은 한국어 사용자를 위한 에스페란토 코스 첫 일부를 확인해 보시기 바랍니다.

 

※ https://decks.memrise.com/ 여기에 가서, 멤라이즈 가입하시고, 한국어 상태에서, 멤링고 키워드("Memlingo")로 찾으시면, 지금 제작이 진행되고 있는 코스를 보실 수 있습니다.

 

스마트폰 멤라이즈 앱(App)으로는 사용자 생성 코스를 검색할 수 없으므로, 인터넷 웹브라우저에서 멤라이즈 사이트에 가입한 후, 해당 코스를 찾아서 (검색 키워드: Parolu) 학습하기 버튼을 누르면, 자기 학습 목록에 이 코스가 포함됩니다.

 

그러고 나서, 스마트 폰 앱을 설치해서 보면, 해당 학습 코스가 자기 앱속에 들어 있을 것입니다. 시범적으로 만들어진 코스라 아직 콘텐츠 품질과 분량 면에서 부족합니다. 2019년 5월 현재 대략 목표치의 1% 정도 들어 갔다고 보시면 됩니다.

 

한국어 화자만을 대상으로 삼을 것인가?

 

애초에 Duolingo가 에스페란토/우리말을 받아주지 않아서 시작한 일입니다.  기왕에 콘텐츠를 저작한다면, 우리 만큼이나 취약한 환경에 놓여 있는 동아시아 몇개 국의 언어를 동시에 타겟으로 삼을 수도 있을 것이라는 생각이 듭니다.

 

그래서 초기에 대상으로 삼을 언어는 4개 입니다. 한국어, 일본어, 중국어(북경식), 베트남어. 이 나라 사람들은 다들 발음이 엉망이고 학습 속도도 느리다는 공통점이 있습니다. 학습자들이 상대적으로 많고 나름 강습도 제법 하는데, 전혀 에스페란토가 늘지 않는 것이 이상할 정도로 효율이 나쁜 언어들이라, 이 언어들을 우선 타겟으로 삼아볼 셈입니다.

 

콘텐츠 저작 과정을 모든 사람들에게 공개할 생각입니다. 아무나 들어와서, 콘텐츠를 수정할 수도 있습니다. 전혀 제약이 없습니다.

제작중인 학습코스 콘텐츠 보기: http://bit.ly/2VJvJKC  (구글 드라이브에 공유된 콘텐츠 저작 과정)

 

 

어떻게 콘텐츠를 모으려고 하는가?

 

초급용 EkParolu 코스 1개와 중급용 Progresiga 코스 1개 해서 2개의 코스를 생각하고 있습니다. 각각의 코스에는 2천~3천개 수준의 표현을 담고 있고, 주제별 묶음으로 대략 20개 단어짜리 100개 레슨로 이뤄진 코스가 될 것 같습니다.

 

자세한 구성은 http://bit.ly/2VJvJKC 의 내용을 보시면 짐작하실 수 있습니다.

 

프로젝트를 어떻게 끌고갈 것인가?

 

콘텐츠 생성이 수개월 걸릴 것으로 생각됩니다. 우리말 사용자를 기준으로 학습이 필요한 표현들을 실용성을 고려해서 만들면, 대략 4~5개월이면 전체 코스 한개를 만들 수 있을 것입니다.

 

만들어진 코스는 주기적으로 소수의 사용자들에게 검토시켜서, 개선사항을 개선하는 식으로 가면, 대략 7~8개월 이내에 1차적으로 대량 배포 가능한 코스가 하나 만들어 질 것으로 보고 있습니다.

 

한국어가 아닌 다른 언어(중국어, 일본어, 베트남어)는 우선 자동번역된 콘텐츠로 초안을 만들고, 각 언어별로 그언어를 잘 하는 사람의 수작업 교정이 필요합니다. 

 

대략 전체 프로젝트에, 기초 콘텐츠 생성에 1인, 각 언어별 감수/수작업 교정 담당자가 2명 정도 해서 10여명 정도 되는 국제 협력 프로젝트가 될 것 같습니다.

 

대략 내년 3월 정도까지를 목표로 삼으면, 듀오링고 에스페란토/영어에 대응되는 아시아판 에스페란토 학습 코스를 만들 수 있지 않을까 생각합니다.

 

이 작업에 관심이 있으신 분들은 댓글로 관심을 표명해 주시기 바랍니다. 콘텐츠 저작/교정에 직접 참여 하시기에 필요한 몇가지 가이드라인을 보내 드리겠습니다.

 

가이드 없이 직접 고쳐 보겠다고 용기를 내시는 분도 있을 수 있습니다. 지금 콘텐츠 저작 문서는 아무나 허락없이 수정할 수 있도록 완전 공개된 상태입니다.

 

콘텐츠가 점차 자라남에 따라서, 그 콘텐츠를 기반으로 직접 돌려 볼 수 있는 멤라이즈 앱 코스로 변환해서 테스트 버전을 만드는 것은, 제가 가끔씩 할 예정입니다.

 

https://decks.memrise.com/ 여기에 가서, 멤라이즈 가입하시고, 한국어 상태에서, 멤링고 키워드("Memlingo")로 찾으시면, 지금 제작이 진행되고 있는 코스를 보실 수 있습니다.

 

해당 프로젝트 홈페이지는 https://memlingo.esperanto.or.kr/ 입니다. 

 

--노모타.