언어정보연구실 >> 윤애선 교수님

Bibliographical Background

석사 과정(논문 제목: ‘현대 불어의 수동문 분석’)에서 통사론(syntax)을, 박사 과정(논문 제목: ‘Les attitudes interlocutives(대화자 태도)’)에서는 의미-화용론(semantico-pragmatics)을 김용숙 교수의 지도 아래 전공하면서, 초기 연구는 이론 언어학(theoretical linguistics)에서 출발하였다. 전세계적으로 70년대와 80년대는 전산 언어학 분야의 암흑기로 그 명맥이 전산학자를 중심으로 소수의 연구자에 의해 이어 오고 있었으므로 언어학자들의 연구 영역 밖에 있었다. 윤애선 교수의 전산 언어학에 대한 관심은 1983년 한국언어학회 동계학술발표회 중 ‘인공지능’ 워크샵에서 출발하였다. ‘컴퓨터에 의한 언어 분석’ 가능성을 알게 되면서, 1984년 KIST에서 Fortran,Cobol, Pascal 등 프로그래밍 언어를 배우게 되었다. 물론 당시 컴퓨터는 키펀치로 뚫은 천공카드로 프로그래밍을 해야 하는 것이었다. 프랑스로 유학에서 지도교수(Bernard Pottier교수)가 초대 프랑스 자동 번역학회 회장이었으나, 아이러니컬하게도 전산 언어학에 매우 회의적이었다. 1989년 박사학위 취득 후 부산대학교에서 전산 분야에서 자연언어처리를 전공한 권혁철 교수를 만나 본격적으로 전산 언어학을 전공하게 되었고 지금까지 공동 연구를 하고 있다. 1990년에 ‘언어정보 연구실(Language Information Laboratory)’를 열었다. 1992-93년 미국 Stanford대학교 언어정보연구소(CSLI: Center for the Studies on Language and Information)에서의 연구년 동안 CALL 분야에도 관심을 갖게 되고, 이후 프랑스 Grenoble 대학 GETA의 Christian Boitet 교수, Nice-Sophia Antipolis대학 LILLA의 Henri Zingle 교수 등과 활발한 국제적 공동 연구를 하고 있다.

전공분야와 인지과학

인지과학을 ‘마음 문제를 지식습득의 관점에서 다양한 방법으로 접근하는 과학 이라고 정의하고, 대표적인 접근 방식을 ‘컴퓨터 프로그래밍에 의한 시뮬레이션’ 이라고 한다면 NLP와 CALL은 언어학, 전산학, 심리학, 교육학 등이 긴밀하게 연결된 정통적인 인지과학 분야이다.

전산언어학 및 자연언어처리
전산언어학 및 자연언어처리(대부분 두 용어의 구분은 하지 않으나, 구별하는 경우 전산언어학은 언어학적 접근방식이 강조되는 반면, 자연언어처리는 전산적인 접근방식이 강조된다.)은 ‘컴퓨터를 이용하여 인간의 언어를 분석하고 이를 응용하는 연구’로서 궁극적인 목표는 ‘인간과 동등한 또는 인간보다 더 나은 언어 사용 능력을 가진 에이젠트’ 의 개발이다. 멀게는 ‘터미네이터’나 ‘AI’와 같은 수많은 공상과학 영화에 나오는 로봇 또는 사이보그들의 언어 사용 능력 등에서 궁극적인 모델을 상상할 수도 있고, 가깝게는 ‘철자 교정기’, ‘문법 교정기’, ‘자동 번역기’, ‘전자 사전’, ‘음성 합성기’, ‘음성 인식기’ 등에서 전산 언어학 연구의 현 주소를 가늠해 볼 수 있다. 이를 위한 세부 분야는 이론 언어학의 세부 분야 이상으로 많다. 음향학, 음성학, 형태론, 어휘론, 통사론, 의미론, 화용론, 지식처리, 정보처리, 단일어 처리, 다국어 처리, 등등을 포함한다. 윤애선 교수의 주된 연구 대상은 한국어, 프랑스어, 영어다.

  1. 한국어의 경우 전산학자인 권혁철 교수와 함께 10여 년 이상 공동 연구를 수행하면서 한국어 철자 검색기 개발에 참여해 왔고, 2002년부터는 국가지정 연구실(National Laboratory)인 ‘한국어 정보처리 연구실’ 에서
    ⓐ ‘전문 용어 시소러스(thesaurus: 개념 지도) 개발’,
    ⓑ ‘대용량 데이터를 이용한 언어 정보 추출’,
    ⓒ‘문맥을 이용한 중의성 분석’,
    ⓓ‘음성합성을 위한 텍스트 전처리’
    등 주제로 연구를 수행하고 있다.
    ⓒ는 국어 통사론을 전공하는 김인택 교수, 최규수 교수와 긴밀하게 연결되어 있고, ⓓ는 음성공학을 전공하는 김형순 교수와 음성학을 전공하는 이병운 교수의 연구와 관련된다.
  2. 프랑스어 연구는 프-한 이중어 기초 자료 구축에 주력하고 있으며 국내에서는 기술력과 자료의 양과 질에서 인정받고 있다. 3년에 걸친 프랑스어 형태소 분석기(Inflection 1.0) 개발, 10년이 넘어 걸린 불-한 전자 사전(FranCo 1.0), 불-한 연어 사전(F-K Collocation 1.0) 등의 자료는 앞으로도 오랫동안 진화할 것이다. 프랑스어를 대상으로 한 연구는 초기 윈도우 시스템의 입출력 장치의 불완전함을 극복하기 위해 다국어 처리(multi-lingual processing)와 함께 다양한 툴(tool)개발을 촉진하였다. 프랑스어, 한국어, 독어, 러시아어, 스페인어, 고대 그리스어를 포함하는 다국어 사전(MultiDico) , Authoring Tool인 EasyLang등이 그 대표적인 예다.
  3. 영어의 경우, 2001년부터 ETRI와 함께 패턴기반 번역기의 문틀과 사전 개발 등을 수행하고 있다.

컴퓨터를 이용한 언어 교육
성경에 나오는 바벨탑의 알레고리가 보여주듯이 원활한 의사소통은 모든 사람이 바라는 바이다. 그런데 인간의 언어에 관련된 정보는 매우 복잡하고 다기능적인 수많은 일을 해내는 우리 뇌의 1/2를 차지할 만큼 크다고 한다. 따라서 모국어를 배운 후 외국어의 학습은 매우 힘들고 어려운 과정이다. 외국어를 효율적이고 효과적으로 가르치기 위해 다양한 학습 방법과 매체가 제안되고 사용되어 왔다. 그 중 ‘컴퓨터’는 ‘지능적 튜터’의 역할을 할
수 있다는 점에서 다른 매체와의 차별성이 부각된다. 컴퓨터를 통해 ‘음성’을 들려주고 ‘영상’과 ‘텍스트’를 함께 보는 단순 제시 매체나 컨텐츠 provider에 머무르는 것이 아니라, 학생 개개인의 학습 기록을 남기고, 각종 테스트를 통해 학습 상태를 점검하고, 적절한 피드백을 통해 부족한 부분을 보완할 수 있는 guide가 되어야 한다는 것이 윤애선 교수의 연구가 지향하는 바이다.

 

    1. 컨텐츠 개발: CALL 컨텐츠는 전산언어학의 연구 결과와 긴밀하게 연결되어야 하며, 컨텐츠의 상호 이식을 위한 표준화 문제에 접근한다. 지능적인 CALL이라는 목표를 위해 지금까지 개발한 컨텐츠는 크게 다음 세 가지다.
      Voila는 1995년에 개발한 초기 CALL로 전문 저작 툴이 부족하고 국내에 CALL 프로그램이 없었던 시기에 만든 2학기용 초중급 프랑스어 학습 시스템이며 지능성보다는 멀티미디어 컨텐츠 provider에 가까우나 학생의 학습 패턴을 분석할 수 있는 기능을 최초로 개발하였다.
      ‘프랑스 문화와 언어’는 4학기 분량의 중고급 프랑스어 및 프랑스 문화와 지역 관련 컨텐츠로 2001년 개발된 것으로 멀티미디어 컨텐츠 provider 측면에서 매우 큰 역동성을 지니고 있으며, 전자 사전, 형태소 분석기 등의 연동으로 지능성을 제공하려고 하였다.
      ‘인지 불문법’ 은 2학기 분량의 불문법에 관한 컨텐츠로 2002년 개발되었으며, XML을 이용하여 컨텐츠의 재사용성과 지능성을 극대화하였으며, 평가에 의한 개별 학습 상태의 진단과 피드백을 제공한다. 이러한 컨텐츠 개발은 프랑스의 Henri Zingle 교수, 이화여대 김용숙 교수, 경기대 김학수 교수와 함께 수행하고 있다.
    2. 평가 시스템 개발: CALL 컨텐츠의 지능성 확보는 정확한 평가 시스템 개발과도 연결된다. 2000년부터 설계한 CyLang은 대규모 학습자를 대상으로 한 문제은행 구축, 동일 난이도를 가진 문제지 선택 시스템 개발, 평가 시스템 등을 포함하여 지금까지 부산대학교 언어교육원에서 4000명을 대상으로 사용되고 있다. 문제 은행을 구성하는 문항의 질 평가를 위해 통계학과의 손건태 교수님, 교육평가 전공자인 교육학과의 김석우 교수님, 이화여대 성태제 교수님과 논의하고 있다.