송동길 교수 (Texas A&M University)
From https://aiednet.kr/sub_posting/posting_view.php?number=126&dp1=information
원문입니다~
[2022년 7월]Thinking About the Bigger Picture Before Utilizing AI in Education
Donggil Song, Ph.D.
creative@tamu.edu
Associate Professor
Engineering Technology and Industrial Distribution
College of Engineering, Texas A&M University
인공지능을 교육에 활용하기 전에 큰 그림을 생각하며…
– 송동길
인공지능을 교육과 교수/학습에 활용하려는 노력은 그 역사가 다른 교육 분야에 비해 상당히 짧다고 할 수 있지만, 그렇다고 아주 최근의 일은 아니다. 학문적으로는 이삼십여 년 전부터 관련 분야의 학술지, 예를 들어, International Journal of Artificial Intelligence in Education, Journal of Educational Data Mining, and Journal of Learning Analytics 등에서 인공지능 활용이 활발히 연구되고 있다 (The International Journal of Artificial Intelligence in Education의 첫 호는 1989년에 발행되었다). 주로 학습자의 학습성과를 체계적으로 분석하거나(프로파일링, profiling)(Kizilcec et al. 2013; Vaessen et al. 2014), 학습 진행 방향(learning path) 분석 및 학습 패턴 프로파일링(Boroujeni & Dillenbourg 2019), 학습성과 예측 모형화(Mao et al. 2018), 학습자의 학습 지속 여부 예측(learner retention prediction)(Spoon et al. 2016) 등이 인공지능을 교육에서 활용하는 것에 관한 학문적 연구의 예로 볼 수 있다. 인공지능 분야에서 좀 더 세세한 접근을 살펴보면, 빅데이터와 머신러닝(machine learning)이 교육연구 분야, 예를 들어, 교육/교수/학습공학(educational technology, instructional/learning technologies), 학습과학(learning sciences), 학습분석학(learning analytics) 등에 활발히 적용되고 있다. 이 분야의 궁극적이고 주된 연구 목적은 적응적 학습 시스템(adaptive learning systems) 혹은 개인화된 학습 시스템(personalized learning systems)을 개발하는 것에 있다(Colchester et al. 2017; Song, 2018; Vandewaetere & Clarebout 2014).
아주 멋져 보이는 말들로 폼잡고 글을 시작해 보았다. 하지만 개인적으로는 한두 가지 반드시 짚고 넘어가야 할 질문이 있다. 그냥 ‘핫’하고, ‘좋은 게 좋은 거’라는 식의 접근은 곤란하다. 부작용 및 우왕좌왕이 생겨날 수 있기 때문이다. 나의 질문은 “인공지능이 무엇이고, 왜 그리고 어떻게 인공지능을 교육에 사용하려고 하는가? 누가 대상인가?”이다. 다시 말해, 한국에서 인기를 끌고 있는 인공지능활용교육에 대한 큰 그림을 잘 모르겠다. 미안한 말이지만, 여기서 이 질문에 답을 할 수 있는 실력이 없다는 점을 먼저 밝히고 싶다. 다만, 이러한 질문을 하는 이유는 혹여나 지나치게 막무가내식 진행이 벌어질까 걱정되는 마음이 있기 때문이다. 거의 잊혀진 듯 한 것을 굳이 끄집어내자면, 모 교수의 줄기세포연구가 공전의 히트를 쳐서 너도나도 뛰어들고, 정부지원이 샘솟고, 수의학과 인기가 치솟았던 흑역사가 떠오른다. 이 사건을 모르는 분들을 위해 (인공지능과는 크게 직접적인 관련은 없지만) 드론의 비유를 들고 싶다. 드론이 처음 개발된 후 수많은 종류와 다양한 성능의 드론이 개발됐고, 많은 사람이 하늘에 드론을 날리고 있다. 저마다의 목적이 있겠지만, 그저 ‘드론이 있으니까’ 날려보자는 인상이 강하다. 그러다 보니 다양한 사건 사고를 목격하게 된다. 항공기나 군용기 군용시설 방해, 드론의 소음, 사람이나 동물과의 충돌, 고성능 카메라를 탑재한 드론의 사생활 침해 문제, 심지어 테러나 범죄에도 이용되는 문제가 나타났다. 다수의 사건 사고가 일어나고 나서야 드론 금지구역이 정해지고, 드론 등급이 생기고, 등급에 따른 자격증이 생기는 등의 해결책이 제시되고 있다. 인기가 먼저 치솟은 후에 문제가 생겨났고, 무언가 우왕좌왕, 소 잃고 외양간 고치기라는 생각이다. 이러한 마음이 인공지능을 활용한 교육에서도 느껴질까 봐 두렵다. “드론이 생겼으니 하늘에 날리자~ 재밌겠다!”와 같이 “인공지능이 있으니 교육에 써보자~ 도움되겠지!” 같은 느낌이다.
무엇을 인공지능이라 부를 수 있고, 어떠한 것은 인공지능이 아닌지에 대한 지침 없이, 어떠한 부작용이나 문제점이 생길 수 있는지에 대한 예측 없이, 인공지능을 적용했을 때 그 성과를 정확히 측정할 방법 없이, 효과 지속성(sustainability)의 여부에 관한 체계적인 연구 없이, 특정한 학습 상황에서 사용해야 하는지 일반적으로 만병통치약 마냥 사용해야 하는지에 대한 분석 없이, “야~ 드론이다~” 하면서 마냥 좋아하며 하늘에 날리듯 인공지능을 교육에 사용하는 것은 무서운 일이다. 물론, 모든 문제점을 한 번에 예측할 수는 없다. 그러나 어느 정도 지침과 방향성을 정하고, 큰 그림을 그린 후 시행하면 그 부작용을 조금 줄일 수 있으리라 생각된다. 그래도 늦지 않다. 미국에서 주로 연구 활동을 하는 입장에서 보면, 한국인의 신속한 진행은 크나큰 장점이다. 특히 ‘빨리빨리 문화’의 효율성과 효과성을 높이 평가하는 편이다. 그러나 큰 그림 관점에서 보았을 때, 그리고 ‘교육’이라는 특수성(결과가 나타나는 데 긴 시간이 걸린다는 점, ‘우리의 미래가 달려있다!’는 점 등)을 고려했을 때, 인공지능을 활용한 교육에 대해 지나치게 서두르는 모습이다. 조금 천천히 가도 괜찮다 (제대로만 한다면).
인공지능이 발전한 것은 어제오늘 일이 아니지만, 최근 들어 이 엄청난 무게의 단어가 주는 다양한 의미 아래 수많은 장밋빛 미래가 점쳐지고 있다. 인공지능이 인간과 비슷한 혹은 더 뛰어난 능력을 갖춘다는, 혹은 갖출 것이라는 전제하에 인공지능 시스템에 대한 무한 신뢰가 한국 교육계에 생겨나는 느낌이다. 인공지능이 인간 수준보다 더 뛰어난 미세한 추론과 판단력까지 겸비하리라는 것이다. 5년 만에 한국에 방문하게 되었는데, ‘인공지능’ 단어가 들어간 각종 새로운 이름의 전공이 대학교에 생겨나고, 이공계가 아닌 분야에서도 인공지능전문 교수를 채용하려 하고, 초등학교 정문에 인공지능교육 우수 학교라는 표창의 현수막이 걸린 것을 보았다. 물론 인공지능은 이미 우리 곁에 있다. 실제로 인공지능 스피커를 사용하고 있고, 같은 도로에서 자율주행자동차와 함께 주행하고 있다. 인공지능이 우리의 삶을 그리고 우리의 학습을 획기적으로 변화시키고 있다는 생각에 많은 사람이 인공지능을 교육에 ‘잘’ 활용하고자 노력하는 것은 물론 당연하다. 그런데 너무 우르르 몰리는 것은 아닌가? 너무 빨리 나가는 것은 아닌가?라는 걱정이 든다. 잠시 호흡을 가다듬고 처음부터 생각해 보자. 우선 고려해야 할 점은 ‘인공지능’이 상당히 넓은 범위의 용어라는 것이다. 교육에서 그리고 학습에서 사용하기 위해 그 뜻을 정확히 하고 범위를 정하는 일은 매우 중요하다.
인공지능이 뭐길래?
구글에서 인공지능과 Artificial Intelligence 혹은 AI를 검색해 보자. 우선 Images 탭을 보면, 로봇, 머신러닝, 네트워크 모형, 컴퓨터, 두뇌 모형 등 각종 다양한 형태의 관련 사진들을 볼 수 있다. 전체검색에서는 자율주행자동차, 알파고 같은 인간을 이기는 게임, 수술 로봇, 음성인식, 얼굴인식, 자동번역, 스팸 필터링 등의 엄청난 양의 자료를 볼 수 있다. 그 다채로움을 한마디로 정의하기가 어렵다. 이러한 혼란에서 그나마 범위를 줄여서 생각해 볼 수 있는 키워드로 빅데이터를 들 수 있다. 최근 인공지능의 경향을 보면 데이터 기반으로 흘러간다고 할 수 있다. [물론 데이터가 크게 작용하지 않는 인공지능 분야도 많다. 이 분야의 과거와 관련된 내용, 예를 들어 Intelligent Tutoring Systems(Beck et al., 1996), 규칙기반 시스템(Cutumisu et al., 2017), 시뮬레이션 기반 트레이닝(Department of the Army, 2011) 등은 여러 곳에서 소개된 바가 많은 듯하여 생략하겠다.] 데이터는 데이터베이스 시스템 안에 저장될 수 있는 한 단위의 의미 있는 사실 혹은 정보를 뜻한다. 저장할 수 있는 데이터의 종류와 양이 증가함에 따라 생겨난 큰 단위의 복잡한 데이터를 ‘빅데이터’라고 부른다. 교육에서의 인공지능 활용 분야에서도 빅데이터가 많이 언급되고 있는 것을 볼 수 있다. 온라인 기반 교육시스템, 각종 애플리케이션 등 디지털 기반 학습 시스템이 광범위하게 사용됨에 따라 다양하고 엄청난 양의 교육 관련 데이터가 축적되고 있다. 여기에 컴퓨터 하드웨어 성능이 발전함에 따라 (특히 그래픽카드), 교육 관련 빅데이터에서 의미 있는 정보를 재생산해내는 것이 가능해졌다. 그렇다면 빅데이터가 곧 인공지능인가? 빅데이터에서 의미 있는 정보를 생산하면 인공지능인가? 머신러닝기법을 활용하여 데이터를 분석하면 인공지능인가? 고급통계를 활용하여 빅데이터를 분석하면 인공지능이 아닌가? 인공지능 정의에 대해 고민해보지 않은 사람은 이런 질문에 답변할 수가 없다.
수만 가지의 인공지능 정의 중 조금 유명한 하나를 살펴보자. Russell과 Norvig(2009)은 인공지능을 “환경으로부터 지각하고 행동을 하는 에이전트”(“the study of agents that receive percepts from the environment and perform actions”)라고 정의한다(p. viii). 에이전트는 “자각한 것의 순서/배열을 행동으로 연결하는”(“implements a function that maps percept sequences to actions”) 주체를 뜻한다(p. viii). 영어번역이라 어색하기 짝이 없는데, 좀 더 쉽게 말하자면 인공지능은 변화하는 주변 ‘환경을 알아차릴’ 수 있어야 하고 이에 따라 ‘스스로’ 그리고 ‘적절히’ 행동할 수 있어야 한다는 뜻이다. 이 정의에 따르면, 알파고는 인공지능인가? 그렇다. 인간인 상대방이 두는 바둑알의 위치와 형세(주변 환경)를 알아차리고 이길 수 있는 확률이 높은(적절한) 다음 수를 스스로 두는(행동하는) 주체이기 때문이다. 이 정의가 옳다고 주장하는 것도 아니고, 반드시 이 정의일 필요도 없다. 하고 싶은 말은, 교육과 학습에서 인공지능을 활용하고자 할 때, 따르고자 하는 정의와 범위를 명시하는 것은 교육자, 교수자, 학습자, 연구자에게 방향성을 제시할 수 있다는 점에서 그 의의가 크다는 것이다. ‘교육과 학습에서 인공지능 활용’ 전문가들과 교육방침을 정하는 분들이 모여서 합의를 이끌 것을 추천한다.
본 메거진의 방향과 한국의 교육상황을 고려한 적절한 정의를 당장 내놓지는 못하지만, 그 간의 연구활동을 통해, 앞서 서술한 맥락에서 다음과 같은 두 가지 접근법을 제안하고자 한다: (1) “인공지능을 사용하여 학습자와 직접 상호작용하는 접근”과 (2) “인공지능을 활용한 데이터 분석적 접근.” 컴퓨터 프로그램 개발에서 비유를 들자면 (1) “인공지능을 사용하여 학습자와 직접 상호작용하는 접근”을 프론트엔드라고 할 수 있고, (2) “인공지능을 활용한 데이터 분석적 접근”을 백엔드라고 볼 수 있다. 사용자가 컴퓨터 프로그램, 모바일 애플리케이션 등을 사용하면서 직접 상호작용하는 (사용자 – 프로그램 상호작용) 인터페이스를 테크놀로지 분야에서 프론트엔드라고 부른다. 반면에, 컴퓨터 프로그램이나 모바일 애플리케이션을 사용함에 따라 그 내부 프로세스와 관련된 서버(server)와 데이터베이스를 관리해 주는 테크놀로지를 백엔드라고 부른다. 프론트엔드가 눈에 보이고 사용자와 직접 상호작용하는 영역이라면, 백엔드는 눈에 보이지 않는 서버에서 주로 데이터와 관련된 기술을 다룬다. 하나의 프로그램이나 소프트웨어에서도 프론트엔드와 백엔드가 동시에 고려되어야 하지만, 보통 큰 프로젝트에서는 프론트엔드 개발팀과 백엔드 개발팀이 따로 존재한다. 이러한 비유를 차용하여, 인공지능을 교육의 프론트엔드에서 사용하면 (1) “인공지능을 사용하여 학습자와 직접 상호작용하는 접근,” 반면에 백엔드에서 사용하면 (2) “인공지능을 활용한 데이터 분석적 접근”으로 보면 된다.
(1) “인공지능을 사용하여 학습자와 직접 상호작용하는 접근”은 주로 학습자가 직접 사용하는 시스템을 구축하는 것이라 할 수 있다. 이러한 점에서 인공지능 공학(AI Engineering)의 한 분야로 볼 수 있다. 예를 들어, 인공지능을 활용하여 학습에 도움을 주는 스마트스피커, 사물인터넷 제품들, 학습용 챗봇 등 학습자와 직접 상호작용하는 시스템을 개발하는 접근이다. 이 접근의 역사는 짧지 않다. 이미 1950년대에 정보를 찾아내는 시스템(the answer-retrieval machine or information retrieval systems – 키워드 검색 시스템이라고 생각하면 된다)이 소개되었다. 정보를 찾는 것을 일종의 학습 행위로 볼 수 있다. 머신러닝 등 최신의 알고리즘을 탑재하지 않더라도 학습자가 원하는 정보를 찾아준다는 점에서 인공지능적인 학습 보조 시스템이라 할 수 있다(Halttunen & Järvelin, 2005). 또한, 2000년 초반부터는 활발하게 대화형 에이전트 혹은 챗봇이 학습에 도움을 줄 수 있도록 개발되어 교육에 활용되는 등(Chou et al., 2003; Oh et al., 2019; Song et al., 2019), 프론트엔드 접근은 학습자와 가까이에 있다.
(2) “인공지능을 활용한 데이터 분석적 접근”은 학습분석학(Learning Analytics)이나 교육데이터마이닝(Educational Data Mining)분야에서 많이 연구되고 있다. 보통 인공지능 알고리즘(주로, 머신러닝 알고리즘)을 활용하여 교육 빅데이터를 분석하여 학습자의 행동, 학습 프로세스, 학습 성과 등 의미 있는 정보를 찾아내는 분야이다(Siemens & Baker, 2012). 이 분야 또한 역사가 짧지 않다. 참고로, 교육데이터마이닝은 “우리가 학습자와 학습환경을 더 잘 이해할 수 있도록 교육환경에서 얻은 데이터를 탐구하는 방법을 개발하는 분야”(“an emerging discipline, concerned with developing methods for exploring the unique types of data that come from educational settings and using those methods to understand students better, and the settings which they learn in”)로 정의된다 (The International Educational Data Mining Society, 2011). 지난 몇 년 사이 많이 언급되고 있는 학습분석학은 “학습과 학습환경을 이해하고 최적화하는 것을 목적으로 데이터를 측정, 수집, 분석, 보고하는 것”이라고 정의된다(“the measurement, collection, analysis, and reporting of data about learners and their contexts, for purposes of understanding and optimizing learning and the environments in which it occurs”)(The 1st International Conference on Learning Analytics and Knowledge, 2010). 비슷해 보이는 두 분야의 차이점도 존재한다. 교육데이터마이닝이 좀 더 기계와 테크놀로지가 주도하는 연구라면 학습분석학은 교수자와 학습자에게 정보를 전달하여(empower) 인간의 판단에 좋은 영향력을 줄 수 있는(leveraging) 것에 집중한다는 분석이 있다(Siemens & Baker, 2012). 두 분야의 공통적이고 특징적인 부분은 주로 교육 빅데이터를 다루고, 그 분석에서 컴퓨터를 활용한 테크닉(주로 고급통계 및 머신러닝)을 사용하는 것에 있다(“the use of computational techniques for analyzing data collected from learning environments”)(Song, 2018, p. 104). 바로 이 분야가 (2) “인공지능을 활용한 데이터 분석적 접근”이라고 할 수 있다. 직접 학습자와 상호작용하는 것이 아니라는 뜻에서 ‘간접적’이지만, 궁극적으로 학습과 학습 프로세스에 도움을 줄 수 있는 백엔드 접근법이라고 할 수 있다.
물론 한가지 시스템이 이 두 가지 접근법을 모두 가질 수 있지만, 기본적으로 이 둘을 나누어서 생각하면 좀 더 체계적으로 인공지능 활용법을 생각해 볼 수 있을 것이다. 이러한 분류 방식은 그저 아주 작고 사소한 하나의 예일 뿐이다. 비록 이러한 기초적인 분류가 실질적으로 얼마나 도움을 줄 수 있을지는 모르나, 이런 방식의 체계적인 접근이 구체적으로 필요하다는 것을 보여주는 하나의 예를 제시하는 것이 이 글의 목적이다. 많은 분이 ‘뭐 당연한 것을 거창하게 분류하고 있네. 누구나 아는 건데’라고 생각할 지 모르겠다. 이렇게 반문해 보겠다: ‘드론금지구역이 필요하다는 것이 뭐가 거창한 주장이었겠는가. 드론의 무게에 따라 등급을 나누는 것을 몰라서 못했겠는가.’
인공지능을 교육에 곧바로 적용하기 전에 해당 분야 전문가들과 교육 정책담당자들이 모여 구체적인 지침 및 방향을 정하는 등, 영양가 있는 큰 그림을 제시하기 기원하면서 짧은 글을 마친다.
참고문헌
Beck, J., Stern, M., & Haugsjaa, E. (1996). Applications of AI in education. Crossroads, 3(1), 11-15.
Boroujeni, M. S., & Dillenbourg, P. (2019). Discovery and temporal analysis of MOOC study patterns. Journal of Learning Analytics, 6(1), 16-33.
Chou, C. Y., Chan, T. W., & Lin, C. J. (2003). Redefining the learning companion: the past, present, and future of educational agents. Computers & Education, 40(3), 255-269.
Colchester, K., Hagras, H., Alghazzawi, D., & Aldabbagh, G. (2017). A survey of artificial intelligence techniques employed for adaptive educational systems within e-learning platforms. Journal of Artificial Intelligence and Soft Computing Research, 7(1), 47-64.
Cutumisu, M., Blair, K. P., Chin, D. B., & Schwartz, D. L. (2017). Assessing whether students seek constructive criticism: The design of an automated feedback system for a graphic design task. International Journal of Artificial Intelligence in Education, 27(3), 419-447.
Department of the Army (2011). The U.S. Army learning concept for 2015. Fort eustis: Training and doctrine command. Retrieved from http://www-tradoc.army.mil/tpubs/pams/tp525-8-2.pdf.
Halttunen, K., & Järvelin, K. (2005). Assessing learning outcomes in two information retrieval learning environments. Information Processing & Management, 41(4), 949-972.
Kizilcec, R., Piech, C., & Schneider, E. (2013). Deconstructing disengagement: Analyzing learner subpopulations in massive open online courses. Proceedings of the 3rd International Learning Analytics & Knowledge Conference, 170-179.
Mao, Y., Lin, C., & Chi, M. (2018). Deep learning vs. bayesian knowledge tracing: Student models for interventions. Journal of Educational Data Mining, 10(2), 28-54.
Oh, E., Song, D., & Hong, H. (2019). Interactive computing technology in anti-bullying education: The effects of conversation-bot’s role on K-12 students’ attitude change towards bullying problems. Journal of Educational Computing Research, 58(1) 200-219.
Russell, S. J., & Norvig, P. (2009). Artificial intelligence. A modern approach. Pearson.
Siemens, G., & Baker, R. S. (2012, April). Learning analytics and educational data mining: towards communication and collaboration. Proceedings of the 2nd international conference on learning analytics and knowledge (pp. 252-254). ACM.
Song, D. (2018). Learning Analytics as an educational research approach. International Journal of Multiple Research Approaches, 10(1), 102-111.
Song, D., Rice, M., & Oh, E. (2019). Participation in online courses and interaction with a virtual agent. The International Review of Research in Open and Distributed Learning, 20(1), 43-62.
Spoon, K., Beemer, J., Whitmer, J. C., Fan, J., Frazee, J. P., Stronach, J., Bohonak, A. J., & Levine, R. A. (2016). Random forests for evaluating pedagogy and informing personalized learning. Journal of Educational Data Mining, 8(2), 20-50.
The 1st International Conference on Learning Analytics and Knowledge (2010, July 22). Retrieved from https://tekri.athabascau.ca/analytics/about
The International Educational Data Mining Society (2011, July). Educational Data Mining. Retrieved from http://educationaldatamining.org/
Vaessen, B. E., Prins, F. J., & Jeuring, J. (2014). University students’ achievement goals and help-seeking strategies in an intelligent tutoring system. Computers & Education, 72, 196-208.
Vandewaetere, M., Desmet, P., & Clarebout, G. (2011). The contribution of learner characteristics in the development of computer-based adaptive learning environments. Computers in Human Behavior, 27(1), 118-130.