2017.08.29 (화)

  • -동두천 26.7℃
  • -강릉 22.9℃
  • 서울 26.1℃
  • 대전 24.3℃
  • 대구 25.4℃
  • 울산 26.2℃
  • 박무광주 29.2℃
  • 구름많음부산 29.5℃
  • -고창 26.8℃
  • 흐림제주 33.6℃
  • -강화 25.4℃
  • -보은 21.9℃
  • -금산 25.8℃
  • -강진군 30.1℃
  • -경주시 24.9℃
  • -거제 29.9℃

빅데이터가 만드는 교육, 완벽할까?

빅데이터는 데이터베이스에 축적되어 있는 대량의 정형화된 데이터뿐만 아니라, 문서나 사진, 동영상과 같은 비정형화된 데이터를 포함하고 있으며, 그 데이터에서 새로운 부가가치를 창출하는 기술까지도 포함한다. 이러한 빅데이터를 학교 교육에서 활용한다면 학생들에게 최적화된 학습자료를 제공할 수 있어 수준별 맞춤 학습이 가능해진다. 학급당 학생 수가 20명이 넘는 현재의 학교 교육에서, 교사 한 명이 매 수업시간마다 학생들의 학습 현황을 분석하여 개별화된 학습 자료를 제공하는 것은 현실적으로 불가능하다. 그러나 수업 장면을 촬영하고, 그것을 빅데이터로 분석하여 교사에게 제공한다면 교사는 쉽고 빠르게 학생들의 학습 현황을 파악하여 그에 맞는 적절한 처방을 내릴 수 있게 된다.


2015 개정 교육과정에서는 디지털교과서를 초등학교 3학년부터 확대·보급할 계획이다. 그동안 디지털교과서는 연구학교를 중심으로 보급되었지만, 향후에는 연차적으로 사회, 과학, 영어 교과를 중심으로 개발하여 희망하는 모든 학교에 보급된다. 뿐만 아니라 인터넷과 스마트기기를 활용한 사이버학습과 온라인 수업이 활성화되고 있다. 이러한 정보기술이 교육분야에 적극적으로 활용됨에 따라 매년 대량의 학습 데이터가 생산, 저장되고 있어 빅데이터의 교육적 활용 가능성은 더욱 높아지고 있다.


학생들 학습패턴 분석… 효과적 교수법 제공 가능
구글의 자동번역시스템은 기존의 번역시스템과 같이 어휘와 문법적 구조를 인식하는 것이 아니다. 구글은 수십억 건의 문장과 번역문을 데이터베이스화하여 유사한 문장과 어구를 추론하는 통계적 기법을 활용하고 있다. 즉 빅데이터 기술을 활용한 번역을 통해 보다 자연스러운 표현이 가능하다는 것이다. 또한 나이스(NEIS)는 매년 6백만 명의 초·중등 학생들의 신체 정보를 저장하고 있어, 이를 활용한다면 한국인 체형에 적합한 옷 사이즈를 공표할 수 있다. 아울러 사이버학습이나 온라인수업, 디지털교과서에 축적된 사용자별 학습 현황과 콘텐츠 이용 현황 등을 분석한다면, 보다 효과적인 교육 프로그램을 학생 개개인에게 제공할 수 있다.


예를 들면 학교에서 학생들이 서책교과서 대신에 디지털교과서를 사용한다면, 디지털교과서를 클릭할 때마다 데이터가 축적되고, 이것을 이용하여 관계분석 (social network analysis)이나 평가분석 (evaluation & assessment analysis), 예측분석 (predictive analysis), 적응분석 (adaptive learning analysis), 정보분석 (analysis dashboard) 등 다양한 형태의 분석이 가능하다. 즉, 디지털교과서를 기반으로 학생들끼리 주고받은 메시지를 분석하여 관계망이나 참여도를 분석할 수 있으며, 로그 분석이나 루브릭, 설문 조사 등을 통해 학생들에 대한 평가도 가
능하다. 이와 함께 학생들의 학습 패턴을 분석함으로써 학습 진행 상황을 예측할 수 있으며, 그에 따른 적합한 학습자료를 학생들에게 전달할 수 있고, 이러한 학습 분석 결과를 교사에게 제공함으로써 수준별 맞춤 학습을 기대할 수 있다. 그러나 이러한 빅데이터가 학교 교육에서 활용되기 위해서는 다음과 같은 과제
가 우선적으로 해결되어야 한다.


첫째, 교육용 데이터에 접근할 수 있도록 관련 법률을 정비해야 한다. 나이스 (NEIS)는 초·중등교육법과 학교보건법에 따라 초·중등학교 학생들의 학교생활기록과 신체검사기록을 작성·관리하고 있다. 즉, 매년 6백만 명 가량의 학생들의 인적 사항과 학적사항, 출결상황, 자격증 및 인증 취득상황, 학습 발달상황, 행동특성 및 종합의견, 신체의 발달상황 및 능력 등 다양한 정보를 저장하고 관리하고 있지만, 이들 자료를 학생들의 현황 파악이나 상급학교 진학 자료로 활용하는 것 이외에는 접근을 허락하지 않고 있다. 그 이유는 교육기본법에 따라
‘학생정보’는 법률로 정하는 경우 외에는 해당 학생(학생이 미성년자인 경우에는 학생 및 학생의 부모 등 보호자)의 동의 없이 제3자에게 제공할 수 없기 때문이다. 그러나 이러한 학생정보 보호의 목적은 데이터 자체에 대한 보호보다는 학생을 보호하는 데 있으며, 빅데이터 분석에서 특정 개인을 식별하는 ‘개인정보’는 그리 중요하지 않다. 따라서 개인정보를 제외한 학생정보를 제3자에게 제공하더라도 학생을 보호하려는 법률 취지에 어긋나지 않으므로 교육기본법을 수정해야 한다.


통계의 오류에 빠지지 않는 세심한 주의 필요
둘째, 학생정보 활용에 따른 개인정보관리체계를 구축해야 한다. 교육분야의 빅데이터에는 어린 학생들의 민감한 정보들이 포함될 수 있다. 따라서 교육분야의 빅데이터를 수집·분석·활용하는 모든 단계에 걸쳐 개인정보가 활용되지 않도록 관리체계를 구축해야 한다. 개인정보보호법에 따르면 ‘개인정보란 해당 정보만으로는 특정 개인을 알아볼 수 없더라도 다른 정보와 쉽게 결합하여 알아볼 수 있는 것’을 포함하고 있으므로, 연관된 정보를 조합하여 특정인을 식별하지 못하도록 가공해서 제공해야 한다. 이를 위해서는 책임있는 공공기관에서 교육분야의 빅데이터 활용 계획을 수립하고, 그것을 목적에 맞게 수집하고 분석하여 활용할 수 있도록 상시적인 관리체계를 구축해야 한다.


셋째, 교육분야의 빅데이터를 발굴하여 표준데이터 형태로 제공해야 한다. 표준화되지 않은 데이터는 활용하는 데 추가 비용이 많이 발생하여 그 효용성이 매우 떨어진다. 최근에 정부는 공공데이터를 민간에서 쉽게 활용할 수 있도록 36대 분야를 선정하여 2만 3,186종의 데이터를 공공데이터포털(data.go.kr)에서 제공하고 있다. 그러나 교육분야의 데이터는 1,305건으로 5.6%에 불과하고, 그나마도 기관 시설에 대한 정보가 대부분을 차지하고 있다. 또한 표준데이터 형태로 제공하고 있는 데이터는 겨우 44종뿐이어서 표준화된 빅데이터 제공이 시급하다.


넷째, 빅데이터 분석 결과는 어디까지나 교사가 참조하는 수준에 머물러야 한다. 새로운 기술에 대한 지나친 신뢰는 인간을 다루는 교육분야에서 매우 심각한 문제를 초래할 수 있다. 빅데이터의 분석 방법은 통계에 의한 추론이므로 늘 오류가 존재할 수 있다. 설사 분석 결과의 정확도가 99.9%일지라도 내가 가르치는 학생은 나머지 0.1%에 해당될 수 있으므로 평상시에 학생들을 직접 관찰한내용과 비교하면서 최종적인 처방이 내려져야 한다. 교육분야의 빅데이터는 학교 교육에 매우 유용하다. 그러나 늘 정확한 분석을 제시하는 것이 아님을 명심해야 할 것이다.