AI와 학습 성과를 이해하기 위한 새로운 도구 - OpenAI

[AI] ai education initiatives | | 🔬 연구
#도구 #ai #chatgpt #openai #review #리뷰 #리서치 #학습 성과
원문 출처: [AI] ai education initiatives · Genesis Park에서 요약 및 분석

요약

OpenAI는 AI가 학습 성과에 미치는 장기적 영향을 정확히 파악하기 위해 에스토니아 타르투 대학교 및 스탠퍼드와 협력하여 ‘학습 성과 측정 스위트’라는 새로운 연구 프레임워크를 개발했습니다. 작년에 진행된 300명 이상의 대학생 대상 무작위 대조 연구에서는 AI 도구 ‘공부 모드’ 활용이 미시경제학 시험에서 약 15%의 성적 향상을 가져오는 등 긍정적인 결과를 보였으나, 기존 방식으로는 학습의 지속성이나 고차원적 사고력 변화 등을 포착하는 데 한계가 있었습니다. 이에 따라 OpenAI는 단순 점수 측정을 넘어 다양한 교육 환경과 맥락에서 AI의 효과를 장기적으로 분석할 수 있는 이 도구를 향후 전 세계 교육 기관에 공개할 계획입니다.

본문

[메인 콘텐츠로 건너뛰기](https://openai.com/ko-KR/index/understanding-ai-and-learning-outcomes/#main) [](https://openai.com/ko-KR/) * [리서치](https://openai.com/ko-KR/research/index/) * 제품 * [비즈니스](https://openai.com/ko-KR/business/) * [개발자](https://openai.com/ko-KR/api/) * [회사](https://openai.com/ko-KR/about/) * [재단(새 창에서 열기)](https://openaifoundation.org) 로그인[ChatGPT 사용하기(새 창에서 열기)](https://chatgpt.com/?openaicom-did=c45b75d1-4303-4b37-bf8f-0e015007f762&openaicom_referred=true) * 리서치 * 제품 * 비즈니스 * 개발자 * 회사 * [재단(새 창에서 열기)](https://openaifoundation.org) AI와 학습 성과를 이해하기 위한 새로운 도구 | OpenAI 목차 * [핵심 요약](https://openai.com/ko-KR/index/understanding-ai-and-learning-outcomes/#haegsim-yoyag) * [배경과 초기 연구](https://openai.com/ko-KR/index/understanding-ai-and-learning-outcomes/#baegyeonggwa-cogi-yeongu) * [공부 모드(변형 A & B) vs 대조군(AI 없음 그룹): 보정 평균 시험 점수](https://openai.com/ko-KR/index/understanding-ai-and-learning-outcomes/#gongbu-modeubyeonhyeong-a-and-b-vs-daejogunai-eobseum-geurub-bojeong-pyeonggyun-siheom-jeomsu) 2026년 3월 4일 [글로벌 정책](https://openai.com/news/global-affairs/) # AI와 학습 성과를 이해하기 위한 새로운 도구 학습 환경 전반에서 AI의 영향을 측정하는 방식을 개선하기 교육은 AI가 가장 큰 잠재력을 보이는 분야 중 하나입니다. ChatGPT와 같은 도구를 활용하면 언제 어디서나 모든 학생이 개인 맞춤형 학습 지원을 받을 수 있습니다. 하지만 교육 분야는 AI가 학습 성과에 미치는 영향을 이해하는 데 아직 초기 단계에 있습니다. 작년에 저희 팀은 [_공부 모드_ ⁠](https://openai.com/ko-KR/index/chatgpt-study-mode/) 와 같은 도구의 활용을 연구하기 시작했고, 학생 성과에서 의미 있는 향상을 확인했습니다. 하지만 이 연구는 또 하나의 중요한 질문을 제기했습니다. AI가 최종 시험 점수뿐 아니라 시간에 따라 학습자의 학습 진전에 어떤 영향을 미치는지 어떻게 평가할 수 있을까요? 이는 교육 생태계 전반의 과제입니다. 현재까지 대부분의 연구 방법은 시험 점수와 같은 제한적인 성과 신호에 초점을 맞추고 있으며, 실제 환경에서 학생들이 AI를 활용해 어떻게 학습하는지, 그리고 이러한 활용이 시간이 지남에 따라 학습 성과에 어떤 영향을 미치는지를 평가하기 어렵습니다. 이러한 격차를 해소하기 위해, 우리는 **학습 성과 측정 스위트,** 를 개발했습니다. 이 프레임워크는 에스토니아 타르투 대학교와 Stanford Accelerator for Learning의 SCALE Initiative와 협력해 개발되었으며, 다양한 교육 환경에서 학습 성과를 장기적으로 측정할 수 있도록 설계되었습니다. 현재 무작위 대조군 시험을 통해 광범위한 검증이 진행되고 있으며, Arizona State University, UCL Knowledge Lab, MIT Media Lab의 연구자들을 포함한 OpenAI의 학습 연구 생태계 **Learning Lab** 과 함께 추가 연구도 진행될 예정입니다.([_이전 공동 연구_ ⁠](https://openai.com/index/affective-use-study/)를 기반으로). 오늘 우리는 측정 도구 모음이 어떻게 작동하는지, 그리고 왜 중요한지에 대한 개요를 소개합니다. 앞으로 더 많은 연구를 발표하고, 이 측정 도구 모음을 전 세계 학교와 대학, 교육 시스템이 활용할 수 있는 공개 자원으로 제공할 계획입니다. > “이 연구를 통해 우리는 빠르게 배우는 동시에, AI를 학교 교육에 의미 있게 통합하는 방법을 더 깊이 이해할 수 있는 기반을 마련하고 있습니다. 또한 이러한 도구가 엄격한 학문적 학습을 지원하는 동시에 고차 사고, 창의성, 호기심, 그리고 학습자로서의 자신감을 어떻게 키울 수 있는지도 이해하고자 합니다.” –Susanna Loeb, 스탠퍼드 대학교 SCALE Initiative 교수 디렉터 및 교육학 교수 #### 핵심 요약 * 현재의 연구 방법은 AI가 학습에 미치는 영향과 관련해 성과 측면에서 유망한 신호를 보여주지만, 시간이 지나면서 AI가 학습 성과에 어떤 영향을 미치는지에 대한 전체적인 모습을 충분히 포착하지는 못합니다. * 학습 성과 측정 스위트는 처음으로 교육자, 연구자, 기관이 다양한 맥락에서 AI가 학습과 학습 성과에 어떤 영향을 미치는지 이해할 수 있도록 돕는 장기 연구용 표준 프레임워크를 제공합니다. * OpenAI의 Learning Lab은 이 작업을 발전시키는 데 중점을 둔 새로운 연구 생태계입니다. 이 분야가 계속 발전함에 따라 OpenAI는 다양한 파트너들과 함께 연구 결과를 발표할 예정입니다. #### 배경과 초기 연구 학생들이 학습을 위해 AI 도구를 사용할 때 그 방식은 매우 다양합니다. 빠른 답을 얻기 위해 AI를 사용할 수도 있고, 튜터와 같은 안내를 받으며 단계별로 문제를 해결하는 데 활용할 수도 있습니다. 사용자가 더 깊이 이해하고 기술을 키울 수 있는 방식으로 ChatGPT를 활용하도록 돕기 위해 OpenAI는 작년에 [_공부 모드_ ⁠](https://openai.com/ko-KR/index/chatgpt-study-mode/) 를 도입했습니다. 공부 모드는 교사, 과학자, 교육학 전문가와 협력해 작성한 맞춤형 시스템 지침을 기반으로 작동합니다. 이러한 지침은 스캐폴딩, 이해도 점검, 안내형 연습과 같은 방식을 통해 단순히 답을 제공하는 것이 아니라 실제 학습을 지원하도록 설계되었습니다. 이러한 교육적으로 설계된 AI 상호작용 방식이 실제로 더 나은 학습 성과로 이어지는지 확인하기 위해, 우리는 신경과학과 미시경제학 시험을 준비하는 대학생 300명 이상을 대상으로 무작위 연구를 진행했습니다. 분석은 아직 진행 중이지만, 초기 결과는 공부 모드와 같은 기능을 통해 지원되는 교육적으로 설계된 AI 상호작용 방식이 학습 성과를 개선할 수 있음을 보여줍니다. 하지만 이 연구는 또 하나의 중요한 사실을 보여줍니다. 진정으로 중요한 것은 이러한 향상과 그에 따른 학습 행동이 시간이 지나도 지속되는지 여부입니다. **연구 설계** 참가자들은 세 그룹 중 하나에 배정되었습니다. 대조군은 AI 생성 개요 기능을 비활성화한 상태에서 Google Search와 YouTube와 같은 기존 온라인 자료를 사용해 학습했습니다. 나머지 두 그룹은 학습 과정을 서로 다른 방식으로 안내하도록 설계된 두 가지 공부 모드 변형 중 하나를 사용했습니다. 이전 수강 경험, 학습 습관, 학업 자신감, AI 도구에 대한 익숙함의 차이를 보정하기 위해 사전에 기초 퀴즈와 온보딩 설문을 수집했습니다. 학생들은 각 시험 전에 시간 제한이 있는 공부 모드 세션을 진행했으며, 두 가지 공부 모드 변형은 과목 전반에 걸쳐 균형 있게 배정되었습니다. 이 설계는 엄격하게 통제된 실험실 환경이 아니라 실제 학습 환경을 반영하도록 구성되었습니다. 참여는 시험 성적과 연결되지 않았으며, 명목상 40분 세션 동안 모든 학생이 공부 모드를 동일한 정도로 사용한 것은 아니었습니다. 이를 통해 우리는 의도-대-처치(ITT) 효과, 즉 실제 배포 환경에서 도구 접근 권한이 제공될 때의 영향을 측정하고 보고할 수 있었습니다. 다시 말해, 실제 사용 참여도는 달라질 수 있음을 고려하면서 공부 모드가 제공되는 것 자체의 인과적 효과를 평가했습니다. **발견한 문제** 각 시험의 성과를 별도로 측정했습니다. 무작위 배정 연구에서 향상 정도는 과목별로 동일하지 않았으며, 공부 모드에 대한 참여 수준도 참가자마다 달랐습니다. * **신경과학(주요 ITT)** : 대조군 대비 공부 모드에서 긍정적인 방향의 차이가 관찰되었지만, 그 결과는 기존 온라인 자료로 학습한 학생들과 통계적으로 구분되지는 않았습니다. 일부 온보딩 및 문제로 인해 공부 모드를 사용하는 학생들의 학습 시간이 영향을 받았습니다. * **미시경제학(1차 ITT):** AI 미사용 대조군과 비교했을 때 공부 모드 접근 권한이 제공된 학생들의 시험 성적이 약 15% 더 높은 의미 있는 향상이 관찰되었습니다. #### 공부 모드(변형 A & B) vs 대조군(AI 없음 그룹): 보정 평균 시험 점수 각 학습 모드 변형을 대조군과 개별적으로 비교해도 효과는 일관되게 유지됩니다. 이는 실제 환경의 변동성을 반영하지만, 동시에 학습 성과를 일반적으로 측정하는 방식의 근본적인 한계를 드러냈습니다. 대부분의 기존 평가 방법은 짧은 기간 동안의 고정된 개입을 기준으로 평가하며, 시험 점수나 최종 에세이와 같은 결과를 주요 지표로 사용합니다. 실제 학습에 영향을 미치는 핵심 메커니즘을 포착하도록 설계되지 않았습니다. 이는 학습자의 전략, 선호도, 학습 습관과 함께 변화하는 지속적이고 개인화된 상호작용을 의미합니다. 또한 단기 기억과 같은 한 가지 역량의 향상이 지속성, 자율적 동기, 창의적 문제 해결과 같은 다른 역량의 감소와 함께 나타날 수 있는지 여부도 파악하지 못합니다. 그 결과, AI가 실제로 학습을 의미 있게 개선하는지를 결정하는 장기적인 인지 효과를 포착하지 못합니다. 학습 환경은 국가, 교육과정, 기관의 목표에 따라 크게 다르기 때문에, 단발성 연구의 결과는 교육 시스

Genesis Park 편집팀이 AI를 활용하여 작성한 분석입니다. 원문은 출처 링크를 통해 확인할 수 있습니다.

공유

관련 저널 읽기

전체 보기 →