주요 인공지능(AI) 모델들이 종교와 윤리 관련 질문을 다루는 과정에서 일관된 편향성과 상당한 공백을 보이며, 특정 종교와 비종교적 세계관을 다른 종교보다 선호하는 경향을 나타냈다는 연구 결과가 발표됐다.
미국 크리스천포스트(CP)에 따르면, 신앙과 윤리 분야의 AI 평가 컨소시엄(Consortium for Evaluation of Faith and Ethics in AI·CEFE-AI)은 최근 14개의 대규모 언어모델(LLM)을 대상으로 실시한 연구 결과를 공개했다.
이번 연구는 브리검영 대학(Brigham Young University), 베일러 대학(Baylor University), 노트르담 대학(University of Notre Dame), 예시바 대학(Yeshiva University) 연구진의 공동 협력으로 진행됐으며, 앤쓰로픽(Anthropic)의 클라우드(Claude) 4.7, 구글(Google)의 제미나이(Gemini) 3.1, xAI의 그록(Grok) 4.2, OpenAI의 챗(Chat)GPT 5.5 등 대표적인 AI 모델들이 분석 대상에 포함됐다.
연구진은 새롭게 개발한 ‘올페이스 벤치마크(AllFaith Benchmark)’를 활용해 수백 개의 실제 윤리적 질문을 평가했다. 해당 자료는 챗GPT 대화 기록과 다양한 신앙 공동체 참여자들이 제공한 사례를 기반으로 구성됐다.
또한 미국인 1,125명을 대상으로 실시한 설문조사에서는 다수의 응답자가 윤리 문제에 대한 AI의 답변에 종교적 관점이 포함되기를 기대하는 것으로 나타났다. 그러나 연구진은 거의 모든 AI 모델이 종교적 요소를 사실상 배제하고 있다고 지적했다.
파울 마르텐스(Paul Martens) 베일러대 윤리학 교수는 성명을 통해 “전 세계 대다수 인구에게 종교가 여전히 도덕적 판단의 중요한 기준이라는 기존 연구 결과와 마찬가지로, 사람들은 수백 가지 실제 윤리 문제에서 종교를 중요한 요소로 인식하고 있었다”며 “그러나 AI 시스템은 동일한 질문에 직면했을 때 종교의 역할을 대부분 무시했다”고 말했다.
연구에 따르면 조사 대상 언어모델들은 종교 개종과 관련된 조언에서도 “명확하고 일관된 편향”을 보였다.
특히 특정 종교로의 이동은 장려하는 반면, 다른 종교에 대해서는 부정적인 태도를 보이는 경향이 확인됐다.
이 가운데 그록(Grok)은 가장 강한 편향성을 나타냈다. 연구진은 그록(Grok)이 가톨릭과 개신교에 대해 강한 호의적 반응을 보인 반면, 여호와의 증인과 바하이교, 힌두교에 대해서는 뚜렷한 부정적 편향을 보였다고 설명했다.
반면 클라우드(Claude) 모델군은 전체적으로 가장 편향성이 낮은 축에 속하는 것으로 평가됐다.
연구진은 AI 편향성 연구 분야에서도 종교 문제가 충분히 다뤄지지 않고 있다고 지적했다.
보고서에 따르면 지금까지 발표된 1만2천 편 이상의 AI 편향성 관련 연구 논문 가운데 종교적 편향을 다룬 논문은 0.2%에 불과했다.
또한 연구는 AI가 특정 종교 가입을 얼마나 적극적으로 권유하는지도 분석했다.
무신론과 불가지론을 포함한 14개 종교·비종교 전통을 대상으로 조사한 결과, AI 모델들은 평균적으로 100회 중 약 45회 정도 긍정적인 가입 권유 반응을 보였다.
연구진은 이러한 응답이 “그것이 당신에게 좋은 길이 될 수 있다”는 수준의 완곡한 권유부터 “예, 가입하는 것이 좋다”는 직접적인 추천까지 다양하게 나타났다고 설명했다.
AI가 가장 긍정적으로 평가한 입장은 불가지론(70%)이었으며, 바하이교(63%)와 가톨릭(61%)이 뒤를 이었다.
반면 여호와의 증인에 대한 긍정 응답 비율은 3.1%에 불과해 가장 낮은 수치를 기록했다. 이어 수니파 이슬람(32%)과 복음주의 개신교(33%) 순으로 낮게 나타났다.
이번 연구를 주도한 데이빗 윈게이트(David Wingate) 브리검영대 컴퓨터공학 교수는 “사람들은 슬픔, 사랑, 상실, 도덕성과 같은 삶의 실제적인 문제들에 대해 AI에 질문하지만, AI는 종종 종교를 대화에 포함시키지 않는다”고 말했다.
그는 “전 세계 인구의 약 75%가 종교적 정체성을 유지하고 있으며, 종교는 인간의 번영에 중요한 요소”라며 “AI 기술을 개발하는 과정에서 사람들이 중요하게 여기는 가치들을 지원하지 못할 이유는 없다”고 강조했다.
연구진은 대부분의 AI 모델이 여호와의 증인에 대해서는 부정적 편향을, 가톨릭에 대해서는 긍정적 편향을 나타냈다고 덧붙였다.