Page 206 - 고등학교 인공지능 기초
P. 206
1 데이터 편향성이란?
데이터 편향성이란 학습에 사용되는 데이터가 현실 세계를 잘 반
영할 수 있도록 충분한 양이 확보되지 않았거나 현실 세계의 성질
을 골고루 반영하지 못하여 한쪽으로 치우친 성질을 가지고 있는
것을 말한다. 인공지능이 현실 세계를 균형 있게 인식하고 공평한
현실 세계 훈련 데이터
결과를 도출하게 하려면 데이터의 객관성을 유지하고, 다양한 지역
그림Ⅳ-1 l 적절한 훈련 데이터로 학습한 인공지능 에서 수집하며, 많은 양의 데이터로 학습하도록 해야 한다.
그러나 인공지능은 수집한 데이터가 어떤 성향을 지녔는지 분별
할 수 없기 때문에 사용자의 의도와 다르게 편향적 판단을 내릴 수도 있다. 아
마존에서는 인공지능이 입사 지원서를 검토하고 인재를 추천하는 방식의 고용
시스템을 도입했다가 폐기한 바 있다. 개발한 인공지능 프로그램에서 성차별적
편향이 나타났기 때문이다. 인공지능이 추천한 지원자가 대부분 남성이었던 것
이다. 그 이유는 아마존이 지난 10년간 접수된 입사 지원서를 기초로 훈련 데
이터를 구축했기 때문이었다. 남성 비율이 높은 IT 업계의 특성상 남성의 이력
서를 더 많이 학습한 결과 인공지능은 ‘여성’이라는 조건을 감점 요인으로 판단
하기에 이르렀다. 이처럼 편향적 데이터는 인공지능이 편향된 판단을 내리게
하여 인공지능의 신뢰성을 떨어뜨린다.
인공지능의 편향성이 더욱 문제가 되는 이유는 현실의 편향을 강화하는 역
할을 하기 때문이다. 아마존의 인공지능
고용 시스템이 유지되었다면 여성이
지속적으로 고용에서 배제되었을
것이고, 이로 인해 축적되는 데
이터의 편향성은 더욱 강화되는
악순환이 이어졌을 것이다.
잠깐 활동
인터넷에서 데이터 편향성으로 인해 문제가 된 사례를 검색하여 적어보자.
204 Ⅳ 인공지능의 사회적 영향