Page 206 - 고등학교 인공지능 기초
P. 206

1    데이터 편향성이란?



                                                        데이터 편향성이란 학습에 사용되는 데이터가 현실 세계를 잘 반

                                                      영할 수 있도록 충분한 양이 확보되지 않았거나 현실 세계의 성질
                                                      을 골고루 반영하지 못하여 한쪽으로 치우친 성질을 가지고 있는
                                                      것을 말한다. 인공지능이 현실 세계를 균형 있게 인식하고 공평한
                          현실 세계           훈련 데이터
                                                      결과를 도출하게 하려면 데이터의 객관성을 유지하고, 다양한 지역
                      그림Ⅳ-1 l 적절한 훈련 데이터로 학습한 인공지능    에서 수집하며, 많은 양의 데이터로 학습하도록 해야 한다.

                                                        그러나 인공지능은 수집한 데이터가 어떤 성향을 지녔는지 분별
                                             할 수 없기 때문에 사용자의 의도와 다르게 편향적 판단을 내릴 수도 있다. 아
                                             마존에서는 인공지능이 입사 지원서를 검토하고 인재를 추천하는 방식의 고용

                                             시스템을 도입했다가 폐기한 바 있다. 개발한 인공지능 프로그램에서 성차별적
                                             편향이 나타났기 때문이다. 인공지능이 추천한 지원자가 대부분 남성이었던 것

                                             이다. 그 이유는 아마존이 지난 10년간 접수된 입사 지원서를 기초로 훈련 데
                                             이터를 구축했기 때문이었다. 남성 비율이 높은 IT 업계의 특성상 남성의 이력
                                             서를 더 많이 학습한 결과 인공지능은 ‘여성’이라는 조건을 감점 요인으로 판단

                                             하기에 이르렀다. 이처럼 편향적 데이터는 인공지능이 편향된 판단을 내리게
                                             하여 인공지능의 신뢰성을 떨어뜨린다.
                                               인공지능의 편향성이 더욱 문제가 되는 이유는 현실의 편향을 강화하는 역

                                             할을 하기 때문이다. 아마존의 인공지능
                                             고용 시스템이 유지되었다면 여성이
                                             지속적으로 고용에서 배제되었을

                                             것이고, 이로 인해 축적되는 데
                                             이터의 편향성은 더욱 강화되는

                                             악순환이 이어졌을 것이다.



                                                                                                 잠깐 활동

                       인터넷에서 데이터 편향성으로 인해 문제가 된 사례를 검색하여 적어보자.














                    204    Ⅳ 인공지능의 사회적 영향
   201   202   203   204   205   206   207   208   209   210   211