사회 > 성차별
필자의 다른기사 보기 인쇄하기 메일로 보내기 글자 크게 글자 작게
“스마트폰 음성인식 서비스는 왜 여성 목소리일까?”
이희은 교수, 젠더 정형화된 목소리가 미치는 사회적 영향 분석
<페미니스트 저널 일다> 박주연
배너

SKT에서 만든 인공지능 음성인식 디바이스 NUGU 광고는 몇 가지 버전이 있다. ‘워킹맘 편’, ‘기러기아빠 편’, ‘스마트녀 편’, ‘남자 편’, ‘여자 편’ 등. 왜 ‘스마트녀 편’이라는 이름의 광고가 왜 있어야 되는지에 대한 비판은 일단 뒤로 하고, ‘기러기아빠 편’을 보면 NUGU의 ‘아리아’라는 여성 목소리와 아빠와의 관계가 불편하게 느껴지는 지점들을 발견하게 된다. 기러기아빠에게 생긴 음성인식 디바이스의 역할은, ‘가스 밸브가 열렸어요’, ‘열심히 돈 버셔야죠’ 등의 말을 하는 부인, 딸의 자리 채워주기처럼 보이기 때문이다. 워킹맘편에서 이 디바이스가 아이의 친구처럼 반응하며, 남편의 역할을 해 주지 않는 것과는 다른 양상이다.

 

이 같은 양상은 이희은 교수(조선대학교 신문방송학과)가 인공지능 음성인식 디바이스에 대해 분석하며 지적한 내용이다. 지난 11월 18일(토) 한양여자대학교에서 열린 2017년 한국여성학회 추계학술대회에서 이 교수는 ‘사운드로 살펴본 인간과 미디어의 공생’을 주제로 발표했다.

 

이희은 교수에 따르면 이런 음성인식 디바이스의 목소리는 대부분 ‘여성의 목소리’이다. 애플사의 시리(Siri)는 젠더 선택이 가능하긴 하지만 처음에는 여성의 목소리만 있었다. 구글의 어시스턴트(Assistant)는 젠더가 없다고 했지만 분명 여성의 목소리로 만들어져 있다. 하필 이름도 어시스턴트(=비서)다. 구글은 그에 대한 비판을 의식한 것인지 어시스턴트의 출시 이후 1년 만인 지난 10월 남성의 목소리를 추가했다. 아마존의 알렉사(Alexa), 마이크로소프트의 코타나(Cortana) 모두 여성의 목소리다.

 

그리고 이 디바이스들은 일종의 개인 비서 역할을 한다는 특징이 있다. ‘오늘의 날씨 좀 알려줘’, ‘내일 내 스케줄을 알려줘’, ‘음악 좀 틀어줘’. 제작사들도 그 역할을 강조하고 있다. 구글은 아예 ‘어시스턴트’라는 이름까지 지어줬으니까 말이다.

 

▶ SKT 인공지능 음성인식 디바이스 NUGU 기러기아빠 편 광고 중에서

  

2008년, 인공지능에 대해 연구하는 인디아나 대학의 칼 맷도맨(Karl MacDorman) 교수가 행한 연구에 따르면 여성, 남성 참가자 모두 여성의 목소리를 ‘더 따뜻하다’고 답했다. 특히 여성 참가자의 그룹이 여성의 목소리를 더 선호하는 경향을 보였다. 아마존과 마이크로소프트가 진행한 시장 조사의 결과에서는 여성의 목소리가 더 ‘도움되고 신뢰할 수 있는 비서의 목소리’에 적합하다고 나왔다고 한다. (WSJ 2017년 2월 21일자, ”Alexa, Siri, Cortana: The Problem With All-Female Digital Assistants”)

 

거의 20년 전 스탠포드 대학에서 클리포드 나스(Clifford Nass)가 발표한 논문에 따르면, 컴퓨터화된 남성의 목소리는 컴퓨터에 대해 가르치는 선생님의 목소리로 인지되고 컴퓨터화된 여성의 목소리는 사랑과 관계에 대한 조언을 주는 조언자로 선호된다고 한다. 명령을 받는 비서 같은 역할에서는 여성의 목소리가 사용되지만 도미노 피자의 온라인/앱 피자 서비스처럼 무언가를 결정해야 하는 경우에는 ‘신뢰감이 가는’ 남성의 목소리가 사용된다. (WSJ 2017년 2월 21일자, 위와 동일 기사)

 

그렇다면 왜 이렇게 목소리의 역할이 나뉘게 된 것일까? 이희은 교수의 발표에 의하면, 산업이나 학계가 제시하는 이유들은 세 가지 정도로 요약된다.

 

첫째, 시끄러운 도시소음 속에서는 여성의 높은 목소리가 더 잘 들린다는 것이다. 하지만 이 교수는, 이 주장이 오히려 근대사회 공적 공간의 대다수가 남성의 목소리로 뒤덮여 있음을 말해준다고 지적한다. 그리고 그런 공간에서 여성의 목소리가 재생되는 것은 명령이 아닌 도움이나 안내의 목적일 때뿐이다.

 

둘째, 사람들이 여성의 목소리에 더 친근함을 느낀다는 설이다. 인간의 뇌는 자궁에 있을 때부터 들었던 엄마(=여성)의 목소리에 선천적으로 더 반응한다는 환원론적인 해석이 대표적이다.

 

셋째, 역사적으로 기계음이 쓰이기 시작한 것은 2차 대전 때 전투기의 항법장치였고 이는 주로 남성이었던 조종사들 사이에서, 여성의 목소리를 사용함으로써 그들의 귀에 쏙 들어오도록 했던 것이 지금까지 이어지고 있다는 주장이다. 이은희 교수는 1990년대 후반 독일의 BMW가 여성의 목소리가 사용된 네비게이션을 출시했다가, 여성의 목소리로 된 지시를 받을 수 없다고 주장한 많은 남성 운전자들의 항의가 있었던 사례를 들며 그 주장의 빈약함을 지적한다.

 

대부분의 나라들이 전화 산업 초기에는 주로 남성을 전화교환수로 채용했었다. 초창기 교환수의 일은 대부분 부르주아 계층이었던 전화 가입자들과 끊임없이 대화하며 그들의 요구에 응하는 일이었다. 기술적 지식 이상으로 고객 접대가 중요 요소가 되었고 전화 산업은 이 일이 여성에게 더 적합하다고 판단했다. 일본과 한국의 경우는 20세기 초 여성의 임금이 상대적으로 낮다는 경제적 이유와 여성의 목소리가 더 ‘상냥하고 친절하여’ 고객에게 평판이 좋다는 문화적 이유가 모두 작용했다.

 

하지만 흥미로운 것은 여성의 목소리가 처음부터 이렇게 ‘듣기 좋은’ 것은 아니었다는 점이라고, 이희은 교수는 지적한다. 교환원들의 말은 처음엔 제각각이었으나 일정한 틀을 갖추는 방식으로 정비되었고, 그것은 교육으로 전수되어 오늘날 우리에게 익숙한 방식으로 규격화되었다. 이처럼 자본주의 테크놀로지와 여성의 목소리는 기술적이고 문화적인 요소가 결합되어 결국 ‘듣기 좋은’ 소리라는 의미를 획득했다는 것이다.

 

젠더로 나뉘어진 목소리의 역할이 가지고 오는 가장 큰 문제점은 그것이 아닐까. ‘듣기 좋은’ 소리를 만들어 낸다는 것. 그리고 그것이 여성의 목소리로 강요된다는 것.

 

생각해보면 ‘안녕하세요, 무엇을 도와드릴까요?’의 시작되는 아름답고 상냥한 안내의 목소리가 우리 세상의 많은 부분을 차지하고 있음을 알게 된다. 우리가 이용하는 교통 수단부터 불편함을 겪었을 때 연락하게 되는 다양한 안내처 그리고 내 손에 늘 쥐어져 있는 작은 기기에서도.

 

▶ 시리와의 대화 중   ⓒ박주연

 

그리고 그 목소리는 거절을 하지 않는다. 나의 아이폰의 ‘시리’는 내 말을 알아듣지 못하면 ‘죄송해요, 이해를 못했어요. 한 번 더 말씀해 주시겠어요?’라고 한다. 시리에게 대화의 주도권은 없다. 자신이 이해할 수 있을 때까지 계속 물을 뿐이다. 그 목소리는 여성의 목소리로 계속 반복된다. (시리의 경우, 언어를 영어로 선택하면 여성과 남성 중 선택을 할 수 있지만 한국어를 선택하면 여성 밖에 선택지가 없다.)

 

여성의 목소리가 설득력을 가지지 못하고 계속 지워지는 이유, 그리고 적절한 목소리를 냈을 때 ‘니가 뭘 알고 감히 그런 말을 하냐?’ 라는 강압적 태도에 마주하게 되는 것은 이렇게 우리 사회 곳곳에 여성의 목소리를 정형화하고 있기 때문이다.

 

여성의 목소리는 하나의 목소리가 아니다. 우리는 늘 상냥하고 친절하고 부드러운 존재가 아니다. 항상 누군가를 ‘오구오구’ 달래며 안내해야 하는 임무를 타고 나지 않았다. 그건 그러길 바라는 누군가가 ‘기대’하는 임무일 뿐이다. 이런 정형화를 가속시키는 사회의 반복되는 움직임에 대해 이제 제동을 걸어야 한다.

 

우리에겐 ‘팅커벨, 아리아, 크리스탈, 레베카’의 선택(SKT의 NUGU는 이 이름 중 선택할 수 있다)이 필요한 게 아니라 ‘제인, 잭슨’의 선택이 필요하다. 아니, 인공지능 로봇에 정말 성별이 필요한지에 대한 논의부터 필요하다는 것을, 이희은 교수의 연구는 시사하고 있다.

 

다시 한 번 강조하자면, 오늘 당신이 듣길 기대하는 그 ‘듣기 좋은’ 목소리는 만들어진 것이다.

배너
트위터 미투데이 페이스북 요즘 공감
기사입력: 2017/12/01 [14:08]  최종편집: ⓒ 일다
 
페페 17/12/02 [11:09] 수정 삭제  
  NUGU 광고 보고 소름 돋았던 게 나만이 아니었구나... 기사 방갑습니다.. 이런 게 앞으로 더 심해질 거 같단 생각이 들었는데, 소비자들이 비판하면 좀 달라질 수도 있겠네요.
ㅇㅇ 17/12/02 [12:36] 수정 삭제  
  !!! 동감이에요
좋아요 17/12/31 [03:20] 수정 삭제  
  좋은 기사 감사합니다. 꾸준히 볼게요. 너무 당연하게만 생각해온 일상 속 차별이네요.
베를린 18/01/16 [20:58] 수정 삭제  
  일다의 젠더적 편견과 과학의 무지를 잘 볼 수 있는 기사였습니다 음성인식 서비스는 안내방송과 같이 가장 중요한 것이 정보 전달입니다. 남녀의 목소리에 따라, 다소 인식 차이가 생기죠. 남녀를 비교했을 때, 여성의 목소리가 더 또렷하게 들리기 때문인데요. 사람은 귀에서 3500HZ 정도의 소리를 가장 또렷하게 인지합니다. 남성은 1000~1500Hz 정도의 소리 음역대인 반면에 여성은, 2000~2500Hz의 음역대로 남성보다 소리 전달력에서 태생적으로 유리합니다. 안내방송이나 음성인식 서비스가 여성의 목소리를 우선하는 이유는 그런 이유에서죠. 일다, 본인들의 피해망상과 자의적 추정에 근거한 유사과학, 젠더적 편견을 스스로 드러내주시니 어째야할지.. 언론 맞긴 합니까?
베를린 18/01/16 [21:05] 수정 삭제  
  게다가 스페이스 오딧세이의 HAL의 음성에서 알려진 것과 같이 남성의 목소리를 위협적이거나 공격적으로 받아들이는 경우가 많아 Siri의 주인공 수잔 베넷, 여성의 목소리를 더 많이 듣게 될거라 이야기 했었죠. 이 기사는 순전히 편견과 추측만 난무합니다. 아무런 연구 결과도 인용하지 않구요.
베를린 18/01/16 [21:10] 수정 삭제  
  MIC의 'Why Are So Many Robot Voices Female?' 기사만 보더라도, 일다의 이 기사는 이미 존재하는 기사들을 한쪽 결론으로 몰아가기 위해 일부를 누락하고, 짜깁기해 내놓은 기사같군요. 연구 인용도 없고 주관적이고, 정말 불성실하고 불량한 의도를 갖고 시작되지 않았나 싶은 기사입니다.
ㅇㅇ 18/04/03 [21:22] 수정 삭제  
  남자가 와서 부들부들 댓글 남기고 가는 것을 보니 띵언ㅇ!!
닉네임 패스워드 도배방지 숫자 입력
내용
기사 내용과 관련이 없는 글, 욕설을 사용하는 등 타인의 명예를 훼손하는 글은 관리자에 의해 예고 없이 임의 삭제될 수 있으므로 주의하시기 바랍니다.
 
나름 빅뉴스 아주의 지멋대로
고수와의 만남
도시에서 자급자족 실험기
퇴비 제조기를 손수 만들어야 하는 이유
메인사진
. ... / 이민영
최하란의 No Woman No Cry
도망은 ‘도망이나 치는 것’일까?
메인사진
. ... / 최하란
반다의 질병 관통기
질병과 장애는 구분되어야 할까?
메인사진
. ... / 반다
독자들의 영상 메시지
메인사진
일다소식
일다의 신간 <이미지 페미니즘> 출간 소식입니다!
[뉴스레터] 노메이크업, 찌찌해방…‘#탈코르셋’ 침묵을 깬 여성들
[뉴스레터] ‘페미니즘 교육’ 정말 준비됐나요?
2018년 5월 <일다> 독자위원회 모니터링 모임이 열렸습니다!
[뉴스레터] 한국정치는 ‘50대’ ‘남성’이 과다 대표된 게 문제죠