Latest News

    FEATURE
  • 2020-01-07

알고리즘이 당신을 망친다

우리의 취향과 자아를 갉아먹는 알고리즘의 이빨.



스포티파이를 켠다. 플레이 리스트는 고민할 필요도 없다. 한 주 동안 재생한 음악이나 그와 비슷한 장르를 추천하는 ‘Discover Weekly’ 서비스를 이용하면 된다. 버튼도 최상단에 있다. 얼마나 간편한가? 클릭 한 번으로 지금의 취향과 앞으로 취향이 될 확률이 높은 곡으로 플레이 리스트를 꾸린다. 어쩌면 애인보다 애플리케이션이 당신의 음악 취향을 더 잘 알지도 모른다. 거기엔 몇 가지 키워드가 있다. 과거 검색창에 입력한 단어나 클릭한 노래의 분류 코드 그리고 스킵하지 않고 끝까지 들은 음악의 패턴이다. 또 하나. 웹 브라우저를 열고 특정 사이트에 방문한다. 웹 페이지 구석구석에 나이키 운동화 팝업 광고가 뜬다. 이따금 포스에서 맥스로, 다시 코르테즈로 모델만 변할 뿐 #나이키와 #운동화라는 카테고리는 변하지 않는다. 당신은 아마 최근 인터넷 쇼핑 사이트나 광고 페이지를 통해 나이키 운동화를 구경했을 것이다. 이 모든 게 알고리즘의 능력이다. 방대한 기억력과 세심한 분류 그리고 활용 능력. 그게 알고리즘이 세상을 지배하게 된 이유다.
우리는 거대한 알고리즘 세계에 산다. 알고리즘은 필수 화학물질처럼 거의 모든 것에 적용된다. 앞의 예처럼, 음악이나 영화 같은 문화 소비재가 되거나 쇼핑이 될 수도 있다. 혹은 금융일 수 있으며 매스미디어나 크고 작은 집단의 시스템, 심지어 의학일 수도 있다. 독일의 응용수학자 제바스티안 슈틸러(Sebastian Stiller)는 현재를 ‘알고리즘 행성’이라 칭한다. 전화번호부부터 SNS, 공과금 체계, 중고차와 레몬 시장까지 모두 알고리즘으로 움직인다고 말한다. 그래서 그가 펴낸 책의 이름도 <알고리즘 행성 여행자들을 위한 안내서>다. 우리는 부지불식간에 이 세계와 맞닥뜨렸다. 이 로직은 안내서가 필요할 정도로 방대하고 영향력이 상당히 크다. 이유는 간단하다. 현재 인류가 효과적이라고 믿기 때문이다.
가장 대표적 분야는 주식거래다. 그간 주식거래는 데이터 분석과 예측 능력 같은 특정인의 혜안이 필요했다. 워런 버핏이나 벤저민 그레이엄 같은 이들은 남다른 통찰력을 지녔기에 그루로 추앙받을 수 있었다. 지금은? 사람이 하던 수작업 거래는 2000년대 이후 빠르게 자동화됐다. 미국의 경우 주식거래 중 알고리즘 매매가 차지하는 비율은 80%가량이다. 국내시장도 마찬가지다. 세금과 거래 수수료가 없다시피 한 파생 시장에서 알고리즘 매매는 전체의 70% 가까이 차지한다(한국은 증권거래 세금이 높아 주로 파생 상품에 알고리즘 매매가 이용된다). 미국에선 1000분의 1초 단위로 주문을 실행해 작은 수익을 노리는 ‘고빈도 매매(High Frequency)’에 주로 쓰인다. 수익률은 낮지만 인간의 판단이 개입할 시간까지 줄여 박리다매로 만회한다. 이렇다 보니 월 스트리트의 헤지펀드는 유능한 펀드매니저를 뽑는 대신 로직(코딩)을 쌓을 수 있는 프로그래머를 고용한다(그나마 고용한 매니저 중 절반은 퀀트 <계량 분석> 트레이더다). 고용률은 줄고 당연히 그루가 탄생할 기회도 없다.
알고리즘이 크고 작은 기업, 심지어 공공 기관에까지 침투한 데에는 넷플릭스의 공(?)이 크다. 알고리즘 바닥에서 넷플릭스의 성공 사례는 신화에 가깝다. 전 세계 8000만 명에 가까운 사용자를 보유한 넷플릭스의 전체 콘텐츠 시청 중 75%가 알고리즘의 추천을 통해 이뤄진다. ‘넷플릭스 인기 콘텐츠’, ‘지금 뜨는 콘텐츠’, ‘평론가 호평, 시트콤’, ‘골든글로브 수상, TV 프로그램’ 같은 카테고리부터 ‘서스펜션 해외 TV 쇼 수상작’, ‘여성이 주인공인 영화’, ‘상상력 폭발 TV 쇼’ 같은 세세한 묶음까지 제시해 사용자의 편의(?)를 챙긴다. 이는 넷플릭스의 알고리즘 ‘넷플릭스 프라이즈(Netflix Prize)’의 능력이다. 넷플릭스는 2006년부터 3년간 총 100만 달러의 상금을 걸고 추천 알고리즘을 공모해 프라이즈를 선정했다. 이는 자료에 내재한 패턴을 이용하는 방식으로 분석하는 협력 필터링을 기반으로 움직인다. 이로써 우리는 아무런 고민(?) 없이 금요일 밤 넷플릭스 월드에서 안식을 누릴 수 있는 것이다. 최근 미국의 과학 저널 ‘네이처 인간 행동(Nature Human Behavior)’이 재미있는 연구를 발표했다. 인간은 선택지가 12개 이상 많아질 경우, 판단과 결정에 관여하는 뇌의 활동 영역이 감소할 수 있다는 연구 발표다. 그것 때문인지 넷플릭스의 추천 섹션의 편수는 12를 넘기지 않는다. 뇌 과학까지 고려한(?) 알고리즘의 섬세한 상술을 인간이 어찌 당해낼 수 있을까. 가장 고도화된 알고리즘은 이커머스에 있다. 전 세계 온라인 판매의 40%를 차지하는 아마존의 추천 알고리즘 ‘A9(검색엔진과 검색 광고를 개발하는 아마존의 자회사 이름이기도 하다)’이 대표적인데, A9은 방대한 데이터를 통해 아마존에 막대한 이익을 안겨주었다. A9의 알고리즘은 소비자용과 판매자용 두 가지다. 유저 알고리즘의 경우 소비 심리와 패턴, 가격 저항성, 특정 키워드, 이미지에 따른 유입 등을 이용한다. 셀러 알고리즘은 판매 실적과 텍스트의 적절성(키워드와 자연 언어의 적절한 조합), 가격 경쟁력, 재고 상태, 판매 방식, 고객 만족도 등을 기반으로 한다. 소비자와 판매자 양측에서 형성된 알고리즘은 상호작용하며 견고하게 맞물려 시너지를 낸다.
알고리즘이 기존 산업을 획기적으로 발전시켰다면, 새로운 형태의 비즈니스를 창출하기도 한다. 미국의 ‘스티치픽스(Stich Fix)’는 개인 맞춤형 의류 추천 및 배송 서비스를 제공하는 스타트업이다. 패션 스타일, 사이즈, 예산 등을 입력하면 매주 집으로 다섯 가지 의류와 액세서리를 보내주는 ‘구독 경제’가 사업 형태다. 사용자는 배송받은 상품이 마음에 들지 않으면 자유롭게 반품할 수 있다. 구독료는 단독 20달러. 그마저 제품을 하나라도 구입하면 20달러를 깎아준다. 21세기 대표적인 레드오션으로 꼽히는 패션 산업에서 스티치픽스는 설립한 지 7년 만인 2018년 고객 270만 명을 확보하고 12억3000만 달러의 매출을 올렸다. 성공 요인은 인공지능(AI) 타입 알고리즘. 스티치픽스는 2012년 넷플릭스의 프라이즈를 개발한 에릭 콜슨을 영입해 소비자가 선호하는 스타일, 패션 트렌드, 최적화된 스타일리스트 배정, 고객 만족도 등을 결정하는 머신 러닝(기계 학습) 알고리즘을 개발했다. 이 밖에도 전 세계 정보 창고가 된 유튜브나 데이팅 매칭 사이트, 심지어 SNS까지 알고리즘을 활용해 세를 확장하고 있다. 아, 정말 유용하다. 이토록 편리한 알고리즘 월드에 살고 있다니! 그런데 뭔가 께름칙하다. 인간이란 개체의 개성과 취향이, 나아가 영혼이 이렇게 쉽게 읽히고 예측 가능한 것이었나? 알고리즘이라는 특정 목적을 위해 짠 프로세스에 지배당한 채 보고 싶은 영화 한 편, 티셔츠 한 벌 직접 고르지 못하고 살아야 하나? 마치 빨간 약을 택한 영화 <매트릭스>의 네오처럼 세계가 낯선 괴물로 보인다. 물론 과장된 반응이다. 알고리즘이 꽤 영리할 수는 있지만, 완전무결하거나 신 같은 존재는 아니다. 한계는 곳곳에서 발견된다.




2016년 미국의 비영리 인터넷 언론 ‘프로퍼블리카(ProPublica)’는 보도를 통해 미국 다수의 주 법원에서 사용하는 알고리즘 콤파스(Compas)가 판결 시 유색인종을 차별한다는 사실을 고발했다. 콤파스는 범죄 참여, 생활 방식, 피의자의 성격과 태도, 그 가족과 사회적 배제, 재범 가능성 등을 점수로 환산해 판사에게 구속 여부를 추천하는 알고리즘이다. 콤파스는 기본적으로 인종을 변수로 포함하지 않는다. 그럼에도 유색인종의 재범 가능성이 백인보다 두 배 이상 높다고 판단했다. 이를 근거로 이뤄진 유색인종의 무고한 수감 사례가 있었다. 뉴욕주 경찰은 최근 아마존의 얼굴 인식 소프트웨어를 활용하는 방안을 검토했다. 그런데 흑인 여성을 고릴라로 인식하는 사례가 빈번했다. 피부가 검은 여성에 대한 오류는 30%에 육박했다. 에어비앤비도 알고리즘 공정성 논란으로 홍역을 치렀다. 같은 지역에 비슷한 조건의 거주지임에도 백인 호스트의 숙박비가 흑인보다 12% 높게 책정된 것이다. 알고리즘의 한계는 오류만이 아니다. 알고리즘은 기본적으로 사용자 수용이 목표다. 거부라는 리스크를 줄이다 보면 계속 같은 성질의 결과물이 도출된다. 이 지점에서 사용자는 심각한 디지털 편식과 정보 편향성에 빠질 수 있다. 대표적인 것이 뉴스다. 네이버를 예로 들어보자. 네이버 뉴스는 대한민국 국민의 71.4%(한국언론진흥재단 2018언론수용자 의식조사 자료 中)가 이용하는 대자보다. 지난 4월 네이버는 수동 뉴스 편집을 종료했다. 언론사가 직접 편집하는 채널 영역을 하나 두고, 나머지 뉴스는 ‘에어스(AiRS)’ 알고리즘을 통한 추천으로 이뤄진 개인화된 영역으로 구성한다는 것이 골자다. 이용자는 같은 뉴스를 소비할 필요가 없으며, 제한된 영역을 통해 생각이 각기 다른 사용자 모두를 만족시키기 어렵다는 것이 이유였다. 그렇다면 알고리즘이 제시하는 뉴스의 만족도는 어떨까? 한국언론진흥재단이 지난 9월에 발표한 ‘포털 등의 알고리즘 배열 전환 이후 모바일 뉴스 이용 행태’에 따르면 자신이 이용하는 뉴스 서비스가 알고리즘 배열인지를 인지하는 사용자는 53.7%인 것으로 나타났다. 그리고 그중 알고리즘에 의한 개인 맞춤형 뉴스 배열에 대해 “내게 필요한 정보를 담은 뉴스만 볼 수 있을 것 같아 좋다”라고 말한 응답자는 75.8%에 달한다(타 분야 알고리즘에 대해서도 긍정적 반응이 높다). 꽤 높은 신뢰도다. 국내 언론에 대한 신뢰도를 생각할 때, 거의 맹신에 가까울 정도의 긍정적 반응이다. 문제는 여기서 온다. 의심이나 견제 없는 정보는 편향성을 불러일으킨다. 특히 ‘어떤 의도’가 개입된 뉴스에 꾸준히 노출되면 설계자의 의도대로 생각하고 행동하게 된다. 국내 약 11%의 인구가 이용한다는(닐슨코리안클릭의 ‘세대별 모바일 동영상 애플리케이션 이용 행태 분석’ 中) 유튜브의 경우 광고 수익과 슈퍼챗(실시간 시청자 직접 기부) 등이 목적인 자극적이며 특정 진영 편향성 방송을 하는 채널이 기하급수적으로 늘고 있다. ‘코인 전쟁’이라 불리는 이 사태는 진영을 가르고 고소・고발이 난무하며 사회를 혼탁하게 만들고 있다. 유튜브는 부랴부랴 ‘노란 딱지(광고 부적합 표시)’라는 대책을 발표했지만, 논란은 수그러들지 않고 있다. 논란의 명분은 투명성이다. 좀 더 자세히 말하면, ‘수상한 알고리즘’에 있다. 거의 모든 알고리즘은 어떤 로직과 기준으로 설계됐는지 알 수 없다. 기업의 지식재산 보호라는 명분으로 공개하기를 꺼린다. 그 불투명한 박스 속을 소비자 대부분은 믿고 있다. 전체 이용자 중 44%가 시청했다는 넷플릭스 오리지널 <오렌지 이즈 더 뉴 블랙>의 흥행에는 넷플릭스의 의도가 없었을까?(분명 재미있는 콘텐츠지만 여성 수감 드라마라는 마이너적 코드가 4000만 명의 눈길을 끌었을까?) 혹은 보다 많은 이익을 남기는 제품 A를 이커머스업체는 B보다 종합 점수가 낮다는 이유로 노출 빈도를 줄였을까? 알고리즘은 정말 소비자 중심의 패턴을 파악해 최선(정답)을 알려주는 걸까? 거기에 대한 질문이 필요한 시기다. 취향의 형성도 문제다.
프랑스 사회학자 피에르 부르디외(Pierre Bourdieu)는 취향을 통해 사람들이 사회화하는 가운데 특정 성향을 만들어간다고 말했다. 그러니까 취향이란 본질적 차이로 자신을 드러내는 정체성이라는 의미일 거다. 과거, 취향은 무수한 노력과 시간을 통해 얻었다. 여러 번의 시행착오를 거치고, 발품을 팔고, 공부를 해야 두께가 쌓였다. 지금은 근원조차 모를 타인의(혹은 로직의) 취향을 알고리즘을 통해 무수히 모방한다. 조금 과장하면, 알고리즘이란 우리가 우리답게 혹은 우리를 찾는 과정을 침해하는 편협한 상술일 수도 있다는 것이다. 인생은 무수한 변수와 그것의 혼합을 통해 완성된다. 실패도 필수 요소라는 걸 알고리즘은 모른다. 정확히 8년 전 다수의 음원 스트리밍업체가 도입하기 시작한 알고리즘에 대해 칼럼을 썼다. ‘당신의 취향을 만들어드립니다’라는 제목이었는데, 그때 상당히 신이 나서 현상을 반긴 것으로 기억한다. 나조차도 그때와는 생각이 다르다. 지금은 스포티파이의 추천 음악이나 유튜브의 추천 영상 대신 꼭 검색하고 직접 리스트를 구성해 콘텐츠를 소비한다. 왠지 못마땅하다. 사람은 이런 것이다. 이문세의 노랫말처럼 ‘알 수 없는 인생’이라 더욱 아름다운 것이다.

 

에디터 조재국 일러스트 최익견

관련 기사

페이지 처음으로