[이뉴스코리아 박은혜 칼럼니스트]
심야 시간. 간간히 버스가 다닌다. 거의 텅텅 비다시피 한 버스가 있는가 하면, 늦은 시간에도 어느 정도의 사람들이 타고 있는 버스가 있다. 텅텅 비어 있는 버스를 보고 있으면 ‘저 늦은 시간까지 굳이 버스를 운행하여 인력과 에너지를 낭비할 필요가 있느냐’ 하는 의문이 들다가도, 사람들이 꽤 있는 버스를 보면 앞서 들었던 의문이 말끔히 사라진다. 한마디로 심야버스는 낭비인 듯 하면서도 없어서는 안 되는 존재다. 없앨 수도, 마냥 늦게까지 운행할 수도 없는 상황에서 문제를 해결해 주기 위해 등장한 것이 바로 서울시의 심야 ‘올빼미버스’, 출퇴근 맞춤 ‘다람쥐버스’다. 심야 운행 버스가 필요한 곳, 새벽 운행 버스가 필요한 곳을 빅데이터를 활용하여 파악한 후, 시민의 편의를 위해 이러한 버스 운행제도를 실시하게 된 것이다.
이 과정이 있기까지 빅데이터의 활약은 대단했다. 우선 교통카드 데이터를 비롯한 다양한 데이터를 수집한 후 정류소별 승‧하차 정보를 분석하여 각 시간대의 혼잡노선을 파악해내었다. 빅데이터가 아니고서는 이루어낼 수 없는 일이자 4차산업혁명의 바람이 불기 전까지는 상상할 수 없는 일이었다.
어렵다고는 하지만 이미 익숙해져 있는 빅데이터
버스 운행 서비스만 보아도 잘 알 수 있듯이 빅데이터는 삶의 질은 물론 자원의 효율적인 활용에 유익을 끼칠 수 있다. 하지만 일반 시민들에게 빅데이터는 여전히 어렵다. 용어는 익히 들어 알고 있지만 의미를 정확히 말해보라고 한다면 적절하게 대답할 이들은 드물다.
‘기존의 관리 방법이나 분석 체계로는 처리하기 어려운 엄청난 양의 데이터’, 이것이 본래의 빅데이터가 가지고 있는 정의다. 이런 빅데이터는 사실 4차 산업혁명의 대표하는 키워드라고는 하지만 이미 미국에서는 1880년대부터 등장했던 용어이며 이후로 지속적인 의미의 변화를 거쳐 온 용어이기도 하다. 의미가 어떻게 바뀌어져 왔든, 오늘날 기업이나 정부, 포털 등이 빅데이터를 효과적으로 분석하여 미래를 예측할 수 있다는 것은 기정사실이다. 더 나아가 예측을 통해 최상의 대응방안을 찾고, 이것을 실질적인 이익으로 연결할 수 있다는 기대감을 갖게 하는 것도 부정할 수 없는 현실이다.
또한 빅데이터를 모른다고 하지만 저마다 빅데이터의 도움을 받고 있다는 것도 부인할 수 없는 일이다. 버스 운행 외에도 가장 우리가 빅데이터를 표면적으로 경험하는 것 중 하나가 인터넷 상에서 마주하게 되는 ‘추천 사이트 및 추천 상품’이다. 내가 오늘 아침 인터넷이나 스마트폰으로 ‘경영’과 관련된 도서를 하나 검색했다고 해 보자. 그러면 그 이후로 내가 클릭하는 포털이나 쇼핑몰에 추천 도서가 뜨기 시작한다. 팝업창이든 하단 광고든, 다양한 추천 도서가 우리의 눈을 사로잡는다. 단연 경영과 관련된 도서다. 그 추천 도서를 보면서, 내가 알지 못했던 새로운 정보를 알게 되고 구입해야 하는 도서를 선정하는 데 꽤 많은 도움을 받게 된다. 이는 내가 검색하고 구매하고 클릭한 장르 등 방대한 자료를 분석하여 빅데이터가 형성되고 이에 맞게 나만의 맞춤형 서비스가 제공된 것이라고 할 수 있겠다. 도서뿐만이 아니다. 조카에게 선물해야 할 유아용품을 검색했다고 해 보자. 역시나 이후로 내가 방문하는 포털이나 쇼핑몰 하단 등에 관련 추천 상품이 뜬다. 그런 중에 기대 이상의 득템을 하게 되기도 하고 대수롭지도 않은 상품을 들여다보느라 시간을 빼앗기기도 한다. 하지만 우리가 무엇인가를 선택하는 데에 있어 도움을 받는 것만은 사실이다.
빅데이터에 숨겨진 대표적인 한계들
포털 사이트에 용무가 있어 방문을 했을 뿐인데, 갑자기 내가 검색하고 관심을 표했던 추천 상품들이 뜨기 시작하면 어떤 생각이 드는가? 일단 ‘편리함’을 경험하게 된다. 내가 조만간에 구입해야 할 물건들을 일일이 검색하여 찾지 않아도 자연스럽게 내 눈 앞에서 다양한 후보구들이 제시가 되기 때문이다. 그야말로 다양한 정보를 얻는다는 데에서는 더할 나위 없이 유익하다. 그러나 과연 빅데이터를 통해 분석된 나의 취향과 나의 구매 관련 의사가 ‘정보 제공’이라는 유익성만을 안고 우리에게 다가온 것일까?
결국은 이러한 추천방식은 서비스라고 하기보다는 광고의 성격이 크다. 우리는 이것에 대해 편리하다고 생각하면서도 어느 새 광고에 휘둘려 가고 있는 것이다. 보다 다양한 상품, 내가 생각지도 않았던 더 좋은 상품들이 등장하니 마음을 주고 시간을 주고 더 나아가 구매할 경우에는 특정 기업에 재화를 안겨줄 수밖에 없다. 엄밀히 말하면 이런 상황에서의 빅데이터는 우리에게 유익함과 편리함을 주기에 앞서 기업의 이익을 올리기 위한 도구일지도 모른다. 한마디로 빅데이터를 통해 우리의 무의식적 니즈를 활용하여 일종의 수익을 얻고자 한 것이다.
한편 빅데이터가 안고 있는 더 큰 문제는 개인 정보 노출 문제다. 빅데이터를 통해 뜨는 정보는 내가 네트워크상에서 공유했던 다양한 요소들이 수집되고 분석된 것이다. 여기에는 이미지, 영상, 텍스트 등이 모두 포함된다. 문제는 이런 무수한 데이터가 모이는 과정에서 나의 개인 정보가 유출될 수 있다. 더 나아가 이러한 기능은 기업정보에 대한 유출, 군사기밀에 대한 유출 등의 문제로도 이어질 수 있다. 실제로 한 금융회사의 고객정보가 대규모로 유출되어 이슈를 낳은 적이 있다. 이처럼 빅데이터는 엄청난 양의 개인정보가 수집 및 관리되는 과정을 수반함으로 개인정보의 누설이나 침해의 문제를 안고 진행될 수밖에 없다. 그리고 그 개인정보는 단지 사사로운 정보가 아니라, 공공의 기밀을 포함할 수도 있기 때문에 더욱 문제가 된다.
나가는 말
빅데이터는 우리가 빈번하게 만나고 밀접하게 경험할 정도로 우리 삶에 깊숙이 들어와 있다. 하지만 앞서 언급한 대로 긍정적인 면만은 있는 것이 아니다. 개인정보침해를 비롯하여 광고에 쉽게 노출되는 문제를 떠안아야 한다. 따라서 정부차원에서 관리, 대응방안에 대해 준비해야 할 것이다. 무엇보다 정보보안기술 자체의 개발과 더불어 정보보안전략이 체계적으로 이어지는 데에도 만전을 기해야 한다. 물론 현재에도 개인정보가 유출되는 문제가 이슈로 등장하곤 하지만, 아직까지는 완벽하게 책임을 지는 시스템과 마주하지는 못하는 실정이다. 이처럼 기업과 개개인이 빅데이터의 수집과 활용에 이어 보완체계가 지속가능한 형태로 개발이 되어야, 산업계와 일반 개개인이 모두 윈-윈하는 장을 펼칠 수가 있다. 이것이 우리가 빅데이터에 대해 제시해야 할 비전이자, 빅데이터를 활용할 인간에게 주어진 과제이다.