[사람중심] ‘빅 데이터’라는 용어는 최근 들어 정보통신 업계에서 ‘공기’나 ‘물’ 같은 존재가 되어버렸습니다. 이것 없이는 비즈니스의 경쟁력도 기업의 미래도 불투명하다고 합니다.
고객의 정보와 관련된 정형 데이터와 달리, 그 동안 그다지 중요하지 않은 것으로 여겨 왔던 비정형 데이터를 어떻게 활용할 것인지가 ‘빅 데이터’ 이슈의 요체입니다. 로그 파일, 전자거래 정보, 웹 검색 기록, e-메일 데이터, SNS 데이터, 사진·동영상 파일 등 무수히 많은 비정형 데이터를 잘 분석하고 가공하면 기업의 새로운 경쟁력이 될 수 있다고 합니다.
‘빅 데이터’라는 주제는 결국 비즈니스 인텔리전스(BI)라는 오랜 주제의 또 다른 이름입니다. 정보를 얼마나 똑똑하게 활용하느냐가 비즈니스에 새로운 가치를 부여한다는 것이죠. 빅 데이터가 화두가 되면서 BI라는 용어가 자주 거론되자, 문득 약 10년 전 즈음에 ‘비즈니스 인텔리전스 월드’라는 계간지를 만들었던 기억이 납니다.
당시 직장이던 컴퓨터월드에서 만들었던 이 계간지는 당시로서는 매우 선진적인 시도였습니다. CRM, ERP, SCM 같은 개별 솔루션들이 이슈가 되고 있던 시절에, ‘솔루션 그 자체보다는 정보를 어떻게 활용할 것인지에 초점이 맞춰져야 한다’는 깃발을 내걸었다는 자체만으로도 의미가 있는 시도였다고 생각됩니다(잡지는 이미 사라졌지만, 잡지 창간과 함께 시작된 ‘BI월드’라는 세미나는 이미 10년을 이어 오면서 해가 갈수록 많은 참가자들이 찾는 행사로 발전하고 있습니다).
당시 BI 잡지 창간호를 준비하면서 가장 인상 깊었던 것은 창간 기념 좌담회에서 들었던 ‘날씨와 BI’에 관한 이야기였습니다. 당시 좌담회에는 날씨 데이터를 활용하는 분야의 최고 전문가로 소개받은 서울대 노재선 교수(농경제사회과학부)가 함께 했는데, 매우 재미있는 두 가지 사례를 들려주었습니다. 서버니, DB니 하는 IT와 관련된 언급은 전혀 없었음에도 불구하고, 최근 이슈가 되는 ‘빅 데이터’의 의미를 일목요연하게 설명할 수 있는 사례라고 생각돼 소개해볼까 합니다.
편의점 - 장마철 가판대의 우산과 어묵
24시간 편의점 세븐일레븐은 해마다 장마철이 되면 각 점포 앞 판매대에 우산을 진열해놓는 정책을 펴왔습니다. 비가 많이 내리는 계절이니 당연히 우산 수요가 늘어날 것이라는 판단 때문이었죠. 하지만, 늘상 비가 오는 우기임에도 우산은 생각만큼 많이 팔리지 않았습니다. 이유인즉슨, 장마철에 우산을 가판대에 설치하는 전략은 그 동안의 판매 데이터에 근거하지 않은 것이었습니다.
과거 몇 년 간의 데이터를 살펴본 결과, 특이한 사실을 확인할 수 있었습니다. 장마철보다는 오히려 장마철이 오기 전의 6월 무렵에 우산 판매량이 더 많았다는 것입니다. 장마철에는 대부분의 사람들이 집에서부터 미리 우산을 챙겨서 나오는 반면, 본격 장마철 이전에는 우산 없이 집을 나섰다가 갑자기 쏟아지는 비에 우산을 사는 경우가 많았던 것입니다.
과거 데이터를 차근차근 분석하면서 알게 된 또 하나의 사실은 장마철에 예상 외로 어묵 판매가 잘 됐다는 사실이었습니다. 습기가 많고 눅눅한 기후가 장기간 이어지면서 따뜻한 국물을 찾는 사람이 의외로 많았던 겁니다. 결국 세븐일레븐 측은 장마철 가판대에 우산을 내놓는 대신, 어묵 코너를 설치해 더 많은 매출을 올릴 수 있었습니다.
놀이동산 - 눈·비 오는 날 롯데월드와 에버랜드의 희비
놀이동산처럼 날씨에 민감한 분야도 많지 않습니다. 대다수 놀이동산은 눈이나 비가 오는 날이면 사실상 개점휴업 상태라 해도 과언이 아니죠. 하지만, 실내 놀이기구가 많은 롯데월드의 경우 눈·비 오는 날 매출이 많이 오른다고 합니다. 계절별로 눈·비 오는 날 잘 팔리는 음식이나, 사람들이 많이 찾는 놀이기구를 파악해두면 매출을 높일 수 있겠지요.
롯데월드의 경우는 날씨와 함께 요일별 매출 데이터가 중요한 역할을 했다고 합니다. 주말에는 어린아이들을 동반한 젊은 부부나 고등학생들이 많은 반면, 주중에는 대학생 커플들이 적지 않다고 합니다.
그래서 주중에는 대학생들이 즐겨 찾는 놀이기구 주변에 이들이 좋아하는 먹을거리, 액세서리를 배치하고, 주말에는 어린이들이 선호하는 놀이기구 주변에 먹을거리와 장난감을 잘 배치해서 매출을 높일 수 있었습니다. 연말이 되면 주중에 대학입시를 치른 고3 수험생들의 방문이 늘어난다는 점도 날씨와 연계해서 중요하게 고려하는 데이터였다는군요.
와인 품질평가 - 전문가 입맛보다 정확한 공식
최근에는 슈퍼크런처라는 책에서 날씨와 관련된 흥미로운 내용을 접했습니다. 와인품질 평가와 관련된 것입니다. 예전에는 좋은 저장고에서 대략 10개월 숙성시킨 와인을 놓고 전문가들이 품평회를 해서 등급을 매겼다고 합니다. 얼마나 오래 숙성되었으며, 어떤 지역(강수량)의 와인인가 하는 전통적인 기준이 중요한 판단 요소였습니다.
그런데 약 10년 전, 아셈 펠터라는 교수가 전세계 여러 지역의 수많은 와인들을 분석해본 끝에 와인의 품질을 평가하는 새로운 공식을 만들어냈습니다. 그 공식이란 바로 아래와 같았습니다.
와인 품질
= 12.145+(0.00117X강수량)
+ (0.614X재배철 평균 기온)
- (0.00386X수확기 강수량)
이 공식에서는 이제껏 중요하게 고려되었던 재배지의 강수량은 그다지 중요하지 않습니다. 강수량에 매겨지는 가산점이 0.00117에 불과합니다. 오히려 포도가 재배되는 계절의 평균기온을 매우 중요하게 고려해 강수량보다 500배나 많은 가산점을 주었습니다. 경험에 의존해 판단하지 않고, 그 동안 축적된 날씨 데이터를 정확히 분석해서 새로운 평가법을 만들어낸 것입니다. 아셈 펠터 교수는 이 공식을 만든 뒤 30달러를 받고 팔았는데, 업계에서는 괴짜 교수 정도로 취급했습니다. 하지만 그가 “올해 어느 지역에서 생산된 와인은 가치가 2배 될 것”이라고 예측한 것이 적중했고, 그 다음해도 이 같은 예측이 맞아떨어졌습니다.
기존 평가 방식은 와인을 담그면 그 후로 10달 동안 오크통 안에 있기 때문에 그 기간에 어떤 변수가 있는지 제대로 예측할 수 없다는 것이 문제였습니다. 와인이 숙성되는 기간의 전체적인 날씨 데이터를 고려하지 않고 기존에 해오던 대로 10개월 전에 예측된 내용, 그것도 별로 중요하지 않은 강수량만을 계속 믿었기에 와인 품평에 오류가 적지 않았던 겁니다.
어느 분야의 어느 기업이나 데이터는 쌓여 있지만, 통계를 내고 분석하지 않는 데이터는 그저 데이터에 불과합니다. 데이터를 유심히 들여다보고, 그 속에서 유의미한 특징을 찾아낼 때 데이터는 비로소 경영에 경쟁력을 더해주는 정보가 될 수 있다는 사실을 위의 사례들은 설명해 주고 있습니다.
어제(11일) 방송된 KBS 예능프로그램 ‘1박 2일’에서는 인천의 백아도를 방문했는데, 풍랑주의보가 발령돼 배가 섬에 고립될 수도 있는 상황이 되자, 해경에 도움을 요청해 섬을 빠져나왔습니다. 그런데 이를 두고 인터넷에는 네티즌들의 질타가 이어지고 있습니다. “예능프로그램에서 편의대로 해경을 불러 민폐를 끼쳐야 하느냐?”는 것이었습니다. 갑작스럽게 풍랑주의보가 발령됐는지는 모르겠지만, 기상이변이 심한 섬 지역인 것을 고려해 미리 대책을 세웠더라면 이제 막 첫발을 내딛은 ‘1박2일 시즌2’가 이렇게 원성을 듣지는 않았을 거라는 생각이 듭니다.
‘기존의 경험에 기초한 예측’에 기댈 때 언제 어떻게 일어날지 모르는 위험요소를 제거하려면, 그 동안 쌓인 데이터를 제대로 분석해서 하는 일의 특성에 맞게 가공하는 정책을 세워야 하겠습니다.
<김재철 기자>mykoreaone@bitnews.co.kr
'클라우드컴퓨팅' 카테고리의 다른 글
네트워크 보안의 숙제…물리·가상·클라우드 환경의 통합 (0) | 2012.09.25 |
---|---|
태풍과 지진을 이기는 <IT재해복구 5계명> (1) | 2012.07.03 |
와인 평가하기 그리고 데이터 분석 (0) | 2011.12.06 |
퀀텀, 백업·관리 강화로 데이터 급증 해결책 제시 (0) | 2011.11.23 |
“전략적 IT활용의 열쇠는 서버 가상화” (1) | 2011.11.08 |