매경 인포그래픽 세미나 후기(현문우답 보충, 배운것 정리)

지난 금요일1(11월 22일)에 매경+한국인포그래픽포럼에서 주최하는 인포그래픽 세미나에 참석할 기회를 갖게 되었다. 

'의사결정을 위한 인포맵핑'이라는 주제로, 분석프로젝트를 진행하면서 데이터시각화가 어떻게 사용되고 있는지를 발표하였다.

이번 세미나는 우리 팀(GIS United)이 앞으로 작업을 잘해나가는데 많은 아이디어와 생각을 갖게 해준 좋은 기회였던것 같다.

두 가지 주제로 짧은 후기로 정리해보기로 했다. 하나는 질문을 받았던 것인데 답변이 너무 미흡해서 (죄송한 마음에) 여기에 다시 정리하는 것이고, 다른 하나는 강연을 들으면서 배운 것을 정리하는 것이다.


1. 가설을 갖고 인포그래픽을 시도했는데 막상 데이터 내용이 설득력이 없는 경우는 어떻게 하면 좋을지?

- 어떤 분이 질의응답 시간에 질문을 하셨었다. 내게 답변기회가 왔었는데 잘 준비하지 못했던지라 제대로된 대답을 드리지 못했었다. 세미나가 끝난뒤 여러번 생각이 나서 고민을 정리해봤는데, 아직 부족하지만 그때보단 좀 더 나은 답변을 할 수 있을것 같다.

1) 가설은 언제나 가설일 뿐 사실이 아니기 때문에, 데이터를 나의 주장에 끼워맞출 수는 없다. 데이터는 (사실은 그러하지 않지만) '객관적'이라는 편견이 있다보니 데이터를 조작하고 싶은 충동도 생길수 있지만, 그럴 경우 제작하는 시각화결과물 또는 인포그래픽은 큰 신뢰를 잃게되므로 그렇게 해서는 안된다.

2) 오히려 데이터가 보여주는 현상을 다른 관점으로 바라보는 것이 대부분 더 좋은 메시지를 주는 경우가 많았다. 하나의 사례를 들어보자면, 부동산 MD전략을 도출하기 위해 카드결제 데이터를 열어보면서 내 가설을 믿고 분석을 시작한 경우가 있었다. 아주 가까이 있는 두 개의 대형마트의 매출규모의 편차가 매우 컸고(9배 가량), 고객 구성도 매우 달랐다(한쪽은 30~40대가 전체 매출의 60%, 다른 한쪽은 50대 이상이 전체 매출의 60% 구성). 다음 순서로 고객 자택위치를 기준으로 매출분포를 살펴보고자 했다. 그동안 몇몇 프로젝트에서 고객분포를 그렸던 경험으로 봤을때, 당연히 후자의 대형마트 고객분포가 전자에 비해 훨씬 넓고 다양한 지역에 퍼져있을거라 생각했다. 하지만 결과는 전혀 다르게 나왔는데, 두 대형마트의 고객분포가 거의 차이가 없었고, 반경에 따른 매출비율도 별 차이가 없었다. 매출분포를 그리기 전까지 '매출규모의 차이', '연령별 고객구성의 차이', '매출의 공간적 패턴의 상이함' 세가지를 묶어서 하나의 슬라이드로 구성하려했으나, 데이터는 내 생각과 너무 다른 결과를 보여주는 바람에 진도를 나갈수가 없었다. 

3) 이미 데이터를 객관적으로 바라보는 관점을 놓치고 있었던 것 같다. 새벽에 혼자서 슬라이드를 놓고 끙끙댈 때 한발짝 떨어져서 슬라이드를 쳐다보던 동료가 아주 간단하게 풀어주었는데, 결론적으로 내용을 바꾼것은 하나도 없었고 관점만 살짝 다르게 했을 뿐이다. 원래 내가 구성하고자 했던 메시지는 '지리적으로 가까이 붙어있는 두 개의 마트라 할지라도, 데이터를 봤을때 이렇게 저렇게 요렇게 큰 차이가 난다'였다. 반면 동료는 같은 결과를 놓고 '두 개의 대형마트가 매출규모나 고객구성에서 매우 다른 패턴을 보이나, 두 지점을 방문하는 고객의 위치는 거의 유사하다. 경쟁에 밀리는 대형마트 입장에서는 방문가능성이 높은 잠재고객을 견인할 수 있는 기회요인으로 볼 수 있다'로 메시지를 정리했다.

4) 늘 우리끼리 하는 이야기이지만, 데이터는 절대로 스스로 말하지 않는다. 처음 데이터를 대할 때에는 이 데이터가 누구도 보지 못하는 새로운 결과를 보여줄거라 기대하지만, 막상 데이터를 열어보면 뚜렷한 패턴이 없거나 그저그런 평범한 결과인 경우가 대부분이다. 결국은 설명이 될만한 조각조각들을 꿰뚫어보는 독특한 관점이 데이터의 가치를 결정하게 되는 것 같다. 때문에 데이터가 보여주는 것 이전에, 관련된 주제에 대해 풍부하고 깊이있는 고민과 연구가 좋은 데이터시각화 결과물을 가져다 주게 된다.

5) 이런 맥락에서, 데이터가 하나도 없는 경우를 가정하고, 지금 갖고 있는 가설을 어떻게 설명할 수 있을 것인지를 생각해보면 좋을것 같다고 답변드렸던 것같다. 뛰어난 역사가들이 현재남아있는 기록물과 의복만으로 당대의 생활상을 설득력있게 파악하는 것을 보면, 좋은 데이터를 확보하지 못해서 좋은 메시지를 만들지 못하는 것은 아닌 것 같다.

6) 또한 위의 경우처럼, 분석과정에서 나오는 모든 결과들은 아무리 소소할지라도 동료들과 공유하면 공유할수록 좋다. 많은 경우에 데이터를 들여다보고 있다보면 혼자 데이터 속에 빠져서 중요한 것을 놓칠 때가 많다. 오히려 동료에게 설명을 하다가 스스로 정리되는 경우도 있고, 위의 경우처럼 또다른 결론을 얻을 수도 있다. 서로 다른 경험에서 얻어진 독특한 관점들이 비교되고 반영될 수 있기 때문에 팀웍은 항상 필요하고 중요하다.


2. 인포그래픽과 데이터시각화

1) 항상 모호하게 구분하여 생각해왔는데, 오후에 송정수 대표님 발표를 들으면서 좋은 실마리를 얻을 수 있었다. 나는 데이터시각화는 정량적인(quantitative) 것을 명확히 드러내주는 것이라고 설명을 하기도 하였고 실제로 그런부분도 있지만, 사실은 정확한 설명이 아닐 뿐더러 데이터시각화의 모든 특징을 설명하는 문장도 아니다. 모든 비주얼 컨텐츠의 목적이 그러한 것처럼, 데이터시각화도 정성적인(qualitative) 정보를 전달하기 위한 수단이다. 정량적 정보를 보여주는 것은 거쳐가는 과정에 가깝다.

2) 강연시간에 인포그래픽이 데이터시각화와 구별되는 지점이 '의도적인 것'이라고 설명을 들었다. 내 방식대로 강연내용을 이해하자면 , 그 둘을 구분하는 지점인 '의도적'이라는 것은 '명확한 메시지'라는 생각을 했다. 데이터시각화는 메시지를 도출하기 이전에 사용할 수 있는 꽤 효과적인 조각모음 과정과 같다. 하지만 데이터시각화 결과물 그 자체가 도출되고 정리된 메시지를 표현하는 가장 효과적인 방식은 아닐 수 있다. 때로는 어떠한 화려한 차트도 사용하지 않고 숫자를 굵고 크게 적는 것과 명확한 출처를 밝히는 것만으로도 효과적으로 메시지를 전달할 수 있는 것이다. 그래서 메시지의 효과적인 전달을 위해 또 한번의 가공이 필요한데, 이 과정이 인포그래픽이라는 생각이 든다.

3) 인포그래픽과 데이터시각화는 명확히 구분을 하기가 여전히 모호한 개념인 것은 맞지만, 누구와 관계지어 작업하는가를 살펴보면 조금 다른 영역에 있다. 인포그래픽이 메시지의 효과적인 전달이 중요한 언론이나 기업마케팅에 많이 쓰이고 있다면, 데이터시각화는 분석에 기반한 기획이나 컨설팅 영역에서 사용빈도가 높다. 그렇다고 각 영역에서 별도로 사용되는 도구나 방식이라 생각할 것은 아니다. 

4) 두 가지 도구(인포그래픽, 데이터시각화)를 잘 다루어서 완성도를 높일 수 있다면, 그래서 언론에서 기사를 다루거나 마케팅을 위한 컨텐츠를 만들때에는 풍부한 분석을 통해 더 좋은 메시지를 만들어내고, 컨설팅 영역에서는 분석보고서를 작성할때 그래픽요소를 잘 적용하여 분석결과를 더 효과적으로 전달할 수 있으면 참 좋겠다는 생각을 했다. 네이선 야우(비주얼라이즈 디스! 저자)가 왜 데이터시각화와 인포그래픽 양쪽을 넘나들면서 데이터를 설명하고, 때로는 데이터 아트도 언급하게 되는지를 조금 더 잘 이해할 수 있게 되었다.



신고
크리에이티브 커먼즈 라이선스
Creative Commons License

+ Recent posts