Think graphs & maps 1편: 바쁜 우리들을 위한 데이터시각화

** 데이터시각화.

'데이터시각화(data visualization)'라는 단어를 소재로 첫번째 글을 쓰게 되었습니다. 

처음 '직장 초년생을 위한 인포그래픽 혹은 데이터시각화'라는 가제로 아이디어를 내놓고 글을 써볼까 말까 고민을 많이 했었습니다. 이유는 저 역시 더듬더듬 배워가는 입장에서 감히 가르치듯 글을 쓸 수 있을까 덜컥 겁이 났기 때문입니다.

그럼에도 불구하고 글을 한번 써보기로 마음먹은 것은, 오히려 초심자가 글을 쓰면 사소한 시행착오도 같이 공유할 수 있지 않을까하는 기대 떄문입니다. 자전거를 갓 배운 어린이가 지금 막 자전거를 타려고 낑낑대는 친구에게는 더 와닿는 경험들을 나눌수도 있지 않을까 하는 것입니다.

마음을 낸 또 하나의 중요한 이유는, 북극성처럼 멀리 있는 고수들을 좇아서 배우는 것도 중요하지만 그들에게 닿을 수 있도록 하수입장에서 징검다리를 놓아주면 좋겠다...는 생각이 들었기 때문입니다. 개인적인 관심으로 구글검색창을 통해 수많은 해외의 고수들을 만나게 되는데요, 이를테면 Nathan Yau와 같은 분들은 정말 고수이지요. 그리고 세계최고의 그래픽팀이라 생각되는 'New York Times Interactive News'는 볼 때마다 감동입니다. Nathan Yau가 쓴 'Visualize This!'라는 책을 혹시 들어보셨는지 모르겠습니다. 데이터시각화를 제대로 해보고 싶은 분들에겐 입문서와 같은 책인데, 요즘 대세라고 불리우는 R을 기본으로 데이터시각화를 설명하고 있습니다. 하지만 R을 한번에 따라잡기에는 조금 막막한 부분이 있습니다. 앞으로 차근차근 배워볼 예정이긴 합니다만.

<미국대선 경우의 수, 출처: http://www.nytimes.com/interactive/2012/11/02/us/politics/paths-to-the-white-house.html>


** 이미 익숙한 툴

저는 여러가지 시각화 방법 중 하나인 '지도(map)'를 그리는 일을 하고 있습니다. 저야 데이터시각화를 업으로 한다지만 바쁜 대학생들과 직장인들에게 화려한 데이터시각화를 요구하는건 솔직히 어이없는 요구라는 생각이 듭니다. 직접 데이터시각화를 해보면 생각보다 많은 시간이 소요됩니다. 말이나 글로 표현하면 너무 길고 어려우니 그림으로 알려주고자 하는 것이고, 또 그림으로 설명하는 것은 익숙하지 않다보니 제대로 만들기가 어렵기 때문입니다. 하지만 동시에 업무에 방해되지 않는 선에서 중요하고 핵심이 되는 근거를 효과적으로 나타낼 수 있는 스킬을 갖추는 것은 절대 놓칠 수 없는 부분인것 같습니다.

그래서 우리가 데이터를 들여다보기 위해 가장 많이 사용하는 프로그램인 '엑셀'만 가지고도 효과적인 그래프를 만들어 낼 수는 없을까, 거기에 덧붙여서 그래픽 편집툴인 일러스트레이터나 QGIS(지도제작을 위한 오픈소스 프로그램) 사용법을 조금만 익혀서 각자의 업무에 효과적으로 쓰는 방법은 없을까하는 고민이 시작되었습니다. 사실 엑셀 하나만으로도, 그래프를 그리지 않고도 테이블 디자인만 조금 손봐도 파워포인트에 멋지게 넣을 수 있는 도표를 만들 수 있습니다. 그리고 이미 작업해왔던 그래프에 아주 조금만 손을 대도 전혀 다른 그래프로 만들어낼 수 있습니다.

** 이미 익숙한 형식과 지도(map)

그래프를 표현하는 방식도 최소화하려고 합니다. 위에 예시로 든 멋드러진 그래픽은 제쳐두고, 우리에게 앞으로도 영원히 익숙할 bar, pie, flow, plot graph를 잘 다루는 방법을 기본으로 하고, 덧붙여서 제가 집중해서 공부하고 있는 map 제작방법을 소개하려고 합니다. 앞의 여러 방식의 그래프는 익숙할지 모르겠지만 map은 생각만큼 쉽지만은 않습니다. 하지만 지도를 만드는 방법을 조금만 익힌다면 정말로 강력한 무기가 될 수 있습니다. 개인적인 바람은 이 글을 통해 배우신 많은 분들이 좋은 그래프를 빠르게 생산하고 버릴 수 있으면 좋겠습니다. 우리는 이 자리에서 예술을 하려는게 아니기 때문입니다.

<연재에서 다루게 될 bar, pie, flow, plot & map>


** 데이터와 식재료

요즘은 빅데이터라는 단어를 언론에서 많이 접할 수 있습니다. 하지만 마치 데이터만 풍부히 있으면 무언가 새로운 가치가 자연히 드러난다는 식의 보도에는 선뜻 동의하기가 어렵습니다. 방대한 엑셀 테이블을 두고두고 쳐다보면서 엉성한 지도를 그려내는 작업을 지금도 반복하고 있는 제 입장에서는 정말로 그렇습니다. 데이터를 고민해서 쳐다본 일이 없는 사람들에게는 사실 데이터란 쓰레기더미와 같은 것입니다. 그래서 친구들에게 쉽게 설명하고자 할때에는 데이터시각화를 '요리'에 비교하곤 합니다.

<식료품점에서 야채를 고르는 사람, 출처:월스트리트저널-동네 식료품점의 승승장구 비결>

데이터는 식료품점의 식자재와 같습니다. 첫째, 조리하지 않으면 아무 의미가 없다는 것, 둘째, 조리하고자 하는 방법에 따라 식자재의 선택도 매우 달라진다는 것, 셋째, 결정적으로 누가 조리하느냐에 따라 음식의 품위가 달라진다는 점에서 같습니다.

이제 막 요리계에 입문한 초보요리사와 7성급 호텔의 주방장이 세상의 모든 식자재가 있는 대형마트에 요리재료를 사러왔다고 가정해봅시다. 답은 간단합니다. 요리의 고수는 달걀 몇개와 몇가지 야채만으로도 감동적인 스크램블에그를 대접해줄 수 있습니다. 또한 맛에만 민감하지는 않을 것입니다. 그릇에 담아내는 모양은 당연히 예쁠것이고, 먹는 사람을 생각해서 영양도 충분히 고려할 것 같습니다.

데이터라는 것도 이것과 크게 다르지 않다고 생각합니다. 주어진 데이터를 어떻게 쓸 때 가치있는 것인지도 충분히 고민해야하고, 효과적으로 표현하는 방법도 시도해야하며, 무엇보다도 업무에 도움이 되는 방향으로 해석해서 의미를 담아내야 합니다. 세상에서 제일 쓸데없는 그래프가 바로 내용은 없고 예쁘기만 한 그래프입니다. 좀 바꿔서 적어보자면 "So what?"이라는 질문에 정확히 답할 수 있어야합니다. 제 개인적인 주장이 그렇다는 것이 아니라, 데이터를 제대로 활용한다는 것은 응당 그러한 의미인 것 같습니다.

**  앞으로의 계획

때문에 연재에서 데이터 시각화만 골라내어 다룰수는 없을 것 같습니다. 어떤 종류의 데이터를 어떻게 검색하고, 획득하고, 바라보고, 해석하고, 시각화하는 프로세스를 오갈 것입니다. 저도 하수인지라 우왕좌왕하겠지만 그 과정조차도 같이 공유할 수 있으면 좋겠습니다.

이제 방대한 종류의 데이터 앞에 놓인 우리의 상황을 한번 정리하면 좋겠습니다. 농수산물 직판장까진 아니더라도 조금은 다듬어진 식재료가 있는 대형마트 식료품 코너 앞에 섰다고 가정을 합시다. 게다가 우리는 한번도 요리를 제대로 해본적이 없거나 기껏 라면이나 좀 끓여본 수준이구요. 그리고 빅데이터에 욕심내지 맙시다. 거듭 돌려 말하지만, 유기농 채소 쓴다고 맛있는 요리가 되는 것이 절대 아닙니다. 양손에 쥘수 있는 스몰 데이터를 제대로 이해하고 표현하는 데에 초점을 맞추겠습니다.

어떻게든 연재를 시작하게 되었는데요, 저도 이 글들이 어디로 튈지 아직 잘 모르겠습니다. 숨어있는 고수분들께서 피드백을 주시면 좋겠습니다. 저도 이번 연재가 더 빡세게 공부할 수 있는 기회가 되었으면 합니다.

신고
크리에이티브 커먼즈 라이선스
Creative Commons License

+ Recent posts