Think graphs & maps 2편: 장그래의 첫번째 슬라이드

** 신입사원 장그래

저는 윤태호 작가님의 '미생'을 즐겨보는 많은 팬들 중 한명입니다. 저도 사회경험이 길지 않다보니 공감이 가는 부분도 있고, 반면 저는 조직생활을 하지 않고 있어서 전혀 다른세계 같기도 하고 그렇습니다.

샤프하고 꼼꼼한 오과장과 김대리 밑에서 장그래는 무척이나 일을 잘해나갑니다. 제 입장에서는 자료를 어떻게 정리해서 보여줬을까하는 호기심이 생겼습니다. 우리가 이번에 만들어보고자 하는 슬라이드의 수준은 현업 10년차 이상의 베테랑들만이 작성할 수 있는 탄탄하고 감동적인 것이 아닙니다. 정말로 장그래 입장에서, 현업에 익숙치 않거나 아예 아무것도 모르는 취준생과 신입사원의 입장에서, 오과장과 같은 상사의 업무지시 이후에 어떤 것들을 스스로 고민해볼 수 있을까 생각해보기로 했습니다. 

미생 75화에는 장그래가 속한 영업3팀이 본격적으로 중고자동차 수출시장을 검토하는 부분이 나옵니다. 스토리를 조금 설명하고 가는 것이 좋을 것 같습니다. 요르단을 타겟으로 진행하던 중고자동차수출 프로젝트가 이러쿵저러쿵해서 엎어질뻔 하다가, 신입사원 장그래의 패기있는 제안으로 팀원 모두가 다시 탁자에 올려놓고 고민하게 된 상황입니다. 

<사업을 검토하는 영업3팀, 출처: 미생 75수 中>


** 데이터 찾아보기

미생 75수에는 아주 간략하게 해외 중고자동차수출시장에 대한 언급이 나옵니다. 

<중고자동차 수출시장 개요, 출처: 미생 75수 中>

2011년 기준으로 국내에서 약 29만 대의 중고차를 수출했고 그 중에 30% 이상이 요르단으로 수출되었다고 합니다. 뒷 내용을 조금만 더 언급하자면, 요르단에 도착한 중고차는 인근 국가로 다시 수출된다고 하네요. 중요한 시장인 것은 분명해 보입니다. 이제 정말로 중고차와 관련한 데이터를 찾아보기로 하겠습니다. 생각나는대로 한번 해보죠. 구글 검색창에 '중고차 통계'를 입력해 봤습니다.

검색창을 캡쳐한 그림 제일 아래에 '한국중고자동차수출조합'이라는 링크가 보이시나요? 생각보다 데이터를 쉽게 찾아낸 것 같습니다. 웹페이지를 한번 들어가 보니 이곳은 '사단법인 한국중고자동차수출조합'인 것을 알수 있구요, 그리고 이것저것 메뉴가 많네요. 어쨌거나 우리가 알고 싶은 것은 중고차수출시장에 관한 모든 정보입니다. 뭘 알아야 사업을 진행할 수 있을지 그것조차 모르는 단계이니까요. 그래도 이것저것 클릭하다 '자료실' 탭에서 'KUCEA 자료' 안에 들어가보니, 사업검토를 위한 기본적인 정보를 찾을 수 있었습니다.

KUCEA 자료실에는 월별로 중고자동차 수출통계가 꼼꼼하게 업데이트되고 있습니다. 미생 75수는 작년 10월에 연재되었습니다. 아마 윤태호 작가님께서는 연도별 통계 중 최신자료였던 2011년 자료를 사용하신 것 같습니다. 지금은 벌써 2013년 1월까지 통계가 올라와있네요.

엑셀 테이블을 성급하게 다운받기 전에 잠깐만 생각을 해봅시다. 월별 통계가 우리에게 모두 필요한 정보일까요? 아니면 볼 필요가 없나요? 최신데이터인 2013년 1월 통계를 보면되나요? 최신이면 다 좋은가요? 그것도 아니면 연도별 통계를 받는게 좋을까요? 근데 연도별 통계는 왜 필요할까요?

쉽고 간단한 질문을 생각없이 그냥 한번 나열해봤습니다. 화면에 떠있는 그대로 보겠습니다. 데이터가 시간순서로 정리되어 있으면 당연히 시간의 흐름에 따라 데이터가 어떻게 변화하는지 보기 좋을 것 같습니다. 그러면 연도별 통계와 월별 통계는 어떻게 다를까요? 너무 뻔한 대답이지만 연도별 통계는 수출총량이 연도별로 어떻게 변화해가는지 보기 좋을 것이고, 월별 통계는 매월 추이가 어떻게 달라지는지 알기 좋겠죠. 특히 자동차가 아니라 패션산업이라면 계절이나 날씨에 영향을 많이 받으니 월별 매출의 편차가 크지 않을까요? 자동차는 어떨런지 모르겠습니다. 막상 엑셀테이블을 열어보면 계절별 여성패션만큼이나 심하게 출렁이고 있을수도 있구요.

다시 본론으로 돌아와서, 지금은 사업검토를 하는 초기단계이니 총량을 비교해보기로 하겠습니다. 

첫번째 질문은 아무래도 "한국에서 해외로 자동차 수출하는 총량이 얼마나 되지? 계속 증가하고 있는건 맞아?" 정도가 될 수 있겠네요. 2010년, 2011년, 2012년의 국가별수출통계를 다운받겠습니다. 참고로 방금 수집한 가공되지 않은 데이터를 "raw data"라고 보통 부릅니다.


** 3년치 정보 긁고 읽기

각각 연도별 엑셀파일에는 과년도 통계도 같이 포함되어 있기 때문에 2011년과 2012년 자료만 다운받아도 괜찮습니다. 아무튼 raw data에서 우선 필요한 정보만 모아옵니다. 각각의 엑셀 테이블 제일 아래의 총합계 수치만 따로 모아 테이블을 아래와 같이 만들었습니다. 

'D' 컬럼의 대당 가격은 제가 한번 넣어봤습니다. 수출하는 중고자동차 한 대당 가격이 올라가고 있는지 아닌지 궁금했는데 조금씩 증가하고 있긴하지만 별 차이가 없군요. (5.3 * 1000$ * 환율 1109원)을 계산하면 평균적으로 대당 600만원 선에서 거래되고 있는 것 같습니다. 금액이나 수량으로 보면 급격하게 수출량이 증가하고 있는 것을 알 수 있습니다. 그래프를 그려보기 전에 무엇을 말하면 좋을지 글로 우선 표현해보죠.

"지난 3년간 중고자동차수출 추이를 보니 매년 수출량이 큰 폭으로 증가하고 있습니다. 2010년에는 약 24만대 수출, 12억 5천만불이었던 것이 2012년 집계에서는 약 37만대, 20억불을 기록했습니다. 그리고 한대당 평균 600만원에서 거래되고 있습니다"

이걸 있는 그대로 읽으면 좀 재미도 없고 알아듣기도 어렵습니다. 엑셀에서 2010년과 2012년의 차이를 계산해보면 약 1.6배의 수출량 증가가 있었던 것을 알 수 있습니다. 160% 증가했다라고 말해도 좋구요. 다시 한번 정리해보면

"2012년 우리나라에서 해외로 수출한 중고자동차는 약 37만대이고 수출총액은 20억불입니다. 이것은 2년 전인 2010년에 비해 160% 가량 증가한 수치입니다."


** 이제 그래프를 그려보자

이제 엑셀에서 그래프를 그려보겠습니다. 연도별로 수출량이 증가하는 것을 금액으로 표현할 수도 있고 수량으로 표현할 수도 있는데요, 굳이 두가지를 모두 그릴 필요는 없을것 같습니다. 왜냐하면 자동차 한대 당 가격의 변동이 거의 없었기 때문에 금액으로 그리는 것과 수량으로 그리는 그래프에 차이가 없을 것이기 때문입니다. 그래도 둘 사이를 구분하자면 수치적으로 와닿는 것은 자동차 수량이고, 최종적으로 시장규모를 결정하는 것은 금액인 것 같습니다. 바로 좀 전에 적은 텍스트대로입니다. 2012년에 37만대의 자동차가 해외로 나갔는데, 그 규모가 20억불이더라- 하는 방식으로 진행하면 좋을듯 합니다.

앞으로 자주 사용할 기능은 메뉴탭 중 [삽입]에 있습니다. 두가지로 그려서 확인해 보겠습니다.우선 '기준년도'와 '금액(천불)' 컬럼의 내용을 마우스 드래그로 영역을 지정한 뒤,

한번은 [세로막대형] -> [2차원 세로막대형-묶은 세로막대형]을 선택했습니다. 또 한번은 바로 옆의 [꺾은선형]을 눌러 [표식이 보이는 꺾은선형]을 선택했습니다.


두 버튼을 각각 눌르면 다음과 같은 그래프가 생성됩니다.



그려본 그래프는 바(bar) 그래프와 라인그래프입니다. 두 그래프 모두 자동차수출금액이 증가하는 것을 또렷하게 보여주고 있습니다만, 하지만 제가 보기에는 bar chart가 더 나은 선택처럼 보입니다. 이유는 line chart를 쓰기에는 데이터포인트가 너무 적기 때문입니다. 데이터포인트가 연도별로 하나씩 총 3개 뿐인데, 적어도 5개 이상은 되어야 흐름을 보여주기에 좋을 것 같다는 생각이 드네요. 또 하나의 이유는 데이터의 성격 때문입니다. 연도별 데이터 자체가 월별 수출량이 집계된 결과입니다. 잘게 쪼개진 시간 단위의 데이터에는 line chart가, 누적된 결과를 표현하는 것은 bar graph가 비교적 더 잘 어울린다는 생각이 드네요. 

중고자동차 연도별 수출은 bar graph를 이용해보도록 하겠습니다. 기본으로 그려지는 그래프를 순서대로 편집해보겠습니다.


지저분한 것들을 우선 걷어냈습니다. 

1) 데이터포인트가 세개 뿐인데 Y축의 5만 단위의 구분을 모두 넣는 것은 불필요해 보입니다. 

2) 숫자를 걷어내고 나니 축선을 따라나온 가로눈금선들도 별 의미가 없습니다. 

3) 수량(대수)을 알려주는 것은 제목만으로 충분한 것 같습니다. 그래서 우측에 조그맣게 있는 범례도 지웠습니다. 

4) 그리고 X축의 기준년도 사이에 있는 세로 눈금선도 없앴습니다. 


그리고 다음으로 진행합니다.

1. 초기에 설정된 chart의 제목은 데이터의 컬럼명인 '수량(대수)'로 되어있습니다. 그래프를 정확히 설명하는 제목으로 바꿉니다. 단위를 함께 기입해주고 위치도 정리해줍니다. 정중앙에 제목이 있는 것보다는 한쪽으로 정렬해 주는 것이 깔끔해 보입니다. 폰트의 크기를 조절하는 것도 매우 중요합니다. 저는 제목은 12pt, 단위는 10pt로 맞췄습니다.

2. 그래프에 수치를 넣어줍니다. 그래프를 클릭한 뒤 리본탭에서 [레이아웃] -> [데이터레이블] -> [바깥쪽 끝에]를 클릭합니다.

다음으로 오른쪽 그래프를 같이 보겠습니다. 여기서는 최근년도 데이터에 집중할 수 있도록 bar의 색을 바꿔줍니다.

1. 2012년의 bar를 강조해서 볼 수 있도록 짙은 회색으로 바꾸고, 나머지는 옅은 회색으로 설정합니다. 

2. 그리고 2010년과 2011년의 데이터레이블은 8포인트로 두고, 2012년 수치만 12포인트에 bold로 바꿨습니다.


다음으로 아래의 과정을 거치면 그래프가 완성됩니다.

1. 2012년 자동차수출수량에 수출액을 같이 기입해줍니다. 3년치 모두를 넣어줄 필요가 있을까요? 잠깐 고민하다가 하나만 넣기로 합니다. 이미 그래프로 수출량이 증대되는 걸 확인했는데 금액까지 모두 넣을 필요는 없어보이네요.

2. 왼쪽 차트에서 내용구성은 완료되었습니다. 마지막으로 말하고픈 메세지를 집어 넣습니다. [레이아웃] -> [텍스트상자] -> [가로 텍스트 상자]를 눌러 차트 안에 적당한 위치에 글을 집어 넣습니다. 내용은 "2010년에 비해 수출액이 160% 가량 증가함"이라고 적습니다.

3. 마지막에 다루지만 가장 중요한 것이 데이터의 출처입니다. 마찬가지로 [레이아웃] -> [텍스트상자] -> [가로 텍스트 상자]를 눌러 차트 안에 적당한 위치에 글을 집어 넣습니다. 아래의 공간이 협소하니, 바(bar)그래프가 포함된 곳을 클릭한뒤, 영역이 잡히면 아래쪽을 끌어올려 공간을 만듭니다. "출처: 사단법인 한국중고자동차수출조합"을 적어넣고 구석에 위치시킵니다. 


** 결과물 비교하기

편집이 마무리된 차트입니다.


엑셀 안에서 편집으로 차트를 위처럼 바꿨습니다. 원래 전하고자 했던 메세지와 의미가 통하는지 살펴보겠습니다.

"2012년 우리나라에서 해외로 수출한 중고자동차는 약 37만대이고 수출총액은 20억불입니다. 이것은 2년 전인 2010년에 비해 160% 가량 증가한 수치입니다."

우리가 만든 차트와 시작 전에 적어보았던 텍스트가 서로 잘 통하나요? 완성도를 높이려면 이것저것 더 편집해보고 싶긴 하지만, 1편에서 이야기했듯 차트는 필요한만큼만 빨리 만들어내는 것이 중요한 것 같습니다. 반복되다보면 자기만의 패턴도 생기구요.

드롭박스에서 작업한 엑셀파일을 열어보실수 있습니다. 링크는 https://www.dropbox.com/sh/0h6z4n23nl1tcjb/6jNCoagygw 입니다. 

신고
크리에이티브 커먼즈 라이선스
Creative Commons License

+ Recent posts