입지전략

공공데이터 시각화 : 광주광역시 광산구 청소년복합문화센터 입지평가와 대중교통버스노선맵핑

전공수업을 거치면서 가장 재미있게 작업했던 부분은 다이어그램이다. 데이터시각화(data visualization)와 견주어 말하자면 사고시각화(logic visualization)라고 이름 붙이면 적절할 것 같다. 그렇다고 데이터시각화라고해서 로직이 없는 것이 아니기에 그 둘을 나눈다는 시도 자체가 별 의미가 없다고 생각한다.

데이터시각화는 왜 하는가? 좋은 데이터시각화란 무엇인가?

명쾌한 답이 될 수 있을지 잘 모르겠지만, 데이터시각화는 숫자로 표현되었을때는 잘 몰랐던 사실을 새롭게 보기 위함이다. 그렇기에 시각화를 하든 안하든 상관없는, 이해하기 어렵지 않고 이미 알고 있는 단순한 사실을 시각화하는 건 큰 의미가 없을 수 있다. 그건 그저 '그래프 꾸미기'에 지나지 않는 것이다. 시각화를 통해 '아~ 이런 사실/문제점/차이점/공통점/의미가 있었구나'하고 새롭게 알게되고 공감, 공유되는 과정을 유도하는 결과물이야말로 좋은 데이터시각화라 할 수 있겠다.

그동안 재밌게 찾아본 비주얼들은 대부분 단순한 통계수치를 꾸미는 것에 지나지 않거나, 복잡한 내용을 단순한 그래프로 일바화하여 간단히 설명하였다 하더라도 '그래서 그게 어쨌다는거지?' 하는 투로 반응할 수 밖에 없는 경우도 많았다. 

그렇기 때문에 실무적으로 혹은 전략적으로 필요한 의사결정에 영향을 줄 수 있는 방향으로 데이터가 수집되고 활용되고 표현될 때 데이터시각화는 큰 의미를 가질 수 있을거라 생각한다.

서론이 너무 길었고, 최근에 작업한 것들을 몇 개 소개할까 한다. 시작부터 데이터시각화의 요건을 나름 엄격하게(?) 말했지만, 벌려놓은 이야기에 어울릴만큼 내가 좋은 결과물을 만들어내고 있다는 이야기는 아니다. 좀 구차한가 ㅎㅎㅎ


1. 청소년문화센터 입지평가

광주 광산구청과 작업한 것 일부이다. 현재 청소년복합문화센터를 건립하기 위해 노력중이다. 적절한 부지를 탐색한 결과 건물을 세울 곳을 우선 정했다. 과연 그 위치가 적절한지에 대해 ppt 한장에 요약될 수 있도록 지도 한장과 그래프 두 편을 만들었다. 사용한 데이터는 통계청이 발표한 2010년 인구센서스 자료와 GIS United의 XsDB이다.(http://www.gisutd.com/GU_XsDB/)

바탕에 깔린 갈색농도는 청소년인구가 어디에 분포해있는지(살고 있는지)를 보여준다. 색이 짙을수록 청소년이 밀집해있다는 뜻이다. 노란색 십자가로 된 부분이 건설예정지이다. 

평가하고 싶었던 부분은 '보다 많은 수요자의 접근성'이다. 보다 많은 청소년들이 쉽게 찾아올 수 있는 위치에 건물을 짓는 것인지 알아보고 싶었다. 

지도로만 확인해도 짙은 갈색이 아래 위로 넓게 분포하는 것을 알 수 있다. 또 하나 확인할 수 있는 것은 신가동/신창동 사이에 보이는 청소년 밀집지, 가장 위쪽에 첨단지역에 보이는 청소년밀집지이다.

예정지를 중심으로 반경 3km의 원을 그려 공간연산을 통해 얼마나 많은 청소년이 거주하고 초중고교가 주변에 있는지를 체크했다. 그 결과 예정지로부터 반경 3km 이내에 광산구 전체 청소년 인구의 약 28%가 거주하고 있다는 사실을 알 수 있었다. 그리고 청소년들이 통학하는 초중고교 갯수와 학생수 또한 광산구 전체의 1/4가량 분포하고 있었다. 앞서 언급한 또다른 청소년 밀집지와 비교를 하지는 않았지만, 청소년복합문화센터의 위치로 적절하다고 보여진다.


2. 광주광역시 대중교통 평가 - 버스노선은 적절한가?

광주 광산구는 최근에 인구가 급증한 지역이다. 경기도의 1기 신도시(성남시,고양시 등등)와 유사한 성격을 나타낸다. 때문에 인프라가 갖춰지는 속도는 인구가 증가하는 속도에 발맞추지 못하고 있는 것이 사실이다. 그 중 광주 전체를 놓고 봤을 때 대중교통버스 노선 수는 적절히 편제되었는지 확인해보았다.

버스가 다니는 도로에 몇 대의 버스가 지나다니고 있는지를 맵핑했다. 두껍고 짙은 갈색일수록 많은 버스, 얇고 옅은 노란색일수록 적은 버스노선이 다니는 것을 뜻한다. 옅은 회색의 땅은 광산구, 짙은 회색의 땅은 광주의 기타 행정구(동구,북구,서구,남구)이다. 한눈에 보기에도 광산구와 다른 행정구의 버스교통상황은 크게 차이가 난다. 이를 수치적으로 비교하면 다음과 같다.

광산구는 북구 다음으로 인구규모가 큰 지역이다. 커버하는 면적은 광주 전체의 50%에 이른다. 하지만 구 내를 경유하는 버스노선 수는 37편으로 최하위를 기록하고 있다. 단순 산수로 인구를 버스노선수로 나누어보면 남구에 비해 약 2배에 이르는 1만명 가량이 하나의 노선을 이용한다고 할 수 있다. 이러한 버스노선 불균형 문제를 개선하려한다면, 광산구는 (1차적으로) 노선당 7천명 수준이 될 수 있도록 - 인구가 가장 많은 북구를 기준으로 - 증편하는 것을 고려할 수 있다. 그리고 증편하는 지역은 위의 지도에서 얇고 샛노란 도로를 기준으로 하면 될 것이다. 

버스를 증편하는 기준을 하나 더 고려한다면, 경제활동인구를 고려할 수 있다. 광주의 대표적인 산업단지로는 하남산업단지와 첨단산업단지가 있다. 하남산업단지는 광산구에, 첨단산업단지는 북구에 위치하고 있다.

왼쪽지도는 하남산업단지를 지나는 버스노선을 맵핑한 지도이고, 오른쪽은 첨단산업단지를 지나는 버스노선을 맵핑하였다. 바탕의 녹색 밀도는 광주 전체의 30대 인구분포이다. 대조적으로 드러나는 것은, 하남산업단지를 경유하는 버스는 광산구 내부에서 운영하는 노선이 대부분인데 반해, 첨단산업단지를 경유하는 버스노선은 광주전체를 누비고 있다. 

30대 인구가 산업단지 내 직장을 고려할 때 우선순위는 어느 곳이 될 수 있을까? 구직자가 자가용을 이용하지 않는다 가정하면, 광산구 이외의 동구,서구,남구,북구의 30대 구직자는 하남산업단지의 다른 여건이 좋다하더라도 교통문제 때문에 첨단산업단지를 선택할 가능성도 있다. 

다시 말해, 단순히 버스노선을 양적으로 증편하는 것에 그치지 않고 지역 내 생활환경, 경제활동 등을 고려해서 질적인 증편이 될 수 있도록 하면 좋을 것이다.



신고
크리에이티브 커먼즈 라이선스
Creative Commons License

패션브랜드의 출점 입지 전략

지난 12월~2월까지 3개월간 한 패션브랜드의 매장별 매출데이터를 분석한 내용 중 일부입니다. 

분석된 내용 중에는 공개하기가 어려운 부분도 있기 때문에 어떤 방법들을 활용했는지를 중점적으로 적어보겠습니다.



이 패션브랜드는 현재 전국에 240 여개 가맹점을 가지고 있고, 앞으로 50~60개 정도의 가맹점주를 더 모집할 계획입니다

따라서 이번 분석을 통해 얻고자 한 결과물은 "어느 지역에 추가로 점포를 개설하면 좋은가?" 하는 질문에 대한 답변입니다

이 문제를 풀어내기 위해 7가지 핵심질문을 다음 표와 같이 정리하였습니다


핵심과제.PNG


위의 그림을 다시 풀어보면

sales : 고객분석 -> 브랜드의 핵심고객은 누구인가?

location : 점포분석 -> 매출이 높은 점포의 입지특성은 무엇인가?

=> "핵심고객이 밀집해있고 좋은 입지조건을 가지고 있으나 아직 점포가 출점하지 않은 곳은 어디인가?"

그리고 향후에 현장에서 출점과 마케팅에 도움이 될 수 있는 효과적인 gCRM 방법은 무엇인가?

이렇게 요약할 수 있겠습니다



분석 프로세스는 다음과 같습니다

입지전략_scale별.PNG 


전국 시군구 251개 중 매출이 높거나 가능성이 많은 시군구를 먼저 고르고, 구체적으로 어느 지역이 입지적으로 좋은 곳인지를 제안하였습니다.

zoom-in 정도는 반경 500미터 벌집모양의 헥사곤인데, 그 크기는 서울의 신촌 정도의 크기입니다. 

다시 말하면 '신촌 어딘가에 매장을 내면 매출이 잘 나올것으로 예측된다' 하는 수준까지 제안한 것입니다.


매장 분석 - 매출권역별 분류


아래 지도는 전국 각 매장의 매출권역 크기를 그려본 지도입니다

매출권역1.PNG 

매출권역이라는 것은 특정 매장의 매출 70%가 발생하는 공간의 크기입니다.

만약 매장으로부터 먼 지역에서 오는 고객이 많다면 매출권역은 클 것이고,

매장과 아주 가까운 지역에 고객이 밀집해있다면 그 매장의 매출권역은 아주 작을 것입니다.

지도에서 볼 수 있듯이, 창녕군의 매장은 창녕군 면적의 절반 정도를 커버하는 반면, 김해시의 어떤 매장은 매출권역의 크기가 매우 작습니다.


매출권역2.PNG 

이 슬라이드는 모든 매장을 매출권역 크기를 기준으로 분류한 것입니다. 

매출권역이 큰 매장은 광역형 매장, 크기가 작은 매장은 밀집형 매장, 나머지는 일반형 매장으로 부르기로 합니다.


오른쪽의 스파이더 차트를 보시면, 광역형/일반형/밀집형 매장이 어떤 특성을 갖고 있는지 비교할 수 있습니다.

광역형 매장의 경우, 매장 주변에 유사업종인 패션매장 수가 매우 많은 것을 알 수 있습니다. 

다시 말하면, 이 매장은 먼 곳에서 많은 사람이 찾는 상권이 발달한 지역에 입점한 경우입니다.

반면 밀집형 매장은 매장 주변에 주거인구와 아파트 가구수가 월등히 많은 것을 알 수 있습니다. 주거밀집지역이라고 할 수 있습니다.


매출권역3.PNG 

각 유형을 대표하는 세 개의 매장을 비교한 그래프입니다.

X축은 오른쪽으로 갈수록 매장으로부터 거리가 점점 멀어지는 것이고, Y축은 누적되는 매출액의 비율입니다. 

A매장은 밀집형매장의 한 사례인데, 그래프를 보면 1100미터까지 그래프가 가파르게 상승하며, 전체 매출의 70%가 발생하는것을 볼 수 있습니다.

반면 C매장(파란색 선)은 그래프가 완만하게 상승합니다. 결국 X축의 오른쪽 끝까지 살펴봐도 전체 매출의 50%를 넘기지 못합니다.

다시 말하면, 절반 이상의 고객은 매장으로부터 반경 5km 바깥에 위치하고 있는 것입니다.


매출권역4.PNG 

매출권역별로 나눈 매장을 다시 매출액 기준으로 분류하여 9개로 나누어보았습니다.

매출액이 높은 유형의 매장만 골라서 비교해보면, 밀집형이 27개, 일반형이 13개, 광역형이 20개인 것을 알 수 있습니다.

즉, 이 패션브랜드에서 매출기여도가 높은 매장은 주거밀집지에 인접한 '밀집형매장'이라고 볼 수 있습니다.

하지만 매출액이 낮은 유형을 보면 그 수가 비슷하거나 같아서 편차가 그리 크다고는 볼 수 없습니다.

좀 더 상세한 분석이 필요한 부분입니다.


매장분석 - 매출볼륨과 성장률 기준 매장분류


매출기준분류.PNG


매장을 매출액 크기와 성장률을 기준으로 분류한 슬라이드입니다.

현상유지/주목/집중관리/성장형 매장으로 분류하였습니다.


현상유지(F매장)는 현재 매출액은 높으나 성장률은 다소 정체되어있거나 떨어지는 매장들입니다.

이미 입점한 지역에서 올릴 수 있는 매출을 달성한 것일 수도 있고, 더 성장할 수 있는 동력을 찾아야할 수도 있습니다


집중관리(E매장)는 매출액도 낮고 성장률도 떨어지는 지역입니다.

인근에 다른 브랜드가 많이 들어와서 경쟁력이 떨어지거나, 혹은 속해있는 상권이 쇠퇴하는 지역일 수도 있습니다.


성장(C,D매장)은 매출액은 크지 않으나 3년간 추이를 볼 때에 꾸준히 매출액이 증가하고 있는 매장입니다.


주목(A,B매장)은 매출액도 크고, 성장률도 좋은 매장입니다.


그래프의 좌우를 보시면 수도권/광역시/지방 으로 나누어 몇개의 매장이 속해 있는지를 적어 놓았는데(여기서는 가렸지만)

이를 통해서 이 브랜드가 강점을 가지는 지역이 어디인지도 판단할 수 있겠죠?


다시 돌아와서 브랜드에서 주목할 매장은 성장형과 주목형 매장일 것입니다. 우선적으로 검토되어야하는 것은 당연히 주목형 매장이고요.

이 매장들이 잘되는 이유는 여러가지가 있을 것입니다. 

상권이 급속히 발달하고 있는 지역일수도 있고, 인근에 주거단지가 개발되어서 인구유입이 많았을 수도 있고요

혹은 매장을 관리하는 점주의 마케팅 능력이 탁월해서 일수도 있습니다. 

다만 개인의 능력치는 점수화하기가 어렵기 때문에 이 매장들이 잘 되는 이유라고 단정짓기도 어렵고, 분석하기도 어렵습니다.

그래서 수치적으로 분석가능한 것들을 모아서 '주목형'에 속하는 매장들이 왜 잘되고 있는 것인지 공통적인 요인을 찾아보았습니다.


출점 가능지역 판단을 위한 헥사곤 분석

헥사곤설명.PNG

매출액이 많은 매장들이 잘되는 공통적인 요인을 찾기 전에, 이번에 분석방법으로 사용한 '헥사곤'에 대해 간략한 설명이 필요합니다

헥사곤은 그림을 통해 알 수 있듯 벌집모양의 육각형을 말하는 것입니다. 

지도에 보이는 아주 작은 점들은 고객들의 위치를 지오코딩한 결과입니다. 

이 지오코딩한 결과를 반경500미터의 벌집통에 모아 담아서 각 헥사곤들을 비교였습니다.

우선은 어느 헥사곤에 고객이 많이 들어가는지가 중요할 것이고, 동시에 어느 헥사곤 있는 고객들이 매출기여도가 높은가를 따져볼 수 있습니다.


더 중요한 것은 각 헥사곤이 가진 특징들을 정리하는 것입니다. 

헥사곤 별로 버스정류장이 많은지 적은지, 패션관련 상점이 많은 것인지, 인구 규모는 얼마나 되는 것인지, 

아파트 가격대는 어떻게 되는지 등등을 공간연산을 통해 살펴보고 비교할 수 있습니다.

이렇게 정리된 헥사곤의 특징과 고객이 얼마나 많이 담겨있는지를 비교하여 연산하면 이 패션브랜드를 찾는 고객의 특징을 간접적으로 추측할 수 있습니다.


회귀식.PNG 


공간에 흩어진 여러 정보들을 헥사곤으로 취합하여 새로운 데이터셋을 하나 만들었습니다. 

이 데이터셋에는 고객데이터와 매출데이터, 인구 및 가구, 상권발달정도를 체크할 수 있는 여러 지표들이 포함되어 있습니다.

통계프로그램을 이용하여 이중에서 매출에 영향을 미치는 변수들을 골라내고, 헥사곤에 다시 적용할 단순회귀식을 하나 만들었습니다

결과적으로 저 위의 모든 변수가 사용된 것은 아니고, 주요한 몇 개 인자들을 골라낼 수 있었습니다. 


그리고 만들어낸 회귀식의 R²은 0.46입니다. 

점주의 능력, 고객의 심리상태, 트렌드 등 많은것을 제외하고 수치화가능한 공간요소로만 이루어진 회귀식이 매출예측을 하는데에 기여하는 정도가 46%라는 뜻입니다.


다음은 통계예측치와 실제 매출을 보여주는 지도를 비교한 것입니다. 여러지역 중 부산경남 지역을 예로 들겠습니다.


회귀지도.PNG 

왼쪽은 통계식을 통해 그려본 지도이고, 오른쪽은 실제로 발생한 매출은 맵핑한 지도입니다.

붉은색일수록 매출액이 높고(매출액이 높을 것이라 기대되고) 푸른색일수록 매출액이 낮은(낮을것이라 예측되는) 헥사곤입니다.

하나하나 들여다보면 색의 차이가 분명히 있지만, 전체적인 패턴을 보면 상당히 유사한 결과를 얻은것으로 보입니다.


아무런 색깔이 없는 흰색 헥사곤은, 기존 매장의 매출권역 바깥의 지역들입니다. 

새로 가맹점주를 모집한다면 기존 점주의 반발이 최소화되도록 흰색 헥사곤 지역에서 모집해야 할 것입니다.

위의 매출예측지도는 기존 매출권역을 대상으로 테스트를 한 것이고, 똑같은 통계식을 흰색 헥사곤에 적용하여 매장이 없는 지역의 매출예측을 하였습니다.

(흰색 헥사곤에 매출예측한 것은 결과적으로 클라이언트에 제안한 내용이기 때문에 에세이에는 생략합니다)

그리고 이번 에세이에 또 하나 생략된 내용은 고객분석입니다. 직접적으로 브랜드를 드러내는 부분이라 이 또한 생략합니다


정리하면, 


'전국적인 단위에서 가맹점주를 모집 혹은 직영점 개설을 고민할 때에 어떤식으로 GIS를 활용하여 의사결정을 할 수 있는가?'

에 대해 방법을 고민했고, 위와 같은 프로세스로 클라이언트에 제안하였습니다. 


클라이언트가 출점을 고려하고 있던 지역과 저희가 제안한 지역이 상당부분 일치하기도 했고, 새롭게 드러난 지역도 있었습니다. 

향후에 실제로 출점을 하고 매출을 확인해서 피드백을 받는다면 이번 프로젝트의 성과를 가늠할 수 있겠습니다


biz-gis 연결 : 

신고
크리에이티브 커먼즈 라이선스
Creative Commons License

+ Recent posts