엑셀 파워쿼리로 open api 분석하기 (아파트 매매 2)
앞선 글에서도 설명드렸듯이
Open api를 통해 데이터 분석은 하고 싶은데, R, 파이썬 등 어려운 코딩으로 하는게 아니라
엑셀로 직접 눈으로 데이터를 보면서 분석하고자 하는 분들에게 소개하는 글입니다.
Open api를 분석하기에 좋은 툴들도 많지만, 초보자를 위한 엑셀 파워쿼리를 활용한 사용법이오니 필요하신 분들만 참고 부탁드립니다.
지난번에 이어 국토교통부의 아파트 매매 실거래가 데이터 분석하는 법을 이어가기 앞서.
그 전 글에서 국토교통부에서 인증키를 받은 후 open api의 샘플 데이터를 엑셀로 가져오는 방법까지 소개해 드렸는데, 이 글을 처음 보신 분께서는 아래 링크를 통해 먼저 참고해주세요
2021.11.11 - [엑셀] - 엑셀 파워쿼리로 빅데이터 open api 분석하기
엑셀 파워쿼리로 빅데이터 open api 분석하기
엑셀 파워쿼리로 빅데이터 open api 분석하기 과거에는 수기로 정리되던 data들이 전산화되고, 체계적으로 정리가 됨에따라 최근 기업뿐만 아니라 일반인들에게도 Big data 분석이 중요해지고
greendays2.tistory.com
다시 한번 간단히 요약하면
엑셀 메뉴 중 데이터 – 새쿼리 – 기타원본에서 – 웹을 클릭하면
(엑셀 버전에 따라 위치는 조금 다를 수 있습니다)
아래와 같이 url 주소를 입력할 수 있는 창이 팝업되는데 여기다 방금 복사한 url 주소를 입력합니다.
우리가 가져와야 할 데이터는 샘플이 아니라 원하는 지역 또는 전국의 데이터를 쉽게 가져와야 하므로 몇가지 추가해야 할 사항이 있습니다.
1. 원하는 지역의 데이터 가져오기
먼저 가져온 데이터의 url 주소를 살펴보면 크게 서비스 url 주소 + 지역코드 + 계약월 + 인증키로 구성되어 있습니다.
http://openapi.molit.go.kr:8081/OpenAPI_ToolInstallPackage/service/rest/RTMSOBJSvc/getRTMSDataSvcAptTrade?LAWD_CD=11680&DEAL_YMD=202103&serviceKey=서비스키
공공데이터포털에 있는 국토교통부 실거래가 정보 오픈 API 활용 가이드 hwp 파일을 한번 열어보시면
다 상세기능내역에서 b) 요청 메시지 명세에 어떻게 사용하는지가 자세히 나와 있는데,
항목명(영문) | 항목명(국문) | 항목 크기 |
항목 구분* |
샘플 데이터 |
항목설명 |
LAWD_CD | 지역코드 | 5 | 1 | 11110 | 각 지역별 코드 행정표준코드관리시스템(www.code.go.kr)의 법정동코드 10자리 중 앞 5자리 |
DEAL_YMD | 계약월 | 6 | 1 | 201512 | 실거래 자료의 계약년월(6자리) |
serviceKey | 인증키 | 100 | 1 | 인증키 (URL Encode) |
공공데이터포털에서 발급받은 인증키 |
※ 항목구분 : 필수(1), 옵션(0), 1건 이상 복수건(1..n), 0건 또는 복수건(0..n)
url 주소에 필수로 들어가야 하는 항목은 3가지로, 지역코드, 계약월, 인증키 입니다.
즉 이 3가지만 수정하여 url 주소를 입력하면 언제든 내가 원하는 지역, 일자의 데이터를 가져올 수 있다는 의미로 예를들어 나는 강남구의 21년 3월의 데이터를 알고 싶다고하면
http://openapi.molit.go.kr:8081/OpenAPI_ToolInstallPackage/service/rest/RTMSOBJSvc/getRTMSDataSvcAptTrade?LAWD_CD=11680&DEAL_YMD=202103&serviceKey=서비스키
url 주소를 파워쿼리에 입력하면 해당 데이터를 가져올 수 있습니다.
참고로 지역코드는 시/구 단위를 기준으로 약 250개의 코드만 가지고 있으면 데이터 조회 가능합니다. 시/구 코드는 아래 첨부파일 참고해주세요~
그럼 api를 파워쿼리를 통해 데이터를 들고 온 후 양갈래 화살표를 눌러 테이블 형태로 담아 둡니다.
그럼 테이블에 데이터들이 보이기 시작하는데, 각 열의 이름들이 영어로 나와 어떤 것을 의미하는지 알기가 어려운데,
이럴 때는 다시 국토교통부 실거래가 정보 오픈 API 활용 가이드 hwp 파일을 한번 열어보시면 c) 응답 메시지 명세에 상세하게 나와 있습니다.
거래금액, 건축년도, 계약년도, 법정동, 아파트명, 계약월, 일, 전용면적, 지번, 지역코드, 층, 해제여부, 해제사유발생일 이렇게 데이터가 나오고
참고로 해제여부 및 해제사유발생일은 이번 21.3월부터 허위 거래 등을 추려내기 위해 별도로 추가한 항목으로 정상 거래가 이루어진 것들을 보기 위해서는 해제여부가 발생안한 거래들도 필터를 걸어서 보셔야 합니다.
이 부분은 다음 글에서 다시 한번 더 설명드리겠습니다.
각 항목명의 영문과 국문은 아래 별도로 정리하였으니, 참고하셔서 각자 보기 편하신대로 이름을 정의 하시면 됩니다.
열 수정은 해당 열의 이름을 클릭하여 바로 수정 가능합니다
c) 응답 메시지 명세
항목명(영문) | 항목명(국문) | 항목설명 | 항목크기 | 항목구분 | 샘플데이터 |
resultCode | 결과코드 | 결과코드 | 2 | 1 | 00 |
resultMsg | 결과메세지 | 결과메세지 | 50 | 1 | NORMAL SERVICE. |
Deal Amount | 거래금액 | 거래금액(만원) | 40 | 1 | 82,500 |
Build Year | 건축년도 | 건축년도 | 4 | 1 | 2015 |
Deal Year | 년 | 계약년도 | 4 | 1 | 2015 |
Dong | 법정동 | 법정동 | 40 | 1 | 사직동 |
Apartment Name | 아파트 | 아파트명 | 40 | 1 | 광화문풍림스페이스본(9-0) |
Deal Month | 월 | 계약월 | 2 | 1 | 12 |
Deal Day | 일 | 일 | 6 | 1 | 1 |
Area for Exclusive Use | 전용면적 | 전용면적(㎡) | 20 | 1 | 94.51 |
Jibun | 지번 | 지번 | 10 | 1 | 9 |
Regional Code | 지역코드 | 지역코드 | 5 | 1 | 11110 |
Floor | 층 | 층 | 4 | 1 | 11 |
Cancel Deal Type | 해제여부 | 해제여부 | 1 | 0 | O |
Cancel Deal Day | 해제사유발생일 | 해제사유발생일 | 8 | 0 | 21.01.27 |
※ 항목구분 : 필수(1), 옵션(0), 1건 이상 복수건(1..n), 0건 또는 복수건(0..n)
이번 글에서는 내가 원하는 지역과 월의 데이터를 엑셀 파워쿼리를 통해 가져오는 법 및 각 항목별 설명에 대해 알려드렸고,
다음 글에서는 테이블별 상세 설명 및 매개함수를 활용하여 한번에 원하는 복수의 지역을 가져오는 법을 공유드리겠습니다.
나는 이것도 너무 어렵다 하시는 분들께서는 직접 국토부 실거래가 제공 시스템에 들어가서 rawdata를 다운 받는 방법도 있으니 아래 링크에서 확인해주세요
https://ttomine.tistory.com/1132?category=975548
엑셀로 아파트 실거래가 분석하기 (피벗 샘플파일 제공)
해당 글은 아파트 시세 분석을 하기 위해 엑셀로 활용하는 방법에 대해 소개 한 글입니다. 정말 엑셀에 기본기능만 활용하실 수 있거나, 전혀 엑셀을 사용해보지 못한 분들을 대상자로 소개한
ttomine.tistory.com
'엑셀' 카테고리의 다른 글
엑셀 파워쿼리로 open api 분석하기 (아파트 매매 분석) (0) | 2021.11.11 |
---|---|
엑셀 파워쿼리로 빅데이터 open api 분석하기 (0) | 2021.11.11 |
댓글