공간 분석/2022 데이터 분석.활용 공모전(행안부) 9

커피박 프로젝트(농가와 상권의 거리 계산과 결과물)

QGIS를 통한 최단거리 계산이번에는 QGIS를 이용해 농가와 상권 사이의 거리를 계산하여, 농가에서 필요한 커피박만큼만 수거할 상권을 선택하겠습니다. 상권의 커피박 배출량이 많기 때문에, 필요한 양만큼만 수거하는 것이 목표입니다. 이를 위해 최단거리로 필요한 커피박 양을 수거하는 상권을 선택하는 과정을 설명하겠습니다.작업 절차QGIS에서 점과 점 사이 거리 계산:농가 위치와 상권 위치 데이터를 QGIS에 로드합니다.QGIS의 도구를 이용해 점과 점 사이의 거리를 계산합니다.최단거리 상권 선택:농가에서 상권까지의 최단거리를 계산하여, 필요한 커피박 양만큼만 수거할 수 있는 상권을 선택합니다.단계별 설명QGIS에서 점과 점 사이 거리 계산:QGIS에서 농가 위치와 상권 위치 데이터를 불러옵니다.'Vecto..

커피박 프로젝트 H (농가 커피박 필요량 추정)

농가 필요 커피박 추정량 계산이번에는 농가에서 필요로 하는 커피박 추정량을 계산하겠습니다. 농가에서는 퇴비를 사용하는데, 이를 커피박으로 만들 수 있습니다. 이를 통해 커피박을 순환자원으로 활용하여 서울 상권의 커피박 배출량과 농가의 필요량 간의 상호작용을 극대화할 수 있습니다.목표농가의 커피박 필요량 추정:농가에서 필요로 하는 커피박의 양을 추정합니다.서울 상권의 커피박 배출량과의 매칭:농가의 커피박 필요량과 서울 상권의 커피박 배출량을 비교하여, 효율적인 자원 순환 시스템을 구축합니다.계산 방법농가의 퇴비 사용량 파악:농가의 평균 퇴비 사용량을 기준으로 커피박 필요량을 추정합니다.커피박 배출량과의 비교:농가의 커피박 필요량과 서울 상권의 커피박 배출량을 비교하여, 필요량을 충족시킬 수 있는지 분석합니..

커피박 프로젝트 G (원두+생두 수입 중량을 이용한 상권 커피박 추정량)

이번에는 서울의 구의 원두+생두 수입중량을 이용하여 상권의 커피박 배출량을 구하겠습니다. 앞에 블로그에서 서울의 상권과 상권에 해당하는 구에 대해서 위치 결합을 했습니다. 그 이유는 서울의 구별 분기 수입 금액이 있기 때문이었습니다. 수입 금액을 통해 수입중량을 구하고 수입중량을 통해 커피박 배출량을 구했습니다.  수입중량을 이용한 커피박 배출량(상권)                             구       연도      분기                상권              점포수    수입중량   커피박 배출량   구간 추정                          상권          상권수입중량    커피박량        평균          L_value    H_value  ..

커피박 프로젝트 E (상권 데이터 결합)

상권을 기준으로 커피박 배출량을 추정하기 위해 연도별 상권 데이터를 결합해 보겠습니다. 지금 가지고 있는 데이터는 서울 상권과 연도, 분기를 기준으로 매출 금액이 나와있습니다. 수집한 데이터는  2014~2020년도까지의 데이터가 존재합니다. 충분한 데이터를 이용한 커피박 추정을 위해 2014~2020년도의 데이터를 concat 하겠습니다. 생각해보니 그 전에 서비스_업종_코드_명에서 커피-음료만 추출한 후 위에 과정을 진행하겠습니다. 추출과 단순 행 결합(loc, concat)데이터를 로드한 후 loc을 이용하여 업종이 커피-음료인 데이터만 추출하겠습니다. 이러한 과정을 모든 데이터에 실행해 주고 concat을 이용하여 단순 행으로 결합합니다.   위의 간단한 코드를 실행하시면 연도, 분기별 상권 데이..

커피박 프로젝트 A (상권의 카페 현황)

프로젝트를 하기 위해 자료를 수집하다 보면 원하는 정보를 담고 있는 데이트 프레임을 찾기는 정말 쉽지 않습니다. 그래서 얻고 싶은 정보가 담긴 자료를 수집하여 결합해야 합니다. 커피박 프로젝트 분석에 앞서 커피박 데이터 프레임을 만들어 보겠습니다. 서울 카페 정보 데이터   데이터 추출 방법론처음 찾은 데이터는 '소상공인_상가(상권)정보_서울' 데이터입니다. 인덱스를 확인한 결과, 약 36만 개의 데이터가 존재합니다. 여기서 서울 카페 정보만을 추출하고자 합니다. 이를 위해 판다스의 loc 기능을 사용하여 원하는 정보만 추출할 계획입니다.분석 방법데이터 로드 및 확인:먼저, '소상공인_상가(상권)정보_서울' 데이터를 판다스로 로드합니다.데이터의 구조와 인덱스를 확인하여 전체 데이터의 크기를 파악합니다.카..

커피박 프로젝트 F (서울 상권의 시군구와 원두 수입량)

문제 해결 및 새로운 접근 방식지난 블로그에서는 커피박 배출량에 대한 데이터 프레임을 완성했지만, 팀원들이 데이터의 신뢰성에 의문을 제기했습니다. 커피 매출 비율과 평균 커피 가격이 정확하지 않다는 것이 주된 이유였습니다. 이를 해결하기 위해 서울 시군구의 원두 수입량 데이터를 활용하여 새로운 데이터 프레임을 만들기로 했습니다.문제점 및 해결 방안커피 매출 비율과 평균 가격의 신뢰성:기존 데이터에서 커피 매출 비율과 평균 가격이 정확하지 않다는 문제가 제기되었습니다.이를 보완하기 위해 서울 시군구의 원두 수입량 데이터를 활용합니다.상권과 시군구 매핑:상권마다 시군구 변수를 모르는 상황에서 QGIS를 활용해 상권과 시군구 위치를 결합하여 상권의 시군구 변수를 구했습니다.새로운 데이터 프레임 생성상권별 시군..

커피박 프로젝트 D (상권의 커피 매출을 이용한 커피박 추정과 신뢰구간)

지난 블로그에서 다룬 데이터 프레임을 바탕으로 상권별 커피박 데이터를 추정하려고 합니다. 이번 블로그에는 코드와 통계적인 내용도 포함되어 있습니다. 먼저, 커피박을 추정하는 이유를 다시 설명드리겠습니다.커피박이란 커피를 추출하고 남은 찌꺼기를 의미합니다. 커피박이 일반 쓰레기로 버려질 경우 환경오염의 원인이 됩니다. 따라서, 상권을 기준으로 커피박 추정량을 알 수 있다면 각 상권에 적절한 수의 커피박 수거함을 배치할 수 있습니다. 이를 통해 인력, 시간, 세금을 효율적으로 사용하여 낭비를 줄일 수 있습니다. 서울 상권 매출 데이터 이전 블로그 데이터 프레임에서 일별(월요일, 화요일, 수요일) 데이터를 추가한 데이터 프레임을 만들었고  상권을 기준으로 그룹화한 데이터 프레임 입니다.   서울 상권 커피박 ..

커피박 프로젝트 C (행정동에서 상권으로 바꾼 이유)

지난 블로그에서는 행정동별 카페 매출 데이터 프레임을 만들었습니다. 모든 행정동 내의 카페 매출이 동일하게 나타났는데, 서울의 행정동 개수가 424개로 예상보다 적어서 분석 단위를 상권으로 변경하려고 합니다.서울에는 약 1,300개의 상권이 존재하기 때문에, 424개의 매출보다는 1,300개의 매출로 세밀하게 분석하는 것이 더 적합하다고 판단했습니다. 예를 들어, 행정동별 카페 매출에서는 각 행정동 내의 모든 카페 매출이 동일하게 나타나 424개의 매출 데이터가 존재했지만, 상권 단위로 분석하면 1,300개의 매출 데이터가 존재하여 약 3배 이상 세밀한 분석이 가능해집니다. Qgis를 이용한 서울의 행정동, 상권 시각화  위의 서울 행정동과 서울 상권을 보시면 서울 행정동보다 서울 상권이 더 세세하게 구..

커피박 프로젝트 B (서울 행정동 별 카페 매출)

커피박 수거함 입지 선정 배경 및 방법론커피박이란 커피 찌꺼기를 의미하며, 대부분 일반 쓰레기로 버려져 환경오염의 원인이 되고 있습니다. 그러나 최근 커피박을 친환경 재료로 사용할 수 있다는 의견이 대두되고 있습니다. 우리는 이러한 커피박을 효율적으로 수거하기 위한 최적의 수거함 입지를 선정하려고 합니다.문제 상황 및 접근 방법슬프게도 서울 카페의 커피박 양에 대한 데이터는 존재하지 않습니다. 대부분의 커피박이 바로 일반 쓰레기로 버려지기 때문에 데이터로 남아 있지 않은 것이 현실입니다. 따라서, 우리는 서울 카페들의 커피박 양을 대략적으로 추정하기 위해 서울 카페의 매출을 기반으로 변수로 삼고자 합니다.가정 및 논리카페 매출과 커피박 양의 상관관계: 서울 카페의 매출이 높다는 것은 커피 매출이 높다는 ..