1. 문제 정의
2023년부터 시행된 광역버스 입석 금지 제도에 따라, 좌석이 모두 찬 버스는 정류장에 정차하지 않습니다. 현재 K-MaaS 및 민간 길 찾기 서비스들은 실시간 잔여 좌석 정보를 제공하고 있으나, 길이 익숙하지 않은 사용자는 단순한 숫자 정보만으로 자신의 정류장에서 실제로 버스에 탑승할 수 있을지를 정확히 예측하기 어렵습니다. 또한, 길 찾기 앱이 추천한 경로라 하더라도 실제로는 버스가 정차하지 않아 계획과 다른 결과가 발생하는 사례가 빈번합니다. 특히 면접, 시험 등 시간 엄수가 중요한 일정에는 이러한 불확실성이 시민들의 큰 불편으로 이어지고 있습니다.
2. 인원 및 기간
- 기간 : 2025년 3월 24일 ~ 2025년 5월 23일
- 역할분담
- 실시간 버스 데이터 수집 : 김영홍
- 기후, 공휴일 데이터 적용 : 최상록
- LSTM 잔여좌석 예측 : 민채영
3. 사용한 기술 소개
- 비동기 처리 : 작업이 완료될 때까지 기다리지 않고, 다른 작업을 동시에 수행할 수 있도록 하는 방식입니다. asyncio 라이브러리를 사용하였고, 비동기 처리를 통해 RPM limit (분당 호출 제한) 내에서 최대한 많은 노선의 정보를 경기도 버스 정보 오픈 API에서 얻을 수 있었습니다.
- TimescaleDB : PostgreSQL 기반의 시계열 데이터베이스 확장으로, 대용량 시계열 데이터를 빠르게 저장하고 분석할 수 있도록 최적화되어 있습니다. 1분 단위로 많은 데이터를 수집하기 때문에, 자동으로 시간 속성을 부여해주고, 데이터 분석 분야에서 익숙한 표준 SQL을 그대로 사용할 수 있어서 선택하였습니다.
- Windows Task Scheduler : 특정 작업을 정해진 시간에 자동으로 실행시키는 도구로, 운영체제 또는 애플리케이션 수준에서 동작합니다. 일일 트래픽 제한으로 24시간 수집할 수 없으므로, 출근 혼잡을 포함하는 오전 5시 30분부터 11시 30분까지 자동으로 실행되도록 스케쥴러를 도입하였습니다.
- LSTM : 순환신경망(RNN)의 일종으로, 긴 시퀀스 데이터에서도 장기 의존성 문제를 해결할 수 있도록 고안된 구조입니다. 간단하면서도 컴퓨팅 자원의 큰 손실 없이도 양질의 결과를 얻을 수 있어 선택하였습니다.
4. 데이터 수집
경기버스정보 OPEN API | 경기도 버스위치정보 조회 서비스 1분 단위 4개 노선 호출, 차내 빈 지리수, 정류소, 수집 https://www.gbis.go.kr/gbis2014/publicService.action?cmd=openApiInfo |
기상청 OPEN API | 기상청 단기 예보 자료 기온, 강수 확률, 풍향, 하늘 상태 등 https://data.kma.go.kr/api/selectApiDetail.do?pgmNo=42&openApiNo=421 |
서울교통공사 | 지하철 혼잡도 정보 30분 간격 평균 혼잡도 (정원대비 승차인원) https://www.data.go.kr/data/15071311/fileData.do |
한국천문연구원 | 특일 정보 국경일, 공휴일, 기념일 정보로 직장 휴무 여부 수집 https://www.data.go.kr/data/15012690/openapi.do |
5. 모델링 및 분석
데이터 수집 기간
- 버스 : 5월 1일 (월) ~ 5월 15일 (금)
- 지하철 : 2024년 4분기
데이터 수집 주기
- 버스 데이터 : 1분 단위, 오전 5시 30분 ~ 오전 10시 30분
- 지하철 데이터 : 30분 단위, 24시간
예측 결과
- 버스 평균 MAE : 1.37, R² : 0.852,
- 지하철 평균 MAE : 2.59, R² : 0.746
분석 결과
버스 데이터 확인 결과 직장인들이 출퇴근하는 평일과, 어린이날을 비롯한 공휴일의 차이도 예측을 잘 수행함. 지하철 데이터는 일차적으로 서울 교통 공사에서 가공한 지하철 혼잡도 지표를 사용하여, 상대적으로 낮은 예측률을 보임
6. 기대효과
사용자 편의성 개선
- 만차 사전 인지 : 예측 잔여 좌석 정보를 통해, 만석 버스를 미리 피할 수 있음
- 경로 선택의 유연성 확보 : 대체 노선 혹은 시간대 변경을 통해 이동 계획을 할 수 있음
- 출퇴근 스트레스 완화 : 정류장에서의 불필요한 대기·혼잡 감소
- 정보 격차 해소 : 초행길도 교통 혼잡을 미리 파악할 수 있음
- 이용자 만족도 향상 : 정확한 예측을 통한 서비스 신뢰도 제고
교통 운영 최적화
- 버스 자원 재배치 : 수요 기반 증차·감차 전략 수립 가능
- 노선 구조 개선 : 버스 노선 수정, 추가 시뮬레이션에 활용 가능
- 택시, 자가용 대체 효과 : 버스 및 대중교통 이용률 증가
- 운영비 절감 : 비효율적 노선 또는 시간대 운행 조정 가능
- 정책 수립의 정량적 근거 : 데이터 기반 수요 예측 가능
기존 서비스의 확장
- 지하철 혼잡도를 연계한 통합 모빌리티 서비스 확장
- API 상품화를 통한 민간 플랫폼 및 지자체 연동 가능
7. 참고 자료
https://velog.io/@carrysocks/버스-데이터-크롤러-개발-및-개선-자리있어-개발기-1
https://github.com/carrysocks/jarih-crawler
'공모전 & 자격증' 카테고리의 다른 글
영천시 스마트 그늘막 입지 선정 (2) | 2025.06.26 |
---|---|
POI (관심 지점) 데이터를 활용한 전기 자전거 충전소 MCLP (1) | 2025.05.31 |
제 3회 신빅해 회고 (0) | 2025.02.12 |
컴활 2급, ADSP, SQLD 취득 후기 (1) | 2025.02.12 |