시공간 그래프 모델링은 시스템 구성 요소의 공간적 관계
와 시간적 추세
를 분석하는 중요한 작업입니다.
기존 접근 방식은 엔터티 간의 기본 관계가 미리 결정되어 있다고 가정하여 고정된 그래프 구조에 대한 공간적 종속성을 대부분 포착합니다. 그러나 명시적인 그래프 구조(관계)
가 반드시 실제 종속성을 반영하는 것은 아니며 데이터의 불완전한 연결
로 인해 실제 관계가 누락
될 수 있습니다.
더욱이 기존 방법은 이러한 방법에 사용된 RNN 또는 CNN이 장거리 시간 시퀀스
를 캡처할 수 없기
때문에 시간 추세를 캡처하는 데 효과적이지 않습니다.
이러한 한계를 극복하기 위해 본 논문에서는 시공간 그래프 모델링을 위한 새로운 그래프 신경망 아키텍처인 Graph WaveNet을 제안합니다.
- 32-layer의 TCN 모듈, GCN 모듈 그리고 Residual connection을 사용하여 빠른 학습과 빠른 추론이 가능합니다.
- 시간적 의존관계와 공간적 의존관계를 포착하기 때문에 다른 인공지능 모델에 비해 높은 성능을 갖고 있습니다.
- 논문에 따르면 32 layer에서 40 layer로 확장하면 학습 성능은 5% 증가하는데 비해 학습 파라미터의 수는 54% 증가한다고 하였습니다. 따라서 논문에서 제시한 모델의 layer 개수와 동일한 32 layer로 모델 학습을 진행하였습니다.
This is the original pytorch implementation of Graph WaveNet in the following paper: [Graph WaveNet for Deep Spatial-Temporal Graph Modeling, IJCAI 2019] (https://arxiv.org/abs/1906.00121). A nice improvement over GraphWavenet is presented by Shleifer et al. paper code.
dilated CNN은 긴 길이의 시계열 데이터를 효과적으로 처리할 수 있습니다.
연산량 감소
: 큰 receptive field를 취하려면, 파라미터의 개수가 많아야 하지만 dilated convolution을 사용하면 receptive field는 커지지만 파라미터의 개수는 늘어나지 않기 때문에 연산량 관점에서 탁월한 효과를 얻을 수 있습니다.추론 속도 증가
: 한 번에 1 steps(5분)씩 추론하지 않고, 12 timesteps (60분)을 한번에 추론할 수 있기 때문에 학습 속도는 6배, 추론 속도는 10배 정도 빠르다.
그래프 기반 컨볼루션 연산을 활용하여 교통량 데이터에서 공간 의존성을 캡처한다.
교툥량 센서의 물리적 위치에 기초하여 그래프를 구성하고, 간선은 센서 간의 쌍방향 거리를 나타낸다. 이러한 연산자를 적용함으로써 컨볼루션 계층은 네트워크 전반에 걸친 교통량 정보의 확산
을 효과적으로 모델링한다.
한국도로교통공사 공공데이터포탈의 VDS 1.5만개의 데이터의 70%, 10%, 20%로 나눠서 각각 train, validation, test로 사용하였습니다.
- Average Training Time: 30.3004 secs/epoch
- Average Inference Time: 1.4278 secs
예측 시간(분) | Test Loss | Test MAPE | Test RMSE |
---|---|---|---|
15 | 1.7689 | 0.0203 | 2.9916 |
30 | 2.0288 | 0.0238 | 3.5879 |
60 | 2.3372 | 0.0278 | 4.2073 |