Skip to content

Latest commit

 

History

History
156 lines (131 loc) · 7.44 KB

README.md

File metadata and controls

156 lines (131 loc) · 7.44 KB

겜플리

이미지・텍스트 기반 나만의 추천 게임플레이리스트

2021.07.17 제 12회 투빅스 빅데이터 컨퍼런스 발표작

Steam에서 제공하는 Multimodal 데이터를 다양한 방법으로 이용하여 개인화된 추천 게임플레이리스트를 제공하는 서비스입니다.

🏁 Flow Chart

1. 게임・유저 데이터

NLP method(LDA, Sentiment Analysis)를 통해 Textual Feature를 생성했습니다.
그 외 변수들은 Feature Engineering을 통해 파생변수를 생성했습니다.

2. Game2Vec

Play Sequence, 이미지, 텍스트 데이터를 각각 Prod2Vec, Convolutional AutoEncoder, AutoEncoder를 이용하여
Multimodal Feature인 Game2Vec을 생성했습니다.

3. Recommender System

앞에서 생성한 Game2Vec을 모델 레이어에 추가하여 학습했습니다.

4. 시연

추천 게임플레이리스트를 제공하는 웹페이지를 구현했습니다.

🏁 Result

Model Evaluation

Model Game2Vec 사용 Test ACC Test AUC Test F1 -
Vanilla GMF 78.51% 0.7746 0.8711
GMF 83.62% 0.8526 0.8956
MLP 81.50% 0.8391 0.8837
NMF 84.33% 0.8715 0.9007 👑 Best Model
DCN Parallel 82.31% 0.8463 0.8868
DCN Stacked 82.55% 0.8500 0.8876
DeepFM 80.61% 0.8194 0.8868
  • Multimodal FeatureGame2Vec을 사용했을 때 모델 성능이 향상했습니다.
  • Neural Collaborative Filtering 계열 모델들의 성능이 좋았습니다.

Web Page

🔍 Page Link

  • 서비스 화면
  • 선호 게임 리스트
  • 시연 예시1

선호 반영

추천

  • 시연 예시2

선호 반영

추천

🏁 Presentation

컨퍼런스 발표영상과 보고서입니다. 자세한 분석 내용은 아래 링크를 통해 확인해주세요!

  • GoogleDrive Badge
  • Youtube Badge

🏁 Contributors

빅데이터 동아리 ToBig's 13기・14기・15기가 함께 하였습니다😃

Jieun Park Hyerin Lee Donghyun Kim
Seongbeom Lee Ayeon Jang Sangyeon Jo

🏁 File Directory

겜플리  
├── 1. data
│   ├── steam_game_meta_data_final.csv                # 게임 메타 데이터
│   ├── steam_user_meta_data_final_v1.csv             # 유저 메타 데이터
│   ├── datasteam_reviews_clean_result_train_v2.csv   # 리뷰 데이터
│   ├── norm_game2vec.pickle                          # Game2Vec
│   └── ...
│   
├── 2. prep
│   ├── game_prep.py                          # 게임 데이터 preprocessing
│   ├── user_prep.py                          # 유저 데이터 preprocessing
│   ├── review_prep.py                        # 리뷰 데이터 preprocessing
│   └── dataloader.py                         # 게임, 유저, 리뷰 데이터 병합 (final data)
│
├── 3. nlp
│   ├── lda.py                                # LDA
│   └── sentiment.py                          # Sentiment Analysis
│
├── 4. embedding # Game2Vec 
│   ├── image_ae.py                           # 게임 이미지 벡터화 (CNN AutoEncoder)
│   ├── text_ae.py                            # 게임 장르 텍스트 벡터화 (AutoEncoder)
│   ├── sequence_prod2vec.py                  # 게임 이용 시퀀스 벡터화 (Prod2Vec)
│   └── game2vec.py                           # 최종 Game2Vec 벡터
│
├── 5. model
│   ├── model_prep.py 
│   │ 
│   ├── 5-1. Neural Collaborative Filtering                
│   │   ├── gmf.py                            # Generalized Matrix Factorization
│   │   ├── mlp.py                            # Multi-Layer Perceptron
│   │   └── nmf.py                            # Neural Matrix Factorization
│   │ 
│   └── 5-2. CTR prediction                
│       ├── deepfm.py                         # Deep Factorization Machine
│       └── dcn.py                            # Deep Cross Network
│
├── utils.py
└── main.py