Skip to content

pengbo-learn/xiami_crawler

Repository files navigation

虾米音乐爬虫

实现

获取歌曲id

曲风流派

歌单

  • 直接访问歌单页面同样会被封禁
  • 进入虾米主页 https://www.xiami.com/
  • 用 selenium 模拟点击歌单
  • 用 selenium 模拟点击全部歌单
  • 用 selenium 模拟选择语种/华语, 点击
  • 用 selenium 模拟点击各个歌单, 进入歌单页面
  • 通过正则表达式解析获取歌曲id

下载歌曲id对应的mp3音乐

  • 歌曲id fO7s7a822
  • 歌曲url https://www.xiami.com/song/fO7s7a822
  • 直接用 youtube-dl 可以下载歌曲, youtube-dl --quiet --extract-audio 'https://www.xiami.com/song/fO7s7a822' -o 'fO7s7a822.%(ext)s' 下载到 f07s7a822.mp3
  • 通过 parallel 可以实现并行下载

环境

  • centos
  • python3
  • 配置 sh env.sh

运行

# 曲风歌曲id写入txts
python3 genre.py
# 歌单歌曲id写入txts
python3 collect.py
# 根据txts下载音乐到mp3s
sh get_mp3.sh

About

虾米音乐爬虫

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published