douban.py

import requests
import json
import os
import csv
save_folder = './images/douban/'

# Json 和 CSV 文件和.github\workflows\douban.yml保持一致
# 只能二选一，不用的那个留空，否则会报错

# 如果是 Json 文件使用下面这一行
# json_file_path = './data/douban/movie.json'
json_file_path = ''

# 如果是 CSV 文件使用下面这一行
# csv_movie_path = './data/douban/movie.csv'
csv_movie_path= './data/douban/movie.csv'
# 这里是book的csv路径
# csv_book_path = './data/douban/book.csv'
csv_book_path= './data/douban/book.csv'

def dowoloadFile(image_url):
  # 确保文件夹路径存在
  os.makedirs(save_folder, exist_ok=True)
  if image_url.startswith("https://") and "dou.img.lithub.cc" in image_url:
    headers = {
      'Host': 'dou.img.lithub.cc',
      'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36'
    }
  else:
    headers = {
    'Referer': 'https://doubanio.com'
    }
  file_name = image_url.split('/')[-1]
  save_path = os.path.join(save_folder, file_name)
  if os.path.exists(save_path):
    print(f'文件已存在 {file_name}')
  else:
    print('文件不存在')
    with open(save_path, 'wb') as file:
      response = requests.get(image_url, headers=headers, timeout=300)
      if response.status_code == 200:
        file.write(response.content)
    print(f'图片已保存为 {file_name}')


if(json_file_path):
  print('我是Movies Json文件，开始执行。。。。。')
  with open(json_file_path, 'r', encoding='utf-8') as file:
    data_json = json.load(file)
  # 提取URL字段的值
  for i in data_json:
    image_url = i['subject']['cover_url']
    dowoloadFile(image_url)
elif(csv_movie_path):
  print('我是Movies CSV文件，开始执行。。。。。')
  data_csv = []  # 存储数据的列表
  with open(csv_movie_path, 'r', encoding='utf-8') as file:
        csv_reader = csv.reader(file)  # 创建 CSV 读取器对象
        next(csv_reader)  # 跳过标题行
        for row in csv_reader:  # 逐行读取数据
            data_csv.append(row)  # 将每行数据添加到列表中
    # 打印数据
  for row in data_csv:
    image_url = row[3]
    # print(image_url)
    dowoloadFile(image_url)
else:
  print('。。。。。。。跳过电影图片下载')

data_book = []
if(csv_book_path):
  print('我是Book CSV文件，开始执行。。。。。')
  with open(csv_book_path, 'r', encoding='utf-8') as books:
    csv_books = csv.reader(books)
    next(csv_books)
    for book in csv_books:  # 逐行读取数据
      data_book.append(book)
    # 打印数据
    for row_book in data_book:
      image_book_url = row_book[3]
      dowoloadFile(image_book_url)
else:
  print('。。。。。。。跳过书籍图片下载')