Skip to content

timegambler/clawerschool

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

GitHub forks GitHub stars

抓取湖大,中南,湘潭大学三所高校校招信息

说明:

湘潭大学和中南大学可以在settings.json文件中进行修改配置

湖南大学的校招信息不需要配置,可以直接运行

项目依赖:

cd到该项目的目录下  
pip install -r requirements.txt

执行方法:

cd sorce
python 湖南大学.py [option_1] [optioin_2]
python 湖南大学.py [option_1] [optioin_2]
python 湖南大学.py [option_1] [optioin_2]

参数说明:
参数 说明 备注
option1 '1'或'2',1表示生成excel文件,
2表示生成csv文件,默认为csv文件
option2 文件路径 默认在当前路径

执行样例:

python 湖南大学.py 1 ./xtuclawer.excel

湖南大学校招数据参数说明

参数 参数说明 备注
overdue 0或1,表示信息是否过期
is_yun 0或1
career_state 0或1
sort_time 未知
career_talk_id 职位id
company_id 公司id
company_name 公司名
logo logo图片网址
hotcount 招收人员规模 大部分为0,无用
professionals 专业 大部分为空,无用
career_type 职业类型 大部分为空,无用
recruit_type 招聘类型 中文形式,一般有‘宣讲会’
company_review 公司评价 大部分为空,无用
company_property 公司性质 一般为‘国有企业’,‘民营企业’
industry_category 企业行业 计算机,软件等
city_name 企业所在位置 广州,深圳等
meet_name 一般被默认为company_name
meet_time 会议时间
school_name 学校名称 大部分为空,无用
address 会议地址
room 房间号 大部分为空,无用
view_count 阅读量
recept_faculty 学校承接方
is_above_college_degree 大学学历,0表示忽略,1表示要求满足
is_above_bachelor_degree 学士学位,0表示忽略,1表示要求满足
is_above_master_degree 硕士学位,0表示忽略,1表示要求满足
is_above_doctor_degree 博士学位,0表示忽略,1表示要求满足
is_recommend 推荐 大部分为0,无用
recommend_time 推荐时间 大部分为0,无用
meet_day
会议日期

这几年的校招场次统计:



结论:根据统计图可以发现2018年校招最多,此时也是经济发展最高的时候,到了2019年校招变少,说明2019年经济存在一定的下行


校招按月份进行统计:



结论:根据统计可以发现一些客观规律,如每年的秋招比春招的招聘场次要多两倍,并且秋招集中在9,10,11,12月,
其中10月份是校招最热的时候,到了12月份基本上秋招结束,而春招集中在3,4,5,6月,规模上也远远不如秋招。

这几年招聘企业性质比例



结论:不难发现国有企业依旧是占绝大多数比例的,其次是普通民营企业,说明国有企业还是占据主导地位的


各个年份招聘企业性质比例



结论:根据比例变化,民营企业在2018年达到巅峰,占据比例高达27.7%,而到了2019年比例又降回到与2017年,再次论证了经济存在一定的下行

About

Python爬虫+简单数据分析

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages