GMV、点击化率、交易转化率、停留时长
支持数据源:
csv\mysql\odps
1.表类型:
用户\商品\商家
2.字段类型:
id 编号
text 文本
number 数值
category 分类
image 图像
datetime 时间
3.全网挖掘(待定):
全网挖掘用户特征(文本+用户画像)
1.数据筛选;
去除超过80%为空值字段;
去除超过80%为单一值字段;
2.离群点;
离群值使用极值替代;判断条件
3.空值填充;
空值编码:0,-1
4.归一编码;
onehot\labelencoder\LabelBinarizer
1.画像设计;
2.画像生成; 采取聚类方法生成
1.简单模型(排序\FM等);
2.文本模型(主题模型);
3.深度模型(神经网络);
4.强化学习模型(Feed流);
1.特征定时任务;
2.模型更新周期;
1.ABTest分组;
2.互动策略;
包括:随机展示策略、均匀展示策略、强化学习策略、多伦对话策略
3.混搭占比;
1.指标管理;
2.指标监控;
该如何设计埋点?
3.调整措施;