下载此文档

产品数据分析建模方案.docx


文档分类:IT计算机 | 页数:约13页 举报非法文档有奖
1/13
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/13 下载此文档
文档列表 文档介绍
产品数据分析建模方案
一、概述
建设背景
对于企业在人才管理上的问题:不能有效的发现自己的人才储备落后于行业的发展,在职员工可能存在上面异常的方面,更好的规划薪酬范围,让员工在个人岗位上获得满足感。依据能力制定合理的薪酬范围。依据行业且
district_id1、district_id2、district_id3、district_id4依次属于从属关系,所以做
出以下推断:district_id1是国家代码,district_id2是省级代码,district_id3是市级代码,district_id4是县级代码。
并且为了更加细致分析商家历史趋势变换趋势,同时又不过多的加入噪声,我们对市级区域内的商家做了聚类分析。对于同一个市内商家个数多于16个的,归为一类/对于同一^市内商家个数少于16个的/按省份进行归类/对于国外的商家按同一地区进行归类,对于都不属于以上几种情况的商家,按照坐标地址归属到最邻近的地区。对每个商家进行区域分类之后,利用分析总体每月趋势变化的方法,对每个区域内进行单独的分析,提取出每个区域的历史变化趋势。
解决框架
下面就是第二个核心部分一模型。
如何学****好关于月份的变化趋势是本题的一个重点难点,为了更好的学****每个月份的趋势,我们设计一个分12个月去单独预测每个月份这样的一个模型。
>模型框架
如何学****好关于M份的变化趋势足本题的-,为了更好的学****誓个叮饴的趋剪,我们设计-亍分空个丿」去单独预测每个丿」份这样的-个模」攸
HHJi-
-I-1--I
预测集:
協终预测集:
模型优点:在能够保证足够数据量的怙况Q由为每个月份提供了史加介适的训练集,起到「放大某午月份特征的作用:■
模型缺点:型川模型的训练成本和复杂度。
我们的模型能够保证足够多数据量的情况下,由为每个月份提供了更加合适的训练集,起到了放大某个月份特征的作用。但与此同时增加模型的训练成本和复杂度。
在分析数据时发现有500多家商店在2015年11月份之前并没有历史销量,一个很明的原因是,在此之前,这些商家并没有与携程进行合作,然而又需要预测,说明在截止2017年一月这4000商家全部都与携程进行了合作在不加其他条件下,这个合作日期应该是分布在2015-11到2017-01的一个均匀分布,而模型并不能学****到该先验知识。因此我要对空值部分预测出来的14个月乘以了一个等差数列,使空值部分未来14个近似月服从一个等差数列的分布。
并且使预测月份变化整体变化趋势可控,我们以的最佳模型xgb预测值基础,统计了未来14个月的变化趋势,根据a榜线上得分结果进行微调取最佳值。在使用gbrt、rf、et预测时,按月调整相应月份的均值,使得其他模型分布也符合这个变化趋势。
算法评分
用均方误差(RootMeanSquaredError,RMSE)作为评判标准,获奖队伍需超过基准指标(RMSE基准值为166),多模型组合的上限为28个
最后我们组的得分在上月结束的“出行产品未来14个月销量预测”比赛中,。
无监督算法模型聚类进行客户价值分析参考
利用KMeans聚类进行航空公司客户价值分析
准确的客户分类的结果是企业优化营销资源的重要依据,本文利用了航空公司的部分数据,利用Kmeans聚类方法,对航空公司的客户进行了分类,来识别出不同的客户群体,从来发现有用的客户,从而对不同价值的客户类别提供个性化服务,指定相应的营销策略。
—、分析方法和过程
1•数据抽取——>——>3。建模与应用
传统的识别客户价值应用最广泛的模型主要通过3个指标(最近消费时间间隔(Recency)、消费频率(Frequency)和消费金额(Monetary))来进行客户细分,识别出价值高的客户,简称RFC模型。
在RFC模型中,消费金额表示在一段时间内,客户购买产品的总金额。但是不适用于航空公司的数据处理。因此我们用客户在一段时间内的累计飞行里程M和客户在一定时间内乘坐舱位的折扣系数C代表消费金额。再在模型中增加客户关系长度L,所以我们用LRFMC模型。
因此本次数据挖掘的主要步骤:
.从航空公司的数据源中进行选择性抽取与新增数据抽取分别形成历史数据和增量数据
.对步骤1)中形成的两个数据集进行数据探索分析和预处理,包括数据缺失值和异常值分析。即数据属性的规约、清洗和变换
.利用步骤2)中的处理的数据进行建模,利用KMeans方法,进行聚类4).针对模型的结果进行分析。
对数据进行聚类分群的结果如下表所示
rzln
I四
ZM

类别教目I
&T-

2.

产品数据分析建模方案 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数13
  • 收藏数0 收藏
  • 顶次数0
  • 上传人kunpengchaoyue
  • 文件大小397 KB
  • 时间2022-05-21
最近更新