摘要:“到底怎么预测才准?”是数据领域终极难题。太多文章,在介绍预测方法本身,而具体到实际中:
“到底怎么预测才准?”是数据领域终极难题。太多文章,在介绍预测方法本身,而具体到实际中:
1、可以用的数据非常少。
2、预测出来领导不满意,让再改改。
3、实际情况差距大,领导还是不满意!
到底怎么办?!今天一篇文章讲清楚,还没有关注陈老师的同学,记得先关注点赞,文章较长,可以回头慢慢看,但理解了思路,能避免后续很多坑。
01 预测算法的本质
从本质上看,预测算法只有2大类:
1、基于时间序列的。
平滑:用于相对平稳的数据。
自回归:用于趋势性递增、递减的数据。
带季节因素自回归:用于有周期性波动的数据。
基于时间序列的预测,最大优势在于:不需要很多数据(如下图)只需要一个指标(比如收入/用户数/订货数量)即可。根据该指标的时间走势,选择对应的模型,详见:
2、基于因果关系的
二分类问题:未来会/不会发生XX,典型如LR。
多分类问题:未来是ABC哪个情况,典型如决策树。
连续型问题:未来的数值是多少,典型如线性回归。
因果关系类模型,对于有投入产出的情况更管用,更能体现:“一分钱一分货”的关系。不过现实中, 影响产出因素很多,往往很难收集到足够多数据,实操的预测误差可能比时间序列还大(如下图)。
这是两种基础思路,在实操中,还要解决更多问题。
02 现实中难点
现实中,缺少数据是头号问题,很多时候,领导就是扔给你一个excel表+几个数字,让你预测……巧妇难为无米之炊,很多时候,时间序列法是唯一选择,因为就一个指标+十几个数,没得选……
现实中第二大麻烦,是怎么衡量预测准确度。
比如预测销量是1000万:
业务做到900万,会说:预测得一点都不准,搞得货积压了
业务做到1100万,会说:预测得一点都不准,还是我厉害
总之,只要你不是100%精准,业务都有理由赖到你头上。甚至可以反复横跳。比如:“本来业务能达标的,看到预测说能达标,我们就省点投入,结果不达标了,都怪预测干扰了业务判断……”
因此,在实际工作中,不能孤零零只谈模型,要和业务动作结合起来,综合提升效果。
03 用业务手段,提升准确度
所有的互联网营销模式,从小米到天猫到拼多多,都在用业务手段,对抗预测的不足,比如:
场景1:“货物本身不耐储藏,多进货的话库存损失率会很高,但销售数量又很少,数据确实很多”——用团购,成团了才采购
场景2:“销售数据很少,少到无法计算价格弹性,业务方又想预测价格弹性,多赚钱”——用拍卖,少量用户竞价,获得更高价格
场景3:“新品是全新款,没有数据,咋预测?”——做新品预售/粉丝凭码购买,测试用户群体规模
场景4:“大促期间备货量难预测?拿捏不准用户有多少需求?”——让用户先付10元定金,定金膨胀3倍,提前锁定订单
凡是有业务手段可以用的,优先上业务手段,人家大厂都没能力100%精准预测,小厂就更别逞能了
04 用基础分析缩小预测范围
在实际工作中,大部分业务场景不需要100%精确度,业务本身就有波动。,业务怕的是突然暴增/暴跌的场景。预测目标与其设定为:“100%精准”,不如设定为:“是否暴增/暴跌超过业务消化能力”。
预测100%精准基本无解,但是发现哪里可能暴涨/暴跌是很容易的。通过基础分析,把不稳定因素区分出来,能大大缩减预测问题的难度(如下图)。
做好基础分析,拆分不稳定因素以后,也更方便挑选模型组合,解决问题(如下图)。
05 用滚动式预测代替长期预测
预测时间周期越长,自然偏差越打。用滚动预测能很大程度弥补这个缺点。通过日/周滚动预测,既能补充数据缺失,又能反映业务方临时调整带来的效果,一举两得(如下图)。
06 用买定离手模式保护自己
一个好问题+滚动预测,基本上能满足实际工作需求。但作为做预测的人,得学会保护自己,避免业务方反复横条,瞎胡甩锅。
买定离手法是很好办法。预测结果给出以后,买定离手,所有相关业务方不再质疑预测结果,而是基于预测结果做叠加。
谁觉得预测少了,谁自己写请示申请额外货物,并且留下书面证据。到时候是预测得不准,还是业务自己申请多了所以卖不动,看得一清二楚(如下图)。
07 再深层地看预测问题
从本质上看,如果业务发展可控,自然没人需要赌命:
1、了解业务规律,把握常规走势
2、通过基础分析,找到波动来源
3、采取业务手段,规避波动风险
这样的组合拳,比盲目赌命管用的多
来源 | 接地气的陈老师(ID:gh_abf29df6ada8)
作者 | 接地气的陈老师 ; 编辑 | 虾饺
内容仅代表作者独立观点,不代表早读课立场
来源:萱萱课堂