摘要:以移动通讯行业举例,一般1年内为热数据,1-3年内为温数据,3+为冷数据。可以对冷温热数据的不同定义进行分析。也可根据数据实际分布情况定义冷温热数据。
冷热数据分析
1、冷温热数据总量及明细
以移动通讯行业举例,一般1年内为热数据,1-3年内为温数据,3+为冷数据。可以对冷温热数据的不同定义进行分析。也可根据数据实际分布情况定义冷温热数据。
示例:
三种表的明细(查看部分数据)
三种表的总量:
2、分库分析冷温热数据
有时会需要弄清楚哪些库下的冷数据较多,需要先行清理,哪些可以后续清理,可以参考如下方式分析:
select class,dbname,count(tblist) from test.test3 group by class,dbname ;
示例:
可以看出gbaserpt、gbaseods、gbasedwd、gbasemsm这4个库下的冷数据最多,应先行迁移或清理数据。
来源:GBASE南大通用