视频1 视频21 视频41 视频61 视频文章1 视频文章21 视频文章41 视频文章61 推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37 推荐39 推荐41 推荐43 推荐45 推荐47 推荐49 关键词1 关键词101 关键词201 关键词301 关键词401 关键词501 关键词601 关键词701 关键词801 关键词901 关键词1001 关键词1101 关键词1201 关键词1301 关键词1401 关键词1501 关键词1601 关键词1701 关键词1801 关键词1901 视频扩展1 视频扩展6 视频扩展11 视频扩展16 文章1 文章201 文章401 文章601 文章801 文章1001 资讯1 资讯501 资讯1001 资讯1501 标签1 标签501 标签1001 关键词1 关键词501 关键词1001 关键词1501 专题2001
myfirstBI项目总结
2020-11-09 07:46:54 责编:小采
文档


app 应用信息统计: saiku安装:http://blog.csdn.net/longshenlmj/article/details/173595 workbench解压即用,http://blog.csdn.net/longshenlmj/article/details/17530379 流程: 1,从hive上导入每天的app应用信息,来自各个网站,基本字段根据经验。 2

app 应用信息统计:

saiku安装:http://blog.csdn.net/longshenlmj/article/details/173595

workbench解压即用,http://blog.csdn.net/longshenlmj/article/details/17530379

流程:

1,从hive上导入每天的app应用信息,来自各个网站,基本字段根据经验。

2,用kettle清洗设计,导入mysql

3,workbench连接好sql,设计XXX.xml的cube文件。

4,将cube文件通过saiku呈现。相关配置使用的细节,见上面的文件saiku安装。

worbench的纬度:从一个角度(另一个表的某个属性)看事实表中的数据统计信息(事实表ft要有对应的字段)

一个纬度表,通过自身的某个键,和事实表的某个键关联。dimension的foreign key和level中column的设定。注意level中的显示列为空,则默认用上面的比较列,设置要显示的列内容,比如显示年份,用date_value进行比较,满足了,在显示同一行上的另一个列的内容。

saiku数据呈现:同一个dim下的level不能分开到row和column上,只能同时在一个上。

dim上是的个数,行列都是dim,事实表中同时满足两个维度条件的元组个数。

measure是统计量,用于统计一列上的个数。比如downloads。统计的是事实表上的一列的值。另一方向放维度就表示,按不同维度值分别进行统计。多个维度,则多个满足条件下的统计。

注意,measure行列都可以放,想横着看,还是竖着看,就放到对应位置就行了。统计过程和统计结果不会发生改变(都是统计事实表中的一列)。measure和dim可以放到一起

另外,在右边的尾部加图功能,所以按日期看增长量。(这个图,放到每天的下载量时候,按区间做一个统计,下载量是否符合正态分布,如果下载量在高处居高不下,说明作弊的可能性很大)

小测试,时间维度用dataval(维度表的column设置项),与事实表的date_value(cube的foreign key)关联,可以统计每天的信息。

level的type选regular,其它类型time_XXX还在测试中?

下载本文
显示全文
专题