PowerBI 开发 第23篇:共享数据集

发布时间 2023-06-12 16:05:41作者: 悦光阴

Power BI共享数据集的一个优点是只要数据集刷新,那么引用该数据集的报表都会自动刷新,节省了刷新报表数据的时间,缺点是使用共享数据集的报表,虽然可以新增Measure,但是无法修改数据模型,比如,关系,数据字段等,报表开发的自由度收到限制。是否使用共享数据集,由报表开发者权衡利弊。

一,什么是共享数据集?

在Power BI Service中,任何一个Report都是由两部分构成:Report (可视化图表)和Dataset(数据集),它两的关系是:图表引用数据集的数据,并以一定的UI布局显示数据。在PowerBI Service的work space中,Report和Dataset是两个不同的type。

当使用Power BI Desktop IDE进行报表开发时,可能不会轻易的看到分开的Report和数据集,需要你打开Task Manager,在PowerBI Desktop进程下面存在Microsoft SQL Server Analysis Service,这就是报表的数据集部分。

当把报表发布到Power BI Service上之后,很容易看到报表是由两部分构成的:

  • report 是报表的可视化实现,主要是由图表及其布局构成
  • dataset 主要包括数据表,数据字段的格式,关系(relationships),度量(Measure),计算列(calculated column)和连接(connection to the data source)等构成

如果多个Report共用一个Dataset,那么这个Dataset就是共享数据集。每当Dataset刷新后,任何引用这个Dataset的Report都会自动刷新,这也是共享数据集的优点。

共享数据集的一个重要意义,即是把后端(建立数据集)的任务从整个报表开发流程中分离出来,后端只需要把精力集中数据查询,模型关联等跟数据处理有关的工作上,而前端只需要把精力集中在DAX表达式和可视化的设计上,这对于BI团队的分工协作有重要意义。

二,如何创建共享数据集

任何Power BI dataset都可以是共享数据集,创建共享数据集的方法非常简单,仅需要把PBIX文件发布到Power BI Service中,发布之后,这个Dataset就可以作为共享数据集。

三,如何连接共享数据集

连接共享数据集的操作十分简单,在Power BI Desktop中新建一个报表,从Data hub中点击 Power BI datasets,并从datasets列表中选择合适的dataset。

连接到共享数据集之后,报表和数据集之间的连接是Live Connection,报表的查询性能跟数据集是否共享没有关系,如果共享数据集使用Import方式连接数据源,那么引用共享数据集的报表的查询性能是非常快的。报表可以创建本地报表级别的Measure,但是建模会受到限制,数据模型只能在原始数据集中进行修改。

 

 

Power BI Shared Datasets: What is it? How does it work? and Why should you care?