。:在分布式数据库系统中,除了包括在集中式数据库中的CPU代价和I/O代价(合称为局部处理代价)之外,由于数据分布在不同的结点上,在数据查询处理中还需要考虑到站点间传输数据的通信代价,因此,总代价=CPU代价+I/O代价+通信代价。:指从接收查询到完成查询的时间间隔。在分布式数据库系统中,响应时间既与通讯时间有关,又与局部处理时间有关。,经过分析得到查询树,然后将原始查询树经过从全局到片段的变换变成了基于片段的查询树,最后经过一系列的基于关系代数等价变换规则的优化算法的转化,使该查询树中选择和投影操作尽可能靠近叶结点,笛卡儿乘积运算尽可能远离叶结点,这样就可以减少操作量和操作次数,从而达到查询优化的目的。,但是处理代价更小的查询。与一般的查询处理过程所不同的是,基于语义信息的查询处理扩展了传统的数据字典,在IDB(IntelligentDatabase)中加入了新的语义信息规则,增添了语义优化过程。使用这种方法不仅可以提高查询的效率并且可把一般查询对于非索引属性的检索转变成为一个对索引属性的检索。但是又存在着增加处理时间的不足。在查询数据量较大的分布式数据库中宜于使用该算法。,减少每个站点上用于连接运算的数据,然后将所有站点的数据汇集到数据量最大的站点做最后装配。7分布式查询优化的方法处理过程主要包括三个步骤::从全部关系中的半连接中生成有益的半连接集合;:从有益的半连接集合中找出最有益的半连接,将其添加到执行策略中,并相应地修改被影响关系的统计值(选择因子,关系的大小等);:重复第一步,直到所有有益的半连接加入到执行策略中,关系经上面步骤缩减后,选择存储数据量最大的站点为组装场地;,在选择连接顺序时,总是使用一种简单而严格的选择方法,每次都是选取当前代价最小的一个连接,这样便可使整个系统最终查询的总代价达到最小。基于查询图的贪婪查询实际上是一种动态优化方案,在具体查询过程中,可以用中间查询结果的大小近似地表示当前通信代价的大小,因此,对于不同结点之间进行查询连接时,应当选取查询运算最小的中间结果,从而降低当前查询代价,达到局部最优。9分布式查询优化的方法算法设计:,首先需要找出中间结果最小的连接运算。然后把这两个相邻节点合并成一个节点。,把相邻的节点合并,如果合并的过程中查询图出现线段合并,线段上的值为原先两条线段值的成绩。。10
分布式数据库查询优化ppt 来自淘豆网www.taodocs.com转载请标明出处.