Web仓储的状态应该反映着Web数据源的状态变化Web仓储状态代表着Web仓储中的内容,当视图更新时Web仓储状态将跟着改变考虑Web仓储中的一个视图V,它可能定义在一个或多个数据源上V(rsk)代表该视图在状态rsk的内容而数据源状态ssi是一个向量,它的每个分量代表着一个数据源的状态Web数据源的状态变化是通过动作序列完成的和传统数据库中的概念相似,一组共同进退的动作序列构成一个Web数据源上的事务一般来说,Web数据源的事务可以分为两种,即局限于单一数据源的事务和全局事务前者由位于同一数据源上的一个动作序列构成,如数据库事务、一组批处理动作等后者由位于多个数据源上的多个动作构成,这些动作相互协调,共同形成一个完整的语义由于Web环境中数据源基本上各自为政,我们可以先不考虑数据源之间的连锁反应,而是认为数据源中每一个事务都只局限于该数据源本身,并且某一数据源的变化不会引起其他数据源的变化即我们先考虑局限于单一数据源的事务,而不考虑全局事务这样可以使讨论简单、可行事实上,我们对SVC维护算法的思想进行介绍和讨论后,很容易把它扩展到更一般的范围我们可以假设Web数据源事务的执行具有一个先后次序(否则我们可以随意在Web仓储中给它们赋以顺序),它等价于序列S=U1,U2,%,Uf,其中Ui代表产生数据源更新事务那么对于任何串行序列R,我们定义它的状态序列RSseq=ss0,ss1,%,ssf为每个事务执行后其数据源状态状态ss0为所有事务都没有提交前的状态,而ssf为所有事务都提交执行后的*终状态我们说RSseq是一致性数据源状态序列,如果R等价于上面的序列S考虑Web仓储中的物化视图V假定在V的维护过程中,Web仓储要经过这样的状态:WRseq=rs0,rs1,%,rsq定义1如果视图V在状态rsj时和V(ssi)具有同样的内容,那么我们就说rsj和数据源状态ssi一致其中,V(ssi)是当数据源处于ssi状态时,对视图V通过其基础数据的实际计算得到的结果在已有文献中,对传统数据仓库环境中的单视致性有着很多讨论。
其定义也有着多种版本文献[3]中的定义强调了集成环境各个状态的有效性、年代性以及针对数据源状态的顺序保持文献[4]中的定义除了要求有效性、年代性和顺序保持外,又多了一条收敛性,即当对数据源的一系列更新停止之后,数据仓库中物化视图的状态应该反映着数据源的*终状态文献[5,6]对单视致性进行了比较全面的分析,给出了4种一致性的定义:收敛一致性、弱一致性、强一致性和完全一致性,这4种一致性的程度依次加强文献[3,4]的定义与文献[5]的强一致性定义比较相似,只不过前两者都要求在数据源上有一个全局时间戳,而后者则不需要后者对于两个非冲突动作也不要求要有固定顺序实际上,后者的强一致性定义更加符合标准可串行性理论回到我们的研究话题我们知道Web环境在不断发展变化,让Web仓储反映RealWeb的全部变化是不现实的,也是没有意义的Web仓储的目标是为了让用户方便、快捷、有效地使用Web数据,所以只要仓储中的数据反映着以前某一时刻Web的真实情况就足够了(当然我们同时认为应该让Web仓储尽量反映较近的RealWeb状态)于是根据我们的研究需要,并参考前面提到的相关文献,我们给出如下的单视致性定义定义2(SVC)假定Web仓储中的物化视图V在维护过程中,Web仓储要经过这样的状态序列Rseq=rs0,rs1,%,rsq我们说该序列具有一致性,如果存在一个一致的数据源序列Sseq=ss0,ss1,%,ssf,以及一个从Web仓储到数据源状态的映射m,使得:(1)每个Web仓储状态都反映着某个一致的数据源状态即对于所有rsj,rsj=m(rsj)(2)Web仓储状态的顺序与相对应的数据源的状态顺序保持匹配也就是说,如果rsj