-
36581.不确定集值数据的高效相似查询
[信息传输、软件和信息技术服务业] [2014-07-15]
基于可能世界的不确定集合的相似查询,从语义上或者从计算方法的角度来看,都有别于传统的确定型集合上的技术.由于集合中的项存在不确定性,即一个项出现在集合中是有一定概率的,使得传统处理集合的技术不再适用.提出了一个基于可能世界的集合期望相似度的度量公式.在期望的度量公式中,如果一对集合(X,Y)的期望相似度大于给定的阈值τ∈(0,1),则被称为相似集合对.一般的算法,在基于可能世界的情况下计算不确定集合的期望相似度,其复杂度是指数级的.提出了利用动态规划来计算集合期望相似度的算法,该算法的复杂度是多项式级别,极大地减少了计算时间.实验结果表明了基于该算法查询的可用性和高性能.
关键词:相似查询;期望相似度;动态规划;不确定集值
-
36582.DMStone:一个分级存储系统性能测试工具
[信息传输、软件和信息技术服务业] [2014-07-15]
对分级存储系统的性能测试,需要提供真实的系统状态和有代表性的访问负载.已有的分级存储系统测试方法通过播放一段时间的文件访问请求来生成系统状态.因为彻底忽略了近期未被访问的文件而与分级存储的真实场景不符,使得测试结果没有说服力.提出了一种分级存储系统性能测试工具DMStone,它使用文件系统快照生成某一时刻的系统状态,并根据后续的相邻快照之间的差异提取访问负载特征,进而生成有代表性的I/O负载.DMStone能够提供某一时刻真实的文件系统状态,涵盖了近期访问过的和长期不用的所有文件.而且,它能够保证后续文件访问的特征与真实应用场景相符合.
关键词:分级存储;性能测试;系统状态;I/O负载;文件系统快照
-
36583.一种可行的分布式硬实时容错调度算法
[信息传输、软件和信息技术服务业] [2014-07-15]
针对分布式硬实时系统发生处理机故障后,当前周期内的任务实例和后续实例相对截止期限的不同紧迫程度,提出非紧迫周期内延迟策略——DNUP(delay in non-urgent period).该策略能够尽可能地推迟非紧迫实例的执行,使得低优先级实例有更多的机会完成其紧迫周期内的执行,从而实现处理器空闲(slack)资源的合理挪动.仿真实验结果表明,与其他几个著名的分布式容错调度算法相比,DNUP策略能够提高任务的可调度性,从而有效减少了所需处理机的数目.
关键词:实时;分布式系统;调度;容错;优先级
-
36584.云计算环境下的分布存储关键技术
[信息传输、软件和信息技术服务业] [2014-07-15]
云计算作为下一代计算模式,在科学计算和商业计算领域均发挥着重要作用,受到当前学术界和企业界的广泛关注.云计算环境下的分布存储主要研究数据在数据中心上的组织和管理,作为云计算环境的核心基础设施,数据中心通常由百万级以上节点组成,存储其上的数据规模往往达到PB级甚至EB级,导致数据失效成为一种常态行为,极大地限制了云计算的应用和推广,增加了云计算的成本.因此,提高可扩展性和容错性、降低成本,成为云计算环境下分布存储研究的若干关键技术.针对如何提高存储的可扩展性、容错性以及降低存储的能耗等目标,从数据中心网络的设计、数据的存储组织方式等方面对当前分布存储的关键技术进行了综述.首先,介绍并对比了当前典型的数据中心网络结构的优缺点;其次,介绍并对比了当前常用的两种分布存储容错技术,即基于复制的容错技术和基于纠删码的容错技术;第三,介绍了当前典型的分布存储节能技术,并分析了各项技术的优缺点;最后指出了当前技术面临的主要挑战和下一步研究的方向.
关键词:云计算;数据中心;分布存储;容错;数据中心网络;复制;纠删码;节能
-
36585.监督式谱空间分类器
[信息传输、软件和信息技术服务业] [2014-07-15]
提出了一种非线性的监督式谱空间分类器(supervised spectral space classifier,简称S3C).S3C首先将输入数据映射到融合了训练数据判别信息的低维监督式谱空间中,然后在该监督式谱空间中构造最大化间隔的最优分割超平面,并把测试数据以无监督的方式也映射到与训练数据相同的新特征空间中,最后,直接应用之前构建的分类超平面对映射后的测试数据进行分类.由于S3C使研究者可以直观地观察到变化后的特征空间和映射后的数据,因此有利于对算法的评价和参数的选择.在S3C的基础上,进一步提出了一种监督式谱空间分类器的改进算法(supervised spectral space transformation,简称S3T).S3T通过采用线性子空间变换和强迫一致的方法,将映射到监督式谱空间内的数据再变换到指定的类别指示空间中去,从而获得关于测试数据的类别指示矩阵,并在此基础上对其进行分类.S3T不仅保留了S3C算法的各项优点,而且还可以用于直接处理多分类问题,抗噪声能力更强,性能更加鲁棒.在人工数据集和真实数据集上的大量实验结果显示,S3C和S3T与其他多种著名分类器相比,具有更加优越的分类性能.
关键词:分类;谱方法;维数约减;流形映射;监督式谱空间
-
36586.一种实现数据主动泄漏防护的扩展中国墙模型
[信息传输、软件和信息技术服务业] [2014-07-15]
中国墙模型具有能够同时提供自主控制和强制控制的特性,因而被广泛应用于商业领域中,以防止有竞争关系的企业之间的信息流动而导致利益冲突.但是由于对读写约束过于严格,因而应用范围有限,特别是在数据泄漏防护的应用中未能发挥其优越性.针对数据泄漏防护对信息流动的控制需求,从数据客体的角度出发,考虑中国墙模型中的利益冲突问题,提出了主动冲突关系的概念,将原来对信息双向流动的约束转换为对单向流动的约束.在此基础上,提出了一种可以实现数据主动泄漏防护的扩展中国墙模型ACWM(aggressive Chinese wall model),并给出了模型的形式化描述和相关定理的证明.分析表明,ACWM模型可以实现传统中国墙模型的安全目标,而约束条件更加灵活,可以实现数据泄漏防护的需求.
关键词:中国墙模型;数据泄漏防护;信息流;利益冲突关系;联盟关系
-
36587.TypeSampler:一种基于gossip的类型采样方法
[信息传输、软件和信息技术服务业] [2014-07-15]
在很多P2P应用中,节点可以根据其兴趣或资源划分为不同的类型,而以特定类型节点为目标的基于覆盖网的路由也就成为实现数据分发及查询的关键.非结构化覆盖网具有维护开销低、鲁棒性高的优点,却也因此难以保证路由效率.提出了一种基于gossip的类型采样方法--TypeSampler,它以等概率采样不同类型的节点(称为类型采样),以此保证在任意节点发现特定类型邻居节点的概率下界,进而保证非结构化覆盖网中的路由效率,为了实现类型采样,TypcSampler首先通过基于gossip的节点采样及反熵聚集估计各类型节点的比例,然后,TypeSampler再根据这些比例估计值周期性地维护每个节点的类型采样表.理论分析与实验结果表明,TypeSampler能够实现精确的类型比例估计以及近似均匀随机的类型采样,并能适应动态的网络环境.而且相对于已有的方法,TypeSampler能够支持更高效的路由,且具有更好的可扩展性.
关键词:类型采样;比例估计;路由;非结构化覆盖网;P2P
-
36588.面向性能剖析的Web应用自动性能建模方法
[信息传输、软件和信息技术服务业] [2014-07-15]
提出了一种面向性能剖析的Web应用自动性能建模方法.该方法考虑了用户行为与系统中不同服务之间的关联,动态地构造与应用实际状态相符的性能模型,并利用Kalman滤波所具备的过滤“噪声”和适应变化的特性,精确估算各服务所需CPU时间.实验结果表明,该方法可以适应Web应用内、外部环境的变化,分析结果可为瓶颈定位和容量规划等性能保障技术提供高质量数据.
关键词:Web应用;性能剖析;性能建模;Kalman滤波
-
36589.基于树核函数的中英文代词消解
[信息传输、软件和信息技术服务业] [2014-07-15]
基于树核函数,提出了从使用中心理论、集成竞争者信息和融入语义角色相关信息这3个方面对结构化句法树进行动态扩展来提升中英文代词消解的性能.首先探索了3种基本结构化句法树捕获方案,并使用SVMLight 中提供的卷积树核函数直接进行基于结构化句法树的相似度计算,从而完成指代消解任务;其次,在分析3种结构化句法树捕获方案的基础上,从中心理论、竞争者信息和语义角色相关信息等几方面对捕获的结构化句法树进行了扩 展;最后,通过ACE 2004 NWIRE英文语料和ACE 2005 NWIRE中文语料上的实验,说明了这些扩展能够提升代词消解的性能.
关键词:代词消解;结构化句法树;树核函数
-
36590.联盟规范系统及其规范能力极限
[信息传输、软件和信息技术服务业] [2014-07-15]
联盟规范系统(coalitional normative system,简称CNS)通过选择性地限制联盟的联合行动来对规范系统(normative system,简称NS)进行扩展,扩展了ATL的语义,提出了Coordinate-ATL(Co-ATL),用于对CNS进行形式化,为了刻画其规范能力的极限,确定了Co-ATL的两个语言片段,分别对应于两类不可改变的系统属性.对NS和CNS之间的关系进行了讨论,表明所得到的结果可以更好地界定NS的能力极限.此外,引入了对执行历史进行编码的有限状态机,进一步对CNS进行了扩展,提出了CNS-M.可以证明,关于CNS能力板限的界定在该扩展下保持稳定.
关键词:规范系统;交互时态逻辑;联盟;并发博弈结构