-
35771.全球电子书市场报告(2015-2019年)
[计算机、通信和其他电子设备制造业,信息传输、软件和信息技术服务业] [2014-12-10]
E-books are books available in a digital format, which allows readers to access content anywhere and at any time using their handheld devices. The Global E-book market is the fastest growing segment in the Global Book Publishing industry.
关键词:电子书;数字格式;手持设备
-
35772.全球AMCCPU卡市场报告
[计算机、通信和其他电子设备制造业,信息传输、软件和信息技术服务业] [2014-12-09]
AMCs are printed circuit boards that follow the specifications of PICMG, a consortium of over 27 companies that together develop open specifications for high-performance elecommunications and industrial computing applications.
关键词:AMC;CPU卡;高级电信运算构架
-
35773.基于图像分解的人脸特征表示
[信息传输、软件和信息技术服务业] [2014-12-07]
提出一种基于图像分解的人脸特征表示方法(FRID),首先通过多方向操作,把一幅图像分解成一系列方向子图像;然后,通过欧拉映射操作,把每幅方向子图像分解成实部和虚部图像,针对每幅实部和虚部图像,分别划分出多个不重叠的局部图像块,通过统计图像块上不同数值的个数生成相应的实部和虚部直方图,一幅图像的所有实部和虚部直方图被串联成一个超级特征向量;最后,利用线性判别分析方法对超级特征向量进行维数约简,以获得每幅图像的低维表示.实验显示该方法在多个人脸数据库上获得了优于时新算法的识别结果,并且表现得更为稳定.
关键词:图像分解;多方向操作;欧拉映射;人脸识别
-
35774.大数据下基于异步累积更新的高效P-Rank计算方法
[信息传输、软件和信息技术服务业] [2014-12-07]
P-Rank是SimRank的扩展形式,也是一种相似度度量方法,被用来计算网络中任意两个结点的相似性.不同于SimRank只考虑结点的入度信息,P-Rank还加入了结点的出度信息,从而更加客观准确地评价结点间的相似程度.随着大数据时代的到来,P-Rank需要处理的数据日益增大.使用MapReduce等分布式模型实现大规模P-Rank迭代计算的方法,本质上是一种同步迭代方法,不可避免地具有同步迭代方法的缺点:迭代时间(尤其是迭代过程中处理器等待的时间)长,计算速度慢,因此效率低下.为了解决这一问题,采用了一种迭代计算方法——异步累积更新算法.这个算法实现了异步计算,减少了计算过程处理器结点的等待时间,提高了计算速度,节省了时间开销.从异步的角度实现了P-Rank算法,将异步累积更新算法应用在了P-Rank上,并进行了对比实验.实验结果表明该算法有效地提高了计算收敛速度.
关键词:异步累积更新;大数据;相似度;P-Rank;大规模计算
-
35775.海量信息融合方法及其在状态评价中的应用
[信息传输、软件和信息技术服务业] [2014-12-07]
针对证据理论无法有效处理海量信息融合的不足,提出一种结合聚类和凸函数证据理论的海量信息融合方法,旨在解决状态评价等普遍而重要的应用问题.该方法首先基于聚类算法BIRCH对采集的海量信息进行预处理,形成多个簇;然后,针对状态评估类问题所用数据大多为数值数据和序数数据这一特点,计算每个簇的质心,并将其作为该簇的代表信息,基于广义三角模糊隶属函数对每个质心信息进行基本概率指派形成证据;最后,基于凸函数证据理论完成各证据的组合,从而完成了海量信息的融合.仿真实验结果表明:该方法既高效又合理地融合了海量信息,为海量信息融合技术的发展提供了一条探索途径.
关键词:证据理论;聚类;信息融合;海量信息;状态评价
-
35776.基于代价敏感多标记学习的开源软件分类
[信息传输、软件和信息技术服务业] [2014-12-07]
随着开源软件数量的增多,从开源软件社区中有效检索到所需的开源软件是具有挑战性的工作.现有方法通常是:首先,人工给每个软件赋予多个描述其功能、用途的标注;然后,通过关键词匹配寻找用户所需的软件.由于其简单、方便,基于标注进行软件检索得到了广泛的应用.然而,用户通常不愿意主动为其上载的开源软件提供标注,这使得根据用户上载软件的文字描述信息,从众多备选软件标注中为其自动选择能够表征其功能、用途的标注,成为了有效检索该软件的关键.把开源软件自动标注形式化为一个代价敏感多标记学习问题,并提出了一种新型代价敏感多标记学习方法 ML-CKNN.该方法通过在多标记学习中引入代价信息,有效缓解了对每一个标注而言具有该标注的示例与不具有该标注的示例分布非均衡性给多标记学习造成的影响.在3个开源软件社区上的实验结果表明:所提出的ML-CKNN方法能够为新上载的开源软件提供高质量的标注,其标注性能显著优于现有方法.
关键词:软件挖掘;机器学习;多标记学习;代价敏感学习;软件自动标注
-
35777.多标记分类和标记相关性的联合学习
[信息传输、软件和信息技术服务业] [2014-12-07]
提出了多标记分类和标记相关性的联合学习(JMLLC),在JMLLC中,构建了基于类别标记变量的有向条件依赖网络,这样不仅使得标记分类器之间可以联合学习,从而增强各个标记分类器的学习效果,而且标记分类器和标记相关性可以联合学习,从而使得学习得到的标记相关性更为准确.通过采用两种不同的损失函数:logistic回归和最小二乘,分别提出了JMLLC-LR(JMLLC with logistic regression)和JMLLC-LS(JMLLC with least squares),并都拓展到再生核希尔伯特空间中.最后采用交替求解的方法求解JMLLC-LR和JMLLC-LS.在20个基准数据集上基于5种不同的评价准则的实验结果表明,JMLLC优于已提出的多标记学习算法.
关键词:多标记学习;多标记分类;标记相关性;条件依赖网络;再生核希尔伯特空间;交替求解
-
35778.基于学习的高分辨率掌纹细节点质量评价方法
[信息传输、软件和信息技术服务业] [2014-12-07]
细节点在高分辨率掌纹匹配中扮演了重要角色,然而掌纹图像受到主线、褶皱线等的影响,提取出的细节点质量参差不齐.所以,对细节点进行质量评价并去除伪细节点,成为一个研究课题.提出了一种基于学习的高分辨率掌纹细节点质量评价方法.首先使用了基于图像的Gabor卷积响应和复数滤波响应等的一系列特征,用来对细节点局部进行冗余描述;然后,把每个特征作为弱分类器,用AdaBoost算法进行多层训练,挑选出对真伪细节点判别效果最理想的特征;最后,把弱分类器加权线性组合的响应分数作为细节点质量的得分,筛选出得分在阈值以上的细节点作为真细节点.该方法的实验结果与基于傅里叶变换的方法相比,能够更好地区分真伪细节点,对细节点的质量做出了更好的评价.
关键词:掌纹识别;细节点质量;Gabor卷积;复数滤波;AdaBoost算法
-
35779.一种基于概率主题模型的命名实体链接方法
[信息传输、软件和信息技术服务业] [2014-12-07]
命名实体链接(named entity linking,简称NEL)是把文档中给定的命名实体链接到知识库中一个无歧义实体的过程,包括同义实体的合并、歧义实体的消歧等.该技术可以提升在线推荐系统、互联网搜索引擎等实际应用的信息过滤能力.然而,实体数量的激增给实体消歧等带来了巨大挑战,使得当前的命名实体链接技术越来越难以满足人们对链接准确率的要求.考虑到文档中的词和实体往往具有不同的语义主题(如"苹果"既能表示水果又可以是某电子品牌),而同一文档中的词与实体应当具有相似的主题,因此提出在语义层面对文档进行建模和实体消歧的思想.基于此设计一种完整的、基于概率主题模型的命名实体链接方法.首先,利用维基百科(Wikipedia)构建知识库;然后,利用概率主题模型将词和命名实体映射到同一个主题空间,并根据实体在主题空间中的位置向量,把给定文本中的命名实体链接到知识库中一个无歧义的命名实体;最后,在真实的数据集上进行大量实验,并与标准方法进行对比.实验结果表明:所提出的框架能够较好地解决了实体歧义问题,取得了更高的实体链接准确度.
关键词:命名实体链接;概率主题模型;维基百科
-
35780.有序判别典型相关分析
[信息传输、软件和信息技术服务业] [2014-12-07]
多视图学习方法通过视图间互补信息的融合,达到增强单一视图方法的鲁棒性并提升学习性能的目的.典型相关分析(canonical correlation analysis,简称CCA)是一种重要的多视图信息融合技术.其研究的是针对同一组目标两组不同观测数据间的相关性,目标是得到一组相关性最大的投影向量.但当面对标号有序的分类任务时,CCA因没有利用类信息和类间有序信息,造成了对分类性能的制约.为此,通过将有序类信息嵌入CCA进行扩展,发展出有序判别典型相关分析(ordinal discriminative canonical correlation analysis,简称OR-DisCCA).实验结果表明,OR-DisCCA的性能比相关方法更优.
关键词:典型相关分析;有序回归;分类;信息融合;判别分析