非平衡样本分类的集成迁移学习算法
作者:田蕊;谭励;于重重;涂序彦
作者单位:北京工商大学计算机与信息工程学院,北京1000482;北京工商大学计算机与信息工程学院,北京1000482;北京科技大学信息计算机与通信工程学院,北京 100089;北京科技大学信息计算机与通信工程学院,北京 100089
加工时间:2014-06-15
信息来源:《电子学报》
关键词:迁移学习;分类器集成;冗余数据淘汰;权重分配
摘 要:针对冗余数据量大且正负样本不平衡的辅助训练数据,提出了一种改进集成迁移学习算法,利用这些辅助训练数据迁移帮助目标数据进行分类.新的样本初始权重分配及调整策略,突出了对负样本的识别能力.通过动态调整辅助训练集,根据设定好的权重阈值下限适时地淘汰冗余数据,降低了冗余数据对分类器性能的影响,提升了迁移学习对非平衡样本的学习能力.本文利用桥梁实际监测数据进行的实验表明了该算法较TrAdaboost算法的有效性.