为了解决这些问题,蒋良晓领导的一个研究小组在《计算机科学前沿》上发表了他们的新研究。
该团队提出了一种新的三阶段标签集成方法,称为基于属性增强的标签集成(AALI)。AALI通过提高原始属性空间的判别能力和识别每个实例的多噪声标签集的质量来提高标签集成的性能。在模拟和现实世界众包数据集上的实验结果表明,AALI在标签质量和模型质量方面优于所有其他最先进的竞争对手。
在研究中,他们设计了一种属性增强方法来丰富属性空间,然后开发了一种过滤器,从众包数据集中筛选出具有高质量多噪声标签集的可靠实例。最后,他们使用交叉验证在可靠实例上构建多个组件分类器来预测所有实例。
在第一阶段,AALI将由多个噪声标签集生成的类隶属度概率定义为新属性,并通过将原始属性与新属性连接来构造增强属性。在第二阶段,AALI开发了一个滤波器,以挑选出具有高质量多噪声标签集的可靠实例。因此,将原始数据集分为可靠数据集和不可靠数据集。在第三阶段,AALI使用多数投票初始化可靠数据集中所有实例的集成标签,同时估计每个集成标签的确定性并将其分配给每个实例的权重。
接下来,AALI使用K-fold交叉验证在可靠数据集上构建M个分量分类器,预测所有实例的类概率分布。最后,AALI对可靠数据集中每个实例的集成标签进行更新,并将集成标签分配给不可靠数据集中的每个实例。在模拟和现实众包数据集上的大量实验结果验证了AALI的优越性。
未来的工作可以集中在使用优化方法找到所开发的滤波器阈值的最优值。
更多信息:Yao Zhang等,基于属性增强的众包标签集成,计算机科学前沿(2022)。DOI: 10.1007/s11704-022-2225-z由Frontiers Journals提供引文:基于属性增强的标签集成用于众包(2023,10月30日)检索自https://techxplore.com/news/2023-10-attribute-augmentation-based-crowdsourcing.html。除为私人学习或研究目的而进行的任何公平交易外,未经书面许可,不得转载任何部分。内容仅供参考之用。
点击分享到









