crédit: Frontières de l’informatique (2022). est ce que je: 10.1007/s11704-022-2225-z
Le crowdsourcing offre un moyen efficace et peu coûteux de collecter des autocollants auprès des travailleurs participatifs. En raison du manque de connaissances professionnelles, l. a. qualité des affiches de groupe est relativement faible. Une approche courante pour résoudre ce problème consiste à collecter plusieurs étiquettes pour chaque example auprès de différents travailleurs de foule, puis à utiliser l. a. méthode d’intégration d’étiquettes pour déduire sa véritable étiquette. Cependant, presque toutes les méthodes d’intégration d’étiquettes existantes utilisent les informations d’attribut d’origine et ne se soucient pas de l. a. qualité de l’ensemble d’étiquettes bruyantes multiples pour chaque example.
Pour résoudre ces problèmes, une équipe de recherche dirigée par Liangxiao JIANG a publié ses nouvelles recherches dans Frontières de l’informatique.
L’équipe a proposé une nouvelle méthode d’intégration d’étiquettes en trois étapes appelée intégration d’étiquettes basée sur l’augmentation des attributs (AALI). AALI améliore les performances d’intégration d’étiquettes en améliorant l. a. capacité discriminante de l’espace de fonctionnalités d’origine et en déterminant l. a. qualité de l’ensemble d’étiquettes bruyantes multiples pour chaque example. Les résultats expérimentaux sur des ensembles de données de crowdsourcing simulés et réels montrent qu’AALI surpasse tous les autres concurrents en termes de qualité d’étiquette et de qualité de modèle.
Dans cet article, ils conçoivent une méthode d’amélioration des attributs pour enrichir l’espace des attributs, puis développent un filtre pour marquer les cases fiables avec plusieurs ensembles d’étiquettes de haute qualité à partir d’un ensemble de données participatif. Enfin, ils utilisent l. a. validation croisée pour créer plusieurs classificateurs de composants sur des cases fiables afin de prédire toutes les cases.
Dans l. a. première étape, AALI identifie les probabilités d’appartenance à une classe résultant d’un ensemble d’étiquettes bruyantes en tant que nouvelles fonctionnalités et construit les fonctionnalités augmentées en associant les fonctionnalités d’origine aux nouvelles fonctionnalités. Dans l. a. deuxième section, AALI développe un filtre pour baliser les cases fiables à l’aide de plusieurs ensembles d’étiquettes de haute qualité. En conséquence, l’ensemble de données d’origine est divisé en un ensemble de données fiables et un ensemble de données non fiables. Dans l. a. troisième étape, AALI utilise le vote majoritaire pour initialiser des classifications intégrées pour toutes les cases dans un ensemble de données fiables tout en estimant l. a. certitude de chaque classification intégrale et en lui attribuant un poids à chaque example.
Ensuite, AALI utilise l. a. validation croisée K-fold pour générer des classificateurs à composants M sur un ensemble de données fiable afin de prédire les distributions de probabilité de classe pour tous les cas. Enfin, AALI met à jour l’étiquette intégrale pour chaque example dans un ensemble de données approuvé et définit l’étiquette intégrale pour chaque example dans un ensemble de données non fiable. De nombreux résultats expérimentaux sur des ensembles de données d’ensemble simulés et réels confirment l. a. supériorité d’AALI.
Les travaux futurs pourraient se concentrer sur l. a. recherche de l. a. valeur optimale du seuil du filtre développé à l’aide de l. a. méthode d’optimisation.
Plus d’knowledge:
Yao Zhang et al., Intégration d’étiquettes basée sur l’augmentation des fonctionnalités pour le crowdsourcing, Frontières de l’informatique (2022). est ce que je: 10.1007/s11704-022-2225-z
Fourni par Frontiers Magazines
l. a. quotation: Intégration d’étiquettes basée sur l’augmentation de fonctionnalités pour le crowdsourcing (30 octobre 2023) Récupéré le 30 octobre 2023 sur
Ce file est soumis au droit d’auteur. Nonobstant toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans autorisation écrite. Le contenu est fourni à titre informatif uniquement.