摘要:
由于隐私保护和数据安全等原因,传统的域自适应问题通常假设神经网络在向目标域迁移时源域数据是可读取的。假设并不总能被满足,为此提出一种无源域自适应方法,不需要读取源域数据,即可实现神经网络由源域向目标域的迁移。该方法将目标域数据依置信度的高低划分为两部分,并基于分而治之的策略设计伪标签。对于高置信度数据,直接将神经网络预测作为伪标签;低置信度数据的伪标签则由神经网络的预测和周围高置信度数据的标签共同决定,这一过程被建模为一个优化问题,由优化问题的解析解给出了低置信度数据的伪标签。为更好地估计低置信度数据的伪标签,利用在低置信度数据上的信息最大化损失促使这些数据特征具有很好的聚类结构;同时,在高置信度数据上使用自监督损失,使得高置信度数据尽可能均匀的分散在特征空间中,从而保证每一个低置信度数据周围都存在高置信度数据。实验结果表明,本文所提方法不仅超过了最新的无源域自适应方法的表现,还取得了优于传统的域自适应方法的表现。
中图分类号:
王世鹏, 孙 剑, 徐宗本. 基于特征置信度的无源域自适应方法[J]. 工程数学学报, 2023, 40(4): 511-522.
WANG Shipeng, SUN Jian, XU Zongben. Source Free Domain Adaptation Based on Feature Structure[J]. Chinese Journal of Engineering Mathematics, 2023, 40(4): 511-522.