伪造内容会削弱身份可信、内容可信与证据可信。
远程身份认证、刷脸登录和实名场景可能被伪造人脸欺骗。
公众人物言论伪造、虚假信息传播会影响公共舆论判断。
司法取证、媒体审核和平台治理需要自动化检测工具辅助判断。
训练集与测试集来自相近分布,例如 FaceForensics++ c23 内部划分。
源域训练后直接迁移到 Celeb-DF、DFDC、DFDCP、UADFV 等目标域。



皮肤纹理、五官边缘、光照协调与融合区域。
高频能量、频谱异常与上采样痕迹。
噪声不一致、边界不连续与压缩残差。
可见空间纹理与语义内容。
块状频域系数与高频异常。
高通噪声残差与边界痕迹。



EfficientNet-B0 提取皮肤纹理、边缘和融合区域等可见线索。
8×8 块 DCT 显式建模频谱异常和生成痕迹。
SRM 高通滤波削弱语义内容,突出取证残差信号。
RGB 与辅助模态进行跨注意力交互。
样本级确定三路贡献比例。
门控权重刻画样本级模态贡献,用于呈现融合策略的自适应变化。

训练源域以 FaceForensics++ 为主,目标域包括 Celeb-DF v1/v2、DFDC、DFDCP 与 UADFV,采用零样本跨域评测。

输入 256×256
EfficientNet-B0
AdamW · 3×10⁻⁴
42 · RTX 4080



域内测试取得较高检测性能。
跨域目标域平均表现提升,体现三流互补的泛化收益。
Acc 与 F1 作为补充指标。
轻量参数规模。
较低计算预算。
单帧推理时间约值。


颜色扰动下仍能保持相对稳定的检测表现。
常见平台退化不会让模型完全失效。
高频与残差信号仍会受噪声扰动影响。



完整三流模型优于单流和双流配置,说明 DCT 与 SRM 提供补充信息。
中心一致性与门控熵正则用于提升特征和融合稳定性。
不同目标域的权重分布反映模型对 RGB、DCT、SRM 证据强度的自适应调节。



RGB 提供语义与纹理。
DCT 捕捉频谱异常。
SRM 突出噪声不一致。
五个目标域平均 AUC,验证三流取证证据对跨域泛化的贡献。
FF++ c23 域内 AUC
域内补充指标
轻量级三流网络规模
较低计算预算与单帧推理开销
跨域 AUC 提升不等于真实场景完全可靠。
尚未充分利用视频级时序一致性。
后续需要抗噪训练和真实平台退化建模。
视频时序建模、抗扰动与可解释报告生成。
RGB、DCT、SRM 从不同取证视角观察同一输入。
GCMA 用跨注意力和门控权重融合三路证据。
跨域稳定性有所提升,但复杂真实场景仍需继续研究。