@ieBugH确实是的。下面是我用人脸图像简单做的一个实验。下图中显示的每个点是透过GAN生成的,每个点代表一张人脸照片在GAN的latent representation里的512维编码坐标(用t-SNE投射到三维以方便显示)。图中有绿蓝红三组照顺序显示,绿蓝兩组你这里可以无视,重点是红的一组里的兩个点,代表两张两张差异仅是平移而已的照片。这个实验告诉我们即使是简单的图像平移也会令两张对人眼貌似一样的照片在 GAN 的 latent representation里产生不小的距离,因此会造成应用上的问题。