AI生成的内容可以被区分出来么?
区分AI生成内容首先是一个技术问题[7]。目前,识别的技术路径主要包括生成内容检测和来源数据追踪两个方向。前者主要通过寻找数字内容所包含的生成特征来确定内容是否由AI生成或篡改。后者则是通过对数字内容全生命周期的相关信息(是否由AI生成、修改)的独立记录来间接反映数字内容的性质。然而对于AI内容识别,目前尚缺乏成熟可靠的技术方案。
1.内容检测路径
内容检测是最为直观的解决方案。虽然目前在人类的感官层面,AI生成内容与人工创作内容已相差无几,但是在细节层面,仍然存在着可被机器或者技术专家所觉察的特征。
在图像内容中,涉及图像边缘、纹理等细节的处理时,AI生成内容会出现像素级的不一致;涉及比例与对称性、光照与阴影等现实物理特征时,AI生成内容会出现细微的错误;在视频内容中,涉及物体运动轨迹、光照与阴影的变化时,AI生成内容会表现出轻微的不自然、缺乏连贯性或物理规律的异常;同理,在音频、文本等AI生成信息中也都存在类似微小的区别。
然而,即使AI生成内容在众多方面与人工内容存在差异,成熟的、高效且可靠的合成内容检测技术尚不可得。评估AI生成内容检测的技术主要需要考虑以下要素:通用性、可解释性、效率、鲁棒性、计算成本等。在图像领域,已经出现了利用深度学习模型、机器学习模型和统计模型等多种模型进行检测的技术,但是通用性、鲁棒性普遍表现不佳。据报道,使用不同方法在不同的训练和测试子集中获得的准确率仅为从61%到70%。当合成图像经过后处理(如压缩和调整大小),检测准确率将会进一步降低,难以在实践中可靠运作。
2.数据跟踪路径
来源数据跟踪是对“内容性质识别”的间接解决方案。来源数据跟踪并不依赖内容本身,而是通过对于内容的变动(生成、修改等)进行记录,从侧面反映内容的真实性、完整性。当前的来源数据跟踪方法主要包括显式标识和隐式标识。
(1)显式标识
显式标识最大特点是可以直接被人感知,提示告知效果显著,但其实践效果还有待评估。显式标识包括内容标签和可见水印等。内容标签与数字内容分离存在(如在特定场景中的周边提示),无法在生成合成内容的全生命周期都起到区分效果;而可见水印仅限于内容的一部分,容易被裁剪或移除;当可见水印被应用在整个内容的大部分区域,会降低数字内容的质量。
(2)隐式标识
隐式标识是指在生成合成内容或数据中添加的,不能被用户直接感知、但能通过技术手段处理的标识。目前主要有数字水印和元数据记录两种技术路径。
数字水印是机器可读的水印,可通过对内容进行肉眼不可见的扰动来嵌入附加来源信息。基于被扰动方式的不同,可以分为基于LSB的水印、离散余弦变换(DCT)水印、LLM水印等。但数字水印的效果同样存在疑问。复杂算法生成的水印需要大量的计算资源来读取,成本高效率低;简单算法生成的水印容易被去除和篡改,安全性不足。
元数据记录则是另一种方法,通过将内容变动生成的元数据独立储存在与数字内容相同的文件中,用以提供于其内容属性、来源等信息。基于独立储存的特征,这种方法虽然相较之下效率更高,但也存在明显缺陷。首先,元数据需要长时间存储,还需要投入资源进行管理和查询优化,增加了成本;其次,元数据原则上可以被任意的添加、修改、抹除,很难保证完整性与真实性。虽可以通过数字指纹或签名技术来提升安全性,但这也会带来额外成本;再次,规避元数据记录的门槛较低。用户可以通过截图或外部设备拍摄等非下载方式绕过元数据记录。
不论是数字水印还是元数据,隐私标识面临的最大挑战是其技术目标的实现对治理生态提出了很高要求。考虑到网络传播链路的复杂性,写入隐式标识,并进行读取、验证,最终对用户进行提示,完成这一闭环需要生态主体的高度协作,兼顾算法的保密性与跨平台的互通识别。若缺乏成熟的技术和治理规范,不仅不能实现来源辨别的目的,且可能会加剧欺骗或混淆的风险。
发表评论