



近年来,由于互联网通信技术的快速发展及多媒体技术的大量应用,网络多媒体信息服务,特别是视频服务已在众多互联网服务中占据重要地位。相较于字符、文字、图片等静态信息载体,视频由于能提供更加形象、丰富的动态信息,被广泛应用于互联网媒体中,如视频分享网站、视频新闻、视频会议、视频点播等。中国互联网络信息中心发布的《第54次中国互联网络发展状况统计报告》显示,截至2024年6月,我国网络视频用户规模达10.68亿人,较2023年12月增长125万人,占网民整体的97.1%。其中,短视频用户规模达10.50亿人,占网民整体的95.5%。视频在内容格式方面呈现差异化发展,各主流视频分享网站纷纷向体育、漫画等领域发展。《中国网络视听发展研究报告(2024)》显示,截至2023年12月,网络长视频平台作品存量已达12万余部,网络音频、网络音乐总作品数量超过2.7亿个,网络短视频账号总数已超过15亿个,网络视听等多媒体内容市场已达万亿规模。由此可见,网络多媒体服务,特别是视频服务已成为网络信息共享中的重要组成部分。
由于互联网网络体系结构的开放性及多媒体内容编辑软件的广泛使用,在互联网上传输的多媒体内容也随之出现了安全、管理方面的问题。数字多媒体信息本身具有的传输方便、易于分发、无损复制等特点加剧了多媒体信息可信安全问题的严重性,如视频内容的篡改、非法窃取与泄露。
国内著名的影视作品著作权案:“窝窝电影”视频网站在2015年非法复制至少9家影视公司的视频,从相关电影网站上以加框链接形式盗取视频,下载500余部影视作品,并在互联网上提供免费在线播放或免费下载,以广告形式牟取非法利益达百万元。用户在观看该网站视频时,由于该网站采用加框链接方式隐藏了原来网站的标识信息,因此用户无法判断该视频的播放源是哪里,无法信任视频提供者的身份信息。例如,随着人工智能技术的大量应用,一些网络不法分子通过受害者照片合成换脸视频,以达到解锁其社交媒体账号或实施诈骗等目的。这类合成视频是通过人工智能等深度学习技术拼接而成的,视频内容缺乏完整性。因此,数字多媒体信息的可信安全问题已成为多媒体服务发展中亟待解决的重要问题。
本书从多媒体内容高层语义信息和底层语义信息的可信方面来研究多媒体信息的可信认证技术,下面给出多媒体高层语义信息和底层语义信息的定义。
定义1.1 多媒体内容的高层语义信息是指该多媒体内容概念层级上的描述信息。该信息通常是多媒体内容在生成过程中为了方便其他用户检索、人机直接交互而人为添加的以文本为载体的描述信息。高层语义信息反映了多媒体内容的创作者或发布者对多媒体内容的概念层级的总结,它包括多个属性,如标题、创作者、关键字等。
定义1.2 多媒体内容的底层语义信息是指该多媒体内容能够为其他用户提供感知内容的数据,通常数字多媒体内容以二进制数据形式存在,如图像的像素矩阵、视频的帧序列。底层语义信息不需要多媒体内容的创作者或发布者对其进行概念层级的总结,而是由用户自己感知其内容并形成自己对该多媒体内容的理解。
用户在互联网上播放、观看多媒体内容时,除可以获得丰富的视觉、听觉感知内容外,还可以获得该多媒体内容的一些描述信息。这些描述信息极易遭到攻击者的篡改,被篡改后的多媒体内容被攻击者传播。底层语义信息容易遭受攻击者添加恶意信息、删除底层数据等威胁,因此需要寻找有效的可信认证方法,以保证底层语义信息的安全。
基于描述信息的高层语义信息同样对用户理解多媒体内容有着重要影响:一方面,这些高层语义信息是用户对多媒体内容进行检索、查询的重要线索,是用户试图对寻找的多媒体内容在本体语义空间进行有效定位的依据;另一方面,这些高层语义信息也面临着安全方面的威胁,如攻击者篡改多媒体内容的创作者信息并重新发布,多媒体内容的版权、来源信息极易遭受破坏。因此,需要寻找一种有效的方法来保证高层语义信息的安全。
互联网体系结构的开放性与透明性决定了在其中传输的多媒体内容面临着严重的安全问题。从简单的通信系统模型来看,多媒体内容在网络上传输时,其语义信息面临的威胁主要来自以下3个方面。
(1)多媒体内容的信源可信性不足。
多媒体内容的提供者(信源)可以以任意方式接入互联网,发布多媒体内容。目前,互联网中视频门户网站、视频下载软件层出不穷,它们对上传视频内容到网络的用户身份的合法性缺乏有效的监管。一方面,用户可能持有盗版视频,但声称自己对该视频拥有版权,并在网络中传播该视频;另一方面,对于在网络中传播的非法视频,无法有效地跟踪视频的提供者。因此,伴随着“三网融合”的不断发展,人们急需寻找一种有效的方法解决多媒体内容信源的可信认证问题。
(2)多媒体内容传输过程中面临着安全威胁。
由于网络IP协议具有开放性,因此在互联网中传输多媒体内容时不能保证其安全性。例如,中间人攻击可以对多媒体内容的传输过程发起攻击,修改多媒体内容或者加入其他信息,如版权信息、虚假或违法信息,使得传输到接收端的多媒体内容完整性遭到破坏。同时,攻击者可以嗅探多媒体内容的数据包,对多媒体内容发起帧丢弃、帧重组等攻击,破坏其内容的语义信息。因此,研究网络中多媒体内容传输过程的安全性,也是多媒体内容安全认证技术的一个重点。
(3)多媒体内容接收端的可信问题。
目前,多媒体内容接收端通常采取口令的方式进行认证,攻击者一旦破解口令获取多媒体内容,就可以对多媒体内容进行非法复制或者传播。而非法用户也可以通过重组多媒体内容的数据包来恢复多媒体内容的数据和结构,从而获取多媒体内容。此外,多媒体内容接收端是否正确地接收到合法的多媒体内容,如视频会议中确保对方收到合法视频,也是多媒体信息可信认证中一个需要研究的问题。因此,多媒体内容接收端的可信及对接收端收到的多媒体内容的安全认证研究也是保证多媒体信息可信的重要环节。
从上面的分析可以看出,保证互联网中多媒体信息的安全可信,既要对多媒体内容的高层语义信息进行安全认证,也要对多媒体内容的底层语义信息进行安全认证,这是实现多媒体内容完整性安全认证的关键。对于高层语义信息的标引,课题组前期积累了一定的研究基础 [1-4] ,在理论与实践方面形成了一套对多媒体信息资源在语义空间中进行有效定位的方法。本书将在此基础上对网络多媒体信息的安全认证进行深入研究,从保证多媒体内容高层语义信息和底层语义信息完整性的角度出发,针对多媒体内容在互联网传输过程中面临的安全威胁,寻找相应的可信认证模型和可信认证算法,为网络多媒体服务的健康发展提供一定的研究基础和应用价值。