«上一篇 下一篇»
  计算机工程  2022, Vol. 48 Issue (5): 272-280  DOI: 10.19678/j.issn.1000-3428.0061303
0

引用本文  

党良慧, 张玉金, 路东生. 基于纹理免疫的JPEG预压缩图像降尺度因子检测[J]. 计算机工程, 2022, 48(5), 272-280. DOI: 10.19678/j.issn.1000-3428.0061303.
DANG Lianghui, ZHANG Yujin, LU Dongsheng. Downscaling Factor Detection of Pre-JPEG Compressed Images Based on Texture-Immune[J]. Computer Engineering, 2022, 48(5), 272-280. DOI: 10.19678/j.issn.1000-3428.0061303.

基金项目

上海市自然科学基金(17ZR1411900);上海市科委重点项目(18511101600);上海高校青年教师培养计划项目(ZZGCD 15090)

作者简介

党良慧(1993—),女,硕士研究生,主研方向为图像处理、机器学习、计算机视觉;
张玉金,副教授、博士;
路东生,硕士研究生

文章历史

收稿日期:2021-03-29
修回日期:2021-05-16
基于纹理免疫的JPEG预压缩图像降尺度因子检测
党良慧 , 张玉金 , 路东生     
上海工程技术大学 电子电气工程学院, 上海 201620
摘要:图像编辑工具的普及导致JPEG图像越来越容易被篡改,其中重采样操作方法通过几何变换能够使伪造的图像更加逼真,因此对JPEG图像进行重采样检测至关重要。传统的光谱分析法依据差分图像相邻极值的间隔遵循几何分布,以及在直方图上的峰值呈现周期性,通过峰值分析对下采样因子进行估计,但由于图像纹理统计特征的周期性干扰了直方图的提取,导致检测准确性较低。提出一种用于JPEG预压缩图像降尺度因子检测的纹理免疫块效应分析算法,利用快速导向滤波对图像进行预处理,并去除图像的纹理和噪声。使用Canny算子对滤波后的图像进行边缘检测,以减轻周期性边缘的干扰,对图像进行交叉差分,从而凸显块效应,提高JPEG图像降尺度因子估计的准确性。在此基础上,结合极大似然估计和谱分析得出降尺度因子的估计值,减小估计误差。实验结果表明,该算法能有效削弱图像纹理对重采样估计的影响,具有较强的纹理免疫能力。
关键词纹理免疫    JPEG预压缩图像    快速导向滤波    降尺度因子估计    图像重采样检测    JPEG块效应    交叉差分    
Downscaling Factor Detection of Pre-JPEG Compressed Images Based on Texture-Immune
DANG Lianghui , ZHANG Yujin , LU Dongsheng     
School of Electronic and Electrical Engineering, Shanghai University of Engineering Science, Shanghai 201620, China
Abstract: The popularity of image editing tools makes JPEG images increasingly vulnerable to tampering, and the resampling operation method makes forged images more realistic through geometric transformation. Resamplingof the detection of JPEG images is therefore crucial. The traditional spectral analysis method follows a geometric distribution according to the interval of adjacent extreme values of the difference image and presents periodic peaks on the histogram. Thedownsampling factor is estimated through peak analysis. The periodicity oftheimage texture statistical features interferes with the extraction of the histogram, resulting in low detection accuracy. A texture immune block effect analysis algorithm for the detection of the downscaling factor of the pre-JPEG compressed images is proposed. The image is pre-processed by fast-guided filtering, and the texture and image noise are removed. The Canny operator detects the edge of the filtered image to reduce the interference of periodic edges, and the cross difference highlights the block effect and improves the accuracy of the JPEG image downscaling factor estimation. On this basis, combined with maximum likelihood estimation and spectral analysis, the downscaling factor is estimated to reduce the estimation error. Experimental results show that the algorithm can effectively weaken the influence of image texture on resampling estimation and provide strong texture immunity.
Key words: texture-immune    pre-JPEG compressed image    fast guide filtering    downscaling factor estimation    image resampling detection    JPEG block artifacts    cross-difference    

开放科学(资源服务)标志码(OSID):

0 概述

被动取证相比主动取证,不需要水印、签名等过多额外信息,具有更广泛的应用前景[1-2]。在图像拼接篡改中,对局部拼接区域进行旋转、缩放等重采样处理可以使伪造图像在几何视角上更加逼真[3-4]。因此,检测局部图像区域是否经过重采样处理有助于定位篡改区域,重采样检测成为图像盲取证的重要手段[5-6]

目前JPEG图像是人们获取信息的主要来源之一。随着各种图像编辑工具的普及,JPEG图像越来越容易被篡改[7]。对图像进行JPEG压缩和重采样操作的方法主要有JPEG后压缩图像重采样、JPEG预压缩图像重采样以及JPEG双压缩图像重采样3种组合[8-9]。在JPEG后压缩图像重采样中,未被篡改的图像是无损压缩格式,篡改后的图像是JPEG格式。在JPEG预压缩图像重采样中,未篡改图像为JPEG格式,篡改后的图像为无损压缩格式。对于JPEG双压缩图像重采样,未篡改和篡改后的图像均为JPEG格式。

KIRCHNER等[10]发现JPEG压缩会在频域产生峰值,并且峰值会根据重采样操作而移位。基于此理论,BIANCHI等[11]提出通过检测移位的JPEG峰来估计缩放因子。GALLAGHER[12]的研究发现,经历重采样操作的JPEG图像,其频域主要有重采样峰、JPEG峰和离散傅里叶变换(Discrete Fourier Transform,DFT)导致的对称JPEG峰。传统的光谱分析法[13],无论是通过检测JPEG峰值或是检测重采样峰值,均会被无关峰值所干扰。尤其当JPEG图像经历下采样操作后,降尺度因子更加微弱,其峰值难以被检测。因此,LIU等[14]引入秩统计理论并结合光谱分析进行JPEG图像下采样因子的估计。

文献[14]研究发现,差分图像相邻极值之间的间隔服从几何分布,且分布直方图具有周期性。未经重采样的JPEG图像的分布直方图以8为周期进行变化,重采样后导致原本的周期发生改变,新的周期与重采样因子有关。因此,降尺度因子可以通过检测重采样操作后的差分图像极值直方图的周期进行估计,但对于JPEG压缩质量较高和纹理丰富的图像来说,该方法检测准确率较低。本文分析影响检测结果的因素主要有图像纹理内容、图像边缘以及块效应强度。其中,由于极值直方图的检测主要在像素域内进行,图像中具有周期性变化的纹理内容会导致检测结果的混淆。而在像素域检测移位块效应的极值直方图时,图像周期性边缘会产生伪周期,干扰直方图估计的准确性。且JPEG压缩质量因子越高,压缩块效应越不明显,极值直方图的检测越困难。如何有效地凸显块效应成为需要解决的难题。

与图像边缘和块效应强度相比,图像丰富的纹理特征对直方图提取的准确性干扰最明显。为了使降尺度因子估计更准确,需要对图像纹理进行分析。纹理是一种反映像素空间分布属性的图像特征,通过像素及其周围空间领域的灰度分布来表现,纹理具有重复性和规律性,其局部统计特征呈周期性变化[15]。导致直方图的统计特性分析产生混淆,影响降尺度因子估计的准确性。

本文提出一种纹理免疫块效应分析算法,分别引入快速导向滤波器和Canny算子削弱图像纹理、周期性边缘的干扰,并寻找更有效的差分方式,凸显JPEG图像移位的块效应网格(Shifted Block Artifact Grid,SBAG),减小估计误差。

1 相关工作 1.1 重采样图像光谱分析

本节主要介绍重采样模型以及图像重采样的光谱分析。为简化分析,在不失一般性的情况下,以一维信号为例进行重采样分析。根据文献[16]中的模型,以$ \lambda =p/q $来表示重采样因子,对于给定的原始图像$ {g}_{0}\left(n\right), n\in {Z}^{2} $,经过以下3个步骤生成重采样图像。

步骤1  重构。由原始离散序列$ {g}_{0}\left(n\right) $通过插值重新构建一个连续信号$ {g}_{h}\left(x\right) $,如式(1)所示:

$ {g}_{h}\left(x\right)=\sum \limits_{i\in z}{g}_{0}\left(i\right)h(x-i) $ (1)

其中:$ h\left(x\right) $为插值核函数。

步骤2  变换。根据函数$ y=\alpha \left(x\right) $进行位置变换得到一个新的函数,如式(2)所示:

$ {g}_{r}\left(x\right)={g}_{h}\left({\alpha }^{-1}\left(x\right)\right) $ (2)

由于本节只考虑一维信号的缩放操作,令$ \alpha \left(x\right)=\lambda x, \lambda \in {R}^{+} $,因此可得$ {g}_{r}\left(x\right) $的表达式如式(3)所示:

$ {g}_{r}\left(x\right)={g}_{h}\left(\frac{x}{\lambda }\right) $ (3)

其中:$ \lambda $为需要检测的重采样因子。

步骤3  采样。将第2步得到的连续信号$ {g}_{r}\left(x\right) $通过重新采样得到重采样信号$ {g}_{1}\left(n\right)={g}_{r}\left(n\right) $,结合式(1)~式(3)可知:

$ {g}_{1}\left(n\right)=\sum \limits_{i\in z}g{}_{0}(i)h\left(\frac{n}{\lambda }-i\right) $ (4)

重采样模型建立后,对其进行光谱分析。在重采样模型中,步骤1的插值操作引入了循环平稳性。为简化分析,考虑$ {g}_{0}\left(n\right) $为具有二阶矩过程的广义平稳信号,并引入方差来进行傅里叶域的峰值分析。从重采样模型的步骤1中提取$ {g}_{h}\left(x\right) $的方差为$ {v}_{h}\left(x\right)={s}_{h}\left(x\right)+{r}_{h}\left(x\right) $$ {s}_{h}\left(x\right) $$ {r}_{h}\left(x\right) $的表达式如下:

$ \begin{array}{l}{s}_{h}\left(x\right)=\sum \limits_{i\in z}\mathrm{V}\mathrm{a}\mathrm{r}\left\{{g}_{0}\left(i\right)\right\}{h}^{2}\left(x-i\right)\\ {r}_{h}\left(x\right)=\sum \limits_{i\ne j\notin {z}^{2}}\mathrm{C}\mathrm{o}\mathrm{v}\left\{{g}_{0}\left(i\right){g}_{0}\left(j\right)\right\}h(x-i)h(x-j)\end{array} $ (5)

其中:$ \mathrm{V}\mathrm{a}\mathrm{r}\left\{\right\} $$ \mathrm{C}\mathrm{o}\mathrm{v}\left\{\right\} $分别表示方差算子和协方差算子。

由于$ {g}_{0}\left(n\right) $是广义平稳信号,且插值核为能量有限函数,因此在光谱分析中可以忽略$ {r}_{h}\left(x\right) $的影响,只考虑$ {s}_{h}\left(x\right) $的光谱分析。假设$ \mathrm{V}\mathrm{a}\mathrm{r}\left\{{g}_{0}\left(i\right)\right\}={\sigma }_{0}^{2} $,可以得到$ {s}_{h}\left(x\right) $的表达式如式(6)所示:

$ {s}_{h}\left(x\right)={\sigma }_{0}^{2}\sum \limits_{i\in z}{h}^{2}\left(x-i\right) $ (6)

基于Dirac函数$ \mathrm{\Delta }\left(x\right)=\sum \limits_{i\in z}\delta \left(x-i\right) $,得到$ {s}_{h}\left(x\right) $的表达式如式(7)所示,其傅里叶变换如式(8)所示:

$ s_{h}(x)= {\sigma }_{0}^{2}{h}^{2}\left(x\right)\times \mathrm{\Delta }\left(x\right) $ (7)
$ {S}_{h}\left(\omega \right)={\sigma }_{0}^{2}{U}_{h}\left(\omega \right)\mathrm{\Delta }\left(\omega \right) $ (8)

其中:$ {U}_{h}\left(\omega \right)=H\left(\omega \right)\times H\left(\omega \right) $$ H\left(\omega \right) $为插值核函数$ h\left(x\right) $的傅里叶变换;$ {S}_{h}\left(\omega \right) $$ {s}_{h}\left(x\right) $的傅里叶变换。

由式(8)可以看出其离散谱的峰值在整数点,插值核的傅里叶变换与插值核卷积的傅里叶变换分别如图 1(a)图 1(b)所示。

Download:
图 1 插值核函数卷积的傅里叶变换 Fig. 1 Fourier transform of the convolution of the interpolation kernel

根据重采样模型中的步骤2的缩放操作引入重采样因子$ \lambda $$ {s}_{h}\left(x\right) $变为$ {s}_{r}\left(x\right) $$ {s}_{r}\left(x\right)={s}_{h}\left(\frac{x}{\lambda }\right) $的傅里叶变换如式(9)所示:

$ {S}_{r}\left(\omega \right)=\lambda {\sigma }_{0}^{2}U\left(\lambda \omega \right){\mathrm{\Delta }}_{\frac{1}{\lambda }}\left(\omega \right) $ (9)

其中:$ {\mathrm{\Delta }}_{\frac{1}{\lambda }}\left(\omega \right)=\sum \limits_{i\in z}\delta \left(\omega -\frac{i}{\lambda }\right) $。根据奈奎斯特采样定理可知,步骤3的采样是重采样信号$ {s}_{r}\left(x\right) $的傅里叶变换,即$ {S}_{r}\left(\omega \right) $的周期延长,式(10)和式(11)分别表示重采样后信号$ {g}_{1}\left(n\right) $的傅里叶变换及其幅值:

$ {S}_{1}\left(\omega \right)=\sum \limits_{j\in z}\lambda {\sigma }_{0}^{2}U\left(\lambda \omega -j\right){\mathrm{\Delta }}_{\frac{1}{\lambda }}\left(\omega -j\right) $ (10)
$ {M}_{1}\left(\omega \right)=\frac{p}{q}{\sigma }_{0}^{2}\left|\sum \limits_{j\in z}U\left(\frac{p}{q}\omega -j\right)\right|{\mathrm{\Delta }}_{\frac{1}{\lambda }}\left(\omega -j\right) $ (11)

图 1所示,$ \left|H\left(\omega \right)\times H\left(\omega \right)\right| $$ {\mathbb{R}}^{+} $内是单调递减的,即$ U\left(\lambda \omega -j\right) $是单调递减的,故谐波的阶数越高,其对应的峰值越弱。结合式(9)和式(10)可以推导出峰值的位置如式(12)所示:

$ \omega =\frac{n}{\lambda }, n\in \mathbb{Z} $ (12)

由奈奎斯特抽样定理可知,当$ \lambda > 2 $$ p/q > 2 $时,通常只有一阶谐波峰值$ {\omega }_{1} $显示在$ {S}_{1}\left(\omega \right) $。如果只考虑上采样的情况,一般重采样因子估计的方法是将频率在0.0~0.5间的峰值作为一阶谐波峰值$ {\omega }_{1} $,使用式(12)来估计重采样因子为$ \lambda =1/{\omega }_{1} $。对于下采样,通过式(11)可知$ {M}_{1}\left(\omega \right) $$ q $成反比。因此,使用传统的光谱法进行峰值分析以检测下采样因子比较困难。

1.2 移位的块效应网格分析

对一幅图像进行JPEG压缩的基本流程主要包括彩色空间转换、8×8分块离散余弦变换、量化、Huffman编码等步骤,解压缩是上述压缩步骤的逆过程。由于每个图像块都是被单独量化的,块内部区域比较平滑,而块与块之间的过渡较为剧烈。这种现象在整个图像的水平和垂直方向上周期性地出现,形成块效应网格(Block Artifact Grid,BAG)。压缩率越高,图像的质量越低,BAG就越明显。

由上述分析可知,BAG是由于JPEG压缩而出现,且对一般的后处理操作具有鲁棒性[17]。为了分析重采样操作对BAG的影响,对一幅大小为$ M\times N $的JPEG压缩图像,本文采用文献[18]的方式给出其数学表达式:

$ \begin{array}{l}B\left(x, y\right)=\sum \limits_{m=0}^{M/T}\delta \left(x-mT\right)+\sum \limits_{n=0}^{N/T}\delta \left(y-nT\right)-\\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \sum \limits_{m=0}^{M/T}\delta \left(x-mT\right)\times \sum \limits_{n=0}^{N/T}\delta \left(y-nT\right)\end{array} $ (13)

其中:$ T $为块效应网格的周期;$ \delta \left(\cdot \right) $为Dirac-Delta函数。原始JPEG图像块效应网格的周期性为8,以重采样因子$ \lambda $操作后,其周期变为$ 8\lambda $。周期性的变化展现了重采样操作对BAG的影响,当JPEG图像经历重新采样改变大小时,BAG以重采样比例变为SBAG。

在JPEG预压缩的情况下,图像经历重采样操作后,原本的块效应网格发生移位,变为仅出现在$ 8\lambda \times 8\lambda $边界上的周期性信号,其周期取决于缩放因子$ \lambda $,如图 2所示。其中压缩质量因子(Quality Factor,QF)值越大,表示JPEG压缩得越厉害。结合秩统计理论[14]可知,对于未经过重采样的未压缩图像,其空间域内的相邻极值间隔分布直方图(Nf图)满足伯努利分布,如图 2(a)所示。经过压缩的JPEG图像由于BAG的存在,导致原本的分布上产生周期为8的峰值,如图 2(c)所示。同时,经历过重采样后的JPEG图像,BAG以重采样因子$ \lambda $产生偏移,导致峰值的周期变为$ 8\lambda $,如图 2(d)所示。而未压缩的图像经历重采样后无此规律,如图 2(b)所示。

Download:
图 2 不同图像的Nf Fig. 2 Different images of Nf diagram

通过以上分析可知,降尺度因子可通过检测直方图的统计特性进行估计。但是由于图像纹理噪声和边缘的干扰会导致Nf 图产生伪周期,从而混叠峰值周期的检测。

2 本文算法

基于上述分析,图像纹理和边缘产生的伪周期会干扰降尺度因子估计的准确性,本文使用快速导向滤波对图像进行预处理来去除图像纹理和噪声的干扰,并利用Canny算子对滤波后的图像进行边缘检测与去除。最后,对图像进行交叉差分,以凸显块效应,提高JPEG图像降尺度因子估计的准确性。具体算法步骤如下:

1)读取一幅JPEG图像;

2)对图像进行快速导向滤波去除纹理和噪声的干扰;

3)对去除纹理的图像使用Canny算子进行边缘检测和去除;

4)对移除纹理和边缘的图像使用交叉差分凸显块效应;

5)计算差分图像的极值区间间隔直方图;

6)结合光谱法和最大似然估计法,估计直方图的峰值周期,并计算重采样因子。

2.1 快速导向滤波

导向图像滤波器具有保边平滑特性,且能避免双边滤波器所产生的梯度伪影[19]。本节对图像进行快速导向滤波来去除图像噪声和纹理的干扰,提高后续处理算法的检测性能。

导向滤波的思想是利用一张引导图像$ G $产生权重,处理输入图像$ I $,进而得到输出图像$ {I}^{n} $。其中,$ G $$ I $均为已知图像,两者可以是相同的。该过程如式(14)所示:

$ {I}_{\left(r, s\right)}^{n}=\sum \limits_{\left(x, y\right)\in {\varOmega }_{\left(r, s\right)}}{W}_{\left(r, s\right)\left(x, y\right)}\left(G\right){I}_{\left(x, y\right)} $ (14)

其中:$ \left(r, s\right) $表示图像的像素点;$ \left(x, y\right) $为其邻域像素点;$ {\varOmega }_{\left(r, s\right)} $表示像素点$ \left(r, s\right) $的领域像素点的集合。可以看出式(14)中权重$ W $仅与引导图像$ G $有关,双边滤波中权重$ W $由输入图像决定。

导向滤波器的核心是在引导图像$ G $与输出图像$ {I}^{n} $之间建立一个局部线性模型,在局部窗口$ {w}_{k} $中,输出图像与引导图像的线性关系如式(15)所示:

$ {I}_{\left(r, s\right)}^{n}={a}_{k}{G}_{\left(r, s\right)}+{b}_{k}, {\forall }_{\left(r, s\right)}\in {w}_{k} $ (15)

其中:$ {a}_{k} $$ {b}_{k} $为窗口$ {w}_{k} $中假定为常数的线性系数。如图 3所示该模型可以保证输出图像$ {I}^{n} $被引导图像$ G $约束,由于$ \nabla {I}^{n}=a\nabla G $,即当引导图像的局部有梯度变化时,输出图像也会产生相应的梯度变化。

Download:
图 3 导向滤波模型 Fig. 3 Guided filtering model

本文目的是根据图像的参数来定义线性系数$ {a}_{k} $$ {b}_{k} $,为了去除图像中的纹理、噪声等干扰因子,假设纹理噪声为$ T $,本文将输出图像$ {I}^{n} $定义如式(16)所示:

$ {I}_{\left(r, s\right)}^{n}={I}_{\left(r, s\right)}-{T}_{\left(r, s\right)} $ (16)

为了求解式(15)中的线性系数$ {a}_{k} $$ {b}_{k} $,根据式(16),假设所需要的系数能够使输入图像$ I $和输出图像$ {I}^{n} $差异最小,在窗口$ {w}_{k} $中的代价函数可以表示为式(17):

$ E\left({a}_{k} , {b}_{k}\right)=\sum \limits_{\left(r, s\right)\in {w}_{k}}\left({\left({a}_{k}{G}_{\left(r, s\right)}+{b}_{k}-{I}_{\left(r, s\right)}\right)}^{2}+\varepsilon {a}_{k}^{2}\right) $ (17)

其中:$ \varepsilon $是正则化系数,可以通过最小二乘法得出该式子的解。

$ \begin{array}{l}{a}_{k}=\frac{\frac{1}{\left|w\right|}\sum \limits_{\left(r, s\right)\in {w}_{k}}{G}_{\left(r, s\right)}{I}_{\left(r, s\right)}-{\mu }_{k}\frac{1}{\left|w\right|}\sum \limits_{\left(r, s\right)\in {w}_{k}}{I}_{\left(r, s\right)}}{{\sigma }_{k}^{2}+\varepsilon }\\ {b}_{k}=\frac{1}{\left|w\right|}\sum \limits_{\left(r, s\right)\in {w}_{k}}{I}_{\left(r, s\right)}-{a}_{k}{\mu }_{k}\end{array} $ (18)

其中:$ {\mu }_{k} $$ {{\sigma }_{k}}^{2} $分别为引导图像$ G $在窗口$ {w}_{k} $中的均值和方差;$ \left|w\right| $表示窗口$ {w}_{k} $中像素的数量。

不同窗口中的线性系数$ {a}_{k} $$ {b}_{k} $不同,因此对所有窗口的输出值相加求均值,最终得到的$ {I}_{\left(r, s\right)}^{n} $如式(19)所示:

$ {I}_{\left(r, s\right)}^{n}=\frac{1}{\left|w\right|}\sum \limits_{k\left|\left(r, s\right)\in {w}_{k}\right.}\left({a}_{k}{G}_{\left(r, s\right)}+{b}_{k}\right) $ (19)

以上为导向滤波的实现,快速导向滤波器对其进行了优化,将引导图像和输入图像进行下采样计算线性系数$ {a}_{k} $$ {b}_{k} $,然后对$ {a}_{k} $$ {b}_{k} $进行上采样并恢复原始尺寸,该方式在保证精度的前提下,减少了时间复杂度,缩短了运算量。

经过快速导向滤波处理的图像被去除了纹理和噪声的干扰,因此算法的纹理免疫性得到提高。之后通过Canny算子对经过滤波处理的图像进行边缘检测和移除图像中的边缘,以减小干扰[20]。最后,对处理后的图像进行交叉差分,以凸显块效应,交叉差分具体介绍如第2.2节所示。

2.2 差分滤波器的选择

对图像进行差分可以在一定程度上减少图像内容的干扰,使结果更加准确。通过文献[21]可知,选择合适的差分方式更能够使结果事半功倍。对于差分方式的选择依据如下所示:设$ I $是大小为$ M\times N $的输入图像,$ I\left(x, y\right) $是像素点$ \left(x, y\right) $的强度值,并且其取值范围为$ 0\le x\le M-1 $$ 0\le y\le N-1 $

文献[22]通过计算图像梯度大小的绝对值来检测块效应,使用的水平方向和垂直方向的差分滤波器定义分别如式(20)和式(21)所示:

$ {I}^{'}\left(x, y\right)=\left|I\left(x, y\right)-I\left(x-1, y\right)\right| $ (20)
$ {I}^{'}\left(x, y\right)=\left|I\left(x, y\right)-I\left(x, y-1\right)\right| $ (21)

上述一阶差分对网格弱水平边缘的刻画能力尚有不足,为了进一步改善性能,文献[23]定义了二阶差分滤波器的水平和垂直方向分别如式(22)和式(23)所示:

$ {I}^{'}\left(x, y\right)=\left|2I\left(x, y\right)-I\left(x+1, y\right)-I\left(x-1, y\right)\right| $ (22)
$ {I}^{'}\left(x, y\right)=\left|2I\left(x, y\right)-I\left(x, y+1\right)-I\left(x, y-1\right)\right| $ (23)

一阶差分滤波器和二阶差分滤波器的效果如图 4所示,其结果受到图像中边缘和纹理的影响较大。

Download:
图 4 QF=50的JPEG图像 Fig. 4 JPEG images with QF = 50

为了减少这些干扰,本文引用文献[24]中提出的交叉差分滤波器,其表达式如式(24)所示:

$ \begin{aligned} {I}^{'}\left(x, y\right)=&\left|I\left(x, y\right)+I\left(x+1, y+1\right)-\right.\\ &\left.I\left(x+1, y\right)-I\left(x, y+1\right)\right| \end{aligned} $ (24)

图 5所示,由于网格提取方法具有局限性,压缩质量越高,JPEG网格越不明显,网格检测难度越高。

Download:
图 5 不同质量因子下的交叉差分图像对比 Fig. 5 Comparison of crossover images at different quality factors

通过以上步骤,首先得到纹理噪声和边缘移除的图像,之后对其进行交叉差分以凸显块效应,得到差分图像$ {I}^{'}\left(x, y\right) $。对差分图像的极值区间间隔直方图进行估计,并结合似然估计和光谱分析,求出降尺度因子的估计值。直方图的计算和降尺度因子的估计步骤如下:

1)计算差分图像$ {I}^{'}\left(x, y\right) $的极值直方图。在不失一般性的情况下,本文以$ {I}_{x}^{'}\left(x, y\right) $来表示x方向的差分,其极值点如式(25)所示:

$ \left\{\left(x, y\right)\left|\left|{I}_{x}^{'}\left(x, y\right)\right| > \left|{I}_{x}^{'}\left(x+\varepsilon , y\right)\right|, \left.\varepsilon \ge 1\right\}\right.\right. $ (25)

之后,计算极值点的相邻区间直方图$ {N}_{f}\left(i\right), i\in \mathbb{N} $

2)估计峰值周期。峰值的周期性间隔T为移位的块效应网格的周期即$ 8\lambda $,故重采样因子的估计为:

$ \widehat{\lambda }=\frac{T}{8} $

由于相邻极值之间的间隔必须为整数,因此仍然采用文献[14]中的方式,将光谱法和最大似然估计相结合来估计降尺度因子的最终值。

3 实验结果与分析

为定量评估算法性能,本文从Dresden图像数据库[25]中获取200张未经压缩的图像,并使用最近邻核函数,将每张图像下采样2倍[26-27],以避免相机内部可能产生的CFA插值的干扰。验证本文方法的检测性能,首先用给定的质量因子{50,55,…,90}对选取出的未压缩图像进行压缩,之后从图像中截取128×128的中心区域,再用给定的降尺度因子$ \left\{\frac{4}{8}\right., \frac{4.5}{8}, \frac{5}{8}, \frac{5.5}{8}, \frac{6}{8}, $ $ \frac{6.5}{8}, \left.\frac{7}{8}, \frac{7.5}{8}\right\} $进行下采样操作,生成待测图像进行算法评估。为了更清晰地呈现算法的性能,本文采用文献[28]的算法评价标准即绝对误差(Mean Absolute Error,MAE)进行评估。

图 6展示了在不同插值核下,针对不同质量因子的JPEG图像进行降尺度因子估计的绝对误差。由图 6可知,文献[13]的光谱分析法对于篡改图像降尺度因子的检测准确性更低,原因是下采样光谱峰较为微弱难以被提取,且JPEG压缩导致的峰值会产生干扰。文献[14]算法的性能随着压缩质量因子的提升而下降,这是因为当质量因子较大时,JPEG压缩产生的块效应网格更微弱,容易受到图像纹理和边缘产生的伪周期的干扰。对此,本文算法采用快速导向滤波去除了图像纹理和噪声的干扰,并引入交叉差分凸显了块效应,使极值区间间隔直方图的提取准确率更高。通过实验结果的对比分析,验证了本文算法能有效减轻图像纹理对重采样估计的影响,具有较强的纹理免疫能力。

Download:
图 6 不同质量因子下针对3种插值核函数的降尺度因子估计性能 Fig. 6 Downscaling factor estimation performance for three kinds of interpolation kernel functions under different quality factors

为更直观地展示算法性能,对比了在3种不同插值核函数下压缩质量因子不同的JPEG图像检测性能,结果如表 1~表 3所示,表中加粗数字表示该组数据最小检测误差。

下载CSV 表 1 bicubic插值核函数下不同压缩质量因子的JPEG图像检测性能 Table 1 JPEG image detection performance with different compression quality factors under bicubic interpolation kernel function
下载CSV 表 2 bilinear插值核函数下不同压缩质量因子的JPEG图像检测性能 Table 2 JPEG image detection performance with different compression quality factors under bilinear interpolation kernel function
下载CSV 表 3 lanczos2插值核函数下不同压缩质量因子的JPEG图像检测性能 Table 3 JPEG image detection performance with different compression quality factors under lanczos2 interpolation kernel function

通过对表 1~表 3进行分析可知:

1)对于不同压缩质量因子下的JPEG图像,以不同的插值核进行下采样操作,文献[13]基于光谱分析法的检测误差均比较大。主要原因为下采样操作在频谱图上引起的峰值较微弱,且JPEG压缩会在频域内产生额外的干扰峰值(JPEG压缩峰和由于离散傅里叶变换的对称性导致的峰值)。而光谱分析法依赖于重采样峰的提取,因此更容易受降尺度因子的影响

2)当重采样因子为$ \left\{\frac{4}{8}\right., \frac{4.5}{8}, \left.\frac{5}{8}, \frac{5.5}{8}\right\} $时,文献[14]的算法和本文算法的检测精度均比较高,但对于重采样因子为$ \left\{\frac{6}{8}\right., \frac{6.5}{8}, \left.\frac{7}{8}, \frac{7.5}{8}\right\} $的检测准确率,本文算法具有更好的性能。分析其原因主要是:此区间内的重采样因子在JPEG图像的空间域引起的移位块效应周期更接近8,因此极值区间间隔直方图的提取更容易受到图像纹理噪声和边缘的干扰。本文使用快速导向滤波去除了图像的纹理和噪声,对图像纹理干扰具有更好的免疫性。此外,利用Canny算子对处理后的图像进行边缘检测与去除,削弱了边缘造成的伪周期的影响,提高了检测结果的准确性。

3)文献[14]的检测结果随着压缩质量因子的上升而下降,这是因为质量因子越高,JPEG压缩越不明显,块效应更加微弱,直方图的检测更加困难。同时,图像纹理的分布属性具有重复性和规律性,即局部统计特征呈现周期性变化,该变化会干扰直方图的提取,影响其统计特性的捕捉,进而干扰结果的准确性。本文算法利用快速导向滤波削弱图像纹理,增加了模型的纹理免疫性。另外,对经过快速导向滤波处理后的图像使用交叉差分滤波处理,能够凸显块效应,提高算法的检测性能。该算法针对JPEG压缩的图像具有更好的鲁棒性,估计结果的准确率更高。

4 结束语

针对直方图的提取容易受到图像纹理噪声、边缘等影响的问题,本文提出一种用于JPEG预压缩图像降尺度因子估计的纹理免疫块效应分析算法。利用快速导向滤波器对图像进行预处理,去除图像纹理和噪声的影响,并使用Canny算子对处理后的图像进行边缘检测与去除,减少图像边缘导致的伪周期干扰,从而更精确地提取直方图。此外,针对块效应强度随压缩质量因子的提高而减弱的问题,本文引入交叉差分凸显块效应网格,以增加算法的鲁棒性。下一步将研究JPEG图像旋转角度、复合重采样(如旋转后缩放、缩放后旋转)等对提取直方图的影响,以更准确地判断图像的真实性。

参考文献
[1]
MAHDIAN B, SAIC S. Blind authentication using periodic properties of interpolation[J]. IEEE Transactions on Information Forensics and Security, 2008, 3(3): 529-538. DOI:10.1109/TIFS.2004.924603
[2]
周治平, 胡成燕, 黄浩. 基于色彩一致性的图像模糊篡改检测[J]. 计算机工程, 2016, 42(1): 237-242.
ZHOU Z P, HU C Y, HUANG H. Image blur forgery detection based on color consistency[J]. Computer Engineering, 2016, 42(1): 237-242. (in Chinese)
[3]
KIM D, AHN W, LEE H K. End-to-end anti-forensics network of single and double JPEG detection[J]. IEEE Access, 2021, 9: 13390-13402. DOI:10.1109/ACCESS.2021.3051678
[4]
BIRAJDAR G K, MANKAR V H. Blind method for rescaling detection and rescale factor estimation in digital images using periodic properties of interpolation[J]. AEU-International Journal of Electronics and Communications, 2014, 68(7): 644-652.
[5]
赵洁, 郭继昌. 基于JPEG系数变化率的图像复制粘贴篡改检测[J]. 浙江大学学报(工学版), 2015, 49(10): 1893-1901, 1998.
ZHAO J, GUO J C. Image copy-paste forgery detection based on JPEG coefficients change rate[J]. Journal of Zhejiang University (Engineering Science), 2015, 49(10): 1893-1901, 1998. (in Chinese)
[6]
LUO S J, LIU J R, XU W B, et al. Upscaling factor estimation on pre-JPEG compressed images based on difference histogram of spectral peaks[J]. Signal Processing: Image Communication, 2021, 94: 116223. DOI:10.1016/j.image.2021.116223
[7]
郑二功, 平西建. 针对一类JPEG图像伪造的被动盲取证[J]. 电子与信息学报, 2010, 32(2): 394-399.
ZHENG E G, PING X J. Passive-blind forensics for a class of JPEG image forgery[J]. Journal of Electronics & Information Technology, 2010, 32(2): 394-399. (in Chinese)
[8]
ZHANG Q, LU W, HUANG T, et al. On the robustness of JPEG post-compression to resampling factor estimation[J]. Signal Processing, 2020, 168: 107371. DOI:10.1016/j.sigpro.2019.107371
[9]
YAO H, MAO F Y, QIN C, et al. Dual-JPEG-image reversible data hiding[J]. Information Sciences, 2021, 563: 130-149. DOI:10.1016/j.ins.2021.02.015
[10]
KIRCHNER M, GLOE T. On resampling detection in re-compressed images[C]//Proceedings of IEEE International Workshop on Information Forensics and Security. Washington D.C., USA: IEEE Press, 2009: 21-25.
[11]
BIANCHI T, PIVA A. Reverse engineering of double JPEG compression in the presence of image resizing[C]//Proceedings of IEEE International Workshop on Information Forensics and Security. Washington D.C., USA: IEEE Press, 2012: 127-132.
[12]
GALLAGHER A C. Detection of linear and cubic interpolation in JPEG compressed images[C]//Proceedings of the 2nd Canadian Conference on Computer and Robot Vision. Washington D.C., USA: IEEE Press, 2005: 65-72.
[13]
VAZQUEZ-PADÍN D, MOSQUERA C, PÉREZ-GONZÁLEZ F. Two-dimensional statistical test for the presence of almost cyclostationarity on images[C]//Proceedings of IEEE International Conference on Image Processing. Washington D.C., USA: IEEE Press, 2010: 1745-1748.
[14]
LIU X J, LU W, ZHANG Q, et al. Downscaling factor estimation on pre-JPEG compressed images[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2020, 30(3): 618-631. DOI:10.1109/TCSVT.2019.2893353
[15]
刘丽, 匡纲要. 图像纹理特征提取方法综述[J]. 中国图象图形学报, 2009, 14(4): 622-635.
LIU L, KUANG G Y. Overview of image textural feature extraction methods[J]. Journal of Image and Graphics, 2009, 14(4): 622-635. (in Chinese)
[16]
CHEN C L, NI J Q, SHEN Z Y, et al. Blind forensics of successive geometric transformations in digital images using spectral method: theory and applications[J]. IEEE Transactions on Image Processing, 2017, 26(6): 2811-2824. DOI:10.1109/TIP.2017.2682963
[17]
KAO Y T, LIN H J, WANG C W, et al. Effective detection for linear up-sampling by a factor of fraction[J]. IEEE Transactions on Image Processing, 2012, 21(8): 3443-3453. DOI:10.1109/TIP.2012.2191562
[18]
CHEN Z P, ZHAO Y, NI R R. Detection of operation chain: JPEG-resampling-JPEG[J]. Signal Processing: Image Communication, 2017, 57: 8-20. DOI:10.1016/j.image.2017.04.008
[19]
HE K M, SUN J, TANG X O. Guided image filtering[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013, 35(6): 1397-1409. DOI:10.1109/TPAMI.2012.213
[20]
KUMAR A, RAHEJA S. Edge detection using guided image filtering and enhanced ant colony optimization[J]. Procedia Computer Science, 2020, 173: 8-17. DOI:10.1016/j.procs.2020.06.003
[21]
NIKOUKHAH T, GROMPONE VON GIOI R, COLOM M, et al. Automatic JPEG grid detection with controlled false alarms, and its image forensic applications[C]//Proceedings of IEEE Conference on Multimedia Information Processing and Retrieval. Washington D.C., USA: IEEE Press, 2018: 378-383.
[22]
LIN W S, TJOA S K, ZHAO H V, et al. Digital image source coder forensics via intrinsic fingerprints[J]. IEEE Transactions on Information Forensics and Security, 2009, 4(3): 460-475. DOI:10.1109/TIFS.2009.2024715
[23]
LI W H, YUAN Y, YU N H. Passive detection of doctored JPEG image via block artifact grid extraction[J]. Signal Processing, 2009, 89(9): 1821-1829. DOI:10.1016/j.sigpro.2009.03.025
[24]
CHEN Y L, HSU C T. Image tampering detection by blocking periodicity analysis in JPEG compressed images[C]//Proceedings of the 10th Workshop on Multimedia Signal Processing. Washington D.C., USA: IEEE Press, 2008: 803-808.
[25]
LI J W, YANG F, LU W, et al. Keypoint-based copy-move detection scheme by adopting MSCRs and improved feature matching[J]. Multimedia Tools and Applications, 2017, 76(20): 20483-20497. DOI:10.1007/s11042-016-3967-0
[26]
CHEN L K, LU W, NI J Q, et al. Region duplication detection based on Harris corner points and step sector statistics[J]. Journal of Visual Communication and Image Representation, 2013, 24(3): 244-254. DOI:10.1016/j.jvcir.2013.01.008
[27]
ZHANG Q B, LU W, WENG J. Joint image splicing detection in DCT and Contourlet transform domain[J]. Journal of Visual Communication and Image Representation, 2016, 40: 449-458. DOI:10.1016/j.jvcir.2016.07.013
[28]
XUE F, YE Z Y, LU W, et al. MSE period based estimation of first quantization step in double compressed JPEG images[J]. Signal Processing: Image Communication, 2017, 57: 76-83. DOI:10.1016/j.image.2017.05.008