結構相異性 目录 定義 結構相似性[2] 結構相異性(DSSIM)的範圍 參考資料 外部連結 导航菜单改善突出显示跨语言链接
误差理论
luminance對比度平均值標準差共變異數
本條目部分链接不符合格式手冊規範。跨語言链接及章節標題等處的链接可能需要清理。 (2015年12月12日) |
結構相異性(structural dissimilarity),有鑑於最小平方誤差(Mean Square error)和 峰值信噪比(Peak signal-to-noise ratio)無法完全反應人類視覺上所感受的誤差,在 2004 年被提出來的新的誤差測量方法。
目录
1 定義
2 結構相似性[2]
3 結構相異性(DSSIM)的範圍
4 參考資料
5 外部連結
定義
假設有兩個信號x與y,它們的結構相異性[1]為
DSSIM(x,y)=11−SSIM(x,y)displaystyle DSSIM(x,y)=frac 11-SSIM(x,y)
其中SSIM(x,y)displaystyle SSIM(x,y)為x與y的結構相似性
結構相似性[2]
兩者的結構相似性定義為:
SSIM(x,y)=[l(x,y)]α[c(x,y)]β[s(x,y)]γdisplaystyle textSSIM(mathbf x ,mathbf y )=[l(mathbf x ,mathbf y )]^alpha [c(mathbf x ,mathbf y )]^beta [s(mathbf x ,mathbf y )]^gamma ,
l(x,y)=2μxμy+C1μx2+μy2+C1displaystyle l(mathbf x ,mathbf y )=frac 2mu _xmu _y+C_1mu _x^2+mu _y^2+C_1,c(x,y)=2σxσy+C2σx2+σy2+C2displaystyle c(mathbf x ,mathbf y )=frac 2sigma _xsigma _y+C_2sigma _x^2+sigma _y^2+C_2,s(x,y)=σxy+C3σxσy+C3displaystyle s(mathbf x ,mathbf y )=frac sigma _xy+C_3sigma _xsigma _y+C_3。
其中,l(x,y)displaystyle l(mathbf x ,mathbf y )比較xdisplaystyle mathbf x 和ydisplaystyle mathbf y 的亮度(luminance),c(x,y)displaystyle c(mathbf x ,mathbf y )比較xdisplaystyle mathbf x 和ydisplaystyle mathbf y 的對比度,s(x,y)displaystyle s(mathbf x ,mathbf y )比較xdisplaystyle mathbf x 和ydisplaystyle mathbf y 的結構(structure),α>0displaystyle alpha >0,β>0displaystyle beta >0,γ>0displaystyle gamma >0,為調整l(x,y)displaystyle l(mathbf x ,mathbf y )、c(x,y)displaystyle c(mathbf x ,mathbf y )、s(x,y)displaystyle s(mathbf x ,mathbf y )相對重要性的參數,μxdisplaystyle mu _x及μydisplaystyle mu _y、σxdisplaystyle sigma _x及σydisplaystyle sigma _y分別為xdisplaystyle mathbf x 和ydisplaystyle mathbf y 的平均值和標準差,σxydisplaystyle sigma _xy為xdisplaystyle mathbf x 和ydisplaystyle mathbf y 的共變異數,C1displaystyle C_1、C2displaystyle C_2、C3displaystyle C_3皆為常數,用以維持l(x,y)displaystyle l(mathbf x ,mathbf y )、c(x,y)displaystyle c(mathbf x ,mathbf y )、s(x,y)displaystyle s(mathbf x ,mathbf y )的穩定。
結構相似性指標的值越大,代表兩個信號的相似性越高。
若使用相同的兩張圖片去做SSIM運算,也就是說μx=μydisplaystyle mu _x=mu _y且σx=σydisplaystyle sigma _x=sigma _y,可以得到
SSIM(x,x)=2μx2+C1μx2+μx2+C1×2σx2+C2σx2+σx2+C2×σxx+C3σxσx+C3=1displaystyle textSSIM(mathbf x ,mathbf x )=frac 2mu _x^2+C_1mu _x^2+mu _x^2+C_1times frac 2sigma _x^2+C_2sigma _x^2+sigma _x^2+C_2times frac sigma _xx+C_3sigma _xsigma _x+C_3=1
實際使用時,簡化起見,一般會將參數設為α=β=γ=1displaystyle alpha =beta =gamma =1及C3=C2/2displaystyle C_3=C_2/2,得到:
SSIM(x,y)=(2μxμy+C1)(2σxy+C2)(μx2+μy2+C1)(σx2+σy2+C2)displaystyle textSSIM(mathbf x ,mathbf y )=frac (2mu _xmu _y+C_1)(2sigma _xy+C_2)(mu _x^2+mu _y^2+C_1)(sigma _x^2+sigma _y^2+C_2)。
在計算兩張影像的結構相似性指標時,會開一個局部性的視窗,一般為Ndisplaystyle N×Ndisplaystyle N的小區塊,計算出視窗內信號的結構相似性指標,每次以像素為單位移動視窗,直到整張影像每個位置的局部結構相似性指標都計算完畢。將全部的局部結構相似性指標平均起來即為兩張影像的結構相似性指標。
結構相異性(DSSIM)的範圍
當DSSIM越大時,代表兩張圖片越接近,SSIM越接近1,DSSIM的值也越大,當SSIM=1,也就是DSSIM趨近無限時,和原始視訊檔案完全一致,若SSIM>=0.98就是難以與原始視訊檔案分辨區別,而SSIM=0.95的時候大多數人都會對畫面滿意,這個數值可以認為是及格的畫面。SSIM=0.90的時候意味著瑕疵可能要比0.95多一倍,肉眼就會察覺到明顯的畫面劣化,因此低於這個數值時,就可以判定為沒有實際觀賞價值。
參考資料
^ Jian-Jiun Ding, Time frequency analysis and wavelet transform class note,the Department of Electrical Engineering, National Taiwan University (NTU), Taipei, Taiwan, 2007.
^ Zhou Wang, Alan C. Bovik, Hamid R. Sheikh, and Eero P. Simoncelli, "Image quality assessment: from error visibility to structural similairty," IEEE Transactions on Image Processing, vol. 13, no. 4, pp. 600−612, Apr. 2004.
外部連結
- https://cg2010studio.wordpress.com/2013/01/07/%E7%B5%90%E6%A7%8B%E7%9B%B8%E4%BC%BC%E6%80%A7-structural-similarity/