數(shù)字圖像采集的發(fā)展得益于技術的發(fā)展,以及越來越廣闊的數(shù)字圖像市場的價格優(yōu)勢。然而,隨著網(wǎng)絡交互時代的到來,標準文件格式和元數(shù)據(jù)在可變性和兼容性方面做出了大量與技術相關的選擇和考慮。對于大多數(shù)圖像采集方案而言,為增加數(shù)字圖像內容的效用、減少可變性,我們提出了十個基本原則。
在圖像轉換方案中,以下的建議旨在為確定和維持成像性能提供指導。專門從事成像的技術人員能夠很好地理解每一個建議的秘訣(有時也會進行討論),但對于像在博物館、圖書館和其他類似機構工作的更廣泛的客戶來說,這些秘訣并不總是很清楚。項目經(jīng)理有時會詢問技術部員工和影像服務提供商一些問題,這些小建議可以作為解答這類問題的基礎。
1.掃描圖像時要核實其成像性能
在數(shù)字化工作流程中,或許最重要的功能是提供一種核實交付圖像成像性能的方法。不管是比較不同的掃描儀還是選擇服務供應商,這都是適用的。要求的采樣率(即每英寸的像素數(shù))實際達到了嗎?光學分辨率和采樣率一致嗎?色彩編碼在什么程度上和期望的要求不同?這些問題需要確定成像單元的可測量目標——不管是以內部還是外包的形式。更重要的是,它們是實時生產(chǎn)控制和接受審計,即良好的質量控制的基礎。請記住,正因為其內容以數(shù)字形式存在,所以不允許有錯誤產(chǎn)生。
成像性能測量系統(tǒng)也可以用來實施成像改善計劃。然而,一旦開始實施此系統(tǒng),就會在結果解釋及糾正等方面出現(xiàn)問題。下面的建議和意見旨在在這一領域為大家提供幫助。
2.成像性能和圖像質量不同
在文化遺產(chǎn)項目中,圖像采集的共同目標是得到高質量的圖像。作為一個目標,有這項聲明可能就足夠了,但在評價一個已經(jīng)完成的成像性能以及改善成像性能的測量系統(tǒng)時,這項聲明一般是不會有幫助的。此外,整體的圖像質量一般理解為視覺印象,它由清晰度、飽和度和個人喜好等組成。在本報告中,我們提到了用物理成像參數(shù)描述成像性能。雖然它的特別接受性水平通常由系統(tǒng)的圖像質量要求決定,但物理成像參數(shù)把技術選擇和結果解釋聯(lián)系到一起。比如,圖像清晰度是一種視覺印象;鏡頭MTF是和圖像清晰度、光學設計、調整相關的物理成像參數(shù)。
3.圖像采樣和圖像分辨率不同
圖像采樣表示數(shù)碼相機或掃描儀在一個特定水平的像素之間的采樣間隔。通常用像素/毫米或像素/英寸來表示。分辨率意味著成像部件或系統(tǒng)精確區(qū)分空間細節(jié)的能力。對于(采樣的)數(shù)字圖像來說,采樣率(或者一部數(shù)碼相機的百萬像素分辨率)為捕捉圖像細節(jié)設置了分辨率的上限。圖像傳感器的尺寸和構造通常決定圖像采樣,其他部分也會影響交互圖像的清晰度和分辨率。
為理解這一點,考慮一下對焦良好的帶鏡頭的數(shù)碼相機。取景后,若鏡頭的焦點位置發(fā)生變化,那么就不能很好地對焦。如果我們比較這兩種圖像文件,它們會有相同的圖像采集情況(和像素數(shù)),但在電腦顯示器或印刷品上觀察時,第二幅數(shù)字圖像會顯得不夠清晰,分辨率比較低。
評價數(shù)碼相機或掃描儀分辨率的一個完善的方法是由ISO12233標準制定的。最初制定這個評價方法是針對數(shù)碼相機的,現(xiàn)在它也應用于膠片、掃描儀和CRT顯示器等。圖1顯示了上述方法應用在數(shù)碼相機對焦實驗的結果。由此產(chǎn)生的空間頻率響應(SFR)是空間頻率的函數(shù)。較低的虛線表示圖像細節(jié)信息(如由于光學對焦不準產(chǎn)生的有限分辨率)的有效損失。
4.色彩和階調的單刺激視覺估計是不可靠的
在成像領域工作一段時間后,人們必定會發(fā)現(xiàn)這方面的例子:在具有相同物理刺激的自然取景條件下,我們在感知顯著的色彩和明度差異時很容易受騙。大多數(shù)這樣的錯覺都是由視覺系統(tǒng)復雜的時空適應性響應引起的。圖2顯示了一個采集樣品的實例。
盡管就感知的明度而言,這些影響是真實的。但當解釋為輻射差異時,它們很容易被誤解。觀察環(huán)境、觀察者的變化和個人喜好都是主要的影響因素。至于系統(tǒng)評價,我們建議在同樣的觀察條件下使用雙重刺激視覺評價。
我們也應謹慎評價圖像的微觀結構。比如,可用特征對比來評價視覺分辨率:對比度越高,分辨率越高。另一個在傳統(tǒng)攝影中眾所周知的問題是尺寸、形狀和目標特征可以評價圖像分辨率產(chǎn)生偏差的程度。當經(jīng)典的條形色靶評價極限分辨率時,觀察者對于要檢測的線條數(shù)量會有基本的了解。這會使評價產(chǎn)生偏差,線條的長度不同,結果也會改變。較長的線條會使估計的分辨率較高。
盡管此處談論的是極限分辨率,但我們也要考慮整體圖像的清晰度。圖3給出了火車站的兩幅圖片。左圖用數(shù)字銳化過濾器處理,右圖用未經(jīng)銳化的對焦很好的數(shù)碼相機拍攝。根據(jù)擴大的鐘面,我們可知右圖的極限分辨率較高,這和我們期望的一致。然而,左圖給人的印象卻更為清晰。
通過SFR繪圖、用每幅數(shù)字圖像中的邊緣特征進行計算可以很容易地理解這些。有人提議,將SFR值減少到10%作為極限分辨率的測量方法。箭頭表示和相應的鐘面一致的相關值。然而,另一個測量手段——銳度,也用來預測圖像的清晰度。這個整合的頻率加權測試方法是視覺距離的函數(shù)。但當觀察這兩幅圖像時,較低頻率處的較高響應表明,左圖具有較高的清晰度。
5.空間圖像的視覺評價是可靠的
檢測掃描圖像不良性能的一個很好的方法是視覺認識能力。它是由Brill,Kim和Branch提出的,用于評價數(shù)字圖像性能。
視覺認識能力:用于解釋和構成視覺信息的后天形成的能力。視覺上有認識能力的人能夠解釋看到的物體,從而檢測非自然或不期望得到的效果,并找出導致性能變化的潛在根源。
正如在上一節(jié)中說明的,用單刺激視覺評價解釋色彩和階調是不可靠的。然而,對帶有信號和噪聲的空間圖像這么做是可靠的、有價值的。這是因為,和數(shù)字成像聯(lián)系在一起的空間和噪聲圖像通常發(fā)生在局部的區(qū)域。顯示時,很多嫌疑區(qū)域在同一個視覺區(qū)域之內,很多變量(如方向性差異)可以很容易地被檢測出來。實際上,我們可以迅速評價出現(xiàn)在眼前的很多刺激,同時觀察提高了檢測空間可變性的機會。但僅此一點可能還不夠,正如定義所闡釋的,某些圖像等級鑒別和預期效果方面的知識是必須的。
JPEG方塊效應是這方面的一個經(jīng)典例子。一個比較好的初始化取景器可以檢測這樣的方塊效應。此處最重要的觀察是:圖像中不會自動產(chǎn)生8像素×8像素的方塊。對最近的JPEG2000方法的改進是,用更多看起來自然的紋理代替固定的8像素×8像素或16像素×16像素的方塊。
視覺檢測的另一個例子是,數(shù)碼相機采用一個彩色濾波陣列(CFA),檢測色彩重構錯誤產(chǎn)生的令人討厭的方塊效應。圖4舉的例子是這些重構錯誤導致出現(xiàn)了一個不期望的彩色棋盤狀圖案。數(shù)字圖像通過在傳感器上對連續(xù)的光學圖像進行采樣、在顯示器或打印機上進行重構(重構只是其中的一種方式)傳遞圖像信息。左邊的圖像是鏡頭的光學質量和傳感器的抽樣相匹配的結果。右邊的圖像表明重構不理想(包括色彩差值在內),這是對光學圖像抽樣不足(即分辨率低),即走樣導致的。
大塊的均勻區(qū)適合協(xié)助人眼檢測可疑的成像行為。在均勻區(qū),我們期望噪聲和紋理是均勻分布的。圖5展示的例子是噪聲紋理以一種周期性的、可預測的方式變化。人們應該能夠看到由其他均勻區(qū)域的高低噪聲紋理定義的網(wǎng)格狀圖案。除常規(guī)工具之外,完成這些特性的自動檢測還需要分析軟件工具。
6.源文件,注意你需要什么
近來,人們很關注將獲得的數(shù)字圖像保存為源文件。專業(yè)攝影師可以使用源文件避免相機制造商在相機內部所做的圖像處理,比如說信號量化等。其他人使用源文件是為了得到一個開放的源圖像文件格式,可以延長存檔的數(shù)字內容的使用期限。然而,在接受這種數(shù)據(jù)采集方法之前,我們應該考慮包含在這種文件中的數(shù)據(jù)的意義。通過追蹤彩色圖像數(shù)據(jù)從物體到數(shù)字圖像文件的情況,即圖6的輪廓,我們能夠做到這些。
第一步是用光學器件采集物體反射或透射的光,并用傳感器檢測。針對傳感器自身的缺陷和曝光不一致的現(xiàn)象,我們需要對測得的數(shù)據(jù)進行處理。如果成像器件使用一個彩色濾波陣列,結果就是產(chǎn)生一個對應于重復的空間模式(如R、G、B信號)的單值矩陣。這些元數(shù)據(jù)形成了“原始的”記錄圖像的第一種形式:校正后的原始CFA數(shù)據(jù)。
傳統(tǒng)處理路徑的下一步是產(chǎn)生一個完全填充的三色圖像陣列,此處就可以應用旨在減少方塊效應的算法了。去馬賽克操作是單記錄陣列向“原始的”經(jīng)過插值的R、G、B數(shù)據(jù)設置的一種插值操作。
再下一步通常是白平衡和矩陣的色彩校正操作,其結果是和色彩編碼有關的圖像數(shù)據(jù)集。這種源圖像數(shù)據(jù)用于存檔是最有用的。但是請注意,這還不是目前大多數(shù)圖像交付的形式。
圖像處理鏈條中的最后一步通常是用于顯示的渲染操作。其結果是涉及色彩編碼輸出的最終圖像數(shù)據(jù)陣列。這一步是一個簡單的色彩空間轉換,但它同樣可以包含色域映射和顏色偏好的選擇。
雖然上述步驟在彩色圖像采集系統(tǒng)中很常見,但具體的實施細節(jié)會有所不同。理解源圖像的信號(色彩)編碼和就某一個特定的文件格式達成一致是同樣重要的。
7.保持中性灰平衡
很多關于成像性能、彩色圖像質量和圖像處理的技術出版物都提到了硬件和軟件元素的設計,而沒有注意系統(tǒng)控制和維護。因為此處重點推薦的是評價和維護成像性能的方法,所以我們建議使用一個簡單的測試方法來檢測成像性能發(fā)生變化的原因。
一旦安裝好圖像采集系統(tǒng)并確定了其目標或可接受性能,那么對中性階調響應曲線,即光電轉換函數(shù)(OECF)的常規(guī)測量便可以用來評價其性能偏差。它是通過在測試目標中放置一系列灰梯尺來完成的,如圖7所示。
圖8顯示了對數(shù)碼相機的測量結果。其目標響應結果是,等量的R、G、B分量產(chǎn)生不同的中性灰。請注意,獲得的圖像文件中有一個R分量,中間階調較高的R色信號水平就表明了這一點。雖然這一實驗不能區(qū)分影響階調和顏色復制的所有因素,但它的確為成像性能檢測提供了一個簡單的指示器。
8.數(shù)碼相機不能制造顏色
對于數(shù)字圖像轉換方案來說,要求有一種方法來測量色彩或顏色復制的精確性。這看起來比較簡單——我們都知道用CIE ΔEab值衡量色差。然而,數(shù)字圖像及其像素值不是物理度量單位,也不是顏色三刺激值。就取景或圖像輸入的物理特性而言,只有在解釋這些值及其可變性時,我們才可以把顏色的精確性測量歸因于圖像采集過程。
若在顯示器上顯示一幅圖像,或評價圖像采集系統(tǒng)的精確性,那么第一步是解讀數(shù)字信號編碼。目前在色彩管理系統(tǒng)中,它可以使用ICC色彩特性文件(規(guī)定了數(shù)字圖像的意圖編碼)來完成。開放和封閉的色彩成像系統(tǒng)為色彩交流提供了有利條件。然而,目前那些放在網(wǎng)站上參與交流的數(shù)字圖像,大多數(shù)都沒有經(jīng)過色彩管理。用戶軟件認為顏色編碼是圖像顯示的一部分,因此sRGB可能是傳遞的圖像內容中最常見的解釋。
如果解讀顏色編碼是確定圖像采集的精確性的第一步,那么如何測量成像性能呢?取景過程中有的參考物體非常有用,不管它們屬于圖像層次還是設備層次。圖7是一幅帶有圖像層次測試目標的實例圖像,其中包含評價成像性能的若干要素。
測試目標的要素可用來評價成像性能變量。其中,彩色圖像捕捉是以圖9所示的色度解釋為基礎的。第一步是確定數(shù)字圖像的感興趣區(qū)域(ROIs),它對應具體的目標要素。第二步,根據(jù)這些區(qū)域的像素值可估計對應的統(tǒng)計數(shù)據(jù)。這樣就能計算出每個色塊的R、G、B平均值。然后,用指定或假設的圖像顏色編碼將這些數(shù)據(jù)轉換成第三步CIELAB坐標的等價值。
之后,測試值可以和下一步中的CIELAB目標坐標值進行比較。常用的色差公式有ΔEab或ΔE00(即CIE ΔE2000)等。
9.同時考慮圖像的內部和外部變化
考察成像性能隨時間變化而變化的情況,以及連續(xù)圖像文件之間的成像性能是很必要的。這不僅與日常的生產(chǎn)質量管理實踐一致,而且在通過采集到的信號繪制圖片時,這些區(qū)別很明顯。根據(jù)定期的圖像評價得到的結果,可以作為重要測量方法的控制圖。
此外,我們經(jīng)常透過數(shù)字圖像觀察不可忽視的圖像變量。可以翻拍的相機通常會出現(xiàn)變量,從圖像中央到邊緣的信號均勻度、清晰度和空間(桶形或針墊)失真。使用數(shù)碼相機時可以通過圖像處理補償光學失真。但這種校正會使得數(shù)字圖像校正方案取景的(重新)采樣不均勻?;蛘?,我們可以把相機鏡頭想像成傳感器上有一個可變光學放大器件(從物體到圖像)。其解決方案是,以一種補償不均勻的采樣方式來重新采集圖像陣列。但重新采樣需要插值計算,因此會造成部分空間圖像細節(jié)的損失。
為模擬這一效果,將掃描過的圖像邊緣放在位于圖像中央和角落的較大的數(shù)字圖像陣列中,如圖10所示。軟件中引入了桶形失真,其中在角落處有5%的有效光學失真。然后,使用同一軟件校正失真圖像,將第一次操作反轉。因為原始邊緣和校正邊緣都是連續(xù)的,所以二者最根本的不同是由雙線性插值的圖像重新采樣引起的。圖像細節(jié)的損失在圖像角落處較大,如圖11的一個較低的SFR值所示。因此,SFR結果預測,校正后的圖像在角落處比中央處的清晰度低。
因為相機的硬件組成會引起變化,所以評價整個圖像的成像性能是很重要的。圖像處理可以解決一些問題,但要留意如模糊、圖像噪聲或外形修整等連鎖效應。
10.標準是評價成像性能要依靠的資本
直到1995年前后,在音像行業(yè)約定俗成的標準中,成像標準在很大程度上取決于少數(shù)控制圖像捕捉和印刷的公司。不同制造商的影片都有互通性,成像過程、印刷過程、成像性能一般比較穩(wěn)定,并且容易理解。各方的成像和交流語言是一致的。通過應用這些標準,人們可以保持物體和圖像之間的聯(lián)系。例如,基于為捕捉圖像而采用的曝光、分辨率和影片處理的標準性能方法,人們可以放心評價文件的光學起源。這個標準和可行的技術數(shù)據(jù)為維持圖像的成像性能提供了一個共同語言。
20世紀90年代中期,隨著數(shù)字成像技術的發(fā)展和完善,出現(xiàn)了一些針對圖像性能的數(shù)字成像標準。這使得人們開始用各種各樣的標準評價成像分辨率、顏色和圖像噪聲,而不是根據(jù)已經(jīng)核實的標準。例如,按照每英寸的像素數(shù)進行采樣并不能區(qū)分真正的光學分辨率。階調和顏色復制方法完全基于編碼值,而不是這些值和源文件本身的物理特性的關系。實際上,若伽瑪值用于此目的,那么其行為往往不遵循公認的準則。其動態(tài)范圍是典型的按照信號編碼,而不是基于適當?shù)男盘柡驮肼暤亩攘糠ㄟM行定義。
在過去的10年里,專門從事成像的技術人員為電子成像性能和質量開發(fā)了很多國際標準。正如McDowell在他的概述文章里所提到的,在使不同成像團體利益一致的合作協(xié)議的發(fā)展過程中,這些標準更大的優(yōu)勢是作為有價值的資源。這對于文化的傳承尤其重要,沒有一個單獨的機構在促進或號令形成更大的社團方面比其更有影響力了。
這些標準的好處體現(xiàn)在改進過程控制、正確選擇技術和降低成本等方面。常規(guī)性能評價使用國際標準允許的工具,為日常工作流監(jiān)測提供了方法。若需求超過目前制定的標準,那么它們可以作為圖書館和博物館修改方法的起點,如目前的一些其他應用。
如果計算的目的只是作為了解,那么它可為評價數(shù)字成像性能所采用的技術服務。為此,上述建議和意見旨在為那些尋求維持或改進數(shù)字圖像采集的人提供技術指導。