轉自:https://scs.bupt.edu.cn/info/1049/2913.htm
近日,人工智能領域國際頂級會議AAAI-2022(CCF-A)傳來喜訊,北京郵電大學計算機學院碩士研究生唐宇翔同學以第一作者投稿一篇“通過統計視角的遷移學習顏色恒常性”(Transfer Learning for Color Constancy via Statistic Perspective)的論文被錄用,論文指導老師為計算機學院視覺機器人與智能技術實驗室的明安龍、康學凈。據官方公布,AAAI-2022共收到9022篇投稿,其中接受1349篇,錄取率僅為15%,錄取難度史上最高。
該論文研究計算攝影技術中顏色恒常性問題,目標在于校正由場景照明引起的圖像色偏,使計算機具備人類視覺系統感知顏色恒常的能力。自上世紀相機誕生以來,如何讓攝像頭準確記錄真實世界的顏色一直是計算攝影領域的關鍵痛點。隨著智能手機的快速發展,人們對拍攝的高標準以及對機身厚度的限制,使得顏色恒常性成為了智能手機圖像信號處理(ISP)模塊的關鍵技術。
顏色恒常性示意圖(左:拍攝時由光照導致的色偏圖像,右:顏色恒常性校正后圖像)
近年來,深度學習方法在單相機RAW數據上盡管有了顯著的改進,但這些模型仍然存在數據嚴重不足的問題,導致型容量較淺,在多相機設置下模型退化。針對上述問題,論文“通過統計視角的遷移學習顏色恒常性”(Transfer Learning for Color Constancy via Statistic Perspective),提出了一種將傳統統計方法和卷積網絡結合的遷移學習顏色恒常性方法(TLCC),其中統計估計方案(SE-Scheme)首創了從統計角度進行顏色恒常性任務的回歸,將與相機相關的光照標簽映射到與相機無關的形式,并為sRGB數據生成偽標簽,極大地擴展了訓練的數據。顏色引導適應分支(CGA-Branch)通過提取顏色信息以自適應地規范主干的特征,進一步促進了從sRGB到RAW數據的高效遷移學習。實驗結果表明TLCC克服了數據限制和模型退化,在流行的基準測試中表現出最先進的性能。此外,實驗還證明TLCC能夠從sRGB數據中學習新的場景信息,以提高具有相似場景的RAW圖像的準確性。
TLCC模型的架構圖
本論文成果可應用于移動終端圖像信號處理(ISP)模塊,并計劃列入已立項的計算攝影技術相關國際標準。