這篇論文也是利用深度學習計算兩張圖片之間 homography 矩陣的方法。與前文的方法(Deep Image Homography Estimation、Unsupervised Deep Homography)不同的是輸出層為 perspective field,也就是每一個像素的變換關係。在有了每個像素的變換關係以後,便能使用 DLT 計算 homography 矩陣,並且也會比只用四個點還要 robust。
以下為本文的架構圖:
其中用到的 blocks 都在上圖介紹了。本方法的 loss function 是拿估計的 perspective field 與 ground-truth 的 perspective 做比較:
最後值得一提的是此方法目前為 Paper With Code 中 Homography Estimation on S-COCO [2] 排名最高的方法。參考資料
[1] Rethinking Planar Homography Estimation Using Perspective Fields
沒有留言:
張貼留言