近日,由菠菜老平台集合网硕士研究生蔡鹏(导师:贾迪)完成的1篇高水平研究论文“A Pure Transformer Architecture for High-Resolution Stereo Matching”,被计算成像领域权威期刊IEEE Transactions on Computational Imaging录用。该期刊是专注于计算摄影成像的权威SCI学术期刊,JCR分区Q1,中科院二区,2022年影响因子为5.4。
在该文中,作者提出了一个纯粹的Transformer架构立体匹配模型,该模型对不同分辨率的输入影像能维持线性复杂度的注意力计算。在Scene Flow数据集上达到了SOTA,所设计的网络获得了 0.33 的绝对像素距离,0.92%的异常像素占比和 98%的遮掩预测交并比,在 KITTI-2015 数据集上获得了 1.78 的平均异常值百分比。与现有方法相比,该方法在细粒度匹配、弱纹理区域视差上可以获得更为准确的估计值,具有较强的泛化性。