VGGT: Visual Geometry Grounded Transformer
個人的に3Dビジョンの基盤モデルの動向に注目している。 複数枚の画像からシーンの立体構造やカメラ情報を復元する3D Reconstruction(3次元再構成)は、3Dコンピュータービジョンの根幹となる技術。 近年はDUSt3Rのようにディープラーニングによる推論で一気に3次元情報を出力するトップダウンアプローチが登場。AIによる3D空間認識が可能になってきている。 https://blog.negativemind.com/2025/06/25/dense-and-unconstrained-stereo-3d-reconstruction/ VGGT (Visual Geometry Grounded Transformer) VGGTは、CVPR 2025で発表された論文VGGT: Visual Geometry Grounded…












