Discover Top Posts Tagged with #dinov2

VGGT: Visual Geometry Grounded Transformer

個人的に3Dビジョンの基盤モデルの動向に注目している。複数枚の画像からシーンの立体構造やカメラ情報を復元する3D Reconstruction(3次元再構成)は、3Dコンピュータービジョンの根幹となる技術。近年はDUSt3Rのようにディープラーニングによる推論で一気に3次元情報を出力するトップダウンアプローチが登場。AIによる3D空間認識が可能になってきている。 https://blog.negativemind.com/2025/06/25/dense-and-unconstrained-stereo-3d-reconstruction/ VGGT (Visual Geometry Grounded Transformer) VGGTは、CVPR 2025で発表された論文VGGT: Visual Geometry Grounded…