【VLA-3D数据集:一个为视觉语言导航任务设计的3D对象参照数据集,包含超过9百万条为7635个3D场景合成生成的语言描述,适用于视觉语言定位和导航任务】'VLA-3D Dataset - A 3D object referential dataset designed for vision-language grounding tasks such as vision-language navigation (VLN)' GitHub: github.com/HaochenZ11/VLA-3D
VLA-3D数据集 视觉语言导航 3D场景 数据集