VLA-3D数据集：一个为视觉语言导航任务设计的3D对象参照数据集，包含超过9百万条为7635个3D场景合成生成的语言描述，适用于视觉语言定位和导航任务

爱可可-爱生活
2024-11-16 18:08:48

【VLA-3D数据集：一个为视觉语言导航任务设计的3D对象参照数据集，包含超过9百万条为7635个3D场景合成生成的语言描述，适用于视觉语言定位和导航任务】'VLA-3D Dataset - A 3D object referential dataset designed for vision-language grounding tasks such as vision-language navigation (VLN)' GitHub: github.com/HaochenZ11/VLA-3D VLA-3D数据集视觉语言导航 3D场景数据集