Florence-VL: Enhancing Vision-Language Models with Generative Vision Encoder and Depth-Breadth Fusion模型训练大语言模型
2024-12-16浏览详情
VisGraphVar: A Benchmark Generator for Assessing Variability in Graph Analysis Using Large Vision-Language Models大语言
2024-12-08浏览详情
MARVEL-40M+: Multi-Level Visual Elaboration for High-Fidelity Text-to-3D Content Creation预训练语言模型3D大语言模型每日A
2024-12-04浏览详情
JPEG-LM: LLMs as Image Generators with Canonical Codec Representations网页链接 本文提出了一种新的图像生成方法JPEG-LM,该方
2024-08-27浏览详情
A Survey on Benchmarks of Multimodal Large Language Models网页链接 本文对多模态大型语言模型(MLLM)的基准测试进行了全面的回
2024-08-25浏览详情
正在拼命加载中
我是有底线的
没有更多的页面可以加载啦!