AnyModal：基于PyTorch的灵活多模态语言模型框架。支持轻松集成图像、音频等多种输入模态，提供模块化的架构设计，包含输入处理器、编码器和分词器三大核心组件。框架可扩展性强，便于添加新的输入模

爱可可-爱生活
2024-11-24 20:49:35

【AnyModal：基于PyTorch的灵活多模态语言模型框架。支持轻松集成图像、音频等多种输入模态，提供模块化的架构设计，包含输入处理器、编码器和分词器三大核心组件。框架可扩展性强，便于添加新的输入模态处理器和分词器，并提供了丰富的预训练模型库】
'AnyModal is a Flexible Multimodal Language Model Framework for PyTorch'
GitHub: github.com/ritabratamaiti/AnyModal
深度学习多模态 PyTorch 机器学习框架