8 块 H200 GPU 卡在同一台 1.5G 内存的大机器上,确实很气势磅礴的感觉 好多 VRAM 和 TensorCore 呀 后面可以多跑一些中小规模的
2025-02-07浏览详情
大型语言模型(LLM)工作原理全解析 大型语言模型的核心机制其实很直观,可以用简单的方式进行拆解: 1. 本质是一个预测游戏 - LLM的核
2025-01-01浏览详情
AI Safeguard联合卡内基梅隆和斯坦福最新开源的一款轻量级的多模态模型:Ivy-VL 3B参数,在多个基准测试中超过了PaliGemma 3B 、 Mo
2024-12-16浏览详情
上海AI实验室OpenGVLab开源了其最新多模态模型,首个在MMMU基准中超过70%的开源LLM:InternVL 2.5,性能媲美GPT-4o、Claude-3.5-Sonnet
2024-12-10浏览详情
全球首个去中心化训练的10B大模型,Prime Intellect通过去中心化的方式训练了一个10B模型:INTELLECT-1 并开源了基础模型、检查点、
2024-12-04浏览详情
【python-sdk:Model Context Protocol(MCP)的官方Python SDK,提供了标准化的LLM上下文交互接口。支持构建MCP客户端和服务器,实现资
【askrepo:一款利用大型语言模型(LLM)阅读源代码的工具,能够理解代码内容并回答相关问题,特色在于与Google Gemini API的结合使用】'as
2024-11-06浏览详情
【DataExpert 数据工程:一个公共知识库,涵盖所有由大型语言模型(LLM)驱动的数据工程概念,帮助你理解并应用LLM技术于数据工程领域】'Da
2024-10-26浏览详情
知识图谱与人工智能 莫纳什大学潘世瑞教授团队提出的图约束推理 (GCR) 框架,它将知识图谱KG中的结构化知识与 LLM 中的非结构化推
2024-10-23浏览详情
AI2 推出了 Molmo 完全开源的多模态LLM。aillm 他们这个图片标注的功能非常好,不止可以语言描述位置和数量还会在图片上标出来。
2024-09-29浏览详情
智源研究院的一个新型多模态大模型:Emu3,通过预测下一个词或token的方式来理解和生成文本、图像和视频 从效果看,尤其视觉语言理解
最新Qwen2.5刚刚发布了,这次一口气开源了一大串模型! 有语言模型 Qwen2.5,编程模型Qwen2.5-Coder、数学模型 Qwen2.5-Math 版本包括
2024-09-22浏览详情
微软开源了一款MoE模型:GRIN-MoE 6.6B活跃参数,在编程和数学任务上能力出色 适用于需要强推理能力,特别是代码、数学和逻辑需求,内存
2024-09-20浏览详情
【doc-comments-ai:由大型语言模型(LLM)驱动的代码文档生成工具,专注于自动生成代码文档,支持多种编程语言,包括Python、Typescript、
2024-09-19浏览详情
Mistral AI发了新模型:pixtral-12b-240910,识别复杂手写笔记、数学公式、图表的能力优秀 12B参数,集语言、视觉能力于一身,可以理解
2024-09-14浏览详情
DeepSeek刚刚开源了其融合了通用与代码能力的新模型:DeepSeek-V2.5 V2.5融合了V2-Chat和Coder-V2的优势,通用对话能力和代码处理能
2024-09-13浏览详情
【Cherry Studio:支持多语言模型提供商的桌面客户端,具备多助手创建、多话题管理、多模型对话回答、拖拽排序、代码高亮和Mermaid图
2024-09-11浏览详情
Meta 发了三篇文章详细介绍 LLM 的训练过程以及微调。aillm 文章非常的干,都是 LLM 微调的关键要点,强烈推荐看看,下面是核心的笔
面壁智能开源了其面壁小钢炮3.0(MiniCPM 3.0)!性能超GPT-3.5,无限长文本超Kimi 特点: 1、MiniCPM 3.0,4B 参数,在自然语言理解、知识、
2024-09-08浏览详情
【Awesome-LLM-Constrained-Decoding:有关大型语言模型(LLM)约束解码的精选论文列表,包含相关代码和资源,旨在实现更可靠、可控和高效
2024-09-06浏览详情
【PromptMage:简化创建和管理LLM工作流的自托管解决方案,提供直观界面以促进提示测试和比较,集成版本控制功能以帮助用户追踪其提示
2024-08-22浏览详情
RAG 效果评估教程aillmrag 介绍如何使用 RAGAs 框架评估 RAG 应用的性能。 并通过构建元数据链和记录到 CometML-LLM 来监控复
2024-08-19浏览详情
【LLM辅助OCR项目:利用大型语言模型(LLM)提升扫描PDF的Tesseract OCR输出质量,将原始OCR文本转化为高准确度、格式良好、易读的文档,适
2024-08-14浏览详情
,终于有人开源专门的角色扮演模型了。aillm Peach-9B-8k-Roleplay,一个专门为角色扮演任务服务,基于Yi-1.5-9B 微调的模型。 开源
2024-08-11浏览详情
一款用于增强 LLM在RAG任务中能力的框架:RAG Foundry 英特尔发布的,其支持数据创建、训练、推理和评估 特点: 1、可定制性: 支持自定
正在拼命加载中
我是有底线的
没有更多的页面可以加载啦!