8 块 H200 GPU 卡在同一台...

8 块 H200 GPU 卡在同一台...

8 块 H200 GPU 卡在同一台 1.5G 内存的大机器上,确实很气势磅礴的感觉 好多 VRAM 和 TensorCore 呀 后面可以多跑一些中小规模的

2025-02-07浏览详情

大型语言模型(LLM)工作原理全解...

大型语言模型(LLM)工作原理全解...

大型语言模型(LLM)工作原理全解析

大型语言模型的核心机制其实很直观,可以用简单的方式进行拆解:

1. 本质是一个预测游戏
- LLM的核

2025-01-01浏览详情

AI Safeguard联合卡内基梅隆和斯坦...

AI Safeguard联合卡内基梅隆和斯坦...

AI Safeguard联合卡内基梅隆和斯坦福最新开源的一款轻量级的多模态模型:Ivy-VL

3B参数,在多个基准测试中超过了PaliGemma 3B 、 Mo

2024-12-16浏览详情

InternVL25

InternVL25

上海AI实验室OpenGVLab开源了其最新多模态模型,首个在MMMU基准中超过70%的开源LLM:InternVL 2.5,性能媲美GPT-4o、Claude-3.5-Sonnet

2024-12-10浏览详情

INTELLECT1

INTELLECT1

全球首个去中心化训练的10B大模型,Prime Intellect通过去中心化的方式训练了一个10B模型:INTELLECT-1
并开源了基础模型、检查点、

2024-12-04浏览详情

python-sdk:Model Context Protocol(MCP)的官方Python SDK,提供了标准化的LLM上下文交互接口。支持构建MCP客户端和服务器,实现资源、提示和工具的标准化管

python-sdk:Model Context Protocol(MCP)的官方Python SDK,提供了标准化的LLM上下文交互接口。支持构建MCP客户端和服务器,实现资源、提示和工具的标准化管

【python-sdk:Model Context Protocol(MCP)的官方Python SDK,提供了标准化的LLM上下文交互接口。支持构建MCP客户端和服务器,实现资

2024-12-04浏览详情

askrepo:一款利用大型语言模型(LLM)阅读源代码的工具,能够理解代码内容并回答相关问题,特色在于与Google Gemini API的结合使用

askrepo:一款利用大型语言模型(LLM)阅读源代码的工具,能够理解代码内容并回答相关问题,特色在于与Google Gemini API的结合使用

【askrepo:一款利用大型语言模型(LLM)阅读源代码的工具,能够理解代码内容并回答相关问题,特色在于与Google Gemini API的结合使用】'as

2024-11-06浏览详情

DataExpert 数据工程:一个公共知识库,涵盖所有由大型语言模型(LLM)驱动的数据工程概念,帮助你理解并应用LLM技术于数据工程领域

DataExpert 数据工程:一个公共知识库,涵盖所有由大型语言模型(LLM)驱动的数据工程概念,帮助你理解并应用LLM技术于数据工程领域

【DataExpert 数据工程:一个公共知识库,涵盖所有由大型语言模型(LLM)驱动的数据工程概念,帮助你理解并应用LLM技术于数据工程领域】'Da

2024-10-26浏览详情

知识图谱与人工智能

知识图谱与人工智能

知识图谱与人工智能 莫纳什大学潘世瑞教授团队提出的图约束推理 (GCR) 框架,它将知识图谱KG中的结构化知识与 LLM 中的非结构化推

2024-10-23浏览详情

AI2 推出了 Molmo 完全开源的多模态LLM

AI2 推出了 Molmo 完全开源的多模态LLM

AI2 推出了 Molmo 完全开源的多模态LLM。aillm

他们这个图片标注的功能非常好,不止可以语言描述位置和数量还会在图片上标出来。

2024-09-29浏览详情

多模态LLM

多模态LLM

智源研究院的一个新型多模态大模型:Emu3,通过预测下一个词或token的方式来理解和生成文本、图像和视频

从效果看,尤其视觉语言理解

2024-09-29浏览详情

Qwen2.5

Qwen2.5

最新Qwen2.5刚刚发布了,这次一口气开源了一大串模型!
有语言模型 Qwen2.5,编程模型Qwen2.5-Coder、数学模型 Qwen2.5-Math

版本包括

2024-09-22浏览详情

微软开源了一款MoE模型:GRIN-MoE6...

微软开源了一款MoE模型:GRIN-MoE6...

微软开源了一款MoE模型:GRIN-MoE
6.6B活跃参数,在编程和数学任务上能力出色

适用于需要强推理能力,特别是代码、数学和逻辑需求,内存

2024-09-20浏览详情

doc-comments-ai:由大型语言模型(LLM)驱动的代码文档生成工具,专注于自动生成代码文档,支持多种编程语言,包括Python、Typescript、Javascript等,利用OpenA

doc-comments-ai:由大型语言模型(LLM)驱动的代码文档生成工具,专注于自动生成代码文档,支持多种编程语言,包括Python、Typescript、Javascript等,利用OpenA

【doc-comments-ai:由大型语言模型(LLM)驱动的代码文档生成工具,专注于自动生成代码文档,支持多种编程语言,包括Python、Typescript、

2024-09-19浏览详情

Mistral

Mistral

Mistral AI发了新模型:pixtral-12b-240910,识别复杂手写笔记、数学公式、图表的能力优秀

12B参数,集语言、视觉能力于一身,可以理解

2024-09-14浏览详情

DeepSeek

DeepSeek

DeepSeek刚刚开源了其融合了通用与代码能力的新模型:DeepSeek-V2.5

V2.5融合了V2-Chat和Coder-V2的优势,通用对话能力和代码处理能

2024-09-13浏览详情

Cherry Studio:支持多语言模型提供商的桌面客户端,具备多助手创建、多话题管理、多模型对话回答、拖拽排序、代码高亮和Mermaid图表等功能

Cherry Studio:支持多语言模型提供商的桌面客户端,具备多助手创建、多话题管理、多模型对话回答、拖拽排序、代码高亮和Mermaid图表等功能

【Cherry Studio:支持多语言模型提供商的桌面客户端,具备多助手创建、多话题管理、多模型对话回答、拖拽排序、代码高亮和Mermaid图

2024-09-11浏览详情

Meta 发了三篇文章详细介绍...

Meta 发了三篇文章详细介绍...

Meta 发了三篇文章详细介绍 LLM 的训练过程以及微调。aillm

文章非常的干,都是 LLM 微调的关键要点,强烈推荐看看,下面是核心的笔

2024-09-11浏览详情

MiniCPM

MiniCPM

面壁智能开源了其面壁小钢炮3.0(MiniCPM 3.0)!性能超GPT-3.5,无限长文本超Kimi

特点:
1、MiniCPM 3.0,4B 参数,在自然语言理解、知识、

2024-09-08浏览详情

Awesome-LLM-Constrained-Decoding:有关大型语言模型(LLM)约束解码的精选论文列表,包含相关代码和资源,旨在实现更可靠、可控和高效的文本生成

Awesome-LLM-Constrained-Decoding:有关大型语言模型(LLM)约束解码的精选论文列表,包含相关代码和资源,旨在实现更可靠、可控和高效的文本生成

【Awesome-LLM-Constrained-Decoding:有关大型语言模型(LLM)约束解码的精选论文列表,包含相关代码和资源,旨在实现更可靠、可控和高效

2024-09-06浏览详情

PromptMage:简化创建和管理LLM工作流的自托管解决方案,提供直观界面以促进提示测试和比较,集成版本控制功能以帮助用户追踪其提示的开发过程

PromptMage:简化创建和管理LLM工作流的自托管解决方案,提供直观界面以促进提示测试和比较,集成版本控制功能以帮助用户追踪其提示的开发过程

【PromptMage:简化创建和管理LLM工作流的自托管解决方案,提供直观界面以促进提示测试和比较,集成版本控制功能以帮助用户追踪其提示

2024-08-22浏览详情

RAG 效果评估教程#ai##llm##rag#...

RAG 效果评估教程#ai##llm##rag#...

RAG 效果评估教程aillmrag

介绍如何使用 RAGAs 框架评估 RAG 应用的性能。

并通过构建元数据链和记录到 CometML-LLM 来监控复

2024-08-19浏览详情

LLM辅助OCR项目:利用大型语言模型(LLM)提升扫描PDF的Tesseract OCR输出质量,将原始OCR文本转化为高准确度、格式良好、易读的文档,适用于需要将扫描文档转换为高质量文本的场景

LLM辅助OCR项目:利用大型语言模型(LLM)提升扫描PDF的Tesseract OCR输出质量,将原始OCR文本转化为高准确度、格式良好、易读的文档,适用于需要将扫描文档转换为高质量文本的场景

【LLM辅助OCR项目:利用大型语言模型(LLM)提升扫描PDF的Tesseract OCR输出质量,将原始OCR文本转化为高准确度、格式良好、易读的文档,适

2024-08-14浏览详情

,终于有人开源专门的角色...

,终于有人开源专门的角色...

,终于有人开源专门的角色扮演模型了。aillm

Peach-9B-8k-Roleplay,一个专门为角色扮演任务服务,基于Yi-1.5-9B 微调的模型。

开源

2024-08-11浏览详情

RAGFoundry

RAGFoundry

一款用于增强 LLM在RAG任务中能力的框架:RAG Foundry
英特尔发布的,其支持数据创建、训练、推理和评估

特点:
1、可定制性: 支持自定

2024-08-11浏览详情

正在拼命加载中

我是有底线的

没有更多的页面可以加载啦!