llm

8 块 H200 GPU 卡在同一台...

8 块 H200 GPU 卡在同一台...

8 块 H200 GPU 卡在同一台 1.5G 内存的大机器上，确实很气势磅礴的感觉好多 VRAM 和 TensorCore 呀后面可以多跑一些中小规模的

2025-02-07 浏览详情

大型语言模型（LLM）工作原理全解...

大型语言模型（LLM）工作原理全解...

大型语言模型（LLM）工作原理全解析

大型语言模型的核心机制其实很直观，可以用简单的方式进行拆解：

1. 本质是一个预测游戏
- LLM的核

2025-01-01 浏览详情

AI Safeguard联合卡内基梅隆和斯坦...

AI Safeguard联合卡内基梅隆和斯坦...

AI Safeguard联合卡内基梅隆和斯坦福最新开源的一款轻量级的多模态模型：Ivy-VL

3B参数，在多个基准测试中超过了PaliGemma 3B 、 Mo

2024-12-16 浏览详情

InternVL25

上海AI实验室OpenGVLab开源了其最新多模态模型，首个在MMMU基准中超过70%的开源LLM：InternVL 2.5，性能媲美GPT-4o、Claude-3.5-Sonnet

2024-12-10 浏览详情

INTELLECT1

全球首个去中心化训练的10B大模型，Prime Intellect通过去中心化的方式训练了一个10B模型：INTELLECT-1
并开源了基础模型、检查点、

2024-12-04 浏览详情

python-sdk：Model Context Protocol(MCP)的官方Python SDK，提供了标准化的LLM上下文交互接口。支持构建MCP客户端和服务器，实现资源、提示和工具的标准化管

python-sdk：Model Context Protocol(MCP)的官方Python SDK，提供了标准化的LLM上下文交互接口。支持构建MCP客户端和服务器，实现资源、提示和工具的标准化管

【python-sdk：Model Context Protocol(MCP)的官方Python SDK，提供了标准化的LLM上下文交互接口。支持构建MCP客户端和服务器，实现资

2024-12-04 浏览详情

askrepo：一款利用大型语言模型（LLM）阅读源代码的工具，能够理解代码内容并回答相关问题，特色在于与Google Gemini API的结合使用

askrepo：一款利用大型语言模型（LLM）阅读源代码的工具，能够理解代码内容并回答相关问题，特色在于与Google Gemini API的结合使用

【askrepo：一款利用大型语言模型（LLM）阅读源代码的工具，能够理解代码内容并回答相关问题，特色在于与Google Gemini API的结合使用】'as

2024-11-06 浏览详情

DataExpert 数据工程：一个公共知识库，涵盖所有由大型语言模型（LLM）驱动的数据工程概念，帮助你理解并应用LLM技术于数据工程领域

DataExpert 数据工程：一个公共知识库，涵盖所有由大型语言模型（LLM）驱动的数据工程概念，帮助你理解并应用LLM技术于数据工程领域

【DataExpert 数据工程：一个公共知识库，涵盖所有由大型语言模型（LLM）驱动的数据工程概念，帮助你理解并应用LLM技术于数据工程领域】'Da

2024-10-26 浏览详情

知识图谱与人工智能

知识图谱与人工智能莫纳什大学潘世瑞教授团队提出的图约束推理 (GCR) 框架，它将知识图谱KG中的结构化知识与 LLM 中的非结构化推

2024-10-23 浏览详情

AI2 推出了 Molmo 完全开源的多模态LLM

AI2 推出了 Molmo 完全开源的多模态LLM

AI2 推出了 Molmo 完全开源的多模态LLM。aillm

他们这个图片标注的功能非常好，不止可以语言描述位置和数量还会在图片上标出来。

2024-09-29 浏览详情

多模态LLM

智源研究院的一个新型多模态大模型：Emu3，通过预测下一个词或token的方式来理解和生成文本、图像和视频

从效果看，尤其视觉语言理解

2024-09-29 浏览详情

Qwen2.5

最新Qwen2.5刚刚发布了，这次一口气开源了一大串模型！
有语言模型 Qwen2.5，编程模型Qwen2.5-Coder、数学模型 Qwen2.5-Math

版本包括

2024-09-22 浏览详情

微软开源了一款MoE模型：GRIN-MoE6...

微软开源了一款MoE模型：GRIN-MoE6...

微软开源了一款MoE模型：GRIN-MoE
6.6B活跃参数，在编程和数学任务上能力出色

适用于需要强推理能力，特别是代码、数学和逻辑需求，内存

2024-09-20 浏览详情

doc-comments-ai：由大型语言模型(LLM)驱动的代码文档生成工具，专注于自动生成代码文档，支持多种编程语言，包括Python、Typescript、Javascript等，利用OpenA

doc-comments-ai：由大型语言模型(LLM)驱动的代码文档生成工具，专注于自动生成代码文档，支持多种编程语言，包括Python、Typescript、Javascript等，利用OpenA

【doc-comments-ai：由大型语言模型(LLM)驱动的代码文档生成工具，专注于自动生成代码文档，支持多种编程语言，包括Python、Typescript、

2024-09-19 浏览详情

Mistral

Mistral AI发了新模型：pixtral-12b-240910，识别复杂手写笔记、数学公式、图表的能力优秀

12B参数，集语言、视觉能力于一身，可以理解

2024-09-14 浏览详情

DeepSeek

DeepSeek刚刚开源了其融合了通用与代码能力的新模型：DeepSeek-V2.5

V2.5融合了V2-Chat和Coder-V2的优势，通用对话能力和代码处理能

2024-09-13 浏览详情

Cherry Studio：支持多语言模型提供商的桌面客户端，具备多助手创建、多话题管理、多模型对话回答、拖拽排序、代码高亮和Mermaid图表等功能

Cherry Studio：支持多语言模型提供商的桌面客户端，具备多助手创建、多话题管理、多模型对话回答、拖拽排序、代码高亮和Mermaid图表等功能

【Cherry Studio：支持多语言模型提供商的桌面客户端，具备多助手创建、多话题管理、多模型对话回答、拖拽排序、代码高亮和Mermaid图

2024-09-11 浏览详情

Meta 发了三篇文章详细介绍...

Meta 发了三篇文章详细介绍...

Meta 发了三篇文章详细介绍 LLM 的训练过程以及微调。aillm

文章非常的干，都是 LLM 微调的关键要点，强烈推荐看看，下面是核心的笔

2024-09-11 浏览详情

MiniCPM

面壁智能开源了其面壁小钢炮3.0（MiniCPM 3.0）！性能超GPT-3.5，无限长文本超Kimi

特点：
1、MiniCPM 3.0，4B 参数，在自然语言理解、知识、

2024-09-08 浏览详情

Awesome-LLM-Constrained-Decoding：有关大型语言模型（LLM）约束解码的精选论文列表，包含相关代码和资源，旨在实现更可靠、可控和高效的文本生成

Awesome-LLM-Constrained-Decoding：有关大型语言模型（LLM）约束解码的精选论文列表，包含相关代码和资源，旨在实现更可靠、可控和高效的文本生成

【Awesome-LLM-Constrained-Decoding：有关大型语言模型（LLM）约束解码的精选论文列表，包含相关代码和资源，旨在实现更可靠、可控和高效

2024-09-06 浏览详情

PromptMage：简化创建和管理LLM工作流的自托管解决方案，提供直观界面以促进提示测试和比较，集成版本控制功能以帮助用户追踪其提示的开发过程

PromptMage：简化创建和管理LLM工作流的自托管解决方案，提供直观界面以促进提示测试和比较，集成版本控制功能以帮助用户追踪其提示的开发过程

【PromptMage：简化创建和管理LLM工作流的自托管解决方案，提供直观界面以促进提示测试和比较，集成版本控制功能以帮助用户追踪其提示

2024-08-22 浏览详情

RAG 效果评估教程#ai##llm##rag#...

RAG 效果评估教程#ai##llm##rag#...

RAG 效果评估教程aillmrag

介绍如何使用 RAGAs 框架评估 RAG 应用的性能。

并通过构建元数据链和记录到 CometML-LLM 来监控复

2024-08-19 浏览详情

LLM辅助OCR项目：利用大型语言模型（LLM）提升扫描PDF的Tesseract OCR输出质量，将原始OCR文本转化为高准确度、格式良好、易读的文档，适用于需要将扫描文档转换为高质量文本的场景

LLM辅助OCR项目：利用大型语言模型（LLM）提升扫描PDF的Tesseract OCR输出质量，将原始OCR文本转化为高准确度、格式良好、易读的文档，适用于需要将扫描文档转换为高质量文本的场景

【LLM辅助OCR项目：利用大型语言模型（LLM）提升扫描PDF的Tesseract OCR输出质量，将原始OCR文本转化为高准确度、格式良好、易读的文档，适

2024-08-14 浏览详情

，终于有人开源专门的角色...

，终于有人开源专门的角色...

，终于有人开源专门的角色扮演模型了。aillm

Peach-9B-8k-Roleplay，一个专门为角色扮演任务服务，基于Yi-1.5-9B 微调的模型。

开源

2024-08-11 浏览详情

RAGFoundry

一款用于增强 LLM在RAG任务中能力的框架：RAG Foundry
英特尔发布的，其支持数据创建、训练、推理和评估

特点：
1、可定制性：支持自定

2024-08-11 浏览详情

正在拼命加载中

我是有底线的

没有更多的页面可以加载啦！