Transformers from Scratch:从零开始构建Transformer模型,带你深入理解自然语言处理的核心技术!亮点:1. 从基础概念到完整架构,逐步解析Transformer的每一个

Transformers from Scratch:从零开始构建Transformer模型,带你深入理解自然语言处理的核心技术!亮点:1. 从基础概念到完整架构,逐步解析Transformer的每一个

【Transformers from Scratch:从零开始构建Transformer模型,带你深入理解自然语言处理的核心技术!亮点:1. 从基础概念到完整架构,逐步

2025-02-12浏览详情

Llama3.cu:用于 LLaMA 3 8B 参数版本的轻量级 CUDA C 语言实现的推理引擎,旨在在 Nvidia GPU 上进行高效的并行处理

Llama3.cu:用于 LLaMA 3 8B 参数版本的轻量级 CUDA C 语言实现的推理引擎,旨在在 Nvidia GPU 上进行高效的并行处理

【Llama3.cu:用于 LLaMA 3 8B 参数版本的轻量级 CUDA C 语言实现的推理引擎,旨在在 Nvidia GPU 上进行高效的并行处理】'Llama3.cu

2025-01-07浏览详情

Simple CSC:一款基于大型语言模型的中文拼写纠错工具,无需训练和提示,简单高效

Simple CSC:一款基于大型语言模型的中文拼写纠错工具,无需训练和提示,简单高效

【Simple CSC:一款基于大型语言模型的中文拼写纠错工具,无需训练和提示,简单高效】'simple-csc - A simple yet effective training-

2025-01-04浏览详情

VLMs Zero to Hero:视觉语言模型(VLM)相关论文列表

VLMs Zero to Hero:视觉语言模型(VLM)相关论文列表

【VLMs Zero to Hero:视觉语言模型(VLM)相关论文列表】’VLMs zero-to-hero - coming: january 2025...' GitHub: github.com/Skalsk

2024-12-30浏览详情

SocialED社交事件探测器:一款开源的Python库,旨在帮助自动从社交媒体平台如推特和脸书上识别和分析事件,包括自然灾害和病毒现象等

SocialED社交事件探测器:一款开源的Python库,旨在帮助自动从社交媒体平台如推特和脸书上识别和分析事件,包括自然灾害和病毒现象等

【SocialED社交事件探测器:一款开源的Python库,旨在帮助自动从社交媒体平台如推特和脸书上识别和分析事件,包括自然灾害和病毒现象等

2024-12-23浏览详情

TopicGPT:将大型语言模型的优势融入主题建模,提供丰富动态的主题表示,可通过自然语言命令直观理解、探索和修改

TopicGPT:将大型语言模型的优势融入主题建模,提供丰富动态的主题表示,可通过自然语言命令直观理解、探索和修改

【TopicGPT:将大型语言模型的优势融入主题建模,提供丰富动态的主题表示,可通过自然语言命令直观理解、探索和修改】'TopicGPT allows

2024-12-22浏览详情

annotateai:自动为论文添加注释的工具,利用大型语言模型帮助读者更好地理解和获取论文中的关键信息

annotateai:自动为论文添加注释的工具,利用大型语言模型帮助读者更好地理解和获取论文中的关键信息

【annotateai:自动为论文添加注释的工具,利用大型语言模型帮助读者更好地理解和获取论文中的关键信息】'annotateai - Automaticall

2024-12-22浏览详情

TokenLearn 静态词嵌入:一种预训练模型2Vec的方法,专注于提升自然语言处理中词嵌入的静态特性,使其更适用于各种下游任务

TokenLearn 静态词嵌入:一种预训练模型2Vec的方法,专注于提升自然语言处理中词嵌入的静态特性,使其更适用于各种下游任务

【TokenLearn 静态词嵌入:一种预训练模型2Vec的方法,专注于提升自然语言处理中词嵌入的静态特性,使其更适用于各种下游任务】'Tokenl

2024-12-20浏览详情

多模态智能预测:探索多模态智能中的下一词预测技术,收集了丰富的研究资料和代码库,助力理解和生成任务

多模态智能预测:探索多模态智能中的下一词预测技术,收集了丰富的研究资料和代码库,助力理解和生成任务

【多模态智能预测:探索多模态智能中的下一词预测技术,收集了丰富的研究资料和代码库,助力理解和生成任务】'Next Token Prediction T

2024-12-20浏览详情

开源语言模型集合:汇集了各种开源语言模型的资源,旨在推动自然语言处理技术的发展,强调模型的透明度和可访问性,方便研究人员和开发者使用

开源语言模型集合:汇集了各种开源语言模型的资源,旨在推动自然语言处理技术的发展,强调模型的透明度和可访问性,方便研究人员和开发者使用

【开源语言模型集合:汇集了各种开源语言模型的资源,旨在推动自然语言处理技术的发展,强调模型的透明度和可访问性,方便研究人员和开发

2024-12-13浏览详情

自然语言处理因果研究清单:汇集自然语言处理领域内关于因果关系的论文,旨在帮助研究者和爱好者深入理解语言数据背后的因果机制

自然语言处理因果研究清单:汇集自然语言处理领域内关于因果关系的论文,旨在帮助研究者和爱好者深入理解语言数据背后的因果机制

【自然语言处理因果研究清单:汇集自然语言处理领域内关于因果关系的论文,旨在帮助研究者和爱好者深入理解语言数据背后的因果机制】

2024-12-12浏览详情

PremSQL:一款开源的本地优先文本转SQL工具,帮助开发者构建安全、完全本地的文本到SQL解决方案,支持自然语言查询数据库,分析数据并绘制图表

PremSQL:一款开源的本地优先文本转SQL工具,帮助开发者构建安全、完全本地的文本到SQL解决方案,支持自然语言查询数据库,分析数据并绘制图表

【PremSQL:一款开源的本地优先文本转SQL工具,帮助开发者构建安全、完全本地的文本到SQL解决方案,支持自然语言查询数据库,分析数据并

2024-12-12浏览详情

Flash Attention:基于Triton语言实现的注意力机制算法,提供高效的计算和优化,适用于大规模数据处理

Flash Attention:基于Triton语言实现的注意力机制算法,提供高效的计算和优化,适用于大规模数据处理

【Flash Attention:基于Triton语言实现的注意力机制算法,提供高效的计算和优化,适用于大规模数据处理】'Flash Attention implemente

2024-12-10浏览详情

Awesome-LLM-as-a-judge:一个关于LLM作为评判器的综合资料库,收集整理了大语言模型在评判任务中的应用研究,涵盖了帮助性、无害性、可靠性、相关性、可行性等多个评估维度,以及相关方法

Awesome-LLM-as-a-judge:一个关于LLM作为评判器的综合资料库,收集整理了大语言模型在评判任务中的应用研究,涵盖了帮助性、无害性、可靠性、相关性、可行性等多个评估维度,以及相关方法

【Awesome-LLM-as-a-judge:一个关于LLM作为评判器的综合资料库,收集整理了大语言模型在评判任务中的应用研究,涵盖了帮助性、无害性

2024-12-05浏览详情

spaCy Layout:一款能够处理PDF、Word文档等多种格式文件的自然语言处理工具,将结构化数据处理与spaCy的强大功能相结合,输出清晰、结构化的数据,并提供熟悉的Doc对象以访问标记文本区

spaCy Layout:一款能够处理PDF、Word文档等多种格式文件的自然语言处理工具,将结构化数据处理与spaCy的强大功能相结合,输出清晰、结构化的数据,并提供熟悉的Doc对象以访问标记文本区

【spaCy Layout:一款能够处理PDF、Word文档等多种格式文件的自然语言处理工具,将结构化数据处理与spaCy的强大功能相结合,输出清晰、

2024-11-20浏览详情

IBM Dolomite Engine:一款用于预训练和微调大型语言模型的超优化库,集成了多项关键创新,包括模型架构、微调方法和系统优化

IBM Dolomite Engine:一款用于预训练和微调大型语言模型的超优化库,集成了多项关键创新,包括模型架构、微调方法和系统优化

【IBM Dolomite Engine:一款用于预训练和微调大型语言模型的超优化库,集成了多项关键创新,包括模型架构、微调方法和系统优化】'Dolo

2024-10-27浏览详情

Fast-LLM:一个开源库,用于加速大型语言模型的训练,它快速、可扩展、支持多种模型架构,并且易于使用

Fast-LLM:一个开源库,用于加速大型语言模型的训练,它快速、可扩展、支持多种模型架构,并且易于使用

【Fast-LLM:一个开源库,用于加速大型语言模型的训练,它快速、可扩展、支持多种模型架构,并且易于使用】'ServiceNow/Fast-LLM: Accele

2024-10-25浏览详情

(博士论文)自然语言处理中的不确定性:深入探究自然语言处理(NLP)中不确定性的来源,提供量化模型预测可靠性的新方法

(博士论文)自然语言处理中的不确定性:深入探究自然语言处理(NLP)中不确定性的来源,提供量化模型预测可靠性的新方法

【(博士论文)自然语言处理中的不确定性:深入探究自然语言处理(NLP)中不确定性的来源,提供量化模型预测可靠性的新方法】
- 自然语言处

2024-10-15浏览详情

OpenR:一个开源框架,专为大型语言模型提供高级推理能力,支持数据生成、策略训练和多种搜索策略,让机器更聪明地理解和解决问题,提供了 MATH-APS 数据集和 MATH-psa 流程奖励模型,并且

OpenR:一个开源框架,专为大型语言模型提供高级推理能力,支持数据生成、策略训练和多种搜索策略,让机器更聪明地理解和解决问题,提供了 MATH-APS 数据集和 MATH-psa 流程奖励模型,并且

【OpenR:一个开源框架,专为大型语言模型提供高级推理能力,支持数据生成、策略训练和多种搜索策略,让机器更聪明地理解和解决问题,提供

2024-10-14浏览详情

GLiNER即服务:一个基于FastAPI的微服务,提供高效、可扩展的文本数据命名实体识别服务,支持高并发请求处理,具备实时监控和负载测试功能

GLiNER即服务:一个基于FastAPI的微服务,提供高效、可扩展的文本数据命名实体识别服务,支持高并发请求处理,具备实时监控和负载测试功能

【GLiNER即服务:一个基于FastAPI的微服务,提供高效、可扩展的文本数据命名实体识别服务,支持高并发请求处理,具备实时监控和负载测试

2024-09-25浏览详情

将自然语言问题转换为数据可视化的框架,用户可以上传 SQLite 数据库或 CSV 文件,并通过自然语言提问,系统将生成相应的 SQL 查询,执行查询并将结果以视觉图形的形式展示

将自然语言问题转换为数据可视化的框架,用户可以上传 SQLite 数据库或 CSV 文件,并通过自然语言提问,系统将生成相应的 SQL 查询,执行查询并将结果以视觉图形的形式展示

【将自然语言问题转换为数据可视化的框架,用户可以上传 SQLite 数据库或 CSV 文件,并通过自然语言提问,系统将生成相应的 SQL 查询,执

2024-09-16浏览详情

GenAI Agents:全面的生成式人工智能(GenAI)Agent开发和实施资源库,包含从简单对话机器人到复杂多代理系统的教程和实现

GenAI Agents:全面的生成式人工智能(GenAI)Agent开发和实施资源库,包含从简单对话机器人到复杂多代理系统的教程和实现

【GenAI Agents:全面的生成式人工智能(GenAI)Agent开发和实施资源库,包含从简单对话机器人到复杂多代理系统的教程和实现】'GenAI A

2024-09-15浏览详情

minimind:3小时从0训练26M小参数GPT,低至2G显卡即可推理训练

minimind:3小时从0训练26M小参数GPT,低至2G显卡即可推理训练

【minimind:3小时从0训练26M小参数GPT,低至2G显卡即可推理训练】GitHub: github.com/jingyaogong/minimind 人工智能 机器学习 自然

2024-09-11浏览详情

数据飞轮:为大型语言模型(LLMs)提供高质量、大量数据的搜索、选择和合成,以优化模型的后期训练

数据飞轮:为大型语言模型(LLMs)提供高质量、大量数据的搜索、选择和合成,以优化模型的后期训练

【数据飞轮:为大型语言模型(LLMs)提供高质量、大量数据的搜索、选择和合成,以优化模型的后期训练】'Post-Training-Data-Flywheel -

2024-09-08浏览详情

Awesome-LLM-Constrained-Decoding:有关大型语言模型(LLM)约束解码的精选论文列表,包含相关代码和资源,旨在实现更可靠、可控和高效的文本生成

Awesome-LLM-Constrained-Decoding:有关大型语言模型(LLM)约束解码的精选论文列表,包含相关代码和资源,旨在实现更可靠、可控和高效的文本生成

【Awesome-LLM-Constrained-Decoding:有关大型语言模型(LLM)约束解码的精选论文列表,包含相关代码和资源,旨在实现更可靠、可控和高效

2024-09-06浏览详情

NLP Zero to Hero:自然语言处理(NLP)领域的入门到精通教程,包含从分词器到Transformer架构的全面内容,旨在帮助学习者掌握NLP的核心概念并理解其发展脉络

NLP Zero to Hero:自然语言处理(NLP)领域的入门到精通教程,包含从分词器到Transformer架构的全面内容,旨在帮助学习者掌握NLP的核心概念并理解其发展脉络

【NLP Zero to Hero:自然语言处理(NLP)领域的入门到精通教程,包含从分词器到Transformer架构的全面内容,旨在帮助学习者掌握NLP的核心

2024-09-04浏览详情

ReDel:为研究人员和开发者构建、迭代和分析递归多智能体系统的套件,提供模块化设计、事件驱动架构和内置可视化工具,支持现代大型语言模型和工具使用

ReDel:为研究人员和开发者构建、迭代和分析递归多智能体系统的套件,提供模块化设计、事件驱动架构和内置可视化工具,支持现代大型语言模型和工具使用

【ReDel:为研究人员和开发者构建、迭代和分析递归多智能体系统的套件,提供模块化设计、事件驱动架构和内置可视化工具,支持现代大型

2024-09-02浏览详情

kotaemon:开源的RAG基础工具,让你与文档进行对话。提供简洁的UI,支持多种LLM API提供商和本地LLMs,易于安装和定制化设置

kotaemon:开源的RAG基础工具,让你与文档进行对话。提供简洁的UI,支持多种LLM API提供商和本地LLMs,易于安装和定制化设置

【kotaemon:开源的RAG基础工具,让你与文档进行对话。提供简洁的UI,支持多种LLM API提供商和本地LLMs,易于安装和定制化设置】'An open

2024-09-02浏览详情

Ruby语言的先进Transformers库:为Ruby语言提供最新的Transformers技术,支持多种模型架构和丰富的功能,适用于自然语言处理任务

Ruby语言的先进Transformers库:为Ruby语言提供最新的Transformers技术,支持多种模型架构和丰富的功能,适用于自然语言处理任务

【Ruby语言的先进Transformers库:为Ruby语言提供最新的Transformers技术,支持多种模型架构和丰富的功能,适用于自然语言处理任务】't

2024-08-26浏览详情

Orca:基于GPT-4复杂解释轨迹的渐进式学习模型,推动自然语言理解与生成的前沿,设计高效且智能的SOTA语言模型,与OpenAI的GPT-4和PALM相媲美

Orca:基于GPT-4复杂解释轨迹的渐进式学习模型,推动自然语言理解与生成的前沿,设计高效且智能的SOTA语言模型,与OpenAI的GPT-4和PALM相媲美

【Orca:基于GPT-4复杂解释轨迹的渐进式学习模型,推动自然语言理解与生成的前沿,设计高效且智能的SOTA语言模型,与OpenAI的GPT-4和PALM

2024-08-26浏览详情

LM-class:现代语言模型教育资源,面向机器学习和神经网络基础的研究生,强调技术深度而非广度,提供强基础和自我更新知识的工具

LM-class:现代语言模型教育资源,面向机器学习和神经网络基础的研究生,强调技术深度而非广度,提供强基础和自我更新知识的工具

【LM-class:现代语言模型教育资源,面向机器学习和神经网络基础的研究生,强调技术深度而非广度,提供强基础和自我更新知识的工具】'LM-

2024-08-25浏览详情

NVIDIA AI Workbench 混合检索增强生成(RAG)项目:基于NVIDIA AI Workbench开发的RAG应用示例,支持自定义Gradio Chat应用,实现文档嵌入本地向量数据库

NVIDIA AI Workbench 混合检索增强生成(RAG)项目:基于NVIDIA AI Workbench开发的RAG应用示例,支持自定义Gradio Chat应用,实现文档嵌入本地向量数据库

【NVIDIA AI Workbench 混合检索增强生成(RAG)项目:基于NVIDIA AI Workbench开发的RAG应用示例,支持自定义Gradio Chat应用,实现文档嵌

2024-08-21浏览详情

正在拼命加载中

我是有底线的

没有更多的页面可以加载啦!