深度学习

[76页白皮书]Google AI Agents：深入探索AI Agent的前沿技术。亮点：1. 涵盖Agent RAG、单Agent评估、多Agent评估等高级主题；2. 提供真实世界的代理架构案例

[76页白皮书]Google AI Agents：深入探索AI Agent的前沿技术。亮点：1. 涵盖Agent RAG、单Agent评估、多Agent评估等高级主题；2. 提供真实世界的代理架构案例

【[76页白皮书]Google AI Agents：深入探索AI Agent的前沿技术。亮点：1. 涵盖Agent RAG、单Agent评估、多Agent评估等高级主题；2. 提

2025-05-03 浏览详情

开源电子书：《大语言模型》...

开源电子书：《大语言模型》...

开源电子书：《大语言模型》
该教程全面覆盖了大语言模型领域的核心内容，包括基本原理讲解、预训练技术、微调方法、价值观对齐以及

2025-04-13 浏览详情

Transformers Breakdown：深入剖析Transformer架构的代码解析项目。亮点：1. 逐行解读Transformer代码，适合初学者快速上手；2. 使用PyTorch实现，代码简

Transformers Breakdown：深入剖析Transformer架构的代码解析项目。亮点：1. 逐行解读Transformer代码，适合初学者快速上手；2. 使用PyTorch实现，代码简

【Transformers Breakdown：深入剖析Transformer架构的代码解析项目。亮点：1. 逐行解读Transformer代码，适合初学者快速上手；2. 使用Py

2025-03-26 浏览详情

[214星] DeepSeek R1：介绍了如何从头构建 DeepSeek R1 模型，包括使用 Qwen 作为基础模型，应用 GRPO 算法进行初步训练，以及通过 Supervised Fine-T

[214星] DeepSeek R1：介绍了如何从头构建 DeepSeek R1 模型，包括使用 Qwen 作为基础模型，应用 GRPO 算法进行初步训练，以及通过 Supervised Fine-T

【[214星] DeepSeek R1：介绍了如何从头构建 DeepSeek R1 模型，包括使用 Qwen 作为基础模型，应用 GRPO 算法进行初步训练，以及通过 Sup

2025-02-28 浏览详情

[80星]r1-ktransformers-guide：让你的DeepSeek-R1 GGUF模型在KTransformers上飞速运行。亮点：1. 性能提升近2倍，比llama.cpp更快；2. 支

[80星]r1-ktransformers-guide：让你的DeepSeek-R1 GGUF模型在KTransformers上飞速运行。亮点：1. 性能提升近2倍，比llama.cpp更快；2. 支

【[80星]r1-ktransformers-guide：让你的DeepSeek-R1 GGUF模型在KTransformers上飞速运行。亮点：1. 性能提升近2倍，比llama.cpp更快；2.

2025-02-24 浏览详情

《理解深度学习》随书代码：各种深度学习模型的Colab Notebooks实现代码

《理解深度学习》随书代码：各种深度学习模型的Colab Notebooks实现代码

【《理解深度学习》随书代码：各种深度学习模型的Colab Notebooks实现代码】
'Understanding Deep Learning'
深度学习 Python

2025-02-16 浏览详情

Transformers from Scratch：从零开始构建Transformer模型，带你深入理解自然语言处理的核心技术！亮点：1. 从基础概念到完整架构，逐步解析Transformer的每一个

Transformers from Scratch：从零开始构建Transformer模型，带你深入理解自然语言处理的核心技术！亮点：1. 从基础概念到完整架构，逐步解析Transformer的每一个

【Transformers from Scratch：从零开始构建Transformer模型，带你深入理解自然语言处理的核心技术！亮点：1. 从基础概念到完整架构，逐步

2025-02-12 浏览详情

神经网络中的奥卡姆剃刀悖论...

神经网络中的奥卡姆剃刀悖论...

神经网络中的奥卡姆剃刀悖论，其实并不是真正的矛盾。

“简单即是美”这一科学哲学原则看似与神经网络的庞大参数空间背道而驰。但

2025-01-04 浏览详情

NX-AI mLSTM Kernels：提供了一套快速高效的 mLSTM 核心库，支持并行、分块和循环步骤的处理方式，并提供了 PyTorch 和 JAX 的封装

NX-AI mLSTM Kernels：提供了一套快速高效的 mLSTM 核心库，支持并行、分块和循环步骤的处理方式，并提供了 PyTorch 和 JAX 的封装

【NX-AI mLSTM Kernels：提供了一套快速高效的 mLSTM 核心库，支持并行、分块和循环步骤的处理方式，并提供了 PyTorch 和 JAX 的封装】

2024-12-18 浏览详情

DL4Proteins notebooks：深度学习工具箱，让生物分子结构预测和设计变得简单易懂，特别适合科研人员、教育工作者和学生使用，推动合成生物学和治疗学创新发展

DL4Proteins notebooks：深度学习工具箱，让生物分子结构预测和设计变得简单易懂，特别适合科研人员、教育工作者和学生使用，推动合成生物学和治疗学创新发展

【DL4Proteins notebooks：深度学习工具箱，让生物分子结构预测和设计变得简单易懂，特别适合科研人员、教育工作者和学生使用，推动合成

2024-12-18 浏览详情

xLSTM-jax： JAX 实现的 xLSTM 模型库，提供高效的训练和推理代码

xLSTM-jax： JAX 实现的 xLSTM 模型库，提供高效的训练和推理代码

【xLSTM-jax： JAX 实现的 xLSTM 模型库，提供高效的训练和推理代码】'NX-AI/xlstm-jax: Official JAX implementation of xLSTM incl

2024-12-16 浏览详情

Ivy：强大的机器学习框架代码转换工具，支持PyTorch、TensorFlow、JAX、NumPy等主流框架之间的代码互转，可以轻松实现模型、工具和库的跨框架移植，支持即时转换和延迟转换两种模式，还

Ivy：强大的机器学习框架代码转换工具，支持PyTorch、TensorFlow、JAX、NumPy等主流框架之间的代码互转，可以轻松实现模型、工具和库的跨框架移植，支持即时转换和延迟转换两种模式，还

【Ivy：强大的机器学习框架代码转换工具，支持PyTorch、TensorFlow、JAX、NumPy等主流框架之间的代码互转，可以轻松实现模型、工具和库

2024-12-13 浏览详情

Zephyr：一个基于JAX的声明式神经网络库，让设计、创建和操作神经网络变得更简单快捷，特别适合想要快速实现机器学习想法的开发者

Zephyr：一个基于JAX的声明式神经网络库，让设计、创建和操作神经网络变得更简单快捷，特别适合想要快速实现机器学习想法的开发者

【Zephyr：一个基于JAX的声明式神经网络库，让设计、创建和操作神经网络变得更简单快捷，特别适合想要快速实现机器学习想法的开发者】'

2024-12-11 浏览详情

OLMo-core：AI2开源的OLMo语言模型核心构建模块，基于PyTorch实现，提供了完整的模型训练和优化组件，支持多种规模模型(1B-13B)训练，包含flash attention、floa

OLMo-core：AI2开源的OLMo语言模型核心构建模块，基于PyTorch实现，提供了完整的模型训练和优化组件，支持多种规模模型(1B-13B)训练，包含flash attention、floa

【OLMo-core：AI2开源的OLMo语言模型核心构建模块，基于PyTorch实现，提供了完整的模型训练和优化组件，支持多种规模模型(1B-13B)训练，包

2024-12-10 浏览详情

ComfyUI-HunyuanVideoWrapper：一个为HunyuanVideo模型开发的ComfyUI封装节点，可在ComfyUI环境中进行视频生成。支持flash_attn和sageattn

ComfyUI-HunyuanVideoWrapper：一个为HunyuanVideo模型开发的ComfyUI封装节点，可在ComfyUI环境中进行视频生成。支持flash_attn和sageattn

【ComfyUI-HunyuanVideoWrapper：一个为HunyuanVideo模型开发的ComfyUI封装节点，可在ComfyUI环境中进行视频生成。支持flash_attn和s

2024-12-09 浏览详情

Deep-ML开放问题库：一个开源的问题库，专注于线性代数、机器学习和深度学习，提供从零开始解决问题的丰富学习体验，助力网站Deep-ML

Deep-ML开放问题库：一个开源的问题库，专注于线性代数、机器学习和深度学习，提供从零开始解决问题的丰富学习体验，助力网站Deep-ML

【Deep-ML开放问题库：一个开源的问题库，专注于线性代数、机器学习和深度学习，提供从零开始解决问题的丰富学习体验，助力网站Deep-ML】

2024-12-09 浏览详情

conv_visualizer：一个神经网络卷积可视化工具，通过交互式界面让用户绘制数字或图形，实时展示神经网络中卷积层、池化层等处理过程。使用Processing和OpenGL技术实现高性能渲染，帮

conv_visualizer：一个神经网络卷积可视化工具，通过交互式界面让用户绘制数字或图形，实时展示神经网络中卷积层、池化层等处理过程。使用Processing和OpenGL技术实现高性能渲染，帮

【conv_visualizer：一个神经网络卷积可视化工具，通过交互式界面让用户绘制数字或图形，实时展示神经网络中卷积层、池化层等处理过程

2024-12-08 浏览详情

混元视频HunyuanVideo：腾讯开发的开源视频生成基础模型，采用统一的图像和视频生成架构，具备文本生成视频和图像转视频两大核心功能。特色包括多模态大语言模型文本编码器、3D VAE压缩技术和提示

混元视频HunyuanVideo：腾讯开发的开源视频生成基础模型，采用统一的图像和视频生成架构，具备文本生成视频和图像转视频两大核心功能。特色包括多模态大语言模型文本编码器、3D VAE压缩技术和提示

【混元视频HunyuanVideo：腾讯开发的开源视频生成基础模型，采用统一的图像和视频生成架构，具备文本生成视频和图像转视频两大核心功能

2024-12-05 浏览详情

FlowModels：基于Flow-Matching的生成模型实现库，提供了多种流匹配生成模型的参考实现，包括RectFlow、LADD、Shortcut等模型，支持文本生成图像、图像反演等功能，并提

FlowModels：基于Flow-Matching的生成模型实现库，提供了多种流匹配生成模型的参考实现，包括RectFlow、LADD、Shortcut等模型，支持文本生成图像、图像反演等功能，并提

【FlowModels：基于Flow-Matching的生成模型实现库，提供了多种流匹配生成模型的参考实现，包括RectFlow、LADD、Shortcut等模型，支持文

2024-12-05 浏览详情

Neptune：Google DeepMind发布的长视频理解数据集，包含超过2400个长视频和3200个问答对，专注于测试AI模型的长视频理解能力，涵盖视频总结、时序排序、状态变化等多个维度，提供多

Neptune：Google DeepMind发布的长视频理解数据集，包含超过2400个长视频和3200个问答对，专注于测试AI模型的长视频理解能力，涵盖视频总结、时序排序、状态变化等多个维度，提供多

【Neptune：Google DeepMind发布的长视频理解数据集，包含超过2400个长视频和3200个问答对，专注于测试AI模型的长视频理解能力，涵盖视频

2024-12-05 浏览详情

GenAI Book：《Hands-On Generative AI with Transformers and Diffusion Models》一书的配套资源库，包含完整的代码示例和练习答案。涵盖

GenAI Book：《Hands-On Generative AI with Transformers and Diffusion Models》一书的配套资源库，包含完整的代码示例和练习答案。涵盖

【GenAI Book：《Hands-On Generative AI with Transformers and Diffusion Models》一书的配套资源库，包含完整的代码示例和练习答

2024-12-04 浏览详情

Trolo：一个将Transformers与YOLO及其他单阶段检测器(SSD)结合的深度学习框架，提供高性能推理和便捷的CLI接口。支持D-FINE等先进模型，具备视频流推理、自动分布式训练等特性。

Trolo：一个将Transformers与YOLO及其他单阶段检测器(SSD)结合的深度学习框架，提供高性能推理和便捷的CLI接口。支持D-FINE等先进模型，具备视频流推理、自动分布式训练等特性。

【Trolo：一个将Transformers与YOLO及其他单阶段检测器(SSD)结合的深度学习框架，提供高性能推理和便捷的CLI接口。支持D-FINE等先进

2024-12-04 浏览详情

Auralis：一款高速文本转语音引擎，支持声音克隆功能。具有超快处理速度(10分钟可处理整本哈利波特)、智能批处理、多任务并行处理、流式处理长文本等特性。支持16种主流语言，可自动增强语音质量，即使

Auralis：一款高速文本转语音引擎，支持声音克隆功能。具有超快处理速度(10分钟可处理整本哈利波特)、智能批处理、多任务并行处理、流式处理长文本等特性。支持16种主流语言，可自动增强语音质量，即使

【Auralis：一款高速文本转语音引擎，支持声音克隆功能。具有超快处理速度(10分钟可处理整本哈利波特)、智能批处理、多任务并行处理

2024-12-02 浏览详情

Awesome-Scene-Graph-Generation：一个场景图生成(SGG)相关论文的精选集，包含了图像、视频、音频、3D等多模态场景图生成研究论文，并归纳了场景图数据集、评估指标以及在图像

Awesome-Scene-Graph-Generation：一个场景图生成(SGG)相关论文的精选集，包含了图像、视频、音频、3D等多模态场景图生成研究论文，并归纳了场景图数据集、评估指标以及在图像

【Awesome-Scene-Graph-Generation：一个场景图生成(SGG)相关论文的精选集，包含了图像、视频、音频、3D等多模态场景图生成研究论文，

2024-12-02 浏览详情

nano-simsiam：一个极简的PyTorch实现的SimSiam自监督学习框架，仅用400行代码实现，基于ResNet50在ImageNet上达到良好性能。支持分布式训练、实时KNN评估和自动混

nano-simsiam：一个极简的PyTorch实现的SimSiam自监督学习框架，仅用400行代码实现，基于ResNet50在ImageNet上达到良好性能。支持分布式训练、实时KNN评估和自动混

【nano-simsiam：一个极简的PyTorch实现的SimSiam自监督学习框架，仅用400行代码实现，基于ResNet50在ImageNet上达到良好性能。支持分

2024-12-02 浏览详情

PyTabKit：一个用于表格数据分类和回归的现代机器学习工具包，提供多种先进的模型(如RealMLP-TD、XGBoost等)的scikit-learn接口，支持自动GPU检测、类别特征处理、数据预

PyTabKit：一个用于表格数据分类和回归的现代机器学习工具包，提供多种先进的模型(如RealMLP-TD、XGBoost等)的scikit-learn接口，支持自动GPU检测、类别特征处理、数据预

【PyTabKit：一个用于表格数据分类和回归的现代机器学习工具包，提供多种先进的模型(如RealMLP-TD、XGBoost等)的scikit-learn接口，支

2024-11-30 浏览详情

Awesome-Efficient-MoE：专注于高效混合专家(MoE)模型相关研究的精选资源集合，收录了MoE模型及其高效变体的研究论文和资源。该仓库涵盖了稀疏MoE、MoE压缩、剪枝、量化、分解和

Awesome-Efficient-MoE：专注于高效混合专家(MoE)模型相关研究的精选资源集合，收录了MoE模型及其高效变体的研究论文和资源。该仓库涵盖了稀疏MoE、MoE压缩、剪枝、量化、分解和

【Awesome-Efficient-MoE：专注于高效混合专家(MoE)模型相关研究的精选资源集合，收录了MoE模型及其高效变体的研究论文和资源。该仓

2024-11-28 浏览详情

RePlay：一个全面的端到端推荐系统框架，集成了最新推荐算法模型。主要功能包括数据预处理和切分、多种推荐模型支持、超参数优化、全面的评估指标、模型集成和混合，以及从离线实验到在线生产的无缝切换。支持

RePlay：一个全面的端到端推荐系统框架，集成了最新推荐算法模型。主要功能包括数据预处理和切分、多种推荐模型支持、超参数优化、全面的评估指标、模型集成和混合，以及从离线实验到在线生产的无缝切换。支持

【RePlay：一个全面的端到端推荐系统框架，集成了最新推荐算法模型。主要功能包括数据预处理和切分、多种推荐模型支持、超参数优化、

2024-11-28 浏览详情

SAMURAI：基于SAM 2模型的零样本视觉追踪框架，引入了运动感知记忆机制，能够在视频中实时追踪和分割目标物体

SAMURAI：基于SAM 2模型的零样本视觉追踪框架，引入了运动感知记忆机制，能够在视频中实时追踪和分割目标物体

【SAMURAI：基于SAM 2模型的零样本视觉追踪框架，引入了运动感知记忆机制，能够在视频中实时追踪和分割目标物体】
'SAMURAI: Adapting

2024-11-28 浏览详情

Flux Layers Explorer：一个探索Flux Dev模型层级效果的工具，允许用户通过修改不同层的强度来研究模型行为，支持注意力层、双重块、单一块等多种层级的调整与实验

Flux Layers Explorer：一个探索Flux Dev模型层级效果的工具，允许用户通过修改不同层的强度来研究模型行为，支持注意力层、双重块、单一块等多种层级的调整与实验

【Flux Layers Explorer：一个探索Flux Dev模型层级效果的工具，允许用户通过修改不同层的强度来研究模型行为，支持注意力层、双重块、

2024-11-28 浏览详情

AnyModal：基于PyTorch的灵活多模态语言模型框架。支持轻松集成图像、音频等多种输入模态，提供模块化的架构设计，包含输入处理器、编码器和分词器三大核心组件。框架可扩展性强，便于添加新的输入模

AnyModal：基于PyTorch的灵活多模态语言模型框架。支持轻松集成图像、音频等多种输入模态，提供模块化的架构设计，包含输入处理器、编码器和分词器三大核心组件。框架可扩展性强，便于添加新的输入模

【AnyModal：基于PyTorch的灵活多模态语言模型框架。支持轻松集成图像、音频等多种输入模态，提供模块化的架构设计，包含输入处理器、

2024-11-24 浏览详情

activeft：基于PyTorch的主动学习微调库，专注于大型神经网络的自动数据选择。提供了高效的数据检索和选择机制，可以帮助优化模型微调过程中的数据使用，特别适用于大语言模型的测试时学习和转导式主

activeft：基于PyTorch的主动学习微调库，专注于大型神经网络的自动数据选择。提供了高效的数据检索和选择机制，可以帮助优化模型微调过程中的数据使用，特别适用于大语言模型的测试时学习和转导式主

【activeft：基于PyTorch的主动学习微调库，专注于大型神经网络的自动数据选择。提供了高效的数据检索和选择机制，可以帮助优化模型微

2024-11-24 浏览详情

DeepCompressor：大型语言模型和扩散模型的模型压缩工具箱，支持8bit以内的任何整数和浮点数据类型的假量化，例如INT8、INT4和FP4_E2M1，具有高效压缩和加速模型推理的特点

DeepCompressor：大型语言模型和扩散模型的模型压缩工具箱，支持8bit以内的任何整数和浮点数据类型的假量化，例如INT8、INT4和FP4_E2M1，具有高效压缩和加速模型推理的特点

【DeepCompressor：大型语言模型和扩散模型的模型压缩工具箱，支持8bit以内的任何整数和浮点数据类型的假量化，例如INT8、INT4和FP4_E2

2024-11-17 浏览详情

Video-XL：面向小时级视频理解的超长视觉语言模型，首个小时级视频理解模型

Video-XL：面向小时级视频理解的超长视觉语言模型，首个小时级视频理解模型

【Video-XL：面向小时级视频理解的超长视觉语言模型，首个小时级视频理解模型】'Video-XL: Extra-Long Vision Language Model for Ho

2024-10-28 浏览详情

TileLang/tvm：开源深度学习编译器堆栈，专为CPU、GPU和专业加速器设计，支持简化和高性能的GPU内核编写

TileLang/tvm：开源深度学习编译器堆栈，专为CPU、GPU和专业加速器设计，支持简化和高性能的GPU内核编写

【TileLang/tvm：开源深度学习编译器堆栈，专为CPU、GPU和专业加速器设计，支持简化和高性能的GPU内核编写】"TileLang/tvm: Open deep

2024-10-27 浏览详情

fastdata：轻量合成数据生成库，专为深度学习模型训练设计，能够快速生成用于语言模型训练的合成数据

fastdata：轻量合成数据生成库，专为深度学习模型训练设计，能够快速生成用于语言模型训练的合成数据

【fastdata：轻量合成数据生成库，专为深度学习模型训练设计，能够快速生成用于语言模型训练的合成数据】'fastdata - a minimal librar

2024-10-24 浏览详情

APL语言下的自回归transformer：在 APL 语言中实现自回归transformer（如 GPT2）的项目，支持反向传播和使用 Adam 优化算法进行训练，旨在结合高性能和简洁代码的优势

APL语言下的自回归transformer：在 APL 语言中实现自回归transformer（如 GPT2）的项目，支持反向传播和使用 Adam 优化算法进行训练，旨在结合高性能和简洁代码的优势

【APL语言下的自回归transformer：在 APL 语言中实现自回归transformer（如 GPT2）的项目，支持反向传播和使用 Adam 优化算法进行训练，旨

2024-10-16 浏览详情

nanoGPT-mup：专注于训练和微调中等大小 GPT 模型的最简仓库，是 karpathy/nanoGPT 的一个分支，并提供了最大更新参数化（muP）的最小实现

nanoGPT-mup：专注于训练和微调中等大小 GPT 模型的最简仓库，是 karpathy/nanoGPT 的一个分支，并提供了最大更新参数化（muP）的最小实现

【nanoGPT-mup：专注于训练和微调中等大小 GPT 模型的最简仓库，是 karpathy/nanoGPT 的一个分支，并提供了最大更新参数化（muP）的最小实

2024-10-01 浏览详情

fused-ssim：高效可微分的结构相似性指数(SSIM)实现，适用于深度学习中图像质量评估，特色在于完全融合的实现方式，减少了全局内存访问，提高了计算效率

fused-ssim：高效可微分的结构相似性指数(SSIM)实现，适用于深度学习中图像质量评估，特色在于完全融合的实现方式，减少了全局内存访问，提高了计算效率

【fused-ssim：高效可微分的结构相似性指数(SSIM)实现，适用于深度学习中图像质量评估，特色在于完全融合的实现方式，减少了全局内存访问

2024-09-18 浏览详情

免费书《机器学习导论》：由Laurent Younes撰写，涵盖机器学习算法的数学基础和分析技术，包括统计预测、核理论、Hilbert空间技术、监督学习算法、生成方法、图形模型、变分方法、深度生成模型

免费书《机器学习导论》：由Laurent Younes撰写，涵盖机器学习算法的数学基础和分析技术，包括统计预测、核理论、Hilbert空间技术、监督学习算法、生成方法、图形模型、变分方法、深度生成模型

【免费书《机器学习导论》：由Laurent Younes撰写，涵盖机器学习算法的数学基础和分析技术，包括统计预测、核理论、Hilbert空间技术、

2024-09-11 浏览详情

diffusers-torchao：利用torchao和diffusers优化扩散模型的端到端方案，支持推理和FP8训练

diffusers-torchao：利用torchao和diffusers优化扩散模型的端到端方案，支持推理和FP8训练

【diffusers-torchao：利用torchao和diffusers优化扩散模型的端到端方案，支持推理和FP8训练】'End-to-end recipes for optimizing d

2024-09-08 浏览详情

Sapiens-Pytorch-Inference：用于Pytorch中人体基础模型推理的最小代码和示例，支持多种任务并行运行，自动下载模型，提供ONNX导出脚本

Sapiens-Pytorch-Inference：用于Pytorch中人体基础模型推理的最小代码和示例，支持多种任务并行运行，自动下载模型，提供ONNX导出脚本

【Sapiens-Pytorch-Inference：用于Pytorch中人体基础模型推理的最小代码和示例，支持多种任务并行运行，自动下载模型，提供ONNX导出脚本

2024-09-05 浏览详情

AI算法库：基于多种深度学习框架的AI算法的原始实现，附带相关研究论文，旨在提供全面教育资源，帮助从零开始理解和实现基础AI概念

AI算法库：基于多种深度学习框架的AI算法的原始实现，附带相关研究论文，旨在提供全面教育资源，帮助从零开始理解和实现基础AI概念

【AI算法库：基于多种深度学习框架的AI算法的原始实现，附带相关研究论文，旨在提供全面教育资源，帮助从零开始理解和实现基础AI概念】'F

2024-09-03 浏览详情

线性神经网络讲座笔记：深度学习中的优化与泛化理论

线性神经网络讲座笔记：深度学习中的优化与泛化理论

【线性神经网络讲座笔记：深度学习中的优化与泛化理论】这是一份深度学习数学理解高级课程讲义，主要探讨了线性神经网络在优化和泛化

2024-09-02 浏览详情

ASTRA-sim 2.0：分布式机器学习系统模拟器，专注于现代深度学习系统的挑战研究，探索瓶颈问题并开发大型DNN模型的高效方法论

ASTRA-sim 2.0：分布式机器学习系统模拟器，专注于现代深度学习系统的挑战研究，探索瓶颈问题并开发大型DNN模型的高效方法论

【ASTRA-sim 2.0：分布式机器学习系统模拟器，专注于现代深度学习系统的挑战研究，探索瓶颈问题并开发大型DNN模型的高效方法论】'ASTRA

2024-09-01 浏览详情

从零开始的深度学习：为深度学习爱好者提供从基础到进阶的实践教程，包括Jupyter Notebook形式的代码，支持在云平台上执行，涵盖神经网络、变分自编码器等多个深度学习主题

从零开始的深度学习：为深度学习爱好者提供从基础到进阶的实践教程，包括Jupyter Notebook形式的代码，支持在云平台上执行，涵盖神经网络、变分自编码器等多个深度学习主题

【从零开始的深度学习：为深度学习爱好者提供从基础到进阶的实践教程，包括Jupyter Notebook形式的代码，支持在云平台上执行，涵盖神经网

2024-09-01 浏览详情

MiniTorch：旨在帮助机器学习工程师学习深度学习系统内部概念的自制教学库，它是一个用纯 Python 重写的 Torch API，旨在简单、易于阅读、经过测试且逐步增量

MiniTorch：旨在帮助机器学习工程师学习深度学习系统内部概念的自制教学库，它是一个用纯 Python 重写的 Torch API，旨在简单、易于阅读、经过测试且逐步增量

【MiniTorch：旨在帮助机器学习工程师学习深度学习系统内部概念的自制教学库，它是一个用纯 Python 重写的 Torch API，旨在简单、易于

2024-08-30 浏览详情

Hugging Face Deep Learning Containers for Google Cloud：为Google Cloud平台提供深度学习容器，支持训练和部署Transformers、S

Hugging Face Deep Learning Containers for Google Cloud：为Google Cloud平台提供深度学习容器，支持训练和部署Transformers、S

【Hugging Face Deep Learning Containers for Google Cloud：为Google Cloud平台提供深度学习容器，支持训练和部署Transformers、Se

2024-08-30 浏览详情

魔搭社区深度学习教程

【魔搭社区深度学习教程】'modelscope-classroom - Your AI Learning Hub' GitHub: github.com/modelscope/modelscope-classroom

2024-08-28 浏览详情

Zamba2：基于PyTorch的Zamba2系列模型实现，专注于低延迟和低内存占用的高性能混合模型，适用于设备端应用

Zamba2：基于PyTorch的Zamba2系列模型实现，专注于低延迟和低内存占用的高性能混合模型，适用于设备端应用

【Zamba2：基于PyTorch的Zamba2系列模型实现，专注于低延迟和低内存占用的高性能混合模型，适用于设备端应用】'Zamba2 - PyTorch imple

2024-08-26 浏览详情

Azula：PyTorch中的扩散模型实现，提供统一且可定制的接口，简化生成扩散模型的文献和实践

Azula：PyTorch中的扩散模型实现，提供统一且可定制的接口，简化生成扩散模型的文献和实践

【Azula：PyTorch中的扩散模型实现，提供统一且可定制的接口，简化生成扩散模型的文献和实践】'azula - Diffusion models in PyTorch'

2024-08-25 浏览详情

多平台推理引擎：支持多种硬件后端的RWKV轻量推理运行时，适用于移动设备和PC平台，简化不同硬件上的深度学习模型部署

多平台推理引擎：支持多种硬件后端的RWKV轻量推理运行时，适用于移动设备和PC平台，简化不同硬件上的深度学习模型部署

【多平台推理引擎：支持多种硬件后端的RWKV轻量推理运行时，适用于移动设备和PC平台，简化不同硬件上的深度学习模型部署】'rwkv-mobile

2024-08-22 浏览详情

正在拼命加载中

我是有底线的

没有更多的页面可以加载啦！