开源电子书:《大语言模型》...

开源电子书:《大语言模型》...

开源电子书:《大语言模型》
该教程全面覆盖了大语言模型领域的核心内容,包括基本原理讲解、预训练技术、微调方法、价值观对齐以及

2025-04-13浏览详情

Transformers Breakdown:深入剖析Transformer架构的代码解析项目。亮点:1. 逐行解读Transformer代码,适合初学者快速上手;2. 使用PyTorch实现,代码简

Transformers Breakdown:深入剖析Transformer架构的代码解析项目。亮点:1. 逐行解读Transformer代码,适合初学者快速上手;2. 使用PyTorch实现,代码简

【Transformers Breakdown:深入剖析Transformer架构的代码解析项目。亮点:1. 逐行解读Transformer代码,适合初学者快速上手;2. 使用Py

2025-03-26浏览详情

[214星] DeepSeek R1:介绍了如何从头构建 DeepSeek R1 模型,包括使用 Qwen 作为基础模型,应用 GRPO 算法进行初步训练,以及通过 Supervised Fine-T

[214星] DeepSeek R1:介绍了如何从头构建 DeepSeek R1 模型,包括使用 Qwen 作为基础模型,应用 GRPO 算法进行初步训练,以及通过 Supervised Fine-T

【[214星] DeepSeek R1:介绍了如何从头构建 DeepSeek R1 模型,包括使用 Qwen 作为基础模型,应用 GRPO 算法进行初步训练,以及通过 Sup

2025-02-28浏览详情

[80星]r1-ktransformers-guide:让你的DeepSeek-R1 GGUF模型在KTransformers上飞速运行。亮点:1. 性能提升近2倍,比llama.cpp更快;2. 支

[80星]r1-ktransformers-guide:让你的DeepSeek-R1 GGUF模型在KTransformers上飞速运行。亮点:1. 性能提升近2倍,比llama.cpp更快;2. 支

【[80星]r1-ktransformers-guide:让你的DeepSeek-R1 GGUF模型在KTransformers上飞速运行。亮点:1. 性能提升近2倍,比llama.cpp更快;2.

2025-02-24浏览详情

《理解深度学习》随书代码:各种深度学习模型的Colab Notebooks实现代码

《理解深度学习》随书代码:各种深度学习模型的Colab Notebooks实现代码

【《理解深度学习》随书代码:各种深度学习模型的Colab Notebooks实现代码】
'Understanding Deep Learning'
深度学习 Python

2025-02-16浏览详情

Transformers from Scratch:从零开始构建Transformer模型,带你深入理解自然语言处理的核心技术!亮点:1. 从基础概念到完整架构,逐步解析Transformer的每一个

Transformers from Scratch:从零开始构建Transformer模型,带你深入理解自然语言处理的核心技术!亮点:1. 从基础概念到完整架构,逐步解析Transformer的每一个

【Transformers from Scratch:从零开始构建Transformer模型,带你深入理解自然语言处理的核心技术!亮点:1. 从基础概念到完整架构,逐步

2025-02-12浏览详情

神经网络中的奥卡姆剃刀悖论...

神经网络中的奥卡姆剃刀悖论...

神经网络中的奥卡姆剃刀悖论,其实并不是真正的矛盾。

“简单即是美”这一科学哲学原则看似与神经网络的庞大参数空间背道而驰。但

2025-01-04浏览详情

NX-AI mLSTM Kernels:提供了一套快速高效的 mLSTM 核心库,支持并行、分块和循环步骤的处理方式,并提供了 PyTorch 和 JAX 的封装

NX-AI mLSTM Kernels:提供了一套快速高效的 mLSTM 核心库,支持并行、分块和循环步骤的处理方式,并提供了 PyTorch 和 JAX 的封装

【NX-AI mLSTM Kernels:提供了一套快速高效的 mLSTM 核心库,支持并行、分块和循环步骤的处理方式,并提供了 PyTorch 和 JAX 的封装】

2024-12-18浏览详情

DL4Proteins notebooks:深度学习工具箱,让生物分子结构预测和设计变得简单易懂,特别适合科研人员、教育工作者和学生使用,推动合成生物学和治疗学创新发展

DL4Proteins notebooks:深度学习工具箱,让生物分子结构预测和设计变得简单易懂,特别适合科研人员、教育工作者和学生使用,推动合成生物学和治疗学创新发展

【DL4Proteins notebooks:深度学习工具箱,让生物分子结构预测和设计变得简单易懂,特别适合科研人员、教育工作者和学生使用,推动合成

2024-12-18浏览详情

xLSTM-jax: JAX 实现的 xLSTM 模型库,提供高效的训练和推理代码

xLSTM-jax: JAX 实现的 xLSTM 模型库,提供高效的训练和推理代码

【xLSTM-jax: JAX 实现的 xLSTM 模型库,提供高效的训练和推理代码】'NX-AI/xlstm-jax: Official JAX implementation of xLSTM incl

2024-12-16浏览详情

Ivy:强大的机器学习框架代码转换工具,支持PyTorch、TensorFlow、JAX、NumPy等主流框架之间的代码互转,可以轻松实现模型、工具和库的跨框架移植,支持即时转换和延迟转换两种模式,还

Ivy:强大的机器学习框架代码转换工具,支持PyTorch、TensorFlow、JAX、NumPy等主流框架之间的代码互转,可以轻松实现模型、工具和库的跨框架移植,支持即时转换和延迟转换两种模式,还

【Ivy:强大的机器学习框架代码转换工具,支持PyTorch、TensorFlow、JAX、NumPy等主流框架之间的代码互转,可以轻松实现模型、工具和库

2024-12-13浏览详情

Zephyr:一个基于JAX的声明式神经网络库,让设计、创建和操作神经网络变得更简单快捷,特别适合想要快速实现机器学习想法的开发者

Zephyr:一个基于JAX的声明式神经网络库,让设计、创建和操作神经网络变得更简单快捷,特别适合想要快速实现机器学习想法的开发者

【Zephyr:一个基于JAX的声明式神经网络库,让设计、创建和操作神经网络变得更简单快捷,特别适合想要快速实现机器学习想法的开发者】'

2024-12-11浏览详情

OLMo-core:AI2开源的OLMo语言模型核心构建模块,基于PyTorch实现,提供了完整的模型训练和优化组件,支持多种规模模型(1B-13B)训练,包含flash attention、floa

OLMo-core:AI2开源的OLMo语言模型核心构建模块,基于PyTorch实现,提供了完整的模型训练和优化组件,支持多种规模模型(1B-13B)训练,包含flash attention、floa

【OLMo-core:AI2开源的OLMo语言模型核心构建模块,基于PyTorch实现,提供了完整的模型训练和优化组件,支持多种规模模型(1B-13B)训练,包

2024-12-10浏览详情

ComfyUI-HunyuanVideoWrapper:一个为HunyuanVideo模型开发的ComfyUI封装节点,可在ComfyUI环境中进行视频生成。支持flash_attn和sageattn

ComfyUI-HunyuanVideoWrapper:一个为HunyuanVideo模型开发的ComfyUI封装节点,可在ComfyUI环境中进行视频生成。支持flash_attn和sageattn

【ComfyUI-HunyuanVideoWrapper:一个为HunyuanVideo模型开发的ComfyUI封装节点,可在ComfyUI环境中进行视频生成。支持flash_attn和s

2024-12-09浏览详情

Deep-ML开放问题库:一个开源的问题库,专注于线性代数、机器学习和深度学习,提供从零开始解决问题的丰富学习体验,助力网站Deep-ML

Deep-ML开放问题库:一个开源的问题库,专注于线性代数、机器学习和深度学习,提供从零开始解决问题的丰富学习体验,助力网站Deep-ML

【Deep-ML开放问题库:一个开源的问题库,专注于线性代数、机器学习和深度学习,提供从零开始解决问题的丰富学习体验,助力网站Deep-ML】

2024-12-09浏览详情

conv_visualizer:一个神经网络卷积可视化工具,通过交互式界面让用户绘制数字或图形,实时展示神经网络中卷积层、池化层等处理过程。使用Processing和OpenGL技术实现高性能渲染,帮

conv_visualizer:一个神经网络卷积可视化工具,通过交互式界面让用户绘制数字或图形,实时展示神经网络中卷积层、池化层等处理过程。使用Processing和OpenGL技术实现高性能渲染,帮

【conv_visualizer:一个神经网络卷积可视化工具,通过交互式界面让用户绘制数字或图形,实时展示神经网络中卷积层、池化层等处理过程

2024-12-08浏览详情

混元视频HunyuanVideo:腾讯开发的开源视频生成基础模型,采用统一的图像和视频生成架构,具备文本生成视频和图像转视频两大核心功能。特色包括多模态大语言模型文本编码器、3D VAE压缩技术和提示

混元视频HunyuanVideo:腾讯开发的开源视频生成基础模型,采用统一的图像和视频生成架构,具备文本生成视频和图像转视频两大核心功能。特色包括多模态大语言模型文本编码器、3D VAE压缩技术和提示

【混元视频HunyuanVideo:腾讯开发的开源视频生成基础模型,采用统一的图像和视频生成架构,具备文本生成视频和图像转视频两大核心功能

2024-12-05浏览详情

FlowModels:基于Flow-Matching的生成模型实现库,提供了多种流匹配生成模型的参考实现,包括RectFlow、LADD、Shortcut等模型,支持文本生成图像、图像反演等功能,并提

FlowModels:基于Flow-Matching的生成模型实现库,提供了多种流匹配生成模型的参考实现,包括RectFlow、LADD、Shortcut等模型,支持文本生成图像、图像反演等功能,并提

【FlowModels:基于Flow-Matching的生成模型实现库,提供了多种流匹配生成模型的参考实现,包括RectFlow、LADD、Shortcut等模型,支持文

2024-12-05浏览详情

Neptune:Google DeepMind发布的长视频理解数据集,包含超过2400个长视频和3200个问答对,专注于测试AI模型的长视频理解能力,涵盖视频总结、时序排序、状态变化等多个维度,提供多

Neptune:Google DeepMind发布的长视频理解数据集,包含超过2400个长视频和3200个问答对,专注于测试AI模型的长视频理解能力,涵盖视频总结、时序排序、状态变化等多个维度,提供多

【Neptune:Google DeepMind发布的长视频理解数据集,包含超过2400个长视频和3200个问答对,专注于测试AI模型的长视频理解能力,涵盖视频

2024-12-05浏览详情

GenAI Book:《Hands-On Generative AI with Transformers and Diffusion Models》一书的配套资源库,包含完整的代码示例和练习答案。涵盖

GenAI Book:《Hands-On Generative AI with Transformers and Diffusion Models》一书的配套资源库,包含完整的代码示例和练习答案。涵盖

【GenAI Book:《Hands-On Generative AI with Transformers and Diffusion Models》一书的配套资源库,包含完整的代码示例和练习答

2024-12-04浏览详情

Trolo:一个将Transformers与YOLO及其他单阶段检测器(SSD)结合的深度学习框架,提供高性能推理和便捷的CLI接口。支持D-FINE等先进模型,具备视频流推理、自动分布式训练等特性。

Trolo:一个将Transformers与YOLO及其他单阶段检测器(SSD)结合的深度学习框架,提供高性能推理和便捷的CLI接口。支持D-FINE等先进模型,具备视频流推理、自动分布式训练等特性。

【Trolo:一个将Transformers与YOLO及其他单阶段检测器(SSD)结合的深度学习框架,提供高性能推理和便捷的CLI接口。支持D-FINE等先进

2024-12-04浏览详情

Auralis:一款高速文本转语音引擎,支持声音克隆功能。具有超快处理速度(10分钟可处理整本哈利波特)、智能批处理、多任务并行处理、流式处理长文本等特性。支持16种主流语言,可自动增强语音质量,即使

Auralis:一款高速文本转语音引擎,支持声音克隆功能。具有超快处理速度(10分钟可处理整本哈利波特)、智能批处理、多任务并行处理、流式处理长文本等特性。支持16种主流语言,可自动增强语音质量,即使

【Auralis:一款高速文本转语音引擎,支持声音克隆功能。具有超快处理速度(10分钟可处理整本哈利波特)、智能批处理、多任务并行处理

2024-12-02浏览详情

Awesome-Scene-Graph-Generation:一个场景图生成(SGG)相关论文的精选集,包含了图像、视频、音频、3D等多模态场景图生成研究论文,并归纳了场景图数据集、评估指标以及在图像

Awesome-Scene-Graph-Generation:一个场景图生成(SGG)相关论文的精选集,包含了图像、视频、音频、3D等多模态场景图生成研究论文,并归纳了场景图数据集、评估指标以及在图像

【Awesome-Scene-Graph-Generation:一个场景图生成(SGG)相关论文的精选集,包含了图像、视频、音频、3D等多模态场景图生成研究论文,

2024-12-02浏览详情

nano-simsiam:一个极简的PyTorch实现的SimSiam自监督学习框架,仅用400行代码实现,基于ResNet50在ImageNet上达到良好性能。支持分布式训练、实时KNN评估和自动混

nano-simsiam:一个极简的PyTorch实现的SimSiam自监督学习框架,仅用400行代码实现,基于ResNet50在ImageNet上达到良好性能。支持分布式训练、实时KNN评估和自动混

【nano-simsiam:一个极简的PyTorch实现的SimSiam自监督学习框架,仅用400行代码实现,基于ResNet50在ImageNet上达到良好性能。支持分

2024-12-02浏览详情

PyTabKit:一个用于表格数据分类和回归的现代机器学习工具包,提供多种先进的模型(如RealMLP-TD、XGBoost等)的scikit-learn接口,支持自动GPU检测、类别特征处理、数据预

PyTabKit:一个用于表格数据分类和回归的现代机器学习工具包,提供多种先进的模型(如RealMLP-TD、XGBoost等)的scikit-learn接口,支持自动GPU检测、类别特征处理、数据预

【PyTabKit:一个用于表格数据分类和回归的现代机器学习工具包,提供多种先进的模型(如RealMLP-TD、XGBoost等)的scikit-learn接口,支

2024-11-30浏览详情

Awesome-Efficient-MoE:专注于高效混合专家(MoE)模型相关研究的精选资源集合,收录了MoE模型及其高效变体的研究论文和资源。该仓库涵盖了稀疏MoE、MoE压缩、剪枝、量化、分解和

Awesome-Efficient-MoE:专注于高效混合专家(MoE)模型相关研究的精选资源集合,收录了MoE模型及其高效变体的研究论文和资源。该仓库涵盖了稀疏MoE、MoE压缩、剪枝、量化、分解和

【Awesome-Efficient-MoE:专注于高效混合专家(MoE)模型相关研究的精选资源集合,收录了MoE模型及其高效变体的研究论文和资源。该仓

2024-11-28浏览详情

RePlay:一个全面的端到端推荐系统框架,集成了最新推荐算法模型。主要功能包括数据预处理和切分、多种推荐模型支持、超参数优化、全面的评估指标、模型集成和混合,以及从离线实验到在线生产的无缝切换。支持

RePlay:一个全面的端到端推荐系统框架,集成了最新推荐算法模型。主要功能包括数据预处理和切分、多种推荐模型支持、超参数优化、全面的评估指标、模型集成和混合,以及从离线实验到在线生产的无缝切换。支持

【RePlay:一个全面的端到端推荐系统框架,集成了最新推荐算法模型。主要功能包括数据预处理和切分、多种推荐模型支持、超参数优化、

2024-11-28浏览详情

SAMURAI:基于SAM 2模型的零样本视觉追踪框架,引入了运动感知记忆机制,能够在视频中实时追踪和分割目标物体

SAMURAI:基于SAM 2模型的零样本视觉追踪框架,引入了运动感知记忆机制,能够在视频中实时追踪和分割目标物体

【SAMURAI:基于SAM 2模型的零样本视觉追踪框架,引入了运动感知记忆机制,能够在视频中实时追踪和分割目标物体】
'SAMURAI: Adapting

2024-11-28浏览详情

Flux Layers Explorer:一个探索Flux Dev模型层级效果的工具,允许用户通过修改不同层的强度来研究模型行为,支持注意力层、双重块、单一块等多种层级的调整与实验

Flux Layers Explorer:一个探索Flux Dev模型层级效果的工具,允许用户通过修改不同层的强度来研究模型行为,支持注意力层、双重块、单一块等多种层级的调整与实验

【Flux Layers Explorer:一个探索Flux Dev模型层级效果的工具,允许用户通过修改不同层的强度来研究模型行为,支持注意力层、双重块、

2024-11-28浏览详情

AnyModal:基于PyTorch的灵活多模态语言模型框架。支持轻松集成图像、音频等多种输入模态,提供模块化的架构设计,包含输入处理器、编码器和分词器三大核心组件。框架可扩展性强,便于添加新的输入模

AnyModal:基于PyTorch的灵活多模态语言模型框架。支持轻松集成图像、音频等多种输入模态,提供模块化的架构设计,包含输入处理器、编码器和分词器三大核心组件。框架可扩展性强,便于添加新的输入模

【AnyModal:基于PyTorch的灵活多模态语言模型框架。支持轻松集成图像、音频等多种输入模态,提供模块化的架构设计,包含输入处理器、

2024-11-24浏览详情

activeft:基于PyTorch的主动学习微调库,专注于大型神经网络的自动数据选择。提供了高效的数据检索和选择机制,可以帮助优化模型微调过程中的数据使用,特别适用于大语言模型的测试时学习和转导式主

activeft:基于PyTorch的主动学习微调库,专注于大型神经网络的自动数据选择。提供了高效的数据检索和选择机制,可以帮助优化模型微调过程中的数据使用,特别适用于大语言模型的测试时学习和转导式主

【activeft:基于PyTorch的主动学习微调库,专注于大型神经网络的自动数据选择。提供了高效的数据检索和选择机制,可以帮助优化模型微

2024-11-24浏览详情

DeepCompressor:大型语言模型和扩散模型的模型压缩工具箱,支持8bit以内的任何整数和浮点数据类型的假量化,例如INT8、INT4和FP4_E2M1,具有高效压缩和加速模型推理的特点

DeepCompressor:大型语言模型和扩散模型的模型压缩工具箱,支持8bit以内的任何整数和浮点数据类型的假量化,例如INT8、INT4和FP4_E2M1,具有高效压缩和加速模型推理的特点

【DeepCompressor:大型语言模型和扩散模型的模型压缩工具箱,支持8bit以内的任何整数和浮点数据类型的假量化,例如INT8、INT4和FP4_E2

2024-11-17浏览详情

Video-XL:面向小时级视频理解的超长视觉语言模型,首个小时级视频理解模型

Video-XL:面向小时级视频理解的超长视觉语言模型,首个小时级视频理解模型

【Video-XL:面向小时级视频理解的超长视觉语言模型,首个小时级视频理解模型】'Video-XL: Extra-Long Vision Language Model for Ho

2024-10-28浏览详情

TileLang/tvm:开源深度学习编译器堆栈,专为CPU、GPU和专业加速器设计,支持简化和高性能的GPU内核编写

TileLang/tvm:开源深度学习编译器堆栈,专为CPU、GPU和专业加速器设计,支持简化和高性能的GPU内核编写

【TileLang/tvm:开源深度学习编译器堆栈,专为CPU、GPU和专业加速器设计,支持简化和高性能的GPU内核编写】"TileLang/tvm: Open deep

2024-10-27浏览详情

fastdata:轻量合成数据生成库,专为深度学习模型训练设计,能够快速生成用于语言模型训练的合成数据

fastdata:轻量合成数据生成库,专为深度学习模型训练设计,能够快速生成用于语言模型训练的合成数据

【fastdata:轻量合成数据生成库,专为深度学习模型训练设计,能够快速生成用于语言模型训练的合成数据】'fastdata - a minimal librar

2024-10-24浏览详情

APL语言下的自回归transformer:在 APL 语言中实现自回归transformer(如 GPT2)的项目,支持反向传播和使用 Adam 优化算法进行训练,旨在结合高性能和简洁代码的优势

APL语言下的自回归transformer:在 APL 语言中实现自回归transformer(如 GPT2)的项目,支持反向传播和使用 Adam 优化算法进行训练,旨在结合高性能和简洁代码的优势

【APL语言下的自回归transformer:在 APL 语言中实现自回归transformer(如 GPT2)的项目,支持反向传播和使用 Adam 优化算法进行训练,旨

2024-10-16浏览详情

nanoGPT-mup:专注于训练和微调中等大小 GPT 模型的最简仓库,是 karpathy/nanoGPT 的一个分支,并提供了最大更新参数化(muP)的最小实现

nanoGPT-mup:专注于训练和微调中等大小 GPT 模型的最简仓库,是 karpathy/nanoGPT 的一个分支,并提供了最大更新参数化(muP)的最小实现

【nanoGPT-mup:专注于训练和微调中等大小 GPT 模型的最简仓库,是 karpathy/nanoGPT 的一个分支,并提供了最大更新参数化(muP)的最小实

2024-10-01浏览详情

fused-ssim:高效可微分的结构相似性指数(SSIM)实现,适用于深度学习中图像质量评估,特色在于完全融合的实现方式,减少了全局内存访问,提高了计算效率

fused-ssim:高效可微分的结构相似性指数(SSIM)实现,适用于深度学习中图像质量评估,特色在于完全融合的实现方式,减少了全局内存访问,提高了计算效率

【fused-ssim:高效可微分的结构相似性指数(SSIM)实现,适用于深度学习中图像质量评估,特色在于完全融合的实现方式,减少了全局内存访问

2024-09-18浏览详情

免费书《机器学习导论》:由Laurent Younes撰写,涵盖机器学习算法的数学基础和分析技术,包括统计预测、核理论、Hilbert空间技术、监督学习算法、生成方法、图形模型、变分方法、深度生成模型

免费书《机器学习导论》:由Laurent Younes撰写,涵盖机器学习算法的数学基础和分析技术,包括统计预测、核理论、Hilbert空间技术、监督学习算法、生成方法、图形模型、变分方法、深度生成模型

【免费书《机器学习导论》:由Laurent Younes撰写,涵盖机器学习算法的数学基础和分析技术,包括统计预测、核理论、Hilbert空间技术、

2024-09-11浏览详情

diffusers-torchao:利用torchao和diffusers优化扩散模型的端到端方案,支持推理和FP8训练

diffusers-torchao:利用torchao和diffusers优化扩散模型的端到端方案,支持推理和FP8训练

【diffusers-torchao:利用torchao和diffusers优化扩散模型的端到端方案,支持推理和FP8训练】'End-to-end recipes for optimizing d

2024-09-08浏览详情

Sapiens-Pytorch-Inference:用于Pytorch中人体基础模型推理的最小代码和示例,支持多种任务并行运行,自动下载模型,提供ONNX导出脚本

Sapiens-Pytorch-Inference:用于Pytorch中人体基础模型推理的最小代码和示例,支持多种任务并行运行,自动下载模型,提供ONNX导出脚本

【Sapiens-Pytorch-Inference:用于Pytorch中人体基础模型推理的最小代码和示例,支持多种任务并行运行,自动下载模型,提供ONNX导出脚本

2024-09-05浏览详情

AI算法库:基于多种深度学习框架的AI算法的原始实现,附带相关研究论文,旨在提供全面教育资源,帮助从零开始理解和实现基础AI概念

AI算法库:基于多种深度学习框架的AI算法的原始实现,附带相关研究论文,旨在提供全面教育资源,帮助从零开始理解和实现基础AI概念

【AI算法库:基于多种深度学习框架的AI算法的原始实现,附带相关研究论文,旨在提供全面教育资源,帮助从零开始理解和实现基础AI概念】'F

2024-09-03浏览详情

线性神经网络讲座笔记:深度学习中的优化与泛化理论

线性神经网络讲座笔记:深度学习中的优化与泛化理论

【线性神经网络讲座笔记:深度学习中的优化与泛化理论】这是一份深度学习数学理解高级课程讲义,主要探讨了线性神经网络在优化和泛化

2024-09-02浏览详情

ASTRA-sim 2.0:分布式机器学习系统模拟器,专注于现代深度学习系统的挑战研究,探索瓶颈问题并开发大型DNN模型的高效方法论

ASTRA-sim 2.0:分布式机器学习系统模拟器,专注于现代深度学习系统的挑战研究,探索瓶颈问题并开发大型DNN模型的高效方法论

【ASTRA-sim 2.0:分布式机器学习系统模拟器,专注于现代深度学习系统的挑战研究,探索瓶颈问题并开发大型DNN模型的高效方法论】'ASTRA

2024-09-01浏览详情

从零开始的深度学习:为深度学习爱好者提供从基础到进阶的实践教程,包括Jupyter Notebook形式的代码,支持在云平台上执行,涵盖神经网络、变分自编码器等多个深度学习主题

从零开始的深度学习:为深度学习爱好者提供从基础到进阶的实践教程,包括Jupyter Notebook形式的代码,支持在云平台上执行,涵盖神经网络、变分自编码器等多个深度学习主题

【从零开始的深度学习:为深度学习爱好者提供从基础到进阶的实践教程,包括Jupyter Notebook形式的代码,支持在云平台上执行,涵盖神经网

2024-09-01浏览详情

MiniTorch:旨在帮助机器学习工程师学习深度学习系统内部概念的自制教学库,它是一个用纯 Python 重写的 Torch API,旨在简单、易于阅读、经过测试且逐步增量

MiniTorch:旨在帮助机器学习工程师学习深度学习系统内部概念的自制教学库,它是一个用纯 Python 重写的 Torch API,旨在简单、易于阅读、经过测试且逐步增量

【MiniTorch:旨在帮助机器学习工程师学习深度学习系统内部概念的自制教学库,它是一个用纯 Python 重写的 Torch API,旨在简单、易于

2024-08-30浏览详情

Hugging Face Deep Learning Containers for Google Cloud:为Google Cloud平台提供深度学习容器,支持训练和部署Transformers、S

Hugging Face Deep Learning Containers for Google Cloud:为Google Cloud平台提供深度学习容器,支持训练和部署Transformers、S

【Hugging Face Deep Learning Containers for Google Cloud:为Google Cloud平台提供深度学习容器,支持训练和部署Transformers、Se

2024-08-30浏览详情

魔搭社区深度学习教程

魔搭社区深度学习教程

【魔搭社区深度学习教程】'modelscope-classroom - Your AI Learning Hub' GitHub: github.com/modelscope/modelscope-classroom

2024-08-28浏览详情

Zamba2:基于PyTorch的Zamba2系列模型实现,专注于低延迟和低内存占用的高性能混合模型,适用于设备端应用

Zamba2:基于PyTorch的Zamba2系列模型实现,专注于低延迟和低内存占用的高性能混合模型,适用于设备端应用

【Zamba2:基于PyTorch的Zamba2系列模型实现,专注于低延迟和低内存占用的高性能混合模型,适用于设备端应用】'Zamba2 - PyTorch imple

2024-08-26浏览详情

Azula:PyTorch中的扩散模型实现,提供统一且可定制的接口,简化生成扩散模型的文献和实践

Azula:PyTorch中的扩散模型实现,提供统一且可定制的接口,简化生成扩散模型的文献和实践

【Azula:PyTorch中的扩散模型实现,提供统一且可定制的接口,简化生成扩散模型的文献和实践】'azula - Diffusion models in PyTorch'

2024-08-25浏览详情

多平台推理引擎:支持多种硬件后端的RWKV轻量推理运行时,适用于移动设备和PC平台,简化不同硬件上的深度学习模型部署

多平台推理引擎:支持多种硬件后端的RWKV轻量推理运行时,适用于移动设备和PC平台,简化不同硬件上的深度学习模型部署

【多平台推理引擎:支持多种硬件后端的RWKV轻量推理运行时,适用于移动设备和PC平台,简化不同硬件上的深度学习模型部署】'rwkv-mobile

2024-08-22浏览详情

正在拼命加载中

我是有底线的

没有更多的页面可以加载啦!