开源电子书:《大语言模型》 该教程全面覆盖了大语言模型领域的核心内容,包括基本原理讲解、预训练技术、微调方法、价值观对齐以及
2025-04-13浏览详情
【Transformers Breakdown:深入剖析Transformer架构的代码解析项目。亮点:1. 逐行解读Transformer代码,适合初学者快速上手;2. 使用Py
2025-03-26浏览详情
【[214星] DeepSeek R1:介绍了如何从头构建 DeepSeek R1 模型,包括使用 Qwen 作为基础模型,应用 GRPO 算法进行初步训练,以及通过 Sup
2025-02-28浏览详情
【[80星]r1-ktransformers-guide:让你的DeepSeek-R1 GGUF模型在KTransformers上飞速运行。亮点:1. 性能提升近2倍,比llama.cpp更快;2.
2025-02-24浏览详情
【《理解深度学习》随书代码:各种深度学习模型的Colab Notebooks实现代码】 'Understanding Deep Learning' 深度学习 Python
2025-02-16浏览详情
【Transformers from Scratch:从零开始构建Transformer模型,带你深入理解自然语言处理的核心技术!亮点:1. 从基础概念到完整架构,逐步
2025-02-12浏览详情
神经网络中的奥卡姆剃刀悖论,其实并不是真正的矛盾。 “简单即是美”这一科学哲学原则看似与神经网络的庞大参数空间背道而驰。但
2025-01-04浏览详情
【NX-AI mLSTM Kernels:提供了一套快速高效的 mLSTM 核心库,支持并行、分块和循环步骤的处理方式,并提供了 PyTorch 和 JAX 的封装】
2024-12-18浏览详情
【DL4Proteins notebooks:深度学习工具箱,让生物分子结构预测和设计变得简单易懂,特别适合科研人员、教育工作者和学生使用,推动合成
【xLSTM-jax: JAX 实现的 xLSTM 模型库,提供高效的训练和推理代码】'NX-AI/xlstm-jax: Official JAX implementation of xLSTM incl
2024-12-16浏览详情
【Ivy:强大的机器学习框架代码转换工具,支持PyTorch、TensorFlow、JAX、NumPy等主流框架之间的代码互转,可以轻松实现模型、工具和库
2024-12-13浏览详情
【Zephyr:一个基于JAX的声明式神经网络库,让设计、创建和操作神经网络变得更简单快捷,特别适合想要快速实现机器学习想法的开发者】'
2024-12-11浏览详情
【OLMo-core:AI2开源的OLMo语言模型核心构建模块,基于PyTorch实现,提供了完整的模型训练和优化组件,支持多种规模模型(1B-13B)训练,包
2024-12-10浏览详情
【ComfyUI-HunyuanVideoWrapper:一个为HunyuanVideo模型开发的ComfyUI封装节点,可在ComfyUI环境中进行视频生成。支持flash_attn和s
2024-12-09浏览详情
【Deep-ML开放问题库:一个开源的问题库,专注于线性代数、机器学习和深度学习,提供从零开始解决问题的丰富学习体验,助力网站Deep-ML】
【conv_visualizer:一个神经网络卷积可视化工具,通过交互式界面让用户绘制数字或图形,实时展示神经网络中卷积层、池化层等处理过程
2024-12-08浏览详情
【混元视频HunyuanVideo:腾讯开发的开源视频生成基础模型,采用统一的图像和视频生成架构,具备文本生成视频和图像转视频两大核心功能
2024-12-05浏览详情
【FlowModels:基于Flow-Matching的生成模型实现库,提供了多种流匹配生成模型的参考实现,包括RectFlow、LADD、Shortcut等模型,支持文
【Neptune:Google DeepMind发布的长视频理解数据集,包含超过2400个长视频和3200个问答对,专注于测试AI模型的长视频理解能力,涵盖视频
【GenAI Book:《Hands-On Generative AI with Transformers and Diffusion Models》一书的配套资源库,包含完整的代码示例和练习答
2024-12-04浏览详情
【Trolo:一个将Transformers与YOLO及其他单阶段检测器(SSD)结合的深度学习框架,提供高性能推理和便捷的CLI接口。支持D-FINE等先进
【Auralis:一款高速文本转语音引擎,支持声音克隆功能。具有超快处理速度(10分钟可处理整本哈利波特)、智能批处理、多任务并行处理
2024-12-02浏览详情
【Awesome-Scene-Graph-Generation:一个场景图生成(SGG)相关论文的精选集,包含了图像、视频、音频、3D等多模态场景图生成研究论文,
【nano-simsiam:一个极简的PyTorch实现的SimSiam自监督学习框架,仅用400行代码实现,基于ResNet50在ImageNet上达到良好性能。支持分
【PyTabKit:一个用于表格数据分类和回归的现代机器学习工具包,提供多种先进的模型(如RealMLP-TD、XGBoost等)的scikit-learn接口,支
2024-11-30浏览详情
【Awesome-Efficient-MoE:专注于高效混合专家(MoE)模型相关研究的精选资源集合,收录了MoE模型及其高效变体的研究论文和资源。该仓
2024-11-28浏览详情
【RePlay:一个全面的端到端推荐系统框架,集成了最新推荐算法模型。主要功能包括数据预处理和切分、多种推荐模型支持、超参数优化、
【SAMURAI:基于SAM 2模型的零样本视觉追踪框架,引入了运动感知记忆机制,能够在视频中实时追踪和分割目标物体】 'SAMURAI: Adapting
【Flux Layers Explorer:一个探索Flux Dev模型层级效果的工具,允许用户通过修改不同层的强度来研究模型行为,支持注意力层、双重块、
【AnyModal:基于PyTorch的灵活多模态语言模型框架。支持轻松集成图像、音频等多种输入模态,提供模块化的架构设计,包含输入处理器、
2024-11-24浏览详情
【activeft:基于PyTorch的主动学习微调库,专注于大型神经网络的自动数据选择。提供了高效的数据检索和选择机制,可以帮助优化模型微
【DeepCompressor:大型语言模型和扩散模型的模型压缩工具箱,支持8bit以内的任何整数和浮点数据类型的假量化,例如INT8、INT4和FP4_E2
2024-11-17浏览详情
【Video-XL:面向小时级视频理解的超长视觉语言模型,首个小时级视频理解模型】'Video-XL: Extra-Long Vision Language Model for Ho
2024-10-28浏览详情
【TileLang/tvm:开源深度学习编译器堆栈,专为CPU、GPU和专业加速器设计,支持简化和高性能的GPU内核编写】"TileLang/tvm: Open deep
2024-10-27浏览详情
【fastdata:轻量合成数据生成库,专为深度学习模型训练设计,能够快速生成用于语言模型训练的合成数据】'fastdata - a minimal librar
2024-10-24浏览详情
【APL语言下的自回归transformer:在 APL 语言中实现自回归transformer(如 GPT2)的项目,支持反向传播和使用 Adam 优化算法进行训练,旨
2024-10-16浏览详情
【nanoGPT-mup:专注于训练和微调中等大小 GPT 模型的最简仓库,是 karpathy/nanoGPT 的一个分支,并提供了最大更新参数化(muP)的最小实
2024-10-01浏览详情
【fused-ssim:高效可微分的结构相似性指数(SSIM)实现,适用于深度学习中图像质量评估,特色在于完全融合的实现方式,减少了全局内存访问
2024-09-18浏览详情
【免费书《机器学习导论》:由Laurent Younes撰写,涵盖机器学习算法的数学基础和分析技术,包括统计预测、核理论、Hilbert空间技术、
2024-09-11浏览详情
【diffusers-torchao:利用torchao和diffusers优化扩散模型的端到端方案,支持推理和FP8训练】'End-to-end recipes for optimizing d
2024-09-08浏览详情
【Sapiens-Pytorch-Inference:用于Pytorch中人体基础模型推理的最小代码和示例,支持多种任务并行运行,自动下载模型,提供ONNX导出脚本
2024-09-05浏览详情
【AI算法库:基于多种深度学习框架的AI算法的原始实现,附带相关研究论文,旨在提供全面教育资源,帮助从零开始理解和实现基础AI概念】'F
2024-09-03浏览详情
【线性神经网络讲座笔记:深度学习中的优化与泛化理论】这是一份深度学习数学理解高级课程讲义,主要探讨了线性神经网络在优化和泛化
2024-09-02浏览详情
【ASTRA-sim 2.0:分布式机器学习系统模拟器,专注于现代深度学习系统的挑战研究,探索瓶颈问题并开发大型DNN模型的高效方法论】'ASTRA
2024-09-01浏览详情
【从零开始的深度学习:为深度学习爱好者提供从基础到进阶的实践教程,包括Jupyter Notebook形式的代码,支持在云平台上执行,涵盖神经网
【MiniTorch:旨在帮助机器学习工程师学习深度学习系统内部概念的自制教学库,它是一个用纯 Python 重写的 Torch API,旨在简单、易于
2024-08-30浏览详情
【Hugging Face Deep Learning Containers for Google Cloud:为Google Cloud平台提供深度学习容器,支持训练和部署Transformers、Se
【魔搭社区深度学习教程】'modelscope-classroom - Your AI Learning Hub' GitHub: github.com/modelscope/modelscope-classroom
2024-08-28浏览详情
【Zamba2:基于PyTorch的Zamba2系列模型实现,专注于低延迟和低内存占用的高性能混合模型,适用于设备端应用】'Zamba2 - PyTorch imple
2024-08-26浏览详情
【Azula:PyTorch中的扩散模型实现,提供统一且可定制的接口,简化生成扩散模型的文献和实践】'azula - Diffusion models in PyTorch'
2024-08-25浏览详情
【多平台推理引擎:支持多种硬件后端的RWKV轻量推理运行时,适用于移动设备和PC平台,简化不同硬件上的深度学习模型部署】'rwkv-mobile
2024-08-22浏览详情
正在拼命加载中
我是有底线的
没有更多的页面可以加载啦!