Deepseek团队发表论文了 一姐有办法 2025-02-22 08:08:12 Deepseek团队发表论文了!论文第一作者是北大硕士实习生,梁文锋也署名了。论文精彩之处在于:介绍了一种NSA架构机制可用于长文本上下文推理,能实现长文本处理上的“降本增效”!对于大模型算法厂商来说无疑是一大福音:这相当于Deepseek公开了核心专利,有需要的大模型厂商可以直接用。Deepseek这是真开源啊!