大模型日报ai前沿动态 【面向创新连贯LLM输出的Min-p采样】 链接:网页链接 论文概述:本文提出了min-p采样,一种动态调整阈值的采
2025-01-02浏览详情
大模型日报 ai前沿动态 【抽象的涌现: Transformer上下文学习的概念编码和解码机制】 链接:网页链接 论文概述: 本文通过提出“
2024-12-24浏览详情
大模型日报 ai前沿动态 【用机器学习探索物理概念和方程式】 链接:网页链接 论文概述:该论文提出了一种新的基于机器学习的框架,
2024-12-23浏览详情
ai前沿动态 大模型日报 【随机特征集成没有免费午餐】 链接:网页链接 论文概述:本文从理论和实验上证明了,在超参数最佳调优的前
2024-12-20浏览详情
大模型日报 ai前沿动态 【用多步预测Transformer实现迷宫导航】 链接:网页链接 论文概述:本文通过提出一种新的多步预测目标函数
2024-12-12浏览详情
大模型日报 ai前沿动态 【Transformer模型搜索能力缺陷研究】 链接:网页链接 论文概述:本文通过图连通性问题,揭示了Transformer
大模型日报 ai前沿动态 【MALT:用多智能体LLM训练改进推理】 链接:网页链接 论文概述:MALT 提出了一种创新的多智能体大语言模型
2024-12-11浏览详情
大模型日报 ai前沿动态 【SAMURAI:适配SAM2实现基于动作感知记忆的零样本视觉跟踪】 链接:网页链接 论文概述: SAMURAI 通过巧妙
2024-12-05浏览详情
大模型日报 ai前沿动态 【XGrammar:灵活高效的大型语言模型结构化生成引擎】 链接:网页链接 论文概述:XGrammar 通过巧妙地将 LLM
2024-12-04浏览详情
大模型日报 ai前沿动态 【安全对齐不应该只是几个Token的深度】 链接:网页链接 论文概述:本文揭示了大型语言模型安全对齐的“浅
大模型日报 ai前沿动态 【Marco-o1:面向开放式解决方案的开放式推理模型】 链接:网页链接 论文概述:Marco-o1模型通过结合CoT微调
2024-12-01浏览详情
大模型日报 ai前沿动态 【推理缩放 Laws:不完美验证器LLM重采样的局限性】 链接:网页链接 论文概述:本文通过实证研究揭示了使用
大模型日报 ai前沿动态 【面向AI安全的NeuroAI路线图】 链接:网页链接 论文概述:本文提出了一份利用神经科学原理提升人工智能系
2024-11-30浏览详情
大模型日报 ai前沿动态 【用动态词元化方法改造(大型)语言模型】 链接:网页链接 论文概述:本文提出了一种基于超网络的动态词元
大模型日报 ai前沿动态 【语言模型靠启发式方法集合求解算术问题】 链接:网页链接 论文概述:大型语言模型并非通过算法或记忆来
2024-11-29浏览详情
大模型日报 ai前沿动态 【Bi-Mamba:精确1-bit状态空间模型研究】 链接:网页链接 论文概述:Bi-Mamba通过创新的量化感知训练方法,将
2024-11-28浏览详情
大模型日报 ai前沿动态 【理解面向回归的LLM嵌入】 链接:网页链接 论文概述:该论文深入研究了大型语言模型嵌入在回归任务中的应
大模型日报ai前沿动态 【大型语言模型分布对齐基准测试】 链接:网页链接 论文概述:本文通过构建一个新的基准测试系统,系统性地评
2024-11-23浏览详情
大模型日报 ai前沿动态 【MemoryFormer:通过移除全连接层来最小化Transformer计算】 链接:网页链接 论文概述:MemoryFormer 提出
大模型日报 ai前沿动态 【超越类人处理:大型语言模型在前向和后向科学文本上的表现相当】 链接:网页链接 论文概述:本文探究了大
2024-11-21浏览详情
大模型日报 ai前沿动态 【聚合标签的弱学习器到强学习器提升】 链接:网页链接 论文概述:本文证明了在 LLP 和 MIL 场景下提升算
大模型日报 ai前沿动态 【上下文充分性:检索增强生成系统的新视角】 链接:网页链接 论文概述:本文通过定义“上下文充分性”并开
2024-11-17浏览详情
大模型日报 ai前沿动态 【大语言模型的越狱提示有哪些特征?攻击背后机制调查】 链接:网页链接 论文概述:本文通过构建大型越狱数
2024-11-10浏览详情
正在拼命加载中
我是有底线的
没有更多的页面可以加载啦!