这篇论文在 ICLR 2024...

  • 斌叔OKmath
  • 2024-12-05 14:32:56
这篇论文在 ICLR 2024 上获得了荣誉提名,第一作者是 o1 的研究人员,也是 lora 的创建者

tldr:他们提出了一种方法,通过贝叶斯推理,根据问题推导出可得出答案的隐藏 cot

AMORTIZING INTRACTABLE INFERENCE IN LARGE LANGUAGE MODELS
网页链接
Edward J. Hu, Moksh Jain, Eric Elmoznino, Younesse Kaddar, Guillaume Lajoie, Yoshua Bengio, Nikolay Malkin
这篇论文在 ICLR 2024...