这篇论文在 ICLR 2024...

斌叔OKmath
2024-12-05 14:32:56

这篇论文在 ICLR 2024 上获得了荣誉提名，第一作者是 o1 的研究人员，也是 lora 的创建者

tldr：他们提出了一种方法，通过贝叶斯推理，根据问题推导出可得出答案的隐藏 cot

AMORTIZING INTRACTABLE INFERENCE IN LARGE LANGUAGE MODELS
网页链接
Edward J. Hu, Moksh Jain, Eric Elmoznino, Younesse Kaddar, Guillaume Lajoie, Yoshua Bengio, Nikolay Malkin