
今日推介(第1597期):通过移除全连...
今日推介(第1597期):通过移除全连接层来最小化Transformer计算、BFloat16在长上下文训练中有损RoPE相对位置编码、大型语言模型是否记住了Bug基准、大语言模型个性化研究、极
今日推介(第1597期):通过移除全连接层来最小化Transformer计算、BFloat16在长上下文训练中有损RoPE相对位置编码、大型语言模型是否记住了Bug基准、大语言模型个性化研究、极
周五软件分享
- MySpeed:开源的网络测速工具 网页链接
- lcl.host:为本地开发环境生成HTTPs证书网页链接
- moffee:Markdown格式的幻灯片生成工具 网页链接
更多软件#科技
【Zyme – An Evolvable Programming Language】网页链接 Zyme – 一种可进化的编程语言。
用经典蜗牛爬井问题对 DeepSeek-R1-Lite-Preview 和 Chatgpt o1-preivew 进行了测试。两者答案都正确,DeepSeek 的推理用了24秒,o1-preivew 用了大约5秒。DeepSeek 详细展示了
CHAOS (混乱)
dev 设计这个 AI AGENT 最初的目的是
为在游戏 Abyss 中具象化 混乱/守序 的二元性
创始人给 CHAOS 布置了一个任务:
通过招募玩家来帮助他们 3D 打印机器人的身
【蜜雪冰城成立雪王爱智慧科技新公司,含多项 AI 业务】雪王爱智慧科技(郑州)有限公司于 11 月 14 日成立,法定代表人为吴剑,注册资本 5000 万元人民币,经营范围包括新兴能源技术研
【WeSQL:一个创新的MySQL发行版,采用计算存储分离架构,将所有数据(包括binlog、schema、WAL等)完全存储在S3或S3兼容存储上,具备跨云平台部署能力,无供应商锁定,特别适合Serverless