Mathematics 图 - 搜索 News

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@ ...

来自MSN5 天

最近，差评君发现了个新鲜玩意儿。喂给 AI 一张图，它就能给你推测出一个人的性格。光靠歌单，就能把人最近的心理状态推测个七七八八。而这些，都出自 Kimi 最新的 k1 视觉思考模型之手。这不，距离上次推出数学模型 k0 ...

IT之家 12 月 24 日消息，科技媒体 TechCrunch 昨日（12 月 23 日）发布博文，认为 OpenAI 的 o3 模型虽然在 ARC-AGI 等测试中取得了亮眼成绩，但背后的高计算成本，让其短期内很难在实际应用中普及。o3 性能o3 ...

ZAKER科技 on MSN19 小时

基于人类反馈的强化学习（RLHF）是优化大语言模型（LLM）行为的关键技术，能够让模型更符合人类偏好和需求，提升生成质量。然而，目前关于 RLHF 的 ...

1 天

微软下一代14B小模型Phi-4出世了！仅用了40%合成数据，在数学性能上击败了GPT-4o，最新36页技术报告出炉。最近，微软下一代小模型Phi-4正式亮相。在GPQA和MATH基准上，其数学性能直接碾压GPT-4o、Gemini Pro 1.5 ...

最直接的实测例子是：当我们把杨振宁、伽利略等世界知名科学家的研究手稿拍照、上传后，k1 居然能识别图片中的文字，生动解读背后的物理、天文学等科学知识，从而回答用户的提问并给出清晰完整的推理思考过程。例如，当我们上传杨振宁的手稿并向 k1 提问，k1 ...

18 小时

OpenAI下一代模型——o3，重磅诞生了！陶哲轩预言难住AI好几年的数学测试，它瞬间破解，编程水平位于全球前200，在ARC-AGI基准中更是惊人，打破所有AI纪录接近人类水平，离AGI更近一步。

6 天on MSN

在 OpenAI o1 正式版发布 10 天后，Kimi 的「高阶推理模型」也落地了。 12 月 16 日，Kimi 直接发布了自己的「视觉思考模型」k1。相比于一个月前发布的 k0-math，k1 ...

5 天

去年是恩师江泽坚先生百年寿诞，今年是吉林大学数学学科创建七十周年。作为江先生的弟子、吉林大学的校友，觉得有必要留下一些文字，多一个角度供后学们瞻仰先贤的风采。

如果你已经阅读了第一和第二章，并花时间消化和思考，希望你对 JS 的理解有更多的收获。如果你跳过/略过它们（尤其是第 ...

面对当前基准测试接近满分的情况，OpenAI引入了一个全新的数学测试EpochAI Frontier Math。这被认为是当前最具挑战性的数学评估之一，包含了极其复杂的问题。就连专业数学家解决单个问题也需要耗费数小时甚至数天。

4 天

参考OpenAI前首席科学家Ilya在NeurIPS ...

一些您可能无法访问的结果已被隐去。