AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@ ...
最近,差评君发现了个新鲜玩意儿。 喂给 AI 一张图,它就能给你推测出一个人的性格。 光靠歌单,就能把人最近的心理状态推测个七七八八。 而这些,都出自 Kimi 最新的 k1 视觉思考模型之手。 这不,距离上次推出数学模型 k0 ...
IT之家 12 月 24 日消息,科技媒体 TechCrunch 昨日(12 月 23 日)发布博文,认为 OpenAI 的 o3 模型虽然在 ARC-AGI 等测试中取得了亮眼成绩,但背后的高计算成本,让其短期内很难在实际应用中普及。o3 性能o3 ...
基于人类反馈的强化学习(RLHF)是优化大语言模型(LLM)行为的关键技术,能够让模型更符合人类偏好和需求,提升生成质量。 然而,目前关于 RLHF 的 ...
微软下一代14B小模型Phi-4出世了!仅用了40%合成数据,在数学性能上击败了GPT-4o,最新36页技术报告出炉。 最近,微软下一代小模型Phi-4正式亮相。在GPQA和MATH基准上,其数学性能直接碾压GPT-4o、Gemini Pro 1.5 ...
最直接的实测例子是:当我们把杨振宁、伽利略等世界知名科学家的研究手稿拍照、上传后,k1 居然能识别图片中的文字,生动解读背后的物理、天文学等科学知识,从而回答用户的提问并给出清晰完整的推理思考过程。 例如,当我们上传杨振宁的手稿并向 k1 提问,k1 ...
OpenAI下一代模型——o3,重磅诞生了!陶哲轩预言难住AI好几年的数学测试,它瞬间破解,编程水平位于全球前200,在ARC-AGI基准中更是惊人,打破所有AI纪录接近人类水平,离AGI更近一步。
在 OpenAI o1 正式版发布 10 天后,Kimi 的「高阶推理模型」也落地了。 12 月 16 日,Kimi 直接发布了自己的「视觉思考模型」k1。相比于一个月前发布的 k0-math,k1 ...
去年是恩师江泽坚先生百年寿诞,今年是吉林大学数学学科创建七十周年。作为江先生的弟子、吉林大学的校友,觉得有必要留下一些文字,多一个角度供后学们瞻仰先贤的风采。
如果你已经阅读了第一和第二章,并花时间消化和思考,希望你对 JS 的理解有更多的收获。如果你跳过/略过它们(尤其是第 ...
面对当前基准测试接近满分的情况,OpenAI引入了一个全新的数学测试EpochAI Frontier Math。 这被认为是当前最具挑战性的数学评估之一,包含了极其复杂的问题。就连专业数学家解决单个问题也需要耗费数小时甚至数天。