AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@ ...
最近,差评君发现了个新鲜玩意儿。 喂给 AI 一张图,它就能给你推测出一个人的性格。 光靠歌单,就能把人最近的心理状态推测个七七八八。 而这些,都出自 Kimi 最新的 k1 视觉思考模型之手。 这不,距离上次推出数学模型 k0 ...
IT之家 12 月 24 日消息,科技媒体 TechCrunch 昨日(12 月 23 日)发布博文,认为 OpenAI 的 o3 模型虽然在 ARC-AGI 等测试中取得了亮眼成绩,但背后的高计算成本,让其短期内很难在实际应用中普及。o3 性能o3 ...
2024中国海外人才交流大会暨第26届中国留学人员广州科技交流会(下称海交会),将于12月24~25日在广州南沙国际会展中心举行。本届主题为「聚全球,创未来」,大会将联动全球300多家知名投资机构,为参加海交会的项目提供融资对接;并向全球排名前200 ...
基于人类反馈的强化学习(RLHF)是优化大语言模型(LLM)行为的关键技术,能够让模型更符合人类偏好和需求,提升生成质量。 然而,目前关于 RLHF 的 ...
微软下一代14B小模型Phi-4出世了!仅用了40%合成数据,在数学性能上击败了GPT-4o,最新36页技术报告出炉。 最近,微软下一代小模型Phi-4正式亮相。在GPQA和MATH基准上,其数学性能直接碾压GPT-4o、Gemini Pro 1.5 ...
OpenAI下一代模型——o3,重磅诞生了!陶哲轩预言难住AI好几年的数学测试,它瞬间破解,编程水平位于全球前200,在ARC-AGI基准中更是惊人,打破所有AI纪录接近人类水平,离AGI更近一步。
在 OpenAI o1 正式版发布 10 天后,Kimi 的「高阶推理模型」也落地了。 12 月 16 日,Kimi 直接发布了自己的「视觉思考模型」k1。相比于一个月前发布的 k0-math,k1 ...
去年是恩师江泽坚先生百年寿诞,今年是吉林大学数学学科创建七十周年。作为江先生的弟子、吉林大学的校友,觉得有必要留下一些文字,多一个角度供后学们瞻仰先贤的风采。
面对当前基准测试接近满分的情况,OpenAI引入了一个全新的数学测试EpochAI Frontier Math。 这被认为是当前最具挑战性的数学评估之一,包含了极其复杂的问题。就连专业数学家解决单个问题也需要耗费数小时甚至数天。
人民网 on MSN3 天
丘成桐人民日报撰文!
当天来了50多位听众,讲堂挤得水泄不通。 听众中有约瑟夫·沃尔夫(Joseph Wolf)教授,他是陈先生在芝加哥大学时的博士生,是我演讲题目的专家,看来他很满意我的工作。