2025-04-09 08:42:42 互联网
近期,据日经新闻披露的一项联合研究成果显示,中美两国的新型生成式人工智能(AI)已经展现出令人瞩目的学术能力,成功跨越了日本顶尖学府——东京大学理科3类入学考试的门槛。这一突破性进展是通过对比测试美国OpenAI的“o1”模型与中国AI初创企业DeepSeek的“R1”模型得出的。
测试内容涵盖了2025年度的东京大学入学考试科目,由AI初创公司Life Prompt提供答案输出,并由知名预备学校河合塾的专业讲师进行评分。结果显示,在两个基础模型的表现中,o1获得了374分,R1紧随其后,取得了369分,均超过了东大理科3类合格的最低分数线368.7分。
值得注意的是,尽管R1在理科1类和理科2类的共通考试中未能达到合格线,但在其他类别,包括文科在内,它与o1均成功“合格”。这一表现不仅展示了AI在跨学科应用上的潜力,也反映了其在学术评估中的广泛适用性。
在具体的考试科目中,英语成为了AI模型的强项。o1和R1在英语部分的得分率均超过了75%,河合塾的英语讲师久恒秀雄对此评价道:“这两个模型在英语表达上几乎没有单词和语法的错误,其水平远远超过了东大考生的平均水平。”
然而,在数学科目上,尽管AI模型能够正确解答出不少最终答案,但在图形处理和论证问题上却频繁出现论述错误和说明不足的情况。在满分为120分的理科数学考试中,o1得了38分,R1得了49分,这一成绩显著低于合格者的平均分。负责数学评分的香坂季京讲师指出:“AI在数学论证上的表现还有待提高。”
对于这一研究成果,自2011年起便致力于“机器人能否进入东京大学”项目的国立信息学研究所新井纪子教授给予了高度评价:“这是AI成长历程中的一个重要里程碑。然而,我们也必须认识到,AI有时会给出令人困惑甚至错误的答案。因此,培养能够正确判断并熟练使用AI输出的人才显得尤为重要。”
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表本站立场。文章及其配图仅供学习分享之
相关资讯
HotNS龙之信条1.01补丁全新上线,优化游戏体验与修复关键问题04-09
HotMeta 新旗舰 AI 模型 Llama 4 Maverick 测试成绩遭质疑,被指针对性优化04-09
Hot特斯拉超充站突破2000座,全国省市100%覆盖,充电还难吗?04-09
Hotvivo 4月21日盛大发布:X200系列手机携手平板、手表新品来袭!04-09
Hot蓝莓听书手机版下载-蓝莓听书手机版免费下载v1.204-09
Hot英伟达RTX 5060 Ti显卡跑分曝光,性能如何引发热议!04-09
Hot刺客信条奥德赛 全攻略:全面解析游戏玩法、技巧与隐藏要素,助你完美征服古希腊04-09
Hot雅迪华宇电池:技术革新+服务升级,铅酸电池行业迎来新变革?04-09
新品榜
战国无双2武器获得方法与获取技巧解析,如何高效获取强力武器
双人成行万花筒下一关挑战解析:如何顺利通关并揭开隐藏的秘密
模拟农场24手机版什么时候出?探索游戏更新与玩家期待的最新动态
波西亚时光送什么礼物?攻略与推荐,教你选对每一份心意
战国无双4-2四星武器的样式与玩家实用性分析,如何选购最适合的四星武器
火炬之光手游好玩不?深度剖析游戏体验与玩家反馈的全面评测
盐和避难所法师套装的样式及其在游戏中的作用与实用性分析
火炬之光秘籍控制台代码的使用技巧与玩法分析,如何利用秘籍提升游戏体验
火炬之光1.15汉化2.2版本更新详解,探索新玩法与修复优化
波西亚时光修改时间bug修复方法及其对游戏体验的影响分析
热门
2025-04-09 07:16:59
steam上荒野的召唤:探索这款游戏背后的荒野魅力与挑战
04-09中土世界战争之影尸罗结局是什么?深度解析中土世界游戏中的最后一战
04-09过山车之星特价活动火爆上线,抢购限时优惠不容错过
04-09战国无双4刷5星武器的样式与获取方法,助你提升角色战力
04-09星际争霸1v7无限矿策略分析,掌握无限资源带来的优势与挑战
04-09警察模拟器巡警停车超时的挑战与策略,如何提高游戏体验?
04-09火炬之光攻击强度排行:探索各职业的终极战力,谁是最强输出
04-09魔界战记1refine保存不了?解决方案与常见问题分析
04-09中土世界战争之影主线做完了干什么?探索游戏主线结束后的新冒险与挑战
04-09