2025-04-07 08:50:43 互联网
本站 4 月 6 日消息,Meta现已发布旗下最新Llama 4 系列AI 模型,包含 Llama 4 Scout、Llama 4 Maverick 和Llama 4 Behemoth,Meta 透露相应模型都经过了“大量未标注的文本、图像和视频数据”的训练,以使它们具备“广泛的视觉理解能力”。
目前,Meta 已将系列模型中的 Scout 和Maverick 上架到Hugging Face(点此访问),而 Behemoth 模型则还在训练中。其中 Scout 可以在单个英伟达H100 GPU 上运行,而Maverick 则需要英伟达H100 DGX AI 平台或“同等性能的设备”。
Meta 表示,Llama 4 系列模型是该公司旗下首批采用混合专家(MoE)架构的模型,这种架构在训练和回答用户查询时的效率更高,所谓“混合专家架构”基本上是将数据处理任务分解为子任务,然后将它们委派给更小的、专门的“专家”模型。
例如,Maverick 总共有4000 亿个参数,但在128 个“专家”模型中只有170 亿个活跃参数(参数数量大致与模型的问题解决能力相对应)。Scout 有170 亿个活跃参数、16 个“专家”模型以及总计1090 亿个参数。
不过值得注意的是,Llama 4 系列中没有一个模型是像OpenAI 的o1 和o3-mini 那样真正意义上的“推理模型”。作为比较,“推理模型”会对其答案进行事实核查,并且通常能更可靠地回答问题,但因此也比传统的“非推理”模型花费更长的时间来给出答案。
Meta 内部测试显示,Maverick 模型最适合用于“通用AI 助手和聊天”等应用场景,该模型在创意写作、代码生成、翻译、推理、长文本上下文总结和图像基准测试中表现超过了OpenAI 的GPT-4o 和谷歌的Gemini 2.0 等模型。然而 Maverick 与谷歌的 Gemini 2.5 Pro、Anthropic 的Claude 3.7 Sonnet 和OpenAI 的GPT-4.5 等功能更强大的最新模型相比仍有一定进步空间。
而 Scout 的优势则是总结文档、基于大型代码库进行推理。该模型支持 1000 万个词元(“词元”代表原始文本的片段,例如单词“fantastic”可拆分为“fan”、“tas”和“tic”),因此一次可以处理“多达数百万字的文本”。
本站注意到,Meta 还进一步预告了其 Behemoth 模型,据该公司称,Behemoth 有2880 亿个活跃参数、16 个“专家”模型,总参数数量接近2 万亿个。Meta 的内部基准测试显示,在一些衡量解决数学问题等科学、技术、工程和数学(STEM)技能的评估中,Behemoth 的表现优于GPT-4.5、Claude 3.7 Sonnet 和Gemini 2.0 Pro,但不如Gemini 2.5 Pro。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表本站立场。文章及其配图仅供学习分享之
相关资讯
新品榜
龙之信条二周目boss挑战攻略及其变化解析,如何应对强化敌人?
《GTA6》代餐!这款犯罪游戏爆火:Steam超30万在线
战国无双全人物路线分歧解析:解锁不同战斗风格与剧情走向
《羊蹄山之魂》官方介绍更新:新机制!新玩法!新武器!
DayZ生存之旅,全面攻略,助你绝地求生
麻布仔大冒险 跳出困境,揭开这场充满勇气与挑战的奇幻之旅
荒野国度四皇是哪四皇-四皇英雄介绍
火炬之光任务流程怎么做?探究任务细节与关键步骤,助你轻松完成游戏任务
雷曼传奇第一章第二关探索与挑战:深入了解游戏设计与关卡创新
双人成行能两个键盘吗?探索《双人成行》游戏中的多人模式与设备支持
热门
2025-04-07 07:43:11
魔界战记全攻略:全面解析游戏玩法与最佳策略,帮助你轻松闯关
04-07魔界战记5角色介绍,揭示每个角色背后的故事与独特技能
04-07僵尸毁灭工程梯子怎么做?打造坚不可摧的生存防线技巧揭秘
04-07战国无双5全任务顺序攻略,带你轻松突破每个挑战与关卡
04-07死亡岛2攻略布鲁诺在哪打?揭开布鲁诺任务位置与战斗技巧
04-07僵尸毁灭工程地图枪店位置大全,带你快速掌握最佳生存路线
04-07地平线怎么关闭动态模糊?详细步骤和优化游戏体验的技巧解析
04-07魔界战记6修罗武器怎么获得?探索修罗武器的获取途径与使用技巧
04-07双人成行配置要求一览:探寻游戏的最佳性能与流畅体验
04-07