资讯

如果看得仔细一点,在Llama官网的性能对比测试图的最下面一行,写着「Llama 4 Maverick optimized for conversationality.」 他表示,Scout (109B) 和Maverick ...
研究者让当前最顶尖的AI模型(GPT-4.1、Gemini 2.5 Pro、Llama-4 Maverick等)在《逆转裁判》中接受考验,看它们能否喊出「反对!」,扭转案情,揭开谎言背后的真相。
瓜田李下的行为在AI圈显然不被认可的情况下,更何况Llama 4这种内部吹哨人已经站出来指证。面对LIama 4作弊的指控,Meta的员工也坐不住了,有两位一亩三分地的用户用实名发声,宣称Meta GenAI从未使用基准测试的数据用来训练LIama ...
4月9日,OpenAI宣布启动先锋计划 (Pioneers Program),旨在推动 AI 在实际用例中的部署。该计划将专注于创建评估模型,设定“优秀模型”的标准,并为构建者提供工具,帮助他们优化自身领域的模型性能。OpenAI认为,我们认为,法律 ...
业内专家认为,Llama 4系列的发布可能重塑AI大模型市场格局。Meta其采用的MoE架构不仅提升了性能,更重要的是大幅降低了使用门槛,这将加速AI技术在各行业的普及应用。随着4月29日LlamaCon大会临近,Meta或将披露更多战略布局。
本文共2343字阅读需要3.1分钟在AI大模型领域,每一次新模型的发布都备受瞩目。而Meta平台公司上周六推出的Llama大语言模型新一代版本——Llama 4 Scout和Llama 4 ...
近日,Meta 公司发布的开源大模型 Llama-4-Maverick 在 LMArena 的排行榜上从第二名直降至第32名,这一剧烈波动引发了开发者们的广泛质疑,认为 Meta 可能通过提交 特供 版本以刷榜。事情的起因要追溯到4月6日,Meta ...
LMArena最新数据显示,Meta此前排名第二的开源大模型Llama-4-Maverick已跌至第32名,引发开发者对Meta“特供版”刷榜的质疑。4月6日发布的Llama 4包含Scout、Maverick和Behemoth三个版本,其中Llama-4-Maverick初版在LMArena排行榜中表现优异,但开源版本效果远不及预期。
随着人工智能技术的飞速发展,开源大模型在自然语言处理领域的应用越来越广泛。近期,Meta发布的最新开源大模型Llama-4-Maverick在Chatbot Arena LLM排行榜中的排名一路飙升,一度位居第二。然而,近期的一系列事件引发了开发者对Meta刷榜作弊的质疑,导致其排名直线下降。
近期,LMArena更新了大型语言模型的排名,引发了一场关于me ta最新发布的开源大模型Llama-4-Maverick真实性能的广泛讨论。此前,Llama-4-Maverick在LMArena的Chatbot Arena ...
4 月 8 日,Chatbot Arena 官方发文确认了用户的上述质疑,公开表示 Meta 提供给他们的是“特供版”,并考虑更新排行榜。根据 Chatbot Arena 官方消息,Meta 首次提交 LMArena 的 ...
IT之家 4 月 14 日消息,LMArena 更新了 Meta 最新发布的开源大模型 Llama-4-Maverick 的排名,其从此前的第 2 名直线下降至第 32 名。这证实了此前开发者对 Meta 为刷榜向 LMArena ...