llama 4 maverick - 搜索 News

资讯

1 小时

Llama4训练作弊爆出惊天丑闻！AI大佬愤而辞职，代码实测崩盘全网炸锅

如果看得仔细一点，在Llama官网的性能对比测试图的最下面一行，写着「Llama 4 Maverick optimized for conversationality.」他表示，Scout (109B) 和Maverick ...

腾讯网1 天

异议！顶流AI决战「逆转裁判」：o1险胜Gemini 2.5登顶、Llama 4零分垫底

研究者让当前最顶尖的AI模型（GPT-4.1、Gemini 2.5 Pro、Llama-4 Maverick等）在《逆转裁判》中接受考验，看它们能否喊出「反对！」，扭转案情，揭开谎言背后的真相。

2 天

LIama 4疑似作弊，都怪Meta把牛皮吹破了

瓜田李下的行为在AI圈显然不被认可的情况下，更何况Llama 4这种内部吹哨人已经站出来指证。面对LIama 4作弊的指控，Meta的员工也坐不住了，有两位一亩三分地的用户用实名发声，宣称Meta GenAI从未使用基准测试的数据用来训练LIama ...

3 天

中邮·金工|Meta LIama 4开源，OpenAI启动先锋计划——AI动态汇总20250414

4月9日，OpenAI宣布启动先锋计划 (Pioneers Program)，旨在推动 AI 在实际用例中的部署。该计划将专注于创建评估模型，设定“优秀模型”的标准，并为构建者提供工具，帮助他们优化自身领域的模型性能。OpenAI认为，我们认为，法律 ...

4 天

Meta开源大模型Llama 4震撼发布，阿里巴巴/微美全息聚焦加速垂直领域 ...

业内专家认为，Llama 4系列的发布可能重塑AI大模型市场格局。Meta其采用的MoE架构不仅提升了性能，更重要的是大幅降低了使用门槛，这将加速AI技术在各行业的普及应用。随着4月29日LlamaCon大会临近，Meta或将披露更多战略布局。

腾讯网5 天

科创前沿丨Meta Llama 4首秀翻车：评测高分实战拉胯，AI巨头为何“赶 ...

本文共2343字阅读需要3.1分钟在AI大模型领域，每一次新模型的发布都备受瞩目。而Meta平台公司上周六推出的Llama大语言模型新一代版本——Llama 4 Scout和Llama 4 ...

5 天

Meta 新模型 Llama-4-Maverick 排名骤降，引发刷榜质疑

近日，Meta 公司发布的开源大模型 Llama-4-Maverick 在 LMArena 的排行榜上从第二名直降至第32名，这一剧烈波动引发了开发者们的广泛质疑，认为 Meta 可能通过提交特供版本以刷榜。事情的起因要追溯到4月6日，Meta ...

中文科技资讯5 天

Meta被曝刷榜：开源版Llama-4-Maverick排名骤降至32位

LMArena最新数据显示，Meta此前排名第二的开源大模型Llama-4-Maverick已跌至第32名，引发开发者对Meta“特供版”刷榜的质疑。4月6日发布的Llama 4包含Scout、Maverick和Behemoth三个版本，其中Llama-4-Maverick初版在LMArena排行榜中表现优异，但开源版本效果远不及预期。

极客网 on MSN5 天

Meta开源模型遭质疑：刷榜作弊被揭露，基准测试排名暴跌引热议

随着人工智能技术的飞速发展，开源大模型在自然语言处理领域的应用越来越广泛。近期，Meta发布的最新开源大模型Llama-4-Maverick在Chatbot Arena LLM排行榜中的排名一路飙升，一度位居第二。然而，近期的一系列事件引发了开发者对Meta刷榜作弊的质疑，导致其排名直线下降。

5 天

Meta开源大模型Llama-4-Maverick排名大跳水，被指刷榜作弊？

近期，LMArena更新了大型语言模型的排名，引发了一场关于me ta最新发布的开源大模型Llama-4-Maverick真实性能的广泛讨论。此前，Llama-4-Maverick在LMArena的Chatbot Arena ...

5 天

Meta 开源大模型 Llama-4-Maverick 基准测试排名暴跌，此前被质疑刷榜作弊

4 月 8 日，Chatbot Arena 官方发文确认了用户的上述质疑，公开表示 Meta 提供给他们的是“特供版”，并考虑更新排行榜。根据 Chatbot Arena 官方消息，Meta 首次提交 LMArena 的 ...

腾讯网5 天

Meta 开源大模型 Llama-4-Maverick 基准测试排名暴跌

IT之家 4 月 14 日消息，LMArena 更新了 Meta 最新发布的开源大模型 Llama-4-Maverick 的排名，其从此前的第 2 名直线下降至第 32 名。这证实了此前开发者对 Meta 为刷榜向 LMArena ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果