llama 4 maverick - 搜索 News

资讯

1 小时

Llama4训练作弊爆出惊天丑闻！AI大佬愤而辞职，代码实测崩盘全网炸锅

如果看得仔细一点，在Llama官网的性能对比测试图的最下面一行，写着「Llama 4 Maverick optimized for conversationality.」他表示，Scout (109B) 和Maverick ...

腾讯网1 天

异议！顶流AI决战「逆转裁判」：o1险胜Gemini 2.5登顶、Llama 4零分垫底

研究者让当前最顶尖的AI模型（GPT-4.1、Gemini 2.5 Pro、Llama-4 Maverick等）在《逆转裁判》中接受考验，看它们能否喊出「反对！」，扭转案情，揭开谎言背后的真相。

2 天

LIama 4疑似作弊，都怪Meta把牛皮吹破了

瓜田李下的行为在AI圈显然不被认可的情况下，更何况Llama 4这种内部吹哨人已经站出来指证。面对LIama 4作弊的指控，Meta的员工也坐不住了，有两位一亩三分地的用户用实名发声，宣称Meta GenAI从未使用基准测试的数据用来训练LIama ...

人人都是产品经理 on MSN3 天

Llama 4出来，Meta 马斯克遇到了大麻烦。

Meta最近推出了其最新的AI模型系列Llama 4，声称在多模态功能和性能上取得了显著进步。然而，这一发布却引发了广泛的争议和批评。 Meta 最近推出了其最新的 AI 模型系列 Llama 4，据称引入了多模态功能的进步和… Meta ...

3 天

中邮·金工|Meta LIama 4开源，OpenAI启动先锋计划——AI动态汇总20250414

4月9日，OpenAI宣布启动先锋计划 (Pioneers Program)，旨在推动 AI 在实际用例中的部署。该计划将专注于创建评估模型，设定“优秀模型”的标准，并为构建者提供工具，帮助他们优化自身领域的模型性能。OpenAI认为，我们认为，法律 ...

4 天

Meta开源大模型Llama 4震撼发布，阿里巴巴/微美全息聚焦加速垂直领域 ...

业内专家认为，Llama 4系列的发布可能重塑AI大模型市场格局。Meta其采用的MoE架构不仅提升了性能，更重要的是大幅降低了使用门槛，这将加速AI技术在各行业的普及应用。随着4月29日LlamaCon大会临近，Meta或将披露更多战略布局。

腾讯网5 天

科创前沿丨Meta Llama 4首秀翻车：评测高分实战拉胯，AI巨头为何“赶 ...

本文共2343字阅读需要3.1分钟在AI大模型领域，每一次新模型的发布都备受瞩目。而Meta平台公司上周六推出的Llama大语言模型新一代版本——Llama 4 Scout和Llama 4 ...

5 天

Meta 新模型 Llama-4-Maverick 排名骤降，引发刷榜质疑

近日，Meta 公司发布的开源大模型 Llama-4-Maverick 在 LMArena 的排行榜上从第二名直降至第32名，这一剧烈波动引发了开发者们的广泛质疑，认为 Meta 可能通过提交特供版本以刷榜。事情的起因要追溯到4月6日，Meta ...

至顶头条 on MSN5 天

超越 Llama 之争：评估大语言模型的 4 个全新基准

大语言模型技术日新月异，但评估它们的能力和局限性仍面临挑战。传统基准测试已不足以全面衡量这些强大工具。本文提出了四个新的人本主义评估维度:价值观、情感、思维和交互,旨在从更深层次、更以人为中心的角度来评估这些变革性技术,以确保AI的发展不仅仅追求智能 ...

5 天

高德地图革新！AI导航智能体，让出行有“思考”更“贴心”

在出行领域，一场前所未有的变革正在悄然兴起，这一切得益于地图导航与人工智能技术的深度融合。4月14日，高德地图正式揭晓了一项革命性的创新——全球首个基于地图的AI导航智能体NaviAgent。这一创新不仅重新定义了导航服务的内涵，更将传统出行工具提升 ...

5 天

关税压力下NVIDIA为何仍被看好？市场需求强劲是关键！

NVIDIA在供应链管理上的灵活性也是其抵御关税风险的一大优势。公司已经部分将产品供应框架部署在北美地区，这不仅降低了关税带来的潜在风险，还增强了供应链的稳定性。据悉，NVIDIA的超级计算平台GB200的大部分构建工作可能已在北美完成，而其合作伙伴如鸿海和ZT系统等也在北美或墨西哥设有生产基地，这进一步巩固了其在全球市场的竞争力。

极客网 on MSN5 天

Meta开源模型遭质疑：刷榜作弊被揭露，基准测试排名暴跌引热议

随着人工智能技术的飞速发展，开源大模型在自然语言处理领域的应用越来越广泛。近期，Meta发布的最新开源大模型Llama-4-Maverick在Chatbot Arena LLM排行榜中的排名一路飙升，一度位居第二。然而，近期的一系列事件引发了开发者对Meta刷榜作弊的质疑，导致其排名直线下降。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果