资讯

如果看得仔细一点,在Llama官网的性能对比测试图的最下面一行,写着「Llama 4 Maverick optimized for conversationality.」 他表示,Scout (109B) 和Maverick ...
研究者让当前最顶尖的AI模型(GPT-4.1、Gemini 2.5 Pro、Llama-4 Maverick等)在《逆转裁判》中接受考验,看它们能否喊出「反对!」,扭转案情,揭开谎言背后的真相。
瓜田李下的行为在AI圈显然不被认可的情况下,更何况Llama 4这种内部吹哨人已经站出来指证。面对LIama 4作弊的指控,Meta的员工也坐不住了,有两位一亩三分地的用户用实名发声,宣称Meta GenAI从未使用基准测试的数据用来训练LIama ...
人人都是产品经理 on MSN3 天
Llama 4出来,Meta 马斯克遇到了大麻烦。
Meta最近推出了其最新的AI模型系列Llama 4,声称在多模态功能和性能上取得了显著进步。然而,这一发布却引发了广泛的争议和批评。 Meta 最近推出了其最新的 AI 模型系列 Llama 4,据称引入了多模态功能的进步和… Meta ...
4月9日,OpenAI宣布启动先锋计划 (Pioneers Program),旨在推动 AI 在实际用例中的部署。该计划将专注于创建评估模型,设定“优秀模型”的标准,并为构建者提供工具,帮助他们优化自身领域的模型性能。OpenAI认为,我们认为,法律 ...
业内专家认为,Llama 4系列的发布可能重塑AI大模型市场格局。Meta其采用的MoE架构不仅提升了性能,更重要的是大幅降低了使用门槛,这将加速AI技术在各行业的普及应用。随着4月29日LlamaCon大会临近,Meta或将披露更多战略布局。
本文共2343字阅读需要3.1分钟在AI大模型领域,每一次新模型的发布都备受瞩目。而Meta平台公司上周六推出的Llama大语言模型新一代版本——Llama 4 Scout和Llama 4 ...
近日,Meta 公司发布的开源大模型 Llama-4-Maverick 在 LMArena 的排行榜上从第二名直降至第32名,这一剧烈波动引发了开发者们的广泛质疑,认为 Meta 可能通过提交 特供 版本以刷榜。事情的起因要追溯到4月6日,Meta ...
大语言模型技术日新月异,但评估它们的能力和局限性仍面临挑战。传统基准测试已不足以全面衡量这些强大工具。本文提出了四个新的人本主义评估维度:价值观、情感、思维和交互,旨在从更深层次、更以人为中心的角度来评估这些变革性技术,以确保AI的发展不仅仅追求智能 ...
在出行领域,一场前所未有的变革正在悄然兴起,这一切得益于地图导航与人工智能技术的深度融合。4月14日,高德地图正式揭晓了一项革命性的创新——全球首个基于地图的AI导航智能体NaviAgent。这一创新不仅重新定义了导航服务的内涵,更将传统出行工具提升 ...
NVIDIA在供应链管理上的灵活性也是其抵御关税风险的一大优势。公司已经部分将产品供应框架部署在北美地区,这不仅降低了关税带来的潜在风险,还增强了供应链的稳定性。据悉,NVIDIA的超级计算平台GB200的大部分构建工作可能已在北美完成,而其合作伙伴如鸿海和ZT系统等也在北美或墨西哥设有生产基地,这进一步巩固了其在全球市场的竞争力。
随着人工智能技术的飞速发展,开源大模型在自然语言处理领域的应用越来越广泛。近期,Meta发布的最新开源大模型Llama-4-Maverick在Chatbot Arena LLM排行榜中的排名一路飙升,一度位居第二。然而,近期的一系列事件引发了开发者对Meta刷榜作弊的质疑,导致其排名直线下降。