资讯
1 天
中关村在线云计算频道 on MSN天翼公有云放大招:昇腾大EP推理集群上线,国产算力再升级近日,中国电信天翼公有云正式上线基于国产昇腾架构的大规模专家并行(简称大EP)推理集群。该集群创新性地应用了大EP与PD分离技术,成功推动国产算力实现单卡推理吞吐429TPS(Tokens Per Second),较传统双机部署 ...
5 小时
华尔街见闻 on MSN斯坦福开源复杂推理AI Agent,融合超10种工具传统的AI助手通常依赖于单一模型或有限的工具集,难以应对需要多步推理、跨领域知识融合及高精度数据分析的任务。例如,解决视觉谜题,需要精细图像理解和基于文本的混合推理。为了解决这一难题,斯坦福开源了OctoTools,这是一个融合了11种不同工具专用于 ...
据悉, 曦望公司前身为商汤大芯片部门,于2024年底分拆独立。公司专注于高性能GPU及多模态场景推理芯片的研发与商业化,致力于为千行百业提供"成本降十倍、能效比突破"的智能算力基石。
探索推理游戏爱好者们的热门选择!最新发布的推理游戏下载量高的排行榜前十揭示了那些备受玩家追捧的智力挑战之作。无论是烧脑剧情还是精巧谜题,这些游戏无疑让玩家们在娱乐中锻炼思维。立即点击,揭开排行榜的秘密,体验最炙手可热的推理冒险吧!
随着ChatGPT等大型语言模型的爆发式增长,AI推理需求呈现出前所未有的规模。然而,高昂的部署成本和能耗问题正在成为AI技术大规模落地的主要障碍。在这一背景下,专用推理芯片作为GPU的有力补充,正在成为行业关注的焦点。
UIUC、斯坦福与哈佛联合提出全新「能量驱动Transformer(EBT)」架构,突破传统前馈推理方式,以能量最小化模拟人类System 2思维,预训练扩展性能较Transformer++最高提升35%。下一代AI基础架构新变革,来了!
在五个主要的视频推理测试中,VIDEO-RTS平均准确率提升了2.4%,特别是在最具挑战性的Video-Holmes推理测试中提升了4.2%。这意味着AI不仅能看懂视频表面内容,还能理解深层逻辑关系,真正做到了"举一反三"。
这个过程就像一个经验丰富的医生诊断病情。医生不会看一眼病人就下结论,而是会先仔细观察症状,然后对照医学知识逐一排除可能性,最后通过推理得出诊断结果。人类标注员在处理关系抽取时也是如此:他们首先识别句子中的关键实体,然后参照详细的标注指南,逐一比较每种 ...
7月17日,在上海举办的2025年RISC-V中国峰会上,中兴微电子副总经理石义军发表了题为《大语言模型推理部署RISC-V服务器应用及架构研究》的演讲。他系统分析了大模型推理在RISC-V服务器中的部署机遇与挑战,提出需通过架构创新与生态共建,推动 ...
黄仁勋的唐装亮相与中文开场,与其说是文化示好,不如视为对中国AI生态的战略认可。他在演讲中明确将DeepSeek与阿里、腾讯并列,称其产品"都是世界级的",这种背书在英伟达历史上实属罕见。更关键的是其技术定性——指出DeepSeek-R1实现了"逐步 ...
华人研究者解决LLM过度思考,提升推理效率。 大模型虽然推理能力增强,却常常「想太多」,回答简单问题也冗长复杂。Rice大学的华人研究者提出 ...
3 天
科技行者 on MSN从零起步也能做推理大模型?StepFun和清华大学揭秘超高效训练的神奇 ...这项由清华大学的胡景程、张引民、韩启、蒋大欣、张翔宇,以及清华大学的沈向洋联合完成的研究发表于2025年7月的arXiv预印本(论文编号:arXiv:2503.24290v2),有兴趣深入了解的读者可以通过GitHub开源项目(https://git ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果