资讯

近日,中国电信天翼公有云正式上线基于国产昇腾架构的大规模专家并行(简称大EP)推理集群。该集群创新性地应用了大EP与PD分离技术,成功推动国产算力实现单卡推理吞吐429TPS(Tokens Per Second),较传统双机部署 ...
传统的AI助手通常依赖于单一模型或有限的工具集,难以应对需要多步推理、跨领域知识融合及高精度数据分析的任务。例如,解决视觉谜题,需要精细图像理解和基于文本的混合推理。为了解决这一难题,斯坦福开源了OctoTools,这是一个融合了11种不同工具专用于 ...
研究团队发现,通过训练诱导的递归方法,即使是标准的变换器架构也能学会这种深度思考的能力。椰子模型(Coconut)就是一个典型例子,它将AI的内部思维状态作为连续的"思维向量",在推理过程中循环使用。这种方法让AI能够在潜在空间中进行类似人类直觉的广 ...
据悉, 曦望公司前身为商汤大芯片部门,于2024年底分拆独立。公司专注于高性能GPU及多模态场景推理芯片的研发与商业化,致力于为千行百业提供"成本降十倍、能效比突破"的智能算力基石。
随着ChatGPT等大型语言模型的爆发式增长,AI推理需求呈现出前所未有的规模。然而,高昂的部署成本和能耗问题正在成为AI技术大规模落地的主要障碍。在这一背景下,专用推理芯片作为GPU的有力补充,正在成为行业关注的焦点。
探索推理游戏的魅力世界,解开智慧之谜!《推理游戏下载 十大必玩精选》带你领略烧脑策略的巅峰对决。无论是硬核侦探迷还是逻辑爱好者,这里有你不可错过的经典之作。一触即发的剧情、精心设计的谜题等你来挑战,立即下载,开启你的推理之旅吧!
在五个主要的视频推理测试中,VIDEO-RTS平均准确率提升了2.4%,特别是在最具挑战性的Video-Holmes推理测试中提升了4.2%。这意味着AI不仅能看懂视频表面内容,还能理解深层逻辑关系,真正做到了"举一反三"。
黄仁勋的唐装亮相与中文开场,与其说是文化示好,不如视为对中国AI生态的战略认可。他在演讲中明确将DeepSeek与阿里、腾讯并列,称其产品"都是世界级的",这种背书在英伟达历史上实属罕见。更关键的是其技术定性——指出DeepSeek-R1实现了"逐步 ...
7月17日,在上海举办的2025年RISC-V中国峰会上,中兴微电子副总经理石义军发表了题为《大语言模型推理部署RISC-V服务器应用及架构研究》的演讲。他系统分析了大模型推理在RISC-V服务器中的部署机遇与挑战,提出需通过架构创新与生态共建,推动 ...
研究发现,推理模型(如DeepSeek-R1、o1)遇到「缺失前提」(MiP)的问题时,这些模型往往表现失常:回答长度激增、计算资源浪费。本文基于马里兰 ...
这项由清华大学的胡景程、张引民、韩启、蒋大欣、张翔宇,以及清华大学的沈向洋联合完成的研究发表于2025年7月的arXiv预印本(论文编号:arXiv:2503.24290v2),有兴趣深入了解的读者可以通过GitHub开源项目(https://git ...
华人研究者解决LLM过度思考,提升推理效率。 大模型虽然推理能力增强,却常常「想太多」,回答简单问题也冗长复杂。Rice大学的华人研究者提出 ...