资讯
1 天
腾讯网 on MSN“大模型六小虎”被曝获20亿融资,放出首个推理模型技术秘籍!MiniMax成立于2021年11月,去年3月获得6亿美元A轮融资,当时估值约为25亿美元(约合人民币180亿元),该轮融资由阿里巴巴集团领投,红杉中国、高瓴资本参投。此前,腾讯、米哈游等公司也参与了MiniMax的融资。
13 小时on MSN
近日,香港科技大学(广州)的研究团队在计算机体系结构领域取得了突破性进展,为提升大规模语言模型的传输速度提出了创新方案。该方案由微电子学域的博士生秦乐、崔峻伟、蔡玮林以及教授黄嘉逸共同研发,相关研究成果以论文形式在ISCA ...
14 小时on MSN
近日,一项重大战略合作在科技界掀起波澜,国内某顶尖设备运营商与安徽海马云科技股份有限公司(海马云)正式达成合作意向,旨在为全球用户提供更为强大、稳定的算力支持。此次合作的核心内容,是向海马云提供包括GPU服务器、管理服务器、存储服务器及全方位售后服务 ...
近期由港中文和华为诺亚实验室联合提出的 ReliableMath 基准,旨在探究大模型推理任务的可靠性。该工作文章和数据集均已开源,并持续在 leaderboard 上更新最新模型结果,目前已新增了 Qwen3、豆包、Gemini ...
Nightfall是一款可供4至12名玩家参与的社交演绎游戏。游戏中人类要找出狼人玩家,在狼人夜间转换前将其投票出局。玩家可利用隐形、验血、照相机等设备收集证据助力投票。游戏还有特殊的玩家角色,这些元素共同构建起游戏的社交演绎体系,让玩家在推理与投票过程中体验游戏乐趣。
19 小时
科技行者 on MSN新加坡大学:让AI大脑快速思考不再是梦,推理效率提升十倍!有兴趣深入了解这项研究的读者,可以通过arXiv:2503.23077v2获取完整的论文原文,其中包含了更详细的技术分析和实验结果。这项研究不仅为当前的AI效率优化提供了全面的技术总结,更为未来的研究方向指明了道路,相信会对整个AI领域的发展产生重要 ...
8 小时
科技行者 on MSN从零起步也能做推理大模型?StepFun和清华大学揭秘超高效训练的神奇 ...这项由清华大学的胡景程、张引民、韩启、蒋大欣、张翔宇,以及清华大学的沈向洋联合完成的研究发表于2025年7月的arXiv预印本(论文编号:arXiv:2503.24290v2),有兴趣深入了解的读者可以通过GitHub开源项目(https://git ...
在这篇文章中,我们将带你探索推理游戏的世界,揭示当前最热门的推理游戏排行榜。无论是烧脑策略还是紧张剧情,从经典之作到新兴爆款,一应俱全。无论你是推理爱好者还是寻求新鲜刺激的玩家,都将在这里找到你的心头好。深入挖掘这些游戏的魅力与乐趣,一起揭开每一道逻辑谜题的秘密吧!
Google双线出击!T5Gemma重燃encoder-decoder架构战火,性能暴涨12分;MedGemma坚守decoder-only路线,强攻医疗多模态,击穿闭源壁垒。Gemma体系完成「架构+落地」双重进化,打响Google开源反击战。
传统Transformer是一种典型的「前馈预测器」,每次推理过程都是按照从输入prompt,到固定的前向传播路径,再到输出结果一次完成的。 无论是Feed Forward ...
o4-mini的设计旨在突破传统LLM在复杂推理上的局限。与早期的模型相比,o4-mini不仅更轻量化、灵活性更高,还能够在专门的数据集上进行深度学习。研究表明,传统LLM在面对未训练过的问题时,解答正确率不足2%,而o4-mini却在经过训练后,成 ...
No.5 《女高推理班》系列|韩国推理综艺 《女高推理班》系列是由知名综艺PD郑中渊打造的沉浸式推理综艺,节目以一所神秘的女子高中为背景,由 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果