kV - 搜索 News

资讯

14 小时

Grouped-head latent Attention (GTA) 震撼登场！这项创新机制通过共享注意力矩阵和压缩潜在值表示，将计算量削减 62.5%，KV 缓存缩减 70%，prefill 和 decode 速度提升 2 倍。无论是处理海量数据 ( 15.520, 0.39, 2.58%) （维权）构成的长序列任务，还是在计算资源极为有限的边缘设备上运行，GTA ...

腾讯网3 天

KV-2重生？俄推出152毫米炮的T-72/T-90改型，炮却是短管的

众所周知，从苏联时代到当今的俄罗斯，一直都存在着为主战坦克安装152毫米炮的执念，但是由于客观困难太多，这个想法一直没能实现，除了二战初期的KV-2重型坦克。直到俄乌战争爆发，俄罗斯国内一度又出现研发“152毫米炮坦克”的呼声。但是多数人都猜测，俄军 ...

2 天

Transformer终结者，谷歌DeepMind全新MoR架构问世，新一代魔王来了

【导读】Transformer杀手来了？KAIST、谷歌DeepMind等机构刚刚发布的MoR架构，推理速度翻倍、内存减半，直接重塑了LLM的性能边界，全面碾压了传统的Transformer。网友们直呼炸裂：又一个改变游戏规则的炸弹来了。

1 天

接连陷裁员、“跑路”争议后，Manus联创发文深度复盘

然而，上下文工程证明并非那么直截了当。它是一门实验科学——我们已经重建了我们的 Agent 框架四次，每次都是在发现了更好的塑造上下文的方式之后。我们亲切地将这种手动架构搜索、提示调整和经验猜测的过程称为「随机研究生下降法」。它不够优雅，但很有效。

腾讯网1 天

DDN推出Infinia存储系统，声称可大幅提升AI推理速度并降低成本

DDN首席技术官Sven Oehme表示："每当你的AI系统重新计算上下文而不是缓存它时，你就在支付GPU税——浪费本可以用来加速结果或服务更多用户的计算周期。通过DDN Infinia，我们将这个成本中心转化为性能优势。" ...

一点资讯 on MSN2 天

《坦克世界》夏促活动迎来第二日，上架苏联大力士和法式五连鞭

从昨天开始，《坦克世界》正式开启了为期一周的夏促特别活动。活动期间每天都有两台金币坦克上线，性能都比较不错。

14 天

原创历史的偶然，由于KV-85不敌虎式，所以苏联坦克走上另外一条路！

具体来说，KV-85是苏联在第二次世界大战时期，为了弥补KV-1坦克所存在的多项不足而开发的改进型号。由于当时苏军急需一种新型重型坦克，因此KV-85在1943年8月便开始少量生产，总计148辆，尽管尚未经过实战考验，便匆忙投入使用。KV-85应运而 ...

1 天

并行革命，32倍吞吐量跃升！英伟达Helix架构突破百万Token推理瓶颈

对于这项技术突破，西北人工智能咨询公司的首席执行官兼联合创始人Wyatt Mayham表示：「英伟达的数百万个token的上下文窗口是一项令人印象深刻的工程里程碑，但对于大多数公司来说，它是一个寻找问题的解决方案，它解决了现有模型如长上下文推理和二次扩展等真实限制，但技术可能性和实际实用性之间存在差距。」 ...

人人都是产品经理 on MSN1 天

Manus 内部的 Context 工程经验（精校、高亮要点）

构建AI智能体时，上下文工程是塑造其行为的核心。如何通过优化KV缓存、动态管理工具、利用文件系统拓展记忆等策略，让智能体更高效、稳定地运转？这些来自实践的经验，或许能为智能体开发提供关键指引。 Manus 团队刚分享了他们构建 Agent 的 ...

3 天on MSN

回应撤离中国市场原因，Manus首度披露技术侧经验教训

Manus近期撤出中国市场、清空国内社交账号内容，全力转战海外市场，官方解释原因主要基于经营效率的调整及国际化布局。北京时间7月19日，Manus联合创始人季逸超发布技术博客，首度从技术角度做出回应，总结创业以来在Agent研发与训练方面的经验教训。

36氪3 年

kv设计与海报区别 - 36氪

KV设计与海报区别就是在同样一场广告活动当中，海报，可以常规理解为“从主视觉延展出来的分支画面”，例如把主视觉比作“1”，那么海报可以 ...

来自MSN8月

《Project KV》陷抄袭风波，一周夭折引网友热议：“头 ...

【ITBEAR】9月9日消息，近日，韩国游戏开发界掀起波澜。新兴工作室Dynamis One宣布，其尚未正式命名的新项目《Project KV》已终止开发，并删除了项目 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果