资讯
赵天辰,清华大学电子工程系高能效计算实验室研究生,研究方向主要是:面向视觉生成的高效算法,与软硬件协同设计近年来,随着视觉生成模型的发展,视觉生成任务的输入序列长度逐渐增长(高分辨率生成,视频多帧生成,可达到 ...
近年来,模仿学习不仅在传统的强化学习中取得了进展,也开始对大语言模型(LLM)产生一定影响。近日,加州大学伯克利分校的研究者提出了一种名为 Q-chunking 的方法,该方法将动作分块(action chunking)—— ...
王思聪身穿白色T恤,搭配墨镜,网友们注意到他似乎瘦了一些,脖子微微前倾,头发略显稀疏,稍显凌乱,让人忍不住猜测他是不是好几天没有打理过头发。不过,这就是王思聪,潇洒自在,从不在乎他人的眼光,洒脱得让人羡慕!
实现通用的,无需训练的稀疏 Attenion 有哪些挑战? 挑战 1 通用性:Attention 虽然具备稀疏性质,但是其稀疏形状在不同的模型甚至同一模型的不同层 ...
当稀疏计算与密集计算的负载差异较大时,我们将摇摆类型的 block 转换为负载较小的类型,以实现单 batch 稀疏矩阵乘法的计算单元负载均衡(如图 ...
新型类脑稀疏模块化架构. 探索更高效的模型架构, MoE是最具代表性的方向之一。 MoE架构的主要优势是利用稀疏激活的性质,将大模型拆解成若干 ...
最大功耗90W,INT8稀疏计算性能达到708TFLOPS。 智东西4月11日报道,美国AI三巨头不仅在大模型赛道争奇斗艳,还纷纷卷起自研AI芯片。昨天“AI界汪峰 ...
针对稀疏大规模多目标优化问题(lsmops)中决策变量稀疏分布检测与非零变量协同优化的难题,研究人员提出了一种多知识驱动的进化算法(mkmoea)。该算法通过双层编码方案整合先验知识与当前进化信息,结合关联优化方法显著提升解集质量。实验证明其在基准测试和实际应用中均优于现有稀疏lsmoeas ...
叠层电池检测中,传统工业 ct 扫描耗时,稀疏角 ct 扫描又存在细节丢失问题。研究人员开展 “非均匀稀疏扫描角选择法用于叠层电池有限角工业 ct 检测” 研究。结果显示该方法提升图像重建质量,对叠层电池快速检测意义重大。
当前正在显示可能无法访问的结果。
隐藏无法访问的结果