资讯

想象一下,如果机器人能像我们人类一样,既能理解"帮我找个休息的地方"这样的日常话语,又能灵活地避开障碍物安全到达目的地,那该有多神奇?这听起来像科幻电影里的情节,但ByteDance Seed的研究团队已经让这个梦想变成了现实。 这项突破性研究发表于2025年6月,由ByteDance Seed团队的多位研究者共同完成,包括核心贡献者陈盛、何佩宇、胡家新、刘子扬、王严升、徐涛、张驰、张重重等人。感 ...
近日,抖音内容技术团队开源了 ContentV,一种面向视频生成任务的高效训练方案。该方案在多项技术优化的基础上,使用 256 块 NPU,在约 4 周内完成了一个 8B 参数模型的训练。尽管资源有限,ContentV ...
本仓库收集的镜像站仅供学习研究使用,严禁滥用或用于非法用途,如有违反,造成任何后果与本人无关。 所有镜像站部分搜集自网络,请保护好你的隐私,请勿在镜像站中登录谷歌账号 2024.08.23 删除了投毒CDN,增加了部分NPM、CDNJS镜像,删除了无效镜像。 2023.6. ...
研究团队还发现了一个有趣的现象:当将多个图片条件拼接成单一输入图片时,现有的基于多模态大语言模型的检索系统在R@1指标(检索结果第一个就是正确答案的比例)上表现比顺序输入多个图片的方式高出约16倍。这与多模态大语言模型在视觉理解任务上的表现规律相悖。
China's A-share market has remained steadfast despite headwinds in major Asian markets at the start of the month, and is likely to provide more structural opportunities as the nation rolls out more ...
近日,由浙江大学ZIP实验室的王威杰、ByteDance Seed的陈俊宇以及莫纳什大学的张泽宇等研究者共同发表的论文《ZPressor: Bottleneck-Aware Compression for Scalable Feed-Forward ...
2025年6月6日-7日,第7届北京智源大会将以线上+线下联动的形式召开,本次智源大会汇聚四位图灵奖得主、海内外顶尖机构学者与产业领袖,在思辨与实证的交织中,为 AI 的未来绘制航图。报名通道已开启。2025北京智源大会倒计时:4 天PyTorch ...
在人工智能快速发展的背景下,各大科技公司纷纷推出自己的AI产品。近日,字节跳动(ByteDance)安全与风控部门发布了一封重要内部邮件,宣布将于6月30日起分批禁用包括Cursor和Windsurf在内的多款第三方AI开发软件。这一决定引发了业界的广泛关注。
论文基本信息 这项研究由普林斯顿大学的Ling Yang、Mengdi Wang,北京大学的Ye Tian、Bowen Li、Yunhai Tong,清华大学的Xinchen Zhang以及ByteDance Seed的Ke Shen共同完成。论文题为《MMaDA: Multimodal Large Diffusion Language ...
在人工智能研究领域,2025年迎来了一项重要突破。由ByteDance Seed团队主导的研究成果《Emerging Properties in Unified Multimodal ...
优点:速度快、hf的版本占用显存也小,这比vl模型要好。 缺点:模型幻觉严重,经常出现莫名其妙的东西,比如$\begin{aligned} & =-\frac...这样的东西;还会重复输出一些不存在的内容;这样的比例很大,基本上可以说不可用,效果不如Qwen2.5-7B-VL。 总的来说,出 ...