资讯

在人工智能研究领域,2025年迎来了一项重要突破。由ByteDance Seed团队主导的研究成果《Emerging Properties in Unified Multimodal ...
想象一下,如果机器人能像我们人类一样,既能理解"帮我找个休息的地方"这样的日常话语,又能灵活地避开障碍物安全到达目的地,那该有多神奇?这听起来像科幻电影里的情节,但ByteDance Seed的研究团队已经让这个梦想变成了现实。 这项突破性研究发表于2025年6月,由ByteDance ...
研究团队还发现了一个有趣的现象:当将多个图片条件拼接成单一输入图片时,现有的基于多模态大语言模型的检索系统在R@1指标(检索结果第一个就是正确答案的比例)上表现比顺序输入多个图片的方式高出约16倍。这与多模态大语言模型在视觉理解任务上的表现规律相悖。
近日,抖音内容技术团队开源了 ContentV,一种面向视频生成任务的高效训练方案。该方案在多项技术优化的基础上,使用 256 块 NPU,在约 4 周内完成了一个 8B 参数模型的训练。尽管资源有限,ContentV ...
在视频生成技术迅速发展的今天,来自ByteDance智能创作团队的研究者们发布了一项令人振奋的突破性成果。 由Angtian Wang、Haibin Huang、Jacob Zhiyuan Fang、Yiding Yang和Chongyang Ma共同完成的研究论文《ATI: Any Trajectory Instruction for Controllable Video ...
大量文章宣传这个开源利器,感谢开源作者们的无私奉献,当体验完demo后,感觉找到了我想要的codes... but,源码仅仅是部分识别能力的开源, 并没提供类似demo这样,能通过输入pdf后,输出一个完整的markdown, 这,,,让人很伤心😭,,,,,, 希望作者能提供帮助,如何进行识别结果的合并,输出 ...
抖音生活服务严正声明,平台从未授权任何第三方以“独家代理”“内部渠道”等名义收取费用,相关招商承诺均属虚假信息。如商家遇到可疑招商或调研活动,请务必核实合作方身份,切勿轻易提供营业执照、账号密码等敏感信息。参与线下活动前,客通过官方客服热线950529核实主办方资质;如发现异常,请立即终止合作并向平台举报,举报邮箱localservices-clean@bytedance.com。
论文基本信息 这项研究由普林斯顿大学的Ling Yang、Mengdi Wang,北京大学的Ye Tian、Bowen Li、Yunhai Tong,清华大学的Xinchen Zhang以及ByteDance Seed的Ke Shen共同完成。论文题为《MMaDA: Multimodal Large Diffusion Language ...
而就在去年11月,美国电子眼镜厂商Igeniospec就向美国美国国际贸易委员会提出过337立案调查申请,并请求美国ITC发布有限排除令、禁止令。其中被调查企业包括中国北京抖音有限公司、美国 ByteDance ...
"title": "Ollama 对比 GPT-4 人工智能工具比较 - aitools.fyi", "url": "https://aitools.fyi/zh/compare/ollama-vs-gpt-4", "content": "Ollama 对比 GPT-4\n\n在 ...
2025年6月6日-7日,第7届北京智源大会将以线上+线下联动的形式召开,本次智源大会汇聚四位图灵奖得主、海内外顶尖机构学者与产业领袖,在思辨与实证的交织中,为 AI 的未来绘制航图。报名通道已开启。2025北京智源大会倒计时:4 天PyTorch ...
想象一下,你参加了一场编程比赛,提交了一个自认为完美的解决方案,却被告知答案错误。当你仔细检查后,发现原来是比赛的测试题目本身出了问题!这听起来似乎很荒谬,但在现实中,这种情况确实存在。这就是字节跳动种子团队的研究者们决定要解决的问题。 这项突破性的研究由字节跳动种子团队的王梓涵、刘思瑶、孙阳、北京大学的李洪燕以及字节跳动的沈恺等研究人员共同完成,并在2025年6月正式发布。对于那些想深入了解技术 ...