近年来,AI绘画工具的崛起引发了广泛关注。从MidJourney到DALL-E,这些工具不仅改变了艺术创作的方式,也让普通人对AI技术的应用充满了期待与焦虑。然而,随着AI绘画工具的普及,一个问题也随之浮现:普通人是否能够真正掌握这些工具?
作者|周一笑邮箱|zhouyixiao@pingwest.com想象一下,耗费动画大师宫崎骏数十年心血、一帧一画精雕细琢的艺术风格——比如《起风了》中耗时一年多的四秒人群场景,或是《幽灵公主》里那个生物钻地镜头背后一年零七个月的 5300 ...
飞象原创(魏德龄/文)刚刚过去的三月,人工智能的功能升级可谓一个爆款接着又一个爆款,无论是面向本地部署的Gemma,还是ChatGPT在社交媒体平台上掀起的日式动漫风。假如说以前的人工智能领域还是每年春节一爆款的话,这次则是直接开启了“疯狂三月”。
在一片宁静的海边小镇,夕阳的余晖洒在古老的灯塔上,灯塔的影子拉得很长。远处的海面上,几艘小船在金色的波光中缓缓航行,天空中飘着几朵粉色的云。画面采用水彩画风格,色彩柔和而温暖,营造出一种宁静而梦幻的氛围。
周末和孩子一起去踏青,在文化公园里,他捡起地上的树叶端详了一阵,突然说:“妈妈你看,这树叶边缘的锯齿,像不像AI画的?”我有点意外,没想到孩子的观察 ...
在当今AI技术飞速发展的背景下,OpenAI再次引发了广泛关注。2022年春季,OpenAI推出了DALL-E2,这一承前启后的里程碑式产品标志着人工智能在图像生成领域的重大进展。随着越来越多的用户能亲身体验这一技术,这个数字探索者社群的兴起,仿佛为这一切注入了新生。然而,像许多先前的智能系统一样,DALL-E2在处理一致性文本方面却频频出错,常常会在图像中出现乱码的单词或短语。此外,在处理复杂提 ...
本文深入体验了GPT-4o图像生成模型,发现其在多种设计场景中表现出色,甚至可能让comfyUI工作流的学习变得不再必要。 上周我介绍了gemini生图模型,我觉得已经算是实用性很强了,但紧接着Open ...
OpenAI 的 4o 图像生成器采用了最新的自回归模型。在最近的一篇论文中,来自加州大学圣地亚哥分校和 Nvidia 的研究人员解释道,自回归模型将"图像和指令作为输入,并在普通的下一个 token 范式中预测编辑后的图像 ...
北京时间 3 月 26 日凌晨,谷歌发布了号称最强推理模型的 Gemini Pro 2.5,而在谷歌之前,OpenAI 率先开了场直播,发布了 GPT-4o image ...
就在刚刚,港中文的一位博士生Jie Liu破解了GPT-4o不一般的前端生图秘密:实际上,它很大可能是原生自回归(AR)生成的,甚至我们可以手动改图。 无独有偶,CMU博士Sangyun Lee也推测出,GPT-4o的图像生成原理,应该大致如下: ...
很多网友猜想 GPT-4o 的图像生成采用了「自回归 + 扩散」的范式。比如 CMU 博士生 Sangyun Lee 在该功能发布后不久就发推猜想 GPT-4o 会先生成视觉 token,再由扩散模型将其解码到像素空间。而且他认为,GPT-4o ...