2 天
人人都是产品经理 on MSNGPT-4o多模态生图爆火,一句话P图效果惊艳,我实测了6种好玩又提效 ...在AI技术飞速发展的今天,GPT-4o的多模态生图功能以其惊艳的视觉效果和广泛的应用场景,正在重新定义创意工作的边界。这一革命性工具的6种实用玩法,从风格转换到表情包制作,从商品图换场景到虚拟试穿,每一种都可能成为你工作中的效率倍增器。
就在刚刚,港中文的一位博士生Jie Liu破解了GPT-4o不一般的前端生图秘密:实际上,它很大可能是原生自回归(AR)生成的,甚至我们可以手动改图。 无独有偶,CMU博士Sangyun Lee也推测出,GPT-4o的图像生成原理,应该大致如下: ...
但就在GPT-4o火遍全球之际,一个来自初创团队的新模型Reve Image(Halfmoon),却凭借其在特定图像生成领域的出色表现,悄然赢得了用户和专业榜单的认可,排名连续多日超过GPT-4o,在人物、奇幻与神话、插画等细分领域更是妥妥的王者。
此外,团队通过用相应的文本描述替换图像输入,创建了一个仅文本版本 Creation-MMBench-TO。对这两个基准的实验全面的评估了主流多模态大模型的创作能力,并探查出了视觉指令微调对模型的潜在负面影响。
根据独立AI评测机构Artificial Analysis测试,GPT-4o实至名归,在图像竞技场中以ELO评分并列第一,超越Recraft V3、FLUX 1.1 [Pro版]和Gemini 2.0 Flash。
该论文采用了名为DE-COP 的方法(2024 年首次在学术论文中提出),旨在检测语言模型训练数据中的受版权保护内容。这种方法也被称为"成员推理攻击",通过测试模型是否能可靠区分人类撰写文本与相同文本的 AI ...
图片来源:Unsplash多家机构指控 OpenAI 可能利用付费墙后的 O'Reilly 书籍训练 AI 模型,未经许可使用受版权保护的内容训练其人工智能。如今,一家 AI ...
鲸哥也用4o生成了自己的头像,大家看看是不是还挺好玩。要知道此前AI头像生成是小红薯上非常赚钱的副业赛道。现在门槛被打没了,你只需要一句话就可以生成(记得这是3D迪士尼风格即可)。
近来风头正盛的 GPT-4.5,不仅在日常问答中展现出惊人的上下文连贯性,在设计、咨询等需要高度创造力的任务中也大放异彩。 当 GPT-4.5 在创意写作、教育咨询、设计提案等任务中展现出惊人的连贯性与创造力时,一个关键问题浮出水面: 多模态大模型(MLLMs)的“创造力天花板”究竟在哪里? 写一篇基于图片的短篇小说、分析一张复杂的教学课件、甚至设计一份用户界面…… 这些对于人类驾轻就熟的任务,对 ...
为了获得更好的生成效果,在进行提示词描述时,尽量简洁而准确地给出人物、动作和神态,比如「这个女人慢慢转过头去,留下一个背影」、「这个女人悲伤严肃地眨着眼睛」等。 因此,我们的建议是二者搭配「食用」 ,不好描述提示词、且涉及大幅度运动时使用 ...
3 天
人人都是产品经理 on MSNGPT-4o深度体验后发现,可能comfyUI工作流真不用学了本文深入体验了GPT-4o图像生成模型,发现其在多种设计场景中表现出色,甚至可能让comfyUI工作流的学习变得不再必要。 上周我介绍了gemini生图模型,我觉得已经算是实用性很强了,但紧接着Open ...
3 天
人人都是产品经理 on MSN【真实测评】GPT 4o秒杀图像类套壳应用?前段时间GPT 4o更新之后,可以直接生成图片。而吉卜力图片的出圈,让这个功能更为广为人知。但具体的表现怎么样?我们看看作者测评的结果。 一、为什么要进行测评 GPT ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果