
{{!completeInfo?'请完善个人信息':''}}
OpenAI联合创始人兼首席执行官Sam Altman发布消息急购10万单位的GPU资源,显示出OpenAI在算力方面的巨大需求。
摘要
GPT-4o的文生图功能让这个发布近一年的老模型焕发第二春,用户增长迅猛。Altman称,ChatGPT在五天内新增了一百万用户,而过去一小时又新增了100万用户,显示出其强大的传播力。
GPT-4o在文生图领域迅速破圈,超越了Midjourney和Stable Diffusion等竞争对手。GPT-4o的优势在于超强的图像控制能力、逼真的画面效果,以及易用性和独特的吉卜力风格。
GPT-4o支持生成吉卜力风格的漫画、风格转换(如将图片转换为吉卜力风格)、草图变图片等功能。用户利用GPT-4o生成了多种创意内容,如《指环王》预告片、真人格斗游戏设计图、超写实图片等。
由于GPT-4o的火爆程度超出预期,OpenAI不得不对免费功能进行限制,目前每天只能生成几张图片。这种限制可能是由于服务器压力过大,显示出OpenAI在应对突发需求时面临的挑战。
今天凌晨,OpenAI联合创始人兼首席执行官Sam Altman发布在线急购GPU的消息:如果有人能提供10万单位的GPU资源并能尽快交付,请马上联系我们!
同时正在逐步控制局面。但大家应该预料到,由于我们在应对算力方面的挑战,OpenAI 的新发布内容将会延迟,可能会出现一些问题,并且服务有时也会变得很慢。
仅一个文生图功能,就让GPT-4o这个发布了将近一年的老模型焕发第二春,迎来井喷式用户增长。
同时Altman在社交平台宣布,26个月前推出的ChatGPT是我见过的最疯狂的病毒式传播事件之一,我们在五天内就新增了一百万用户。
而在过去的一小时里,我们就又新增了100万用户。
随后,官宣GPT-4o的文生图功能再次免费开放,但火爆程度还是超出了OpenAI预期。
其实文生图领域一直是个老赛道,闭源的Midjourney稳坐王座,开源的Stable Difusion总下载量也超过1亿次。但为啥GPT-4o还能破圈,把这两位高手拉下马呢?
除了超强的图像控制、文本还原能力、逼真的画面之外,易使用和吉卜力风格是这次GPT-4o实现病毒式传播的主要原因之一。
Midjourney在2023年是相当的火爆,几乎和ChatGPT不相上下。但最早的版本使用体验比ChatGPT差太多了。
用Midjourney生图片感觉和写dos代码差不多,需要使用/imagine prompt、--quality、--s、--seed、--ar等各种复杂的参数。
此外,Midjourney还没有自己的服务器只能在Discord上使用,注册起来非常非常麻烦严重影响体验。
估计后来Midjourney自己也觉悟了,开始简化提示词格式,支持纯文本提示和可视化控制,发布自己的独立网站,但热度已经过去趋于平稳。
而Stable Difusion依然是开源文生图的标杆,但这家公司已经蹦了。CEO被董事会开除,欠员工薪水等负面新闻不断。很久很久没有发布新的重磅产品,一直在吃老本。
其实,OpenAI也有自己的文生图模型DALL·E系列,已经更新至3.0版本。估计这一次的GPT-4o使用的还是DALL·E系列(目前没公布具体型号),但效果比前三次强太多了。
GPT-4o玩法展示
说了那么多,「AIGC开放社区」就为大家展示一下用户通过GPT-4o,实现的疯狂案例吧。才过几天,玩法已经千奇百怪了。
吉卜力风格漫画,这个也是GPT-4o破圈的主要原因之一。
只需要输入提示词:吉卜力漫画风格,中间写着OpenAI和GPT-4o。GPT-4o的字体略小。
虽然GPT-4o支持中文提示,但为了准确还原文本提示,最好使用英文。
也可以生成统一风格的吉卜力漫画。但必须对图片进行连续调整,就是基于它的多轮提问功能,直接用文本说就行调教起来很简单。估计宫崎骏看到这个要掀桌子了吧~
或者直接上传图片,然后让它转换成吉卜力。这种风格转换在国内外使用的非常多。
还有用户通过GPT-4o+快手可灵,直接生成了一个吉卜力风格的《指环王》预告片。
也有人打算使用GPT-4o快速生图的能力,制作一款真人格斗游戏。
除了风格变换之外,也能直接将草图变成图片,这对于设计师来说能节省海量时间。例如,上传一张草图,然后提示:将这幅草图转化为一张超写实的YT缩略图,尺寸为 1920x1080。
在创作过程中唯一应保留的文字是 “1000 MPH” 以及它旁边的箭头。其余的文字都是供你遵循的关于细节方面的指示。
也可以秒出设计图,上传一张随机的鞋子图片,然后提示词:80 年代的创意广告,阿迪达斯风格。
简约的3D UI图片。专业的设计师来绘画这些,最少也得1—3天吧。
GPT-4o也是抄袭UI风格的利器,例如,你看好了一家网站的风格,直接截图上传到GPT-4o,然后提示词:以这个化妆品网站为参考,为一家现代面包店创建一个主页。
保持相同的布局、字体和简洁风格。用高品质的面包和糕点图片替换护肤相关内容。页面要包含大尺寸主视觉区、品牌使命、产品类别和特色商品展示。输出为逼真的网站图片。
虽然并不完美,但十几秒直接出概念图还是相当震撼的。
GPT-4o生成的写实人物也相当逼真,提示词:《赛博朋克2077》中的强尼-银手登上《VOGUE》杂志封面,呈现时尚杂志摄影大片风格。强尼 银手手持Arms 3516摆姿势,身着强尼的背心、戴着强尼的飞行员墨镜,搭配强尼的裤子和鞋子。
采用电影级灯光效果。封面顶部有《VOGUE》标志,采用时尚杂志布局,背景简约,展现专业摄影风格。除了模特背后顶部的《VOGUE》标题外,不添加任何其他文字。
十几秒就能出一个超写真的大片风格海报。
需要注意的是,「AIGC开放社区」在OpenAI发布GPT-4o图像功能那天使用时,免费功能是没有任何限制的。现在的免费功能,每天只能生成几张图片,想再使用只能等第二天重置了。
估计是实在太火爆OpenAI服务器扛不住才加的限制吧。所以,从这点就能看出,他们最初发布的时候也没想到能火爆到这个地步。
原文链接:点击前往 >
文章作者:AIGC开放社区
版权申明:文章来源于AIGC开放社区。该文观点仅代表作者本人,扬帆出海平台仅提供信息存储空间服务,不代表扬帆出海官方立场。因本文所引起的纠纷和损失扬帆出海均不承担侵权行为的连带责任,如若转载请联系原文作者。 更多资讯关注扬帆出海官网:https://www.yfchuhai.com/
{{likeNum}}
好文章,需要你的鼓励