惠安汇通石材有限公司惠安汇通石材有限公司

穿着高跟鞋的女奥特曼,穿红色高跟鞋的奥特曼

穿着高跟鞋的女奥特曼,穿红色高跟鞋的奥特曼 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机(jī)器人ChatGPT火(huǒ)爆以来,微软(ruǎn)公司(sī)创始人比尔·盖(gài)茨已多次公(gōng)开谈论人(rén)工智能话题。在最近的一次采访中,他再次表示:“AI可能会让(ràng)科技行业迎来一(yī)次(cì)剧烈的洗(xǐ)牌”。

这个结论是(shì)他(tā)在(zài)当地时间(jiān)2月20日接受《In Good Company》节(jié)目专(zhuān)访时提出的。

他(tā)预期,AI的发展可能会威胁到(dào)谷(gǔ)歌(gē)的市占(zhàn)率,因为微(wēi)软在AI方面(miàn)的行动相(xiāng)当迅速。而最终科技巨头将把AI整合成用户的(de)“全能助手”,包(bāo)揽一(yī)切应用,与人们进行沟通并(bìng)提供建议,可以取代亚马逊、Siri或Outlook等应用。

大佬口中全能助手的到(dào)来(lái)可能尚需(xū)时日,但由ControlNet引发的又一次(cì)AI绘画浪(làng)潮,让AIGC在ChatGPT的话题热点包围中杀出重围(wéi)。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入(rù)可控期,将洗牌科技行业?_黑料(liào)正能(néng)量

01

ControlNet颠(diān)覆AI绘画新玩法

AIGC向(xiàng)可控靠近

以AI绘画为代表的(de)AIGC上一次(cì)爆火的(de)时候,还是(shì)2022年8月,在美国科罗拉多州举办的新兴(xīng)数字艺术家竞赛中,一幅名为《太(tài)空歌剧院》的作品获奖。

随后各大厂商的AI绘画软(ruǎn)件被广大(dà)网友熟知(zhī)并体验,Stable Diffusion便是其中代(dài)表(biǎo)。

ChatGPT之(zhī)后又一应用杀疯(fēng)了,AIGC或进(jìn)入可控(kòng)期,将(jiāng)洗牌科技行业?_黑料正(zhèng)能量

用户(hù)们可以在应用中输入一组(zǔ)关键(jiàn)词或者一张照(zhào)片,就能获得一幅AI创作的(de)画作。

作画的关键就是所输入的文本(běn)。同一组关键词也可以创作出很多张风(fēng)格不一样的(de)画(huà)作,这让创作的过(guò)程就像开盲盒。

很多用(yòng)户很喜欢这种(zhǒng)不确定的惊喜,他们会将生成的美图当做(zuò)头像(xiàng)。而(ér)另一部分喜欢翻看AI绘画的(de)“翻车”作品。在社交媒体上,许多(duō)用户分享AI“翻车现场”,例如,一(yī)位网友的小狗(gǒu)照片(piàn)被AI画成了“肌肉男”,还(hái)有网友的个人照片(piàn)被AI识别成了建筑(zhù)。

而如今随(suí)着ControlNet的出现与加持(chí),以(yǐ)往(wǎng)AI绘画的填(tián)写关键词(cí)游(yóu)戏可能要被(bèi)颠(diān)覆了。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业(yè)?_黑料正(zhèng)能量

ControlNet是一位正在斯坦福读博的中(zhōng)国人张吕敏(mǐn)创作(zuò)的一种基于控制点(diǎn)的图像变形(xíng)算(suàn)法,主要(yào)用于数字(zì)图像处理(lǐ)、计算机视(shì)觉和(hé)计算机图形(xíng)学等领域。

其(qí)SD插件一经发布,在短短的两天内便成为了AI绘画领域最新的热点(diǎn)。

在(zài)此之前,大家用了很(hěn)多(duō)方法想(xiǎng)让AI生成的(de)结(jié)果尽(jǐn)可能(néng)的符合(hé)要求(qiú),但是都不尽如人意(yì),它的(de)出现代表(biǎo)着AI生成开始进入真(zhēn)正的可控时期(qī)。

因为(wèi)ControlNet可以直接提(tí)取画面的(de)构图(tú),人物的姿势和画面(miàn)的深度(dù)信息等(děng)。有了它的帮助,就(jiù)不用频繁(fán)的(de)用提(tí)示词来碰运气,抽盲盒式的创作了。

通俗(sú)的说ControlNet相当(dāng)于(yú)给(gěi)AI绘画加了“魔法”,不少(shǎo)博主(zhǔ)的作品已经获得了大量的浏览(lǎn)量,“viggo”就是其中之一,他用(yòng)朋(péng)友的照片直接带她们走进动(dòng)漫世(shì)界(jiè)。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将(jiāng)洗牌科技行业?_黑料正能量

viggo先用StableDiffusion图(tú)片转文字。

再用Text2Prompt插件拓展(zhǎn)找到对应(yīng)的关键词;最后用(yòng)ControlNet插件绑定骨骼开始(shǐ)换关键词试(shì)效果(guǒ)。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进入可(kě)控期(qī),将洗牌科技行业(yè)?_黑料正能量(liàng)

通过图片就(jiù)可(kě)以(yǐ)看出来,效(xiào)果(guǒ)十分惊艳。

ChatGPT之后又一应用杀疯(fēng)了(le),AIGC或(huò)进(jìn)入(rù)可控期,将洗牌科技行业?_黑料正能(néng)量

ChatGPT之后(hòu)又一应用(yòng)杀疯了,AIGC或(huò)进入可控期,将(jiāng)洗牌(pái)科技行业?_黑(hēi)料(liào)正能(néng)量

更厉害(hài)的是(shì),除(chú)了真实的照片,草(cǎo)图也可以加上“魔(mó)法”,知乎大牛“DevPoint”和“逗砂(shā)”介(jiè)绍(shào)到ControlNet还能(néng)实(shí)现线稿转全彩图。大神张吕敏其本尊也亲自回应。

ChatGPT之后又一应用杀疯了(le),AIGC或进入可(kě)控期,将洗(xǐ)牌科技行业?_黑料(liào)正能量

不(bù)得不(bù)说当(dāng)下AIGC已经变得越来越强大,甚至输出的作品都已经(jīng)能以假乱真了。

02

难辨虚(xū)实(shí),AIGC技术力爆发

警惕(tì)安全(quán)问题

近日,“苏州金鸡湖(hú)有(yǒu)游艇party”的(de)消息火遍网络,而经过警方辟谣这所(suǒ)谓的(de)“party”可能是全国(guó)第一起AI绘图诈骗(piàn)。

由于这个活动里面给(gěi)出的美女(nǚ)照片都是(shì)AI制作的真人(rén)照片(piàn)绘图(tú),因为(wèi)太(tài)逼真(zhēn),被(bèi)大家当(dāng)成(chéng)真事(shì)传播了

ChatGPT之后又一应用杀(shā)疯(fēng)了,AIGC或进入可控期(qī),将(jiāng)洗牌科技行业?_黑(hēi)料正能量

不过(guò)仔(zǎi)细观察可以发现,活动发起者(zhě)提供的照(zhào)片中有(yǒu)个(gè)很大的漏洞(dòng)可以发现并非真人,而是AI绘图,那(nà)便(biàn)是图片中女性的(de)手(shǒu)指部分有的存在异常。

ChatGPT之后(hòu)又一应用杀(shā)疯(fēng)了,AIGC或进入可控期,将洗牌科(kē)技行业?_黑料(liào)正(zhèng)能量

有行业人事表示(shì):“现在因为手指部分(fēn)的(de)绘(huì)画(huà)算法比(bǐ)较复杂,AI还不(bù)太会画人的手,但最新看到的图片已经有越来越完美的(de)AI模型出现,以后(hòu)可(kě)能(néng)就完全没有漏(lòu)洞了。

类似(shì)的AI作图诈(zhà)骗在国外也(yě)已有发(fā)生。据英(yīng)国广(guǎng)播(bō)公(gōng)司报道,土耳(ěr)其地震期间(jiān),有Tiktok用户使用AI合成了儿童受灾的假照片(piàn)发布到网络,以此诱骗(piàn)善良的人(rén)打赏“捐助(zhù)”从而实施(shī)诈骗(piàn)。

目前随着技术发展,AIGC已经能做出真人照片般的(de)绘(huì)图(tú)效果(guǒ),如果这样的(de)图片被用来诈骗,将(jiāng)非常可怕(pà)。

此外AIGC还引发(fā)了(le)很多担忧,一方面,批判(pàn)者认为AI在“学习”了大量前人的作品之后,其创作没有任何情(qíng)绪和灵魂,难以和人类的艺术创作相提并(bìng)论(lùn)。

另一(yī)方面,AIGC背后的版权(quán)、目前都并没有得到有效的(de)解决,还有AIGC会不(bù)会穿着高跟鞋的女奥特曼,穿红色高跟鞋的奥特曼代替人类(lèi)“至高(gāo)无上”的创意。

马斯克也强调(diào),人工智(zhì)能的安全问题需要得到重(zhòng)视,太晚就来不及了。

03

AIGC下(xià)一(yī)站(zhàn)除了视(shì)频,还有远方

技(jì)术(shù)都是(shì)有两面性的,潜在的(de)危害并不能掩(yǎn)盖其光辉(huī)的贡献。现在看来,人工智能技术将是第四(sì)次(cì)工业革命的核心驱(qū)动力量,将创造新的增(zēng)长奇迹。

过去一年,人工(gōng)智能在技术(shù)和商业层面都有了巨大(dà)进(jìn)展,AI绘画(huà)就是(shì)人工智能技术发生方(fāng)向(xiàng)性改变的一个代(dài)表。其下一站或许就是视频。

此前,Meta和谷歌先后发布了几条引爆(bào)科技圈的短视频。这些视频引(yǐn)发关注并(bìng)非内容做得多优秀,反(fǎn)而都非常(cháng)简(jiǎn)单,比(bǐ)如(rú)一匹正在喝(hē)水的(de)马,一(yī)只画(huà)画的玩具(jù)熊,或(h穿着高跟鞋的女奥特曼,穿红色高跟鞋的奥特曼uò)者(zhě)一段(duàn)骑摩托(tuō)车的第(dì)一视(shì)角录像,随便一个(gè)有手机的人都可以随(suí)手录(lù)下一(yī)段(duàn)。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入可控(kòng)期,将洗牌科技行业(yè)?_黑料正能(néng)量(liàng)

但这些(xiē)短视频的创作方式非常简(jiǎn)单(dān),创作者仅(jǐn)仅(jǐn)需(xū)要向AI输入(rù)一段(duàn)话(huà),甚至只是说一下要(yào)求(qiú),AI就可以根据(jù)需要生(shēng)成(chéng)一(yī)段(duàn)视(shì)频。

谷歌发布的两个AI生成(chéng)视频分(fēn)别(bié)来自于(yú)Imagen Video和Phenaki,前者主要突(tū)出的是(shì)高清,与(yǔ)Meta的Make-A-Video没有(yǒu)太(tài)多的差别(bié)。

在Make-A-Video公布了(le)AI生成的视频后,AI圈就已经玩了(le)一波梗,一个能够做(zuò)出更高清视频的AI还不(bù)足(zú)以在短时间内戳中兴奋点。

Phenaki更加令人震(zhèn)惊的地(dì)方在于(yú),它(tā)可以制作出超过2分钟(zhōng)的连贯的也有确切(qiè)内容的视频(pín),这才是真正让(ràng)人们(men)感到惊(jīng)喜的地方。因为无论(lùn)AI生成(chéng)的视频多么(me)高清,也只能(néng)是为内容生产(chǎn)者(zhě)提供一(yī)个灵感,一个素材(cái),一个过场(chǎng)动(dòng)画。

不过能够制作出有具(jù)体剧情内(nèi)容的视(shì)频就意味着(zhe),一些视频创作由AI代替人工完成已经初步有了(le)可能。

当下AI的发展(zhǎn)速度已经超过大(dà)部分(fēn)人(rén)的想象。内容产业的(de)本质(zhì)是供给(gěi)创造需求,AIGC作(zuò)为全(quán)新(xīn)的内(nèi)容生产方式,可以为内(nèi)容(róng)产业带来更新(xīn)的内(nèi)容风(fēng)格、更快的生产速度(dù),更低的生产成本(běn),这无疑会驱动内容产业的(de)大(dà)爆(bào)发。

除了AI绘(huì)图、视频,AIGC技术还能应用于音(yīn)乐、代码、机(jī)器人(rén)动作等多种内容形式的生(shēng)成。不难发现该(gāi)项技术(shù)不仅在游戏等行(xíng)业能得到有(yǒu)效(xiào)应用,对于(yú)下一代互联网(wǎng)各种(zhǒng)元素的构建亦有关键意(yì)义。

从商业化的角度来(lái)看,文化娱乐、教(jiào)育(yù)、传媒等诸多(duō)领域,本身就对(duì)基于AI的可视化内容有强烈需求。

因此,AI绘画及视频或不是结(jié)果(guǒ),而只(zhǐ)是AI进(jìn)程中的一块重要拼图,有望在技术更新(xīn)的加持(chí)下实现更大的应(yīng)用(yòng)价值(zhí)。

AI从理解内容(róng),走(zǒu)向了(le)可以生成内容,甚至能够(gòu)创造出独立价值和独(dú)立视角(jiǎo)的内容。AIGC的再次出圈,更(gèng)代表着未来(lái)的先进生产力即将到来。

ChatGPT之后又(yòu)一应(yīng)用杀疯了,AIGC或进入可控期,将(jiāng)洗牌科技行业?_黑料正(zhèng)能量

04

紧抓大(dà)模型与(yǔ)算力,牢固AIGC底座(zuò)

从技(jì)术(shù)的发展也可以(yǐ)看出(chū),在语言(yán)大模型、图像大(dà)模型之后,多模态大模型已经成(chéng)为了新的趋势。

大(dà)模型被誉为(wèi)当前人(rén)工智能发展的智(zhì)能(néng)底座,是全(quán)球(qiú)竞争最激烈的研究方(fāng)向之一,包括谷歌、亚马逊、百度、阿里、腾讯(xùn)等(děng)众多头部(bù)企业(yè)都在竞相发力。

不过训(xùn)练大模(mó)型(xíng)的(de)确价格(gé)不菲,以国盛证(zhèng)券发布的《ChatGPT需要(yào)多少算力(lì)》报告(gào)估算,GPT-3训练一次的成本约为140万(wàn)美元。而对于一些更大的LLM(大型语(yǔ)言模型),训练成本则介于200万美元至1200万(wàn)美元高价之间。

以(yǐ)ChatGPT在2023年1月(yuè)的独立访客(kè)平(píng)均数1300万(wàn)计算,其对应芯片(piàn)需求为3万多片英(yīng)伟达A100 GPU,初始(shǐ)投入成本约为8亿(yì)美元(yuán),每日仅(jǐn)电费(fèi)就在5万美元(yuán)左右。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进入可(kě)控期,将洗(xǐ)牌科技行业(yè)?_黑料正能量(liàng)

此外不论(lùn)是ChatGPT还是AIGC,都离(lí)不开庞大算力支(zhī)持。在关注各类大模型的发展同时,更应该关注(zhù)算力网(wǎng)络(luò)的建设(shè)。

算(suàn)力网络正驱动AI产业发(fā)展进入史(shǐ)诗级加速进程,让AIGC及通(tōng)用AI这一人工智能发展(zhǎn)的终极目(mù)标离(lí)得更近(jìn)。

因为算力可以对突破(pò)性技(jì)术创新提供大(dà)力的支持。这方面(miàn),多模(mó)态大模型是(shì)典型。作(zuò)为(wèi)面(miàn)向未来强人工智能、通用人工智能的重要技术创新,多(duō)模态大模(mó)型已经(jīng)在人工(gōng)智能领域提出了很多年,业界也有不少(shǎo)技(jì)术突破,但是,多模态(tài)大模型(xíng)进一步往下(xià)走,算力需(xū)求呈几(jǐ)何式上升(shēng),一般的(de)算力基础设(shè)施很快将难(nán)以(yǐ)胜任。

从图像、文字、语音单独一项的训练(liàn),到双模态、三模(mó)态(tài)的跃(yuè)迁,让人工智能可以灵活应(yīng)对不同模态的转化、像人(rén)与世界交互一样自(zì)然,这方面,由(yóu)算力网络来驱动将有明显(xiǎn)优势。

ChatGPT之后又一应用杀(shā)疯了,AIGC或(huò)进(jìn)入可控期,将洗牌(pái)科技行业?_黑料正能量(liàng)

此外,还(hái)有很多需要爆发(fā)式增长的(de)算力来支撑的(de)技术创新,将在人(rén)工智(zhì)能(néng)算(suàn)力网络支撑下快速推进(jìn)。

AIGC已经露出曙光,期待在大模型和(hé)大算力的支(zhī)持下(xià)AIGC能持续颠覆内容(róng)生产(chǎn)的方式,将(jiāng)创造的边(biān)际成本降(jiàng)低(dī),让万众(zhòng)受(shòu)益。

未经允许不得转载:惠安汇通石材有限公司 穿着高跟鞋的女奥特曼,穿红色高跟鞋的奥特曼

评论

5+2=