惠安汇通石材有限公司惠安汇通石材有限公司

广西大学唐纪良主任科员,广西大学唐记良

广西大学唐纪良主任科员,广西大学唐记良 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人ChatGPT火爆以来,微软(ruǎn)公司创(chuàng)始人比尔·盖茨已(yǐ)多次(cì)公开谈论人工智能(néng)话题。在最近的一次采访中,他再次表示:“AI可能(néng)会让(ràng)科技(jì)行业迎(yíng)来一次(cì)剧烈(liè)的洗牌”。

这个结论(lùn)是他(tā)在(zài)当(dāng)地时(shí)间2月20日接受(shòu)《In Good Company》节目专(zhuān)访时提出的(de)。

他预(yù)期,AI的发展可能会威胁到谷(gǔ)歌的市占率(lǜ),因为微软在AI方面(miàn)的(de)行动(dòng)相当迅速。而最终科技(jì)巨头将(jiāng)把AI整合成用户(hù)的“全能助手”,包揽一切应用,与人们进行(xíng)沟(gōu)通并提供建议,可(kě)以取代亚马逊、Siri或Outlook等应用。

大(dà)佬口中全(quán)能(néng)助手的到(dào)来(lái)可(kě)能尚需时日,但由(yóu)ControlNet引发(fā)的又一次(cì)AI绘画(huà)浪潮,让AIGC在ChatGPT的话题(tí)热点(diǎn)包围中杀出重围。

ChatGPT之后又一应用杀疯了,AIGC或(huò)进入可(kě)控期,将洗牌(pái)科技行(xíng)业?_黑料(liào)正能量

01

ControlNet颠覆(fù)AI绘画新玩法

AIGC向(xiàng)可控靠近

以AI绘画为代表的AIGC上一次爆火的时候,还是(shì)2022年8月,在美国科罗拉多州举办的新兴数(shù)字(zì)艺术家竞赛中,一幅名(míng)为(wèi)《太空(kōng)歌剧院》的作品获奖。

随后(hòu)各大厂商的AI绘画软件被(bèi)广大网友(yǒu)熟知(zhī)并体(tǐ)验,Stable Diffusion便是其中代表(biǎo)。

ChatGPT之(zhī)后(hòu)又一应(yīng)用杀疯了(le),AIGC或进入可(kě)控期(qī),将洗牌(pái)科技行业?_黑料正能量

用户们可以在应用中输入一组关(guān)键词或者(zhě)一(yī)张照(zhào)片,就能获得一幅(fú)AI创作的(de)画作。

作画的关(guān)键(jiàn)就是所输入的(de)文(wén)本。同一组关键词(cí)也可以(yǐ)创作出(chū)很多(duō)张风格不一样的画作(zuò),这让(ràng)创作的过程就像开盲盒。

很多(duō)用户(hù)很喜欢这种(zhǒng)不确(què)定的惊喜,他们会将(jiāng)生成的美(měi)图当(dāng)做头像。而另一部分(fēn)喜(xǐ)欢(huān)翻看AI绘画的“翻车”作品。在(zài)社交(jiāo)媒体上,许多用户分享AI“翻车(chē)现场”,例如,一位网友的小狗照(zhào)片被AI画成了(le)“肌肉男”,还有网友的个人照片(piàn)被AI识(shí)别成了建筑。

而如(rú)今随着ControlNet的出现与(yǔ)加持,以(yǐ)往AI绘画的填写关键词游戏可能要被颠覆了。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进(jìn)入可(kě)控期,将洗牌科技行业(yè)?_黑料正能(néng)量

ControlNet是一位(wèi)正在(zài)斯(sī)坦(tǎn)福读博的中国人(rén)张吕敏创作的(de)一种(zhǒng)基于控制点的图像变形算法,主(zhǔ)要(yào)用(yòng)于数字图像处(chù)理、计算机视觉和计算机(jī)图形学等(děng)领(lǐng)域。

其SD插件一经发布,在短(duǎn)短(duǎn)的两天内(nèi)便(biàn)成为(wèi)了AI绘(huì)画(huà)领域最新(xīn)的热(rè)点。

在此(cǐ)之前(qián),大家(jiā)用了很多方法想让(ràng)AI生成的结果尽可能的符合要求,但是(shì)都(dōu)不尽如人意,它的出现(xiàn)代表着AI生(shēng)成(chéng)开始进(jìn)入真(zhēn)正的可控时(shí)期(qī)。

因为(wèi)ControlNet可(kě)以直接提取(qǔ)画面的构图,人物的姿势(shì)和画面的深度信(xìn)息等。有了(le)它的帮助,就不用(yòng)频繁(fán)的用提示词来(lái)碰运气,抽盲盒式的创作了。

通俗(sú)的说ControlNet相当(dāng)于给AI绘画加了“魔法”,不少博主的(de)作品已经获得了大量的浏览量,“viggo”就是其中之一(yī),他用朋友的照片(piàn)直接带她们走(zǒu)进动(dòng)漫世界(jiè)。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或(huò)进入可控期,将(jiāng)洗牌(pái)科技行业?_黑(hēi)料(liào)正能(néng)量

viggo先用StableDiffusion图片转文字。

再用Text2Prompt插(chā)件拓展找到对应的关键词;最(zuì)后用ControlNet插件绑定(dìng)骨(gǔ)骼开始换关键词试效果。

ChatGPT之后(hòu)又一(yī)应用(yòng)杀疯了(le),AIGC或进入(rù)可控期(qī),将洗(xǐ)牌(pái)科技行(xíng)业?_黑料正能量

通过图片(piàn)就可以看出来,效果(guǒ)十分惊(jīng)艳。

ChatGPT之后又(yòu)一(yī)应用杀疯(fēng)了(le),AIGC或进入(rù)可(kě)控期,将洗<span style='color: #ff0000; line-height: 24px;'><span style='color: #ff0000; line-height: 24px;'><span style='color: #ff0000; line-height: 24px;'>广西大学唐纪良主任科员,广西大学唐记良</span></span></span>牌科技行业?_黑料正能量

ChatGPT之后又一应用杀疯了(le),AIGC或(huò)进入可控期(qī),将洗牌科技行业?_黑料正能量

更(gèng)厉害的是(shì),除了真实(shí)的(de)照(zhào)片(piàn),草图也可以加上“魔(mó)法”,知乎(hū)大牛(niú)“DevPoint”和“逗(dòu)砂”介绍(shào)到ControlNet还能(néng)实现线稿转(zhuǎn)全彩图(tú)。大神张吕敏其本尊也亲自(zì)回(huí)应。

ChatGPT之后又(yòu)一应用杀(shā)疯了,AIGC或进入可控期,将洗牌(pái)科技行业(yè)?_黑料正能(néng)量(liàng)

不得不说当下(xià)AIGC已经(jīng)变(biàn)得(dé)越来(lái)越(yuè)强大(dà),甚至输出的作品都已经能以假乱真了(le)。

02

难辨虚(xū)实,AIGC技术力爆发

警惕安(ān)全问题

近日,“苏州(zhōu)金鸡(jī)湖有游艇party”的消息火(huǒ)遍(biàn)网(wǎng)络,而经过警方辟(pì)谣这所(suǒ)谓(wèi)的“party”可能是全国第一起AI绘图(tú)诈骗。

由于这个活动里面给出的美女照片都(dōu)是AI制作的真(zhēn)人(rén)照片(piàn)绘图,因为(wèi)太逼(bī)真,被(bèi)大家当(dāng)成真事传播了

ChatGPT之后又一应用杀(shā)疯了,AIGC或进入(rù)可控期,将洗(xǐ)牌科技(jì)行业?_黑(hēi)料正能量(liàng)

不过(guò)仔细观察可以发现,活动发起者提供的照片中有(yǒu)个很大的(de)漏洞可(kě)以发(fā)现(xiàn)并非真人,而是AI绘图,那便是图片中(zhōng)女性的(de)手(shǒu)指(zhǐ)部(bù)分有的存在异常。

ChatGPT之后又一(yī)应用杀(shā)疯了,AIGC或进入可(kě)控(kòng)期,将洗牌科技(jì)行业(yè)?_黑料(liào)正(zhèng)能量

有行(xíng)业人事(shì)表示:“现(xiàn)在因(yīn)为手指部分的绘画算(suàn)法(fǎ)比(bǐ)较复杂(zá),AI还不太会画(huà)人的手(shǒu),但最(zuì)新看(kàn)到的图片已经有越来(lái)越完美的AI模(mó)型出现,以后可能就完全没有漏(lòu)洞了。

类似的AI作图诈(zhà)骗在国外也已有(yǒu)发生。据英(yīng)国广播公司(sī)报道,土耳其(qí)地震期间,有(yǒu)Tiktok用户使用AI合成了儿(ér)童受灾的假(jiǎ)照片发布到网络,以此(cǐ)诱骗善(shàn)良的人打赏“捐助(zhù)”从而实施诈骗。

目前(qián)随着技术发展,AIGC已经(jīng)能做出真人照(zhào)片(piàn)般的(de)绘图效果,如果这样的图片被用来(lái)诈骗,将非(fēi)常可怕。

此外AIGC还引发(fā)了很多担忧,一(yī)方面,批判者认为AI在“学习”了大量前人(rén)的(de)作(zuò)品之后,其创作没有任何情绪(xù)和(hé)灵魂,难以和人类的艺术创作(zuò)相提并论(lùn)。

另(lìng)一(yī)方面(miàn),AIGC背后(hòu)的版权(quán)、目前都(dōu)并(bìng)没有(yǒu)得(dé)到有效的解(jiě)决,还(hái)有AIGC会不会代替(tì)人(rén)类(lèi)“至(zhì)高无上(shàng)”的创意。

马(mǎ)斯克也强调,人工智(zhì)能(néng)的(de)安全问题需要得到重视,太晚就来不(bù)及了。

03

AIGC下一站除了视频,还(hái)有远方

技(jì)术都是有(yǒu)两面性的(de),潜(qián)在的危害并(bìng)不能掩盖其(qí)光辉的(de)贡献。现在(zài)看来,人工智能技术将是第四次工(gōng)业(yè)革命(mìng)的核(hé)心驱(qū)动(dòng)力量,将创造新的(de)增长奇(qí)迹(jì)。

过(guò)去一年(nián),人工智能在技(jì)术和(hé)商业层面都(dōu)有了巨大进展(zhǎn),AI绘画就是人工智能技术(shù)发生方向性改变的(de)一个(gè)代表。其下一站或许(xǔ)就是视频。

此前,Meta和谷歌先后(hòu)发布了几条(tiáo)引爆(bào)科技(jì)圈的短(duǎn)视频(pín)。这些(xiē)视频(pín)引发关注并非内容做得多优秀,反而都非常简单(dān),比如一(yī)匹正在喝水的(de)马,一只画(huà)画的(de)玩具熊,或者(zhě)一段骑摩托车的第一视角录像(xiàng),随(suí)便一个有(yǒu)手机(jī)的人(rén)都可以(yǐ)随手录下一段。

ChatGPT之后(hòu)又一(yī)应用杀疯了,AIGC或进(jìn)入可控期,将洗牌科技行业?_黑料正(zhèng)能量

但这些短视频的创作方式非常简单,创作者仅(jǐn)仅需要向AI输(shū)入一段话,甚至只是说(shuō)一下要求,AI就可(kě)以根据(jù)需要(yào)生成一段视频。

谷歌发(fā)布的两个(gè)AI生成视频(pín)分别来(lái)自于Imagen Video和Phenaki,前者主要突出的(de)是(shì)高(gāo)清,与Meta的Make-A-Video没(méi)有太多的差别。

在Make-A-Video公布(bù)了(le)AI生成的(de)视(shì)频(pín)后,AI圈就已经(jīng)玩了一波梗,一个能(néng)够做出更高清视频(pín)的AI还不足以(yǐ)在(zài)短时(shí)间(jiān)内戳(chuō)中兴奋点。

Phenaki更加(jiā)令人震惊的地方在于(yú),它可以制作出超(chāo)过2分钟(zhōng)的连贯的也有确切(qiè)内(nèi)容的视频,这才是真正(zhèng)让人们感到惊喜(xǐ)的地方。因为无论AI生成(chéng)的(de)视(shì)频(pín)多么高清,也只能是为(wèi)内容(róng)生产(chǎn)者提供一个(gè)灵感,一个素材,一个(gè)过(guò)场(chǎng)动画。

不过能够制作出有具体剧情(qíng)内(nèi)容的视频就(jiù)意味着,一些视频创作由AI代替人工完成已经(jīng)初步有了可(kě)能。

当下AI的(de)发展速度已经超过大(dà)部分人的想(xiǎng)象(xiàng)。内容产业的(de)本质是供给创造需求(qiú),AIGC作为全(quán)新的内容生产方(fāng)式(shì),可以为(wèi)内容(róng)产业带来更新(xīn)的内(nèi)容风格、更快的生产速度,更低的生(shēng)产成本,这无疑会驱动内容产业的大(dà)爆(bào)发(fā)。

除(chú)了AI绘图、视频,AIGC技术还能应用于音(yīn)乐(lè)、代码、机器人动作等多种内(nèi)容(róng)形式的(de)生成。不难发现该项技术不仅在游戏等行(xíng)业能得(dé)到有效应用,对于下(xià)一代互联网(wǎng)各种元素的构(gòu)建亦有(yǒu)关键意义。

从(cóng)商(shāng)业化的角度(dù)来看,文化(huà)娱(yú)乐、教育、传媒等(děng)诸(zhū)多(duō)领域(yù),本身就(jiù)对(duì)基(jī)于AI的可(kě)视化(huà)内容有强烈需求。

因此(cǐ),AI绘画及视频或不是结(jié)果(guǒ),而只是AI进程中的(de)一块重要(yào)拼图,有(yǒu)望在技术(shù)更新的加持(chí)下实现(xiàn)更大的应用(yòng)价值。

AI从理解(jiě)内容(róng),走向了可以(yǐ)生成内容(róng),甚至能够创造出独立价值和独立视角(jiǎo)的内容(róng)。AIGC的再次(cì)出圈,更代表着未来的先进生产力即将到来。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或进(jìn)入可控(kòng)期,将洗牌科(kē)技(jì)行业(yè)?_黑料正能量

04

紧抓大(dà)模型与算力,牢固(gù)AIGC底座

从(cóng)技(jì)术的发展(zhǎn)也可(kě)以看出,在语(yǔ)言(yán)大模型、图(tú)像大模型之后(hòu),多模态大模型(xíng)已经(jīng)成为了新的趋势。

大模(mó)型被誉(yù)为(wèi)当(dāng)前人工(gōng)智能发展的智能(néng)底座,是全球竞争最(zuì)激烈的研究方向(xiàng)之(zhī)一,包(bāo)括谷歌、亚马逊、百度、阿(ā)里、腾(téng)讯(xùn)等众(zhòng)多(duō)头部(bù)企业都(dōu)在(zài)竞(jìng)相(xiāng)发力。

不过训练(liàn)大模型(xíng)的确价格不菲,以国盛证(zhèng)券发布(bù)的(de)《ChatGPT需(xū)要多(duō)少(shǎo)算力》报告估(gū)算,GPT-3训练(liàn)一次的成本约为(wèi)140万美元。而对于一些更(gèng)大(dà)的LLM(大型语(yǔ)言模型(xíng)),训练(liàn)成本则介于(yú)200万美元(yuán)至1200万美元高(gāo)价之间。

以ChatGPT在(zài)2023年1月的独立访客平均数1300万计算(suàn),其对应(yīng)芯片需求(qiú)为3万多片英伟达A100 GPU,初始投(tóu)入成(chéng)本约为(wèi)8亿(yì)美元,每日仅(jǐn)电(diàn)费就在5万美元左右。

ChatGPT之(zhī)后又(yòu)一(yī)应(yīng)用杀疯了,AIGC或进入可控期,将洗牌科(kē)技行(xíng)业(yè)?_黑(hēi)料正能量

此外不论(lùn)是ChatGPT还是(shì)AIGC,都离不开庞大算力支持。在关注各类(lèi)大(dà)模型的发展同时,更应该关注(zhù)算力网络的建设(shè)。

算力网(wǎng)络正驱(qū)动AI产业发(fā)展进(jìn)入史诗级加速进程,让AIGC及(jí)通用(yòng)AI这一人工智能发展的终极目标离(lí)得更近。

因为(wèi)算力(lì)可以对(duì)突破性技术创新提(tí)供大力的支持。这方(fāng)面,多模态大(dà)模型(xíng)是典(diǎn)型。作为面向未来强(qiáng)人工智能、通(tōng)用人工智能(néng)的重(zhòng)要技(jì)术创新,多(duō)模态大模型已经在人工智能(néng)领域提出了很多年,业界也有不少技术突破,但是,多模(mó)态大模型进一步往下(xià)走,算力(lì)需求呈几何(hé)式上升,一般的算力(lì)基础设施很(hěn)快将难(nán)以胜任。

从图像、文字(zì)、语(yǔ)音单独一(yī)项的训练,到双模态、三模态的跃迁,让人工(gōng)智能可以灵活应对不同模态的转化、像人与世界交互一样自然,这方面(miàn),由算力网络来驱动将(jiāng)有明显优(yōu)势。

ChatGPT之后又一应用杀(shā)疯了,AIGC或(huò)进入可(kě)控期(qī),将洗牌科技行(xíng)业(yè)?_黑料正能量

此外,还有很多需要爆发(fā)式(shì)增长的(de)算力来(lái)支撑的(de)技术创(chuàng)新,将在人(rén)工智能算力网络支撑下快(kuài)速推(tuī)进(jìn)。

AIGC已(yǐ)经露出曙(shǔ)光,期待在大模(mó)型(xíng)和大算力的支持(chí)下AIGC能持(chí)续颠(diān)覆内容生(shēng)产的(de)方式,将创造(zào)的边际成本降低,让万众受(shòu)益。

未经允许不得转载:惠安汇通石材有限公司 广西大学唐纪良主任科员,广西大学唐记良

评论

5+2=