惠安汇通石材有限公司惠安汇通石材有限公司

感知力是一种什么能力,手机情景感知是什么意思

感知力是一种什么能力,手机情景感知是什么意思 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊(liáo)天机器(qì)人ChatGPT火爆(bào)以来(lái),微软公(gōng)司(sī)创(chuàng)始人比尔·盖茨已多次公开谈论人(rén)工智(zhì)能话(huà)题(tí)。在最(zuì)近的(de)一次采访中(zhōng),他再(zài)次表示:“AI可能会让科技(jì)行(xíng)业迎来一次剧(jù)烈的洗牌”。

这(zhè)个(gè)结(jié)论(lùn)是他在当地时间2月(yuè)20日接受《In Good Company》节(jié)目专访时提出的。

他预(yù)期,AI的发展可能会威(wēi)胁到谷歌的市占率,因为微软在AI方面的行动相当(dāng)迅速。而最终(zhōng)科技巨头将把AI整(zhěng)合成用(yòng)户的“全能助手(shǒu)”,包揽一(yī)切应(yīng)用,与人们(men)进行沟通并提供建议,可以取代亚马逊、Siri或Outlook等应用。

大(dà)佬口中全能助手的到来(lái)可(kě)能尚需时日,但由ControlNet引发的又一次AI绘画(huà)浪潮,让AIGC在ChatGPT的话题热点包围中(zhōng)杀出重围。

ChatGPT之(zhī)后又一应用杀疯了(le),AIGC或进入可控期(qī),将洗牌科技行业(yè)?_黑料正(zhèng)能(néng)量(liàng)

01

ControlNet颠覆(fù)AI绘(huì)画新(xīn)玩法

AIGC向可控靠近(jìn)

以(yǐ)AI绘(huì)画为代表(biǎo)的AIGC上一次爆火的时候(hòu),还是2022年8月(yuè),在美国科罗拉多州举办的新兴(xīng)数(shù)字(zì)艺术家(jiā)竞赛(sài)中(zhōng),一(yī)幅名为(wèi)《太空歌剧(jù)院》的(de)作品获奖。

随后各大厂(chǎng)商的AI绘画软件被广大网友(yǒu)熟知并(bìng)体验,Stable Diffusion便是其中代表。

ChatGPT之后(hòu)又一应(yīng)用(yòng)杀疯了,AIGC或(huò)进入可(kě)控期,将(jiāng)洗牌(pái)科技(jì)行业?_黑料正能量

用户们可以在应用中输入一组关(guān)键词(cí)或(huò)者一张照片,就能(néng)获得(dé)一(yī)幅AI创(chuàng)作的画作(zuò)。

作画(huà)的关键就是所输(shū)入(rù)的文本。同一组关键词(cí)也(yě)可以创作出很(hěn)多张风格不一样的画作,这让创作的过(guò)程就(jiù)像开盲盒(hé)。

很多用户很(hěn)喜欢(huān)这(zhè)种不确(què)定(dìng)的惊喜,他(tā)们会将生(shēng)成的(de)美图(tú)当做头像。而另(lìng)一部分(fēn)喜欢翻看(kàn)AI绘画的“翻车(chē)”作(zuò)品。在社交媒体上,许多用户分(fēn)享AI“翻车现场”,例如,一位网友的(de)小狗照(zhào)片(piàn)被AI画成了“肌(jī)肉男”,还(hái)有网友的(de)个人(rén)照片被AI识别成(chéng)了(le)建筑。

而如今随着ControlNet的出现与加持,以往(wǎng)AI绘画的填(tián)写(xiě)关键词游戏可能要被颠(diān)覆(fù)了(le)。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入可控期,将洗牌科技(jì)行业?_黑(hēi)料(liào)正能量

ControlNet是一位正在(zài)斯坦福读博的中(zhōng)国人张吕敏创作的(de)一种(zhǒng)基(jī)于控制(zhì)点的图像变形算法,主要用于数字图像处理(lǐ)、计算机视觉和计(jì)算机图(tú)形学等领域。

其SD插件一经(jīng)发(fā)布(bù),在短短的两(liǎng)天内便成为了AI绘画领域最新的(de)热点。

在此(cǐ)之前,大家用了很多(duō)方法(fǎ)想让(ràng)AI生成的结果尽可能的符(fú)合(hé)要(yào)求,但是(shì)都(dōu)不尽如人意,它的(de)出现(xiàn)代表着(zhe)AI生成开始进入真(zhēn)正的(de)可控(kòng)时期。

因为ControlNet可以(yǐ)直接提取画面(miàn)的构图,人物的(de)姿(zī)势和(hé)画(huà)面的深度信息等。有了它的帮助,就不用频繁的用提示词来碰(pèng)运气,抽盲盒式的创作(zuò)了。

通俗的说ControlNet相(xiāng)当(dāng)于给AI绘画加了(le)“魔法(fǎ)”,不少博主的作品已经(jīng)获(huò)得了大量的浏览量,“viggo”就是(shì)其中(zhōng)之一,他用(yòng)朋(péng)友(yǒu)的照片直接带她(tā)们走进动(dòng)漫世(shì)界。

ChatGPT之后又一(yī)应用杀疯了(le),AIGC或(huò)进入可(kě)控期,将(jiāng)洗牌科(kē)技行业?_黑料正能量

viggo先用StableDiffusion图片转文字。

再(zài)用Text2Prompt插(chā)件拓(tuò)展找到对应的(de)关键词;最后(hòu)用ControlNet插件绑定骨骼开(kāi)始(shǐ)换关键词试效果。

ChatGPT之(zhī)后又一应用杀疯(fēng)了,AIGC或进入可控期,将洗牌(pái)科技行业?_黑料(liào)正能量

通过图(tú)片(piàn)就可以看出来,效果十(shí)分惊艳。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或(huò)进(jìn)入(rù)可控(kòng)期,将洗牌科技行业?_黑料正能(néng)量

ChatGPT之后(hòu)又一应(yīng)用杀疯(fēng)了,AIGC或进入可控期,将洗牌科技行(xíng)业?_黑料正能(néng)量

更厉(lì)害(hài)的(de)是,除了真实(shí)的照片,草(cǎo)图(tú)也可以加上“魔(mó)法”,知乎大(dà)牛“DevPoint”和“逗砂”介绍到ControlNet还(hái)能实(shí)现线稿转全彩(cǎi)图。大神张吕敏其本尊(zūn)也亲自回应。

ChatGPT之后又一应用杀疯了,AIGC或(huò)进入(rù)可控期,将(jiāng)洗牌科技行(xíng)业?_黑料正能量

不得不说当(dāng)下AIGC已经变得越来越(yuè)强大,甚至输出的作品(pǐn)都已经能以假乱真了。

02

难辨虚(xū)实,AIGC技术力爆发

警惕安全问题

近日,“苏州金鸡湖有游艇party”的消息(xī)火遍网(wǎng)络,而经(jīng)过(guò)警(jǐng)方辟谣这所谓的“party”可(kě)能是全国第一起AI绘图诈骗。

由(yóu)于(yú)这(zhè)个活动里面给出(chū)的美女照(zhào)片都是AI制作的真人照片绘图,因为太逼真,被大家当成(chéng)真事传(chuán)播了

ChatGPT之后(hòu)又一应用(yòng)杀疯了,AIGC或进入可(kě)控期,将洗(xǐ)牌科技行业?_黑(hēi)料(liào)正能(néng)量

不过仔(zǎi)细(xì)观察可以(yǐ)发现,活动发起者提供的(de)照片中有个(gè)很大(dà)的漏洞可以发现并非真人,而是AI绘图,那(nà)便是图片中女(nǚ)性的(de)手指部(bù)分有(yǒu)的存在异常。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进(jìn)入可(kě)控期,将洗牌科(kē)技行业?_黑料(liào)正能量

有行业人事表(biǎo)示:“现在(zài)因(yīn)为手指(zhǐ)部(bù)分的绘画算法比(bǐ)较复杂(zá),AI还不(bù)太(tài)会画人的手,但(dàn)最新(xīn)看(kàn)到的图片已经有越来越完美的AI模型(xíng)出现(xiàn),以后可能就完全没有漏洞了(le)。

类似的AI作图诈骗在国外也(yě)已有发(fā)生。据英(yīng)国广(guǎng)播公(gōng)司报道,土(tǔ)耳(ěr)其地震期(qī)间(jiān),有Tiktok用(yòng)户使(shǐ)用AI合(hé)成了儿童(tóng)受(shòu)灾(zāi)的假照片发布到网络,以此诱(yòu)骗善(shàn)良的人打(dǎ)赏“捐助”从而实施诈骗。

目前随着技术发展,AIGC已经(jīng)能(néng)做出真人照片(piàn)般的绘图效果,如果这样的图(tú)片被用来诈骗,将非常可(kě)怕。

此外AIGC还引发了很多担忧,一方面(miàn),批判者认(rèn)为(wèi)AI在(zài)“学习(xí)”了(le)大量前人的(de)作品之后,其创作没有(yǒu)任何(hé)情(qíng)绪和灵魂,难(nán)以和人类(lèi)的艺术创作相提并(bìng)论(lùn)。

另一方(fāng)面,AIGC背后的版权、目前都并没有得到有效的解决,还有(yǒu)AIGC会不会代替人类(lèi)“至高无上”的创(chuàng)意。

马斯(sī)克也强(qiáng)调,人工智(zhì)能(néng)的安全(quán)问题需要得到重视,太晚就来不(bù)及(jí)了(le)。

03

AIGC下(xià)一站(zhàn)除(chú)了视频,还(hái)有(yǒu)远方

技(jì)术都是有两面性的,潜(qián)在(zài)的危害并(bìng)不能掩盖其光辉的贡献。现在看来,人(rén)工智能技术(shù)将是(shì)第四次工业革(gé)命的核心驱动(dòng)力量,将(jiāng)创造(zào)新的增长奇迹。

过去(qù)一年,人工智能在技术和(hé)商业层面都有了(le)巨大进展,AI绘(huì)画就是(shì)人工智能(néng)技术发生方向性改变的一(yī)个代表(biǎo)。其下一(yī)站或许就(jiù)是(shì)视(shì)频。

此(cǐ)前,Meta和谷歌先后发布了几条引爆科(kē)技圈的短(duǎn)视频。这些(xiē)视频引(yǐn)发关(guān)注并(bìng)非内容做得多(duō)优(yōu)秀,反而都非(fēi)常简单(dān),比如一匹正在喝水(shuǐ)的马,一只画画的玩具熊,或者一段骑摩托车的第(dì)一视角录像,随便一个有手(shǒu)机的(de)人(rén)都可(kě)以(yǐ)随(suí)手录下一段(duàn)。

ChatGPT之(zhī)后又(yòu)一应(yīng)用(yòng)杀疯了,AIGC或进入可控期,将洗(xǐ)牌科(kē)技行(xíng)业?_黑料正能(néng)量

但这些短(duǎn)视(shì)频的创作方式非常简(jiǎn)单,创(chuàng)作(zuò)者仅仅需要向AI输入(rù)一段话,甚至只是说一下要求(qiú),AI就可以根(gēn)据需要(yào)生成(chéng)一段视频。

谷(gǔ)歌发(fā)布的两个AI生成视频分别来自于(yú)Imagen Video和Phenaki,前者主要突出的是高清(qīng),与(yǔ)Meta的Make-A-Video没有太多的差(chà)别。

在Make-A-Video公(gōng)布了(le)AI生成的(de)视频后,AI圈(quān)就(jiù)已经玩了(le)一波(bō)梗(gěng),一个能够做出更高清(qīng)视频(pín)的AI还不足以在(zài)短时间内戳中兴奋点(diǎn)。

Phenaki更(gèng)加令人震(zhèn)惊(jīng)的(de)地方在于,它可(kě)以制作出超过2分钟的连(lián)贯的也有(yǒu)确切内容(róng)的视频,这才是真正让(ràng)人们感到惊喜的(de)地方。因为无论(lùn)AI生成(chéng)的视频多(duō)么高清,也只能是为内容生产者提供一个灵感,一个素材,一个过场动画(huà)。

不(bù)过(guò)能够制作出(chū)有具体剧(jù)情内容的视频就意(yì)味着,一些(xiē)视(shì)频创作由AI代替人(rén)工完(wán)成已经初步有(yǒu)了可能。

当下AI的发展速度(dù)已经超(chāo)过大部(bù)分(fēn)人(rén)的想象。内容产业的本质是供给创造需求,AIGC作为全新的内容生产方式(shì),可以为内容产业带来更新的内容风(fēng)格(gé)、更(gèng)快的(de)生产速度,更(gèng)低的(de)生(shēng)产成(chéng)本,这无疑会驱动内容产业的大爆(bào)发。

除(chú)了AI绘图、视频,AIGC技术还能应(yīng)用于音乐、代码、机器人动(dòng)作等多种内容形式的(de)生成(chéng)。不难(nán)发现该项技术不仅在游戏等(děng)行业(yè)能得到有效应用,对(duì)于下一代互联(lián)网各(gè)种元(yuán)素的构(gòu)建亦有关键意义。

从(cóng)商(shāng)业化(huà)的角度(dù)来(lái)看(kàn),文化娱乐、教育(yù)、传媒等(děng)诸多领域,本身就对(duì)基于AI的可视(shì)化内容有强烈需求。

因此,AI绘画及(jí)视频或(huò)不是结果,而只是AI进程中(zhōng)的一(yī)块(kuài)重要(yào)拼图(tú),有望在技术(shù)更(gèng)新的(de)加持下实现更(gèng)大的应用(yòng)价值。

AI从理(lǐ)解内容,走向了可以生成内(nèi)容(róng),甚至能够创造出独立(lì)价值和独立视角的内(nèi)容。AIGC的再次出圈,更代表着(zhe)未(wèi)来的先(xiān)进生产力即将到来。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌(pái)科技行业(yè)?_黑料正能量(liàng)

04

紧(jǐn)抓(zhuā)大模型与算力(lì),牢固AIGC底座

从技术(shù)的发展也(yě)可以看出(chū),在语言(yán)大模型、图像(xiàng)大模型之(zhī)后,多模(mó)态大模型已(yǐ)经(jīng)成为了新的(de)趋势。

大模型被(bèi)誉为当前人工智能发展(zhǎn)的智能底(dǐ)座,是(shì)全球竞争最(zuì)激烈的(de)研(yán)究方向之一,包(bāo)括(kuò)谷(gǔ)歌、亚马逊(xùn)、百度、阿里、腾讯等众多头部企业都(dōu)在竞(jìng)相发(fā)力(lì)。

不过训练大(dà)模(mó)型(xíng)的确(què)价格不(bù)菲,以国(guó)盛证券发布的(de)《ChatGPT需(xū)要多(duō)少算力》报告估(gū)算,GPT-3训练(liàn)一次的成本(běn)约为140万美元(yuán)。而对(duì)于一些更大的(de)LLM(大型语言模型),训练成本则介于200万美(měi)元(yuán)至1200万美元高(gāo)价之间(jiān)。

以ChatGPT在2023年1月的独立访客平均(jūn)数(shù)1300万计算,其对应芯(xīn)片需求为3万多片(piàn)英伟达A100 GPU,初始投(tóu)入成本(běn)约为8亿美元,每日仅电费就在(zài)5万美(měi)元左右。

ChatGPT之(zhī)后(hòu)又一应用杀(shā)疯(fēng)了(le),AIGC或(huò)进(jìn)入(rù)可控期,将洗(xǐ)牌科(kē)技行业?_黑料正能量

此(cǐ)外不论是ChatGPT还是AIGC,都(dōu)离不开庞(páng)大算力支(zhī)持。在关(guān)注各类(lèi)大模型的发(fā)展同时(shí),更应该关注(zhù)算(suàn)力(lì)网络的建设。

算力网络正驱动AI产业(yè)发展进入史诗级加(jiā)速进(jìn)程,让AIGC及通用AI这(zhè)一人工智能发展的终极目标离得更近。

因为算力可(kě)以对突(tū)破(pò)性技(jì)术(shù)创新提供大力的支持。这方面,多模态(tài)大(dà)模型(xíng)是典(diǎn)型。作为面(miàn)向未来(lái)强人工智(zhì)能、通用人工智(zhì)能的重要技术创新(xīn),多模态(tài)大模型已经(jīng)在(zài)人工智能(néng)领(lǐng)域提出(chū)了(le)很多年,业(yè)界也有不少(shǎo)技术突破,但是,多(duō)模态大模型进一(yī)步(bù)往下走(zǒu),算力需求呈几何(hé)式(shì)上升(shēng),一般的(de)算力(lì)基(jī)础(chǔ)设施很快将难以胜任。

从(cóng)图像、文字、语(yǔ)音单独一项的训(xùn)练,到(dào)双模态、三模态的跃迁,让人工智能可以灵活(huó)应对不同模(mó)态的转化、像人(rén)与世界(jiè)交互(hù)一样自然,这方面,由(yóu)算力网(wǎng)络来(lái)驱动将有(yǒu)明显优势(shì)。

ChatGPT之后又(yòu)一应(yīng)用杀(shā)疯了,AIGC或进入(rù)可控期,将(jiāng)洗(xǐ)牌科(kē)技(jì)行业(yè)?_黑料正能量

此(cǐ)外,还有(yǒu)很多需要爆(bào)发式增(zēng)长的(de)算力来支撑的技术创新(xīn),将在人工智能(néng)算力网(wǎng)络支撑下快速推进。

AIGC已经露出(chū)曙光,期(qī)待在(zài)大(dà)模型(xí感知力是一种什么能力,手机情景感知是什么意思ng)和(hé)大(dà)算力的(de)支持(chí)下AIGC能持续(xù)颠覆内容生(shēng)产的(de)方式(shì),将(jiāng)创造(zào)的边际成本降(jiàng)低,让(ràng)万(wàn)众(zhòng)受益。

未经允许不得转载:惠安汇通石材有限公司 感知力是一种什么能力,手机情景感知是什么意思

评论

5+2=