自聊(liáo)天机器人ChatGPT火爆(bào)以(yǐ)来,微软公司创始(shǐ)人比尔·盖茨(cí)已多次公(gōng)开谈(tán)论人(rén)工智能(néng)话题。在(zài)最近的一次采访中(zhōng),他再(zài)次(cì)表(biǎo)示:“AI可能会(huì)让科(kē)技行业迎来一次(cì)剧烈(liè)的(de)洗牌”。
这(zhè)个结论是他在当地时间2月20日接受《In Good Company》节目专访时提出的(de)。
他预期,AI的(de)发展可能会(huì)威胁到谷歌的市占率,因为微(wēi)软(ruǎn)在AI方面的行动相(xiāng)当迅速。而(ér)最终科技巨头将把(bǎ)AI整(zhěng)合成用户的“全能(néng)助手”,包揽(lǎn)一切应用,与人们进(jìn)行(xíng)沟通并提(tí)供建(jiàn)议,可以取(qǔ)代亚马逊、Siri或Outlook等应用(yòng)。
大佬(lǎo)口中全能助手的到来可能尚需时日,但由ControlNet引发(fā)的又一次AI绘画(huà)浪潮,让AIGC在ChatGPT的话题(tí)热点包围中杀出(chū)重(zhòng)围。
01
ControlNet颠(diān)覆AI绘画新玩法
AIGC向可(kě)控靠近
以AI绘画为代表的(de)AIGC上(shàng)一次爆火(huǒ)的时(shí)候(hòu),还是(shì)2022年(nián)8月(yuè),在美(měi)国科罗拉多州(zhōu)举办(bàn)的新(xīn)兴数字(zì)艺术家竞赛(sài)中(zhōng),一(yī)幅名为《太空歌(gē)剧(jù)院》的作品(pǐn)获奖。
随后各大厂商的AI绘画软件(jiàn)被广(guǎng)大网友熟知并体验,Stable Diffusion便是其中代表。
用户们可以(yǐ)在应用中输(shū)入一组关键词或者一张照片(piàn),就能获得一幅(fú)AI创作(zuò)的(de)画作。
作(zuò)画(huà)的关键就是所(suǒ)输入的文本。同一组关键词也可以创作出很多张风格不一样的画(huà)作,这让创作的过(guò)程就(jiù)像(xiàng)开盲盒(hé)。
很多用户(hù)很(hěn)喜欢这(zhè)种(zhǒng)不(bù)确定的(de)惊(jīng)喜(xǐ),他们会将(jiāng)生成的美(měi)图(tú)当做(zuò)头像。而(ér)另一部分喜欢翻看AI绘画的“翻车”作品。在(zài)社交媒体(tǐ)上,许多用户分享AI“翻(fān)车(chē)现场”,例如,一位网友的小狗(gǒu)照(zhào)片被AI画成了“肌肉(ròu)男”,还有网友(yǒu)的个人(rén)照片被(bèi)AI识别成了建筑。
而(ér)如今随着ControlNet的出现与加持,以往AI绘画的(de)填写关键词游戏可(kě)能要(yào)被颠覆了。
ControlNet是一位正(zhèng)在斯坦福读(dú)博的中(zhōng)国人张吕敏创作的(de)一种(zhǒng)基(jī)于控制(zhì)点(diǎn)的图像(xiàng)变形算法(fǎ),主要(yào)用于(yú)数(shù)字图像处理、计算机视觉和计算机图形(xíng)学等领(lǐng)域(yù)。
其SD插件(jiàn)一经发布,在短短的两天内便成为(wèi)了AI绘画领域(yù)最新的热点。
在(zài)此(cǐ)之前,大(dà)家用了很多方法想让AI生成的结果(guǒ)尽可能的(de)符合要求,但(dàn)是(shì)都不尽如人(rén)意,它(tā)的出(chū)现代表(biǎo)着AI生成(chéng)开始(shǐ)进入真正的可控时期(qī)。
因为ControlNet可以直(zhí)接提取画(huà)面的构图(tú),人物的姿势和画面的深度信(xìn)息等。有了(le)它的帮(bāng)助(zhù),就不(bù)用频繁的用提示(shì)词来(lái)碰运气,抽盲盒式的创作了。
通俗的说(shuō)ControlNet相当于给AI绘画加(jiā)了“魔法”,不少博主(zhǔ)的作(zuò)品(pǐn)已经获(h80寸电视尺寸长宽多少uò)得了大量的(de)浏览量,“viggo”就(jiù)是其中之一,他用(yòng)朋(péng)友(yǒu)的照片(piàn)直接带她们走(zǒu)进动(dòng)漫世界。
viggo先(xiān)用StableDiffusion图片转文字(zì)。
再用Text2Prompt插(chā)件拓(tuò)展找到(dào)对应(yīng)的关键词;最后用ControlNet插件绑定骨骼开始换关键词(cí)试效果(guǒ)。
通过图片就可以看出来,效果十(shí)分(fēn)惊艳。
更厉害的(de)是,除了真(zhēn)实的(de)照(zhào)片,草图也可以(yǐ)加上“魔法(fǎ)”,知乎大牛“DevPoint”和“逗砂”介绍(shào)到ControlNet还能实现线稿(gǎo)转全彩图。大神(shén)张吕(lǚ)敏(mǐn)其本(běn)尊也(yě)亲自回(huí)应。
不得不说(shuō)当下(xià)AIGC已经变得越来(lái)越(yuè)强大,甚至输出的作品都(dōu)已经能以假乱真了(le)。
02
难辨虚实,AIGC技术(shù)力爆发
警惕安全问题(tí)
近日,“苏(sū)州金(jīn)鸡湖有(yǒu)游艇party”的(de)消息火(huǒ)遍网络,而经过警(jǐng)方辟(pì)谣(yáo)这(zhè)所谓(wèi)的“party”可能是全国第(dì)一(yī)起AI绘图诈骗(piàn)。
由(yóu)于这(zhè)个活动里面给(gěi)出的美女照片都(dōu)是AI制作的真(zhēn)人照片(piàn)绘图(tú),因(yīn)为太逼真(zhēn),被大家当成真事(shì)传播了(le)。
不过仔细观察(chá)可以(yǐ)发现,活(huó)动发起者(zhě)提供的照(zhào)片中有个很大的漏洞可以发现并非(fēi)真人,而是AI绘图,那(nà)便(biàn)是图(tú)片中女性(xìng)的手指部(bù)分有的(de)存(cún)在异常。
有行(xíng)业人事表示:“现在因(yīn)为手指部(bù)分的(de)绘画(huà)算法比较复杂(zá),AI还不太(tài)会(huì)画人的手,但最新看到的图片已经有越来越完美的(de)AI模型出现,以后可能就完全没有(yǒu)漏洞了。”
类(lèi)似的AI作图诈(zhà)骗(piàn)在国外也已(yǐ)有发(fā)生。据英(yīng)国广播公司报道(dào),土(tǔ)耳其地震期间,有Tiktok用户使用AI合成了儿童受灾的假照片(piàn)发布到网络,以此(cǐ)诱骗善良的(de)人打赏(shǎng)“捐助(zhù)”从而实施诈骗。
目前随着技术发展,AIGC已经能做出真人(rén)照(zhào)片般的绘图效果,如果这样的图(tú)片(piàn)被用来诈(zhà)骗,将非常(cháng)可怕。
此外AIGC还引发了很多担(dān)忧,一方(fāng)面,批判(pàn)者(zhě)认为AI在“学习”了大量前人(rén)的作品之后,其创作没有任何情(qíng)绪和灵魂,难以和人类(lèi)的艺术创(chuàng)作相(xiāng)提并论。
另一方面,AIGC背后的版权(quán)、目前(qián)都(dōu)并没有得到有(yǒu)效的解(jiě)决,还有AIGC会不会(huì)代替人类“至(zhì)高无上”的(de)创意。
马斯克(kè)也强调,人工(gōng)智能的安全问(wèn)题需(xū)要得(dé)到重视,太晚就来不及了。
03
AIGC下一站除了视(shì)频(pín),还有(yǒu)远方(fāng)
技术都是有(yǒu)两面(miàn)性的(de),潜在(zài)的危害并不(bù)能掩盖其光辉的贡献。现(xiàn)在看来,人工(gōng)智(zhì)能技术将是(shì)第四次工业革命(mìng)的核心驱动(dòng)力量,将创(chuàng)造新的增长奇迹。
过去一年,人工(gōng)智能在(zài)技术和商业层面都有了巨大进展,AI绘画就是(shì)人工智能技术发生方向性改变(biàn)的一个代表(biǎo)。其下一站(zhàn)或许就是视频(pín)。
此前,Meta和谷歌先后(hòu)发布了几条引爆科技圈的短视频。这(zhè)些(xiē)视频引发(fā)关注并非内容做得多(duō)优秀,反而都非常(cháng)简单,比如一(yī)匹正在喝(hē)水的马,一只画画的玩具熊(xióng),或(huò)者一段骑摩托车的第一视角(jiǎo)录像,随便一个有手(shǒu)机(jī)的人都可以(yǐ)随(suí)手录下一段(duàn)。
但(dàn)这些短视频的创作方式(shì)非常(cháng)简(jiǎn)单,创作者(zhě)仅(jǐn)仅需要向AI输入一段话,甚至只是说一(yī)下(xià)要(yào)求(qiú),AI就可以根据需要生成一段视频(pín)。
谷(gǔ)歌发布的(de)两(liǎng)个(gè)AI生(shēng)成视频分别来自(zì)于Imagen Video和Phenaki,前者主要突出的(de)是高清,与Meta的Make-A-Video没有太多的差(chà)别(bié)。
在Make-A-Video公布了AI生成的视(shì)频后,AI圈就(jiù)已(yǐ)经玩了(le)一波梗,一个能(néng)够做出更高清视频的AI还不足以在(zài)短时间内戳中兴奋点。
Phenaki更加令(lìng)人震惊的地方在于,它可以(yǐ)制作出(chū)超(chāo)过2分钟的(de)连贯的也有确切内容的(de)视频,这才是真正让人们感到惊喜的地方。因为无(wú)论AI生成的视频多么高清(qīng),也只能是为内容生(shēng)产者(zhě)提供一个灵(líng)感,一(yī)个素材(cái),一个(gè)过场动画(huà)。
不过(guò)能够制作出有具体剧情内容的视频就意味着,一(yī)些(xiē)视频创作(zuò)由AI代(dài)替人(rén)工完成已经初步有了可能。
当(dāng)下(xià)AI的发展速度已经(jīng80寸电视尺寸长宽多少)超过大(dà)部分(fēn)人的想象。内容产业(yè)的本(běn)质(zhì)是(shì)供(gōng)给创(chuàng)造需求,AIGC作(zuò)为全(quán)新的内容生产(chǎn)方式,可以为内容产业(yè)带来更新的内容风(fēng)格、更快的生产速(sù)度,更低的(de)生产成本,这无疑会驱动内容(róng)产业的(de)大爆发。
除了(le)AI绘图、视频(pín),AIGC技术(shù)还能(néng)应用于(yú)音(yīn)乐、代码、机器人动作等多种内(nèi)容形80寸电视尺寸长宽多少式(shì)的生成。不难(nán)发现该项技术不仅在游戏等(děng)行(xíng)业(yè)能(néng)得到有(yǒu)效应用,对于(yú)下一(yī)代互联网各种元(yuán)素的构(gòu)建亦(yì)有(yǒu)关键意义(yì)。
从商业(yè)化的角度来看,文(wén)化娱乐、教育、传(chuán)媒等诸多(duō)领域,本身就对基于AI的可(kě)视化内容有强烈需求。
因此,AI绘画及视频或不(bù)是结果(guǒ),而只(zhǐ)是AI进程中的一块重要拼图,有望在(zài)技术更(gèng)新的(de)加持下实现更大的(de)应(yīng)用价值。
AI从理解内容(róng),走向了可(kě)以生(shēng)成内容,甚至能够创造(zào)出独立价值和独立视角的内容。AIGC的再次出圈,更代表(biǎo)着未来的先进生(shēng)产力即(jí)将到来。
04
紧抓大模型(xíng)与算力,牢固(gù)AIGC底座(zuò)
从技术(shù)的发展也可(kě)以看出,在语言大模型(xíng)、图(tú)像大模型(xíng)之(zhī)后(hòu),多模态大(dà)模型已经成为了新的趋势。
大模型(xíng)被誉(yù)为当前人工智能发(fā)展的智能底座,是全球竞争最激烈的研究方向之一,包括谷(gǔ)歌、亚马逊、百(bǎi)度、阿里、腾(téng)讯等众多(duō)头部企业都在竞相发力。
不(bù)过训(xùn)练大模型的确(què)价格不菲,以国(guó)盛(shèng)证券发布的《ChatGPT需要多(duō)少算力》报告估算(suàn),GPT-3训练一次(cì)的成本(běn)约为140万美元。而对(duì)于一(yī)些更大的LLM(大(dà)型语言模型),训练成本(běn)则介于(yú)200万美元(yuán)至1200万美元高价之(zhī)间。
以ChatGPT在(zài)2023年1月(yuè)的(de)独立访客平均数1300万计算,其对(duì)应芯片需求为3万多片(piàn)英伟达(dá)A100 GPU,初始投入成本约为8亿美(měi)元,每日(rì)仅电费就在(zài)5万美元左右。
此外不论是ChatGPT还是AIGC,都(dōu)离不开(kāi)庞大(dà)算(suàn)力支(zhī)持。在关注(zhù)各类大模(mó)型的发展同时(shí),更(gèng)应该关注算力网络的(de)建设。
算(suàn)力网(wǎng)络(luò)正驱(qū)动AI产业发(fā)展进入(rù)史诗级加速进程,让AIGC及(jí)通用AI这一人工智(zhì)能发展(zhǎn)的终极目标离得更(gèng)近。
因为算力可以对(duì)突破(pò)性(xìng)技术创(chuàng)新提供大力的支持。这方(fāng)面,多模态大模(mó)型是典(diǎn)型。作为面向(xiàng)未来强(qiáng)人工智能(néng)、通用人工智能的重(zhòng)要技术创新,多(duō)模(mó)态大模型已经(jīng)在(zài)人工智能领域提出了(le)很多年,业(yè)界也有不少技术突破(pò),但(dàn)是,多模态大模(mó)型进一步往(wǎng)下(xià)走,算力需求呈几何式上(shàng)升,一般的算(suàn)力基础设施(shī)很快将(jiāng)难以胜任。
从图像(xiàng)、文字、语音单独一项的(de)训(xùn)练,到双模态、三模态(tài)的(de)跃迁,让人工智能可以(yǐ)灵活应(yīng)对不(bù)同模态的(de)转化、像(xiàng)人与世界交互(hù)一样自然,这方面,由算(suàn)力(lì)网络来驱动将有明显优势。
此外,还(hái)有(yǒu)很多需要爆发式(shì)增长的算力来支撑的技术创新(xīn),将在人工智能(néng)算力网(wǎng)络支撑下快速(sù)推(tuī)进。
AIGC已经(jīng)露(lù)出(chū)曙光,期待在大(dà)模型(xíng)和大算力的支持下AIGC能(néng)持续颠覆内容生(shēng)产的方式,将创造的边际(jì)成本降低,让万众受益。
未经允许不得转载:惠安汇通石材有限公司 80寸电视尺寸长宽多少
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了