自聊(liáo)天(tiān)机(jī)器(qì)人ChatGPT火爆(bào)以来,微软公司(sī)创始人(rén)比(bǐ)尔·盖茨已(yǐ)多次公开(kāi)谈论人工智能话(huà)题。在(zài)最(zuì)近的一次(cì)采访(fǎng)中,他(tā)再次表示(shì):“AI可能(néng)会让科技行业迎来一次剧烈的(de)洗牌”。
这个结论(lùn)是他(tā)在(zài)当地(dì)时(shí)间2月(yuè)20日接受《In Good Company》节目(mù)专访时提出的(de)。
他预期,AI的(de)发(fā)展可能会威胁到谷歌的市占(zhàn)率,因为微(wēi)软(ruǎn)在AI方面的行动(dòng)相当迅(xùn)速。而最(zuì)终科技巨头将把AI整合成用(yòng)户(hù)的“全能助手”,包揽一切应(yīng)用,与人(rén)们(men)进行沟通并(bìng)提供建议(yì),可(kě)以(yǐ)取(qǔ)代亚马逊、Siri或Outlook等应用。
大佬口中全能(néng)助(zhù)手(shǒu)的到来(lái)可能尚需(xū)时(shí)日,但由ControlNet引发的又(yòu)一次(cì)AI绘画浪潮,让(ràng)AIGC在ChatGPT的话题热(rè)点包围中杀(shā)出(chū)重(zhòng)围。
01
ControlNet颠覆AI绘画新玩法
AIGC向可(kě)控(kòng)靠近
以(yǐ)AI绘画(huà)为代表的AIGC上一次(cì)爆火的时候,还是2022年8月,在美国科罗(luó)拉多(duō)州(zhōu)举(jǔ)办的(de)新兴数字(zì)艺术(shù)家竞赛中,一幅名为(wèi)《太(tài)空歌剧院》的作品获(huò)奖(jiǎng)。
随后各(gè)大厂商的AI绘画软件被广(guǎng)大网友熟知并体验,Stable Diffusion便是(shì)其中代表(biǎo)。
用户们(men)可(kě)以(yǐ)在应(yīng)用中输入(rù)一组关键词或者一张(zhāng)照片,就(jiù)能获得一(yī)幅AI创作(zuò)的画作。
作画的关(guān)键(jiàn)就是所输入(rù)的文(wén)本。同一组关键词(cí)也(yě)可以创作出很多张风(fēng)格(gé)不一样(yàng)的画作,这让创作的过程就(jiù)像开盲(máng)盒。
很多用(yòng)户很喜(xǐ)欢这(zhè)种不(bù)确定的惊喜,他(tā)们会将生成的美图当做头像。而另一部分喜欢翻看AI绘画的“翻车”作品。在社交媒体上,许多(duō)用(yòng)户分享(xiǎng)AI“翻车现场(chǎng)”,例(lì)如(rú),一位网友的小狗(gǒu)照片(piàn)被AI画成了“肌肉男”,还有(yǒu)网友(yǒu)的个人照片被AI识别(bié)成了建筑。
而如今随(suí)着ControlNet的出现(xiàn)与加持,以往AI绘(huì)画(huà)的填写(xiě)关键词游戏可能(néng)要(yào)被颠覆了。
ControlNet是一位正在斯坦(tǎn)福读博(bó)的中国人张吕敏创作的一种基于控制点的图像变形算法,主要用于(yú)数字图(tú)像处理、计算机视觉和计算机(jī)图形学等领域。
其SD插件一经发布,在短短的两天内便成为了AI绘画领域最新的(de)热点。
在此之(zhī)前,大家用了很(hěn)多方法想让AI生成的结果尽可能的(de)符合要求,但是(shì)都不尽如(rú)人意,它的出现代表(biǎo)着AI生成开(kāi)始(shǐ)进入真(zhēn)正的(de)可控时期。
因为ControlNet可以直接提取(qǔ)画(huà)面的构(gòu)图,人物的姿(zī)势和画面的(de)深度(dù)信息(xī)等。有了它的(de)帮(bāng)助,就不用频(pín)繁的(de)用提示词来碰运气,抽盲盒式的创(chuàng)作了。
通俗的说(shuō)ControlNet相当于给AI绘画加了“魔法”,不少博主的作品已经获得了大量的浏览(lǎn)量,“viggo”就是其中之一(yī),他用朋友的照片(piàn)直接带(dài)她(tā)们(men)走进动漫世(shì)界。
viggo先用StableDiffusion图片(piàn)转文字。
再用Text2Prompt插件拓展找到对应的关键(jiàn)词;最(zuì)后用ControlNet插(chā)件绑定骨骼开始换关键词试(shì)效果。
通过图片就(jiù)可以看(kàn)出来,效果十分惊艳。
更厉害的(de)是,除(chú)了真实的照片(piàn),草图也可(kě)以加上“魔法(fǎ)”,知乎(hū)大牛“DevPoint”和“逗砂”介绍到ControlNet还(hái)能(néng)实现线(xiàn)稿转全彩图。大(dà)神张吕(lǚ)敏(mǐn)其本尊也亲(qīn)自回应。
不得不说当下(xià)AIGC已经变得越来越强大,甚至输出的作(zuò)品都已经能以(yǐ)假乱真了。
02
难辨(biàn)虚实,AIGC技(jì)术力爆发
警惕安(ān)全问题(tí)
近日(rì),“苏州金鸡湖有游艇party”的(de)消息火遍网络先考与显考是什么意思区别,先考与显考有何区别,而经过警方辟谣(yáo)这所谓的“party”可能(néng)是(shì)全国第一起AI绘图诈(zhà)骗。
由于这个活(huó)动里面(miàn)给出的美女(nǚ)照(zhào)片都是AI制作的(de)真人照片(piàn)绘图,因为(wèi)太逼真,被大家当(dāng)成真事传播了。
不过仔(zǎi)细(xì)观(guān)察可以发(fā)现,活(huó)动发起(qǐ)者提供的照片中有个很大(dà)的漏洞可以发现(xiàn)并(bìng)非真人,而(ér)是AI绘图,那便是图(tú)片(piàn)中女性的手指(zhǐ)部分有的存在异(yì)常。
有(yǒu)行业人事表示:“现在因(yīn)为手指部分的绘画算法比较(jiào)复杂,AI还不太(tài)会画人的手,但最(zuì)新(xīn)看到(dào)的图片已(yǐ)经有越来越完(wán)美(měi)的AI模型出现,以后可(kě)能就完全没(méi)有漏洞了。”
类似(shì)的AI作(zuò)图诈骗在国外也已有(yǒu)发生。据英国广播公司(sī)报道,土耳其地震期间,有Tiktok用户使(shǐ)用AI合成(chéng)了(le)儿童受灾的假照片发布到网络,以此(cǐ)诱骗善良(liáng)的人打赏(shǎng)“捐助”从而(ér)实(shí)施诈骗。
目前随着技术发(fā)展(zhǎn),AIGC已(yǐ)经能做(zuò)出真人照片般的绘图效果,如果(guǒ)这样的图(tú)片被用来(lái)诈骗,将非常可怕。
此外AIGC还引(yǐn)发了很多担(dān)忧,一(yī)方(fāng)面,批判(pàn)者(zhě)认为AI在“学习”了(le)大量前(qián)人(rén)的作品之后,其创作(zuò)没有任(rèn)何(hé)情绪和灵(líng)魂,难(nán)以和人类(lèi)的艺术创作相(xiāng)提并论。
另(lìng)一方面,AIGC背后的(de)版(bǎn)权、目前都并没有得到有(yǒu)效的解决,还有AIGC会不(bù)会(huì)代替人类“至高无上”的创(chuàng)意。
马(mǎ)斯克(kè)也强调,人工(gōng)智(zhì)能的安全问题需要得到重视(shì),太晚就来不及了。
03
AIGC下一(yī)站除(chú)了视(shì)频,还有远方
技术都是有(yǒu)两(liǎng)面性的,潜在的危害并不能掩盖其(qí)光辉的贡献。现在看来,人工智能技术将是第四次工(gōng)业革命的核心(xīn)驱动力(lì)量,将(jiāng)创造新的(de)增长奇迹。
过去一年,人工智能在(zài)技术和商业(yè)层(céng)面都有了巨大进(jìn)展,AI绘画就(jiù)是人工智能技术发生(shēng)方向性改(gǎi)变的一个代(dài)表。其(qí)下一站或许(xǔ)就是视频。
此前,Meta和谷歌先后发布了几条(tiáo)引爆科技圈(quān)的短(duǎn)视频。这些视频(pín)引发关注并(bìng)非内容(róng)做得多优秀,反而(ér)都非常简单,比如(rú)一匹正(zhèng)在喝(hē)水的马,一只画画的(de)玩(wán)具熊(xióng),或者一(yī)段骑摩托车(chē)的(de)第一视角(jiǎo)录像(xiàng),随便一个有(yǒu)手机的人(rén)都(dōu)可以随手录下一段。
但这些短(duǎn)视频的创作方式非常简单,创作者仅仅(jǐn)需(xū)要向(xiàng)AI输入一(yī)段话,甚至只(zhǐ)是说一下(xià)要求,AI就可以根据需要生(shēng)成(chéng)一段视频(pín)。
谷(gǔ)歌发布的两个(gè)AI生成视频分别来(lái)自于Imagen Video和Phenaki,前者主(zhǔ)要(yào)突出(chū)的是高清,与Meta的Make-A-Video没有(yǒu)太多的差别。
在Make-A-Video公布了AI生成的视频后(hòu),AI圈就已(yǐ)经玩了(le)一(yī)波(bō)梗,一个能够(gòu)做出更高清视频的AI还(hái)不(bù)足(zú)以在短时间内戳(chuō)中兴奋点(diǎn)。
Phenaki更加令人震(zhèn)惊(jīng)的(de)地(dì)方在于,它可以制作(zuò)出(chū)超(chāo)过2分(fēn)钟的连贯(guàn)的也有确(què)切内容的视(shì)频,这(zhè)才是(shì)真正让人们感到惊喜的地方。因为(wèi)无论AI生成的视频多么高(gāo)清,也只能是为(wèi)内容生产者提(tí)供一(yī)个灵感,一(yī)个素材(cái),一个过场动画。
不(bù)过(guò)能够制作(zuò)出有(yǒu)具(jù)体剧情内容的(de)视频就意味着(zhe),一些(xiē)视频(pín)创作由AI代替人工(gōng)完成已经初步有了可能(néng)。
当下AI的发展速度已经(jīng)超过大部(bù)分(fēn)人的想象。内容(róng)产(chǎn)业的本质是供(gōng)给创造需(xū)求,AIGC作为全新(xīn)的内容生产方式(shì),可以为内容(róng)产业(yè)带来更新的内容(róng)风格、更快的生产速(sù)度,更低的生产(chǎn)成本,这(zhè)无(wú)疑会驱动(dòng)内容产业的大爆发。
除了AI绘(huì)图、视频,AIGC技术还能应(yīng)用于音乐、代码、机器(qì)人动作等多种内容形(xíng)式的(de)生成。不难发现(xiàn)该项技术不仅在游戏等(děng)行业能得到(dào)有效应用,对(duì)于(yú)下一代互联网各(gè)种元(yuán)素的构(gòu)建(jiàn)亦(yì)有关(guān)键意义。
从商业化的角度来看(kàn),文化娱乐、教育、传媒等诸多(duō)领域,本身就对基于AI的可视化内容有强(qiáng)烈需求。
因(yīn)此,AI绘画及视频或(huò)不是结果,而只(zhǐ)是AI进(jìn)程中(zhōng)的一块重要拼图,有(yǒu)望在技术更新的加持下实现更大的(de)应用价值。
AI从(cóng)理解内容,走向了可以生成内容(róng),甚至能够创造出独(dú)立价值和独(dú)立视角的内容(róng)。AIGC的再次出圈,更代表着未来的先(xiān)进生产力即将到来。
04
紧(jǐn)抓大模型(xíng)与算力,牢固AIGC底座
从技(jì)术的发展也可以看出,在语言大模型、图像大模型(xíng)之后,多模态大模型已(yǐ)经成为了新的趋势。
大(dà)模(mó)型被誉为当前人工智能发展(zhǎn)的智(zhì)能底座,是全球竞争最激烈(liè)的(de)研究(jiū)方(fāng)向之一(yī),包(bāo)括(kuò)谷歌、亚(yà)马逊(xùn)、百(bǎi)度、阿(ā)里、腾讯等众多头(tóu)部(bù)企业都在竞相发力(lì)。
不过训练大模型(xíng)的确价格不菲,以国盛(shèng)证券发(fā)布的《ChatGPT需要多少算力(lì)》报(bào)告估算,GPT-3训练一(yī)次的成(chéng)本约为140万美元。而对(duì)于(yú)一些更大的LLM(大型语言模型),训练成本则介于200万美元(yuán)至1200万美元(yuán)高价之间。
以ChatGPT在(zài)2023年1月(yuè)的(de)独(dú)立访客平均(jūn)数1300万计算,其对应芯片(piàn)需求(qiú)为3万多片(piàn)英伟达(dá)A100 GPU,初始投入成(chéng)本约为(wèi)8亿美元,每(měi)日(rì)仅电费就在5万美元左右。
此外不(bù)论是ChatGPT还是AIGC,都离不开庞(páng)大算力支持。在关注各(gè)类大模型(xíng)的发展同时,更应该关注算力网络的建(jiàn)设(sh先考与显考是什么意思区别,先考与显考有何区别è)。
算力网络正驱动(dòng)AI产(chǎn)业发展进入(rù)史诗级加(jiā)速(sù)进程,让AIGC及(jí)通(tōng)用AI这(zhè)一(yī)人工智能发展的终(zhōng)极目标(biāo)离得更(gèng)近。
因为算(suàn)力(lì)可以对突破(pò)性技术(shù)创新提供大力的支持。这方面,多模态大(dà)模型是典型。作为面(miàn)向未来强人工(gōng)智(zhì)能、通用人工智能的重要技术创(chuàng)新,多模态大模型已经在人工智能领域提出了很(hěn)多(duō)年(nián),业界也有不少技术突破(pò),但是(shì),多(duō)模(mó)态大模型进一步往下走,算力(lì)需(xū)求(qiú)呈几何式上(shàng)升,一般的算(suàn)力基础设施很(hěn)快将难以胜任。
从图像、文字、语音单独(dú)一项的训练,到双模态、三模态(tài)的跃迁,让人工智(zhì)能可以灵活应对(duì)不同模(mó)态的转化(huà)、像人与世界(jiè)交互一样自(zì)然(rán),这方面,由算力网络来(lái)驱动(dòng)将有明显(xiǎn)优势。
此外,还(hái)有(yǒu)很(hěn)多需要爆(bào)发(fā)式增长的算力(lì)来支撑的(de)技术创新,将在人工智能算力(lì)网络支撑下快速推进。
AIGC已经露(lù)出曙光,期待在(zài)大模型和大算力的支持下AIGC能持续颠覆内容生产的方式,将创造的边(biān)际成本(běn)降低(dī),让万众受益。
未经允许不得转载:腾众软件科技有限公司 先考与显考是什么意思区别,先考与显考有何区别
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了