本文相關(guān)基金

      更多

      相關(guān)資訊

      嘉實動態(tài)

      AI新進展帶來哪些投資機會?

      字體大小:

      之所以認(rèn)為是神話,是因為科技程度還達(dá)不到。

      ——高銘《天才在左瘋子在右》

      用一段文字描述就可以形成一段“真實”的視頻,曾經(jīng)想象中的場景如今已經(jīng)實現(xiàn)!

      春節(jié)假期尚未結(jié)束,OpenAI發(fā)布的新一代文字生成視頻模型——Sora就已經(jīng)引發(fā)熱潮,通過文字生成1分鐘的高質(zhì)量視頻,極其真實、個性化的視頻表現(xiàn),且符合現(xiàn)實世界物理規(guī)律的圖像,令人驚艷,這也直接帶動了資本市場的表現(xiàn)。

      Sora模型有何特點,龍年AI投資有哪些趨勢?本期《風(fēng)向》將為您一一梳理。

      文本轉(zhuǎn)視頻,時長達(dá)1分鐘

      一個視頻勝千言,從OpenAI放出的視頻來看,通過一長串的提示詞,諸如“幾只巨大的毛茸茸的猛犸象踏著白雪皚皚的草地走近”,AI就生成了極其真實的動態(tài)畫面場景。

      資料來源:OpenAI官網(wǎng)

      提示詞:幾只巨大的毛茸茸的猛犸象踏著白雪皚皚的草地走近,它們長長的毛茸茸的皮毛在風(fēng)中輕輕飄動,遠(yuǎn)處覆蓋著積雪的樹木和雄偉的雪山,午后的陽光下有縷縷云彩,太陽高高地掛在空中距離產(chǎn)生溫暖的光芒,低相機視角令人驚嘆地捕捉到大型毛茸茸的哺乳動物,具有美麗的攝影和景深。

      如果不是猛犸象已經(jīng)滅絕,或者視頻標(biāo)注了AI生成,我相信包括筆者在內(nèi)的很多人會認(rèn)為是實拍鏡頭。

      不僅僅是動物,人物和場景表現(xiàn)也極其真實。

      資料來源:OpenAI官網(wǎng)

      提示詞:一位時尚女性走在充滿溫暖霓虹燈和動畫城市標(biāo)牌的東京街道上。她穿著黑色皮夾克、紅色長裙和黑色靴子,拎著黑色錢包。她戴著太陽鏡,涂著紅色口紅。她走路自信又隨意。街道潮濕且反光,在彩色燈光的照射下形成鏡面效果。許多行人走來走去。

      根據(jù)OpenAI官網(wǎng)的介紹,Sora能夠生成具有多個角色、特定類型的運動以及主體和背景的準(zhǔn)確細(xì)節(jié)的復(fù)雜場景,該模型不僅了解用戶在提示中提出的要求,還了解這些東西在物理世界中的存在方式。

      其次,該模型能夠更加準(zhǔn)確的理解人類給出的提示詞,借助GPT的能力,Sora將用戶的簡短提示轉(zhuǎn)換成更詳細(xì)的提示,使其能夠準(zhǔn)確地解釋提示詞,并生成質(zhì)量更高的圖像。

      如同電影中常見的多機位拍攝,Sora模型還可以在單個生成的視頻中創(chuàng)建多個鏡頭,準(zhǔn)確地保留角色和視覺風(fēng)格。而且生成的視頻也可以重新編輯,比如讓植被更加茂密等等,如果嫌視頻的時間過短,也可以讓AI向前或向后拓展視頻。

      Sora的技術(shù)報告顯示,OpenAI并不是把Sora單純當(dāng)作一個視頻模型來看待,而是將視頻生成模型作為“世界模擬器”,不僅可以在不同設(shè)備的原生寬高比直接創(chuàng)建內(nèi)容,還能展示出對真實世界的模擬能力,如3D一致性、長期一致性和對象持久性等。

      依托于大語言模型,讓機器模仿人

      根據(jù)公開資料,在文生視頻領(lǐng)域,比較成熟的模型思路有循環(huán)網(wǎng)絡(luò)(RNN)、生成對抗網(wǎng)絡(luò)(GAN)和擴散模型(Diffusionmodels)。

      結(jié)合OpenAI官網(wǎng)下的文獻(xiàn)參考,Sora為使用Transformer架構(gòu)的擴散模型。它從看起來像靜態(tài)噪聲的視頻開始生成視頻,然后通過多個步驟消除噪聲來逐漸對其進行轉(zhuǎn)換。

      如果用通俗但不太嚴(yán)謹(jǐn)?shù)脑拋斫忉?,之前的GAN模型更多的是對其他圖片“形”的模仿,而擴散模型更多的是對“神”的模仿,比如圖像內(nèi)涵,圖像與圖像的關(guān)系等等。

      隨著訓(xùn)練計算的增加,樣本質(zhì)量顯著提高

      圖片來源:Sora技術(shù)報告

      在其技術(shù)報告中,Sora可以將圖片和視頻轉(zhuǎn)化為補丁,從而可以用更廣泛的數(shù)據(jù)訓(xùn)練。OpenAI將圖片和視頻數(shù)據(jù)轉(zhuǎn)化為統(tǒng)一的表示方式——補丁(patches)來進行訓(xùn)練,補丁類似于大語言模型中的tokens,并且可以高度擴展。通過統(tǒng)一數(shù)據(jù)的表示方式,Sora可以用更廣泛的數(shù)據(jù)訓(xùn)練,使生成的視頻更加真實。

      目前Sora模型還在進行安全測試,僅向有限的創(chuàng)作者開放。據(jù)彭博社預(yù)計,GPT-4經(jīng)過6個月的測試后正式開放,參考GPT-4,預(yù)計Sora或?qū)⒂?月向公眾開放。

      政策端大力鼓勵,國內(nèi)AIGC商業(yè)化已全面鋪開

      去年8月底,國內(nèi)首批大模型產(chǎn)品通過《生成式人工智能服務(wù)管理暫行辦法》(下稱《辦法》)備案,可正式上線面向公眾服務(wù)。

      去年下半年,一批國內(nèi)大模型陸續(xù)向社會開放,C端商業(yè)化逐步鋪開。此前,這些大模型廠商已開始布局B端部分場景,與多家企業(yè)簽訂合約。當(dāng)前國產(chǎn)AIGC在BC兩端同時發(fā)力,商業(yè)化全面鋪開,已腳踏實地開啟賺錢之路。上述備案完成與《辦法》正式實施日相隔僅半個月,體現(xiàn)監(jiān)管層對這一新興產(chǎn)業(yè)的鼓勵態(tài)度。

      去年9月初,工信部和財政部聯(lián)合印發(fā)《電子信息制造業(yè)2023-2024年穩(wěn)增長行動方案》再次強調(diào)了對人工智能和大模型發(fā)展的重視,表示要推動先進計算產(chǎn)業(yè)發(fā)展和行業(yè)應(yīng)用。

      目前,國內(nèi)AIGC的產(chǎn)業(yè)架構(gòu)分為基礎(chǔ)層、中間層和應(yīng)用層。


      整個AI生成內(nèi)容鏈條第一層是基礎(chǔ)層,也是由大語言模型為基礎(chǔ)搭建的AIGC技術(shù)基礎(chǔ)設(shè)施層。

      第二層為中間層,及垂直化、場景化、個性化的模型和應(yīng)用工具。預(yù)訓(xùn)練的大語言大模型是基礎(chǔ)設(shè)施,在此基礎(chǔ)上可以快速抽取生成場景化、定制化、個性化的小模型,實現(xiàn)在不同領(lǐng)域的應(yīng)用部署。

      第三層為應(yīng)用層,面向C端的文字、圖片、視頻生成等內(nèi)容的生成服務(wù)。側(cè)重于用戶的使用體驗和需求,使得用戶可以用消費級的顯卡算力挖掘豐富的內(nèi)容,包括ChatGPT、Sora等等。

      根據(jù)中國電子學(xué)數(shù)據(jù),2021年中國人工智能核心產(chǎn)業(yè)市場規(guī)模為1300億元,同比增長38.9%。根據(jù)《新一代人工智能發(fā)展規(guī)劃》,到2025年,我國人工智能核心產(chǎn)業(yè)規(guī)模將超過4000億元,帶動相關(guān)產(chǎn)業(yè)規(guī)模超過5萬億元。

      投資方向怎么選?

      中信證券研報認(rèn)為,從投資角度來看,Sora背后的涌現(xiàn)能力為自動駕駛、設(shè)計等需要現(xiàn)實世界建模的行業(yè)提供了明確方向。Gemini在短期內(nèi)的部分商業(yè)場景表現(xiàn)可能會更為出色,尤其是需要結(jié)合圖片與文字的多模態(tài)應(yīng)用場景。除去應(yīng)用端的投資機會,硬件端的需求也必然會隨著多模態(tài)的技術(shù)進步而不斷提高。

      從AI投資的角度看,嘉實基金大科技研究總監(jiān)王貴重認(rèn)為,隨著OpenAI和GPT4的面世,意味著AI從弱人工智能向強人工智能的邁進。目前,AI行業(yè)正處在在一個爆發(fā)的起點,未來隨著大模型成本的不斷下降,AI賦能各行各業(yè)將會成為一種可能。所有跟信息技術(shù)相關(guān)的領(lǐng)域都會迎來一定程度的重塑,但仍有大量的長尾的應(yīng)用沒有得到顯著的滿足。

      目前科技投資的整體架構(gòu)分為底層的基礎(chǔ)設(shè)施、芯片層、服務(wù)器層,云層,再到上面的大模型、專用模型,最后到各個行業(yè)的應(yīng)用,未來需要在整體的研究圖譜中密切跟蹤各個行業(yè)的發(fā)展進度。

      最看好的環(huán)節(jié)依然是AI應(yīng)用。第一,曾經(jīng)被互聯(lián)網(wǎng)改變的行業(yè)會再一次被AI改變。首先是內(nèi)容,無論是一維媒介文字,二維媒介圖片,三維媒介視頻,四維媒介游戲,還是社交、搜索、短視頻、電商,我們用的互聯(lián)網(wǎng)應(yīng)用都會集成AI功能。第二,軟件會從功能軟件到智能軟件,軟件的能力會進一步提升,幫我們做更多的事情,交互也會更加友好。無論是辦公、OA、CRM、ERP,甚至一些專業(yè)的畫圖、EDA等工具。

      *風(fēng)險提示:以上觀點不構(gòu)成具體投資建議?;鹜顿Y需謹(jǐn)慎。投資人應(yīng)當(dāng)認(rèn)真閱讀《基金合同》、《招募說明書》、《產(chǎn)品資料概要》等基金法律文件,了解基金的風(fēng)險收益特征及其特有風(fēng)險,并根據(jù)自身的投資目的、投資期限、投資經(jīng)驗、資產(chǎn)狀況等判斷基金是否和投資人的風(fēng)險承受能力相適應(yīng)。基金管理人不保證基金一定盈利,也不保證最低收益或本金不受損失。基金過往業(yè)績及其凈值高低并不預(yù)示其未來業(yè)績表現(xiàn),基金管理人管理的其他基金的業(yè)績并不構(gòu)成本基金業(yè)績表現(xiàn)的保證。


      AI新進展帶來哪些投資機會?

      2024-02-27 來源:嘉實基金

      之所以認(rèn)為是神話,是因為科技程度還達(dá)不到。

      ——高銘《天才在左瘋子在右》

      用一段文字描述就可以形成一段“真實”的視頻,曾經(jīng)想象中的場景如今已經(jīng)實現(xiàn)!

      春節(jié)假期尚未結(jié)束,OpenAI發(fā)布的新一代文字生成視頻模型——Sora就已經(jīng)引發(fā)熱潮,通過文字生成1分鐘的高質(zhì)量視頻,極其真實、個性化的視頻表現(xiàn),且符合現(xiàn)實世界物理規(guī)律的圖像,令人驚艷,這也直接帶動了資本市場的表現(xiàn)。

      Sora模型有何特點,龍年AI投資有哪些趨勢?本期《風(fēng)向》將為您一一梳理。

      文本轉(zhuǎn)視頻,時長達(dá)1分鐘

      一個視頻勝千言,從OpenAI放出的視頻來看,通過一長串的提示詞,諸如“幾只巨大的毛茸茸的猛犸象踏著白雪皚皚的草地走近”,AI就生成了極其真實的動態(tài)畫面場景。

      資料來源:OpenAI官網(wǎng)

      提示詞:幾只巨大的毛茸茸的猛犸象踏著白雪皚皚的草地走近,它們長長的毛茸茸的皮毛在風(fēng)中輕輕飄動,遠(yuǎn)處覆蓋著積雪的樹木和雄偉的雪山,午后的陽光下有縷縷云彩,太陽高高地掛在空中距離產(chǎn)生溫暖的光芒,低相機視角令人驚嘆地捕捉到大型毛茸茸的哺乳動物,具有美麗的攝影和景深。

      如果不是猛犸象已經(jīng)滅絕,或者視頻標(biāo)注了AI生成,我相信包括筆者在內(nèi)的很多人會認(rèn)為是實拍鏡頭。

      不僅僅是動物,人物和場景表現(xiàn)也極其真實。

      資料來源:OpenAI官網(wǎng)

      提示詞:一位時尚女性走在充滿溫暖霓虹燈和動畫城市標(biāo)牌的東京街道上。她穿著黑色皮夾克、紅色長裙和黑色靴子,拎著黑色錢包。她戴著太陽鏡,涂著紅色口紅。她走路自信又隨意。街道潮濕且反光,在彩色燈光的照射下形成鏡面效果。許多行人走來走去。

      根據(jù)OpenAI官網(wǎng)的介紹,Sora能夠生成具有多個角色、特定類型的運動以及主體和背景的準(zhǔn)確細(xì)節(jié)的復(fù)雜場景,該模型不僅了解用戶在提示中提出的要求,還了解這些東西在物理世界中的存在方式。

      其次,該模型能夠更加準(zhǔn)確的理解人類給出的提示詞,借助GPT的能力,Sora將用戶的簡短提示轉(zhuǎn)換成更詳細(xì)的提示,使其能夠準(zhǔn)確地解釋提示詞,并生成質(zhì)量更高的圖像。

      如同電影中常見的多機位拍攝,Sora模型還可以在單個生成的視頻中創(chuàng)建多個鏡頭,準(zhǔn)確地保留角色和視覺風(fēng)格。而且生成的視頻也可以重新編輯,比如讓植被更加茂密等等,如果嫌視頻的時間過短,也可以讓AI向前或向后拓展視頻。

      Sora的技術(shù)報告顯示,OpenAI并不是把Sora單純當(dāng)作一個視頻模型來看待,而是將視頻生成模型作為“世界模擬器”,不僅可以在不同設(shè)備的原生寬高比直接創(chuàng)建內(nèi)容,還能展示出對真實世界的模擬能力,如3D一致性、長期一致性和對象持久性等。

      依托于大語言模型,讓機器模仿人

      根據(jù)公開資料,在文生視頻領(lǐng)域,比較成熟的模型思路有循環(huán)網(wǎng)絡(luò)(RNN)、生成對抗網(wǎng)絡(luò)(GAN)和擴散模型(Diffusionmodels)。

      結(jié)合OpenAI官網(wǎng)下的文獻(xiàn)參考,Sora為使用Transformer架構(gòu)的擴散模型。它從看起來像靜態(tài)噪聲的視頻開始生成視頻,然后通過多個步驟消除噪聲來逐漸對其進行轉(zhuǎn)換。

      如果用通俗但不太嚴(yán)謹(jǐn)?shù)脑拋斫忉?,之前的GAN模型更多的是對其他圖片“形”的模仿,而擴散模型更多的是對“神”的模仿,比如圖像內(nèi)涵,圖像與圖像的關(guān)系等等。

      隨著訓(xùn)練計算的增加,樣本質(zhì)量顯著提高

      圖片來源:Sora技術(shù)報告

      在其技術(shù)報告中,Sora可以將圖片和視頻轉(zhuǎn)化為補丁,從而可以用更廣泛的數(shù)據(jù)訓(xùn)練。OpenAI將圖片和視頻數(shù)據(jù)轉(zhuǎn)化為統(tǒng)一的表示方式——補?。╬atches)來進行訓(xùn)練,補丁類似于大語言模型中的tokens,并且可以高度擴展。通過統(tǒng)一數(shù)據(jù)的表示方式,Sora可以用更廣泛的數(shù)據(jù)訓(xùn)練,使生成的視頻更加真實。

      目前Sora模型還在進行安全測試,僅向有限的創(chuàng)作者開放。據(jù)彭博社預(yù)計,GPT-4經(jīng)過6個月的測試后正式開放,參考GPT-4,預(yù)計Sora或?qū)⒂?月向公眾開放。

      政策端大力鼓勵,國內(nèi)AIGC商業(yè)化已全面鋪開

      去年8月底,國內(nèi)首批大模型產(chǎn)品通過《生成式人工智能服務(wù)管理暫行辦法》(下稱《辦法》)備案,可正式上線面向公眾服務(wù)。

      去年下半年,一批國內(nèi)大模型陸續(xù)向社會開放,C端商業(yè)化逐步鋪開。此前,這些大模型廠商已開始布局B端部分場景,與多家企業(yè)簽訂合約。當(dāng)前國產(chǎn)AIGC在BC兩端同時發(fā)力,商業(yè)化全面鋪開,已腳踏實地開啟賺錢之路。上述備案完成與《辦法》正式實施日相隔僅半個月,體現(xiàn)監(jiān)管層對這一新興產(chǎn)業(yè)的鼓勵態(tài)度。

      去年9月初,工信部和財政部聯(lián)合印發(fā)《電子信息制造業(yè)2023-2024年穩(wěn)增長行動方案》再次強調(diào)了對人工智能和大模型發(fā)展的重視,表示要推動先進計算產(chǎn)業(yè)發(fā)展和行業(yè)應(yīng)用。

      目前,國內(nèi)AIGC的產(chǎn)業(yè)架構(gòu)分為基礎(chǔ)層、中間層和應(yīng)用層。


      整個AI生成內(nèi)容鏈條第一層是基礎(chǔ)層,也是由大語言模型為基礎(chǔ)搭建的AIGC技術(shù)基礎(chǔ)設(shè)施層。

      第二層為中間層,及垂直化、場景化、個性化的模型和應(yīng)用工具。預(yù)訓(xùn)練的大語言大模型是基礎(chǔ)設(shè)施,在此基礎(chǔ)上可以快速抽取生成場景化、定制化、個性化的小模型,實現(xiàn)在不同領(lǐng)域的應(yīng)用部署。

      第三層為應(yīng)用層,面向C端的文字、圖片、視頻生成等內(nèi)容的生成服務(wù)。側(cè)重于用戶的使用體驗和需求,使得用戶可以用消費級的顯卡算力挖掘豐富的內(nèi)容,包括ChatGPT、Sora等等。

      根據(jù)中國電子學(xué)數(shù)據(jù),2021年中國人工智能核心產(chǎn)業(yè)市場規(guī)模為1300億元,同比增長38.9%。根據(jù)《新一代人工智能發(fā)展規(guī)劃》,到2025年,我國人工智能核心產(chǎn)業(yè)規(guī)模將超過4000億元,帶動相關(guān)產(chǎn)業(yè)規(guī)模超過5萬億元。

      投資方向怎么選?

      中信證券研報認(rèn)為,從投資角度來看,Sora背后的涌現(xiàn)能力為自動駕駛、設(shè)計等需要現(xiàn)實世界建模的行業(yè)提供了明確方向。Gemini在短期內(nèi)的部分商業(yè)場景表現(xiàn)可能會更為出色,尤其是需要結(jié)合圖片與文字的多模態(tài)應(yīng)用場景。除去應(yīng)用端的投資機會,硬件端的需求也必然會隨著多模態(tài)的技術(shù)進步而不斷提高。

      從AI投資的角度看,嘉實基金大科技研究總監(jiān)王貴重認(rèn)為,隨著OpenAI和GPT4的面世,意味著AI從弱人工智能向強人工智能的邁進。目前,AI行業(yè)正處在在一個爆發(fā)的起點,未來隨著大模型成本的不斷下降,AI賦能各行各業(yè)將會成為一種可能。所有跟信息技術(shù)相關(guān)的領(lǐng)域都會迎來一定程度的重塑,但仍有大量的長尾的應(yīng)用沒有得到顯著的滿足。

      目前科技投資的整體架構(gòu)分為底層的基礎(chǔ)設(shè)施、芯片層、服務(wù)器層,云層,再到上面的大模型、專用模型,最后到各個行業(yè)的應(yīng)用,未來需要在整體的研究圖譜中密切跟蹤各個行業(yè)的發(fā)展進度。

      最看好的環(huán)節(jié)依然是AI應(yīng)用。第一,曾經(jīng)被互聯(lián)網(wǎng)改變的行業(yè)會再一次被AI改變。首先是內(nèi)容,無論是一維媒介文字,二維媒介圖片,三維媒介視頻,四維媒介游戲,還是社交、搜索、短視頻、電商,我們用的互聯(lián)網(wǎng)應(yīng)用都會集成AI功能。第二,軟件會從功能軟件到智能軟件,軟件的能力會進一步提升,幫我們做更多的事情,交互也會更加友好。無論是辦公、OA、CRM、ERP,甚至一些專業(yè)的畫圖、EDA等工具。

      *風(fēng)險提示:以上觀點不構(gòu)成具體投資建議。基金投資需謹(jǐn)慎。投資人應(yīng)當(dāng)認(rèn)真閱讀《基金合同》、《招募說明書》、《產(chǎn)品資料概要》等基金法律文件,了解基金的風(fēng)險收益特征及其特有風(fēng)險,并根據(jù)自身的投資目的、投資期限、投資經(jīng)驗、資產(chǎn)狀況等判斷基金是否和投資人的風(fēng)險承受能力相適應(yīng)。基金管理人不保證基金一定盈利,也不保證最低收益或本金不受損失?;疬^往業(yè)績及其凈值高低并不預(yù)示其未來業(yè)績表現(xiàn),基金管理人管理的其他基金的業(yè)績并不構(gòu)成本基金業(yè)績表現(xiàn)的保證。