高小山說
2023年2月15日晚,百姓網(wǎng)創(chuàng)始人王建碩做客高山書院,與同學(xué)們一起進(jìn)行了一場關(guān)于 ChatGPT 的主題討論會,討論話題涉及:
(1)ChatGPT 出來,創(chuàng)業(yè)者關(guān)注點(diǎn)應(yīng)該是什么?
(資料圖片)
(2)ChatGPT 將會有怎樣的應(yīng)用?
(3)百度的“文心一言”或王慧文的“光年之外”,值得做嗎?
(4)ChatGPT 創(chuàng)業(yè)有哪些坑?
(5)很多工作會被 ChatGPT 取代嗎?
以下內(nèi)容根據(jù)課程分享整理而成,經(jīng)導(dǎo)師審核后公開發(fā)布。課程內(nèi)容分為上下兩篇,此為上篇,下篇為高山同學(xué)們的分享,敬請期待~
嘉賓簡介
王建碩
百姓網(wǎng)創(chuàng)始人
基于GPT大模型的產(chǎn)品探索者
主持人
李可佳
Monad Infinity Venture Partner?
原字節(jié)跳動智慧教育CEO
高山書院2020級同學(xué)
張首晟獎學(xué)金獲得者
高山科學(xué)促進(jìn)中心秘書長
各位老師同學(xué),大家晚上好。我是今天討論的主持人李可佳,感謝今天的嘉賓王建碩老師和上線的各位同學(xué)們,非常期待與大家就最近大熱的 ChatGPT 進(jìn)行一次深度交流。
作為一個計(jì)算機(jī)專業(yè)的畢業(yè)生,我第一次聽說 GPT 已經(jīng)是比較晚的時候了。2020 年的 7 月份,GPT-3 橫空出世,我一個老同學(xué)興奮地發(fā)了個朋友圈:“請注意,現(xiàn)在站在你面前的是互聯(lián)網(wǎng)原子彈、人工智能界的卡麗熙、算力吞噬者、黃仁勛的新 KPI、下崗工人制造機(jī)、幼年期的天網(wǎng)——最先進(jìn)的 AI 語言模型 GPT-3。” 我隨手評論三個字:拉倒吧。
在我看來,這就好比是美國研發(fā)了一個新的核武器,比第二名的武器要強(qiáng)上百倍。但這些事情對于我們小老百姓來說,又有什么關(guān)系呢?
所以最開始我沒有太在意這個事情,跟著大眾吃了一個月的瓜,最近看了張宏江院士和王建碩老師的一些文章后,我發(fā)現(xiàn)這個東西不是一個核武器,反而有點(diǎn)像是給每個人發(fā)一把 AK47。
在 ChatGPT 的沖擊下,這個世界會變得更加分裂還是更加美好?有沒有可能會有一些意想不到的事情發(fā)生?下面有請王建碩老師為我們分享他的觀點(diǎn)。
謝謝可佳,也感謝高山書院邀請我來與同學(xué)們一起分享這個話題,大家有任何問題可以隨時提問。
首先談?wù)勎覀€人對 ChatGPT 一個感性的認(rèn)識。一個詞來形容就是:興奮。
像 ChatGPT 這樣能夠發(fā)動全民參與,提升生產(chǎn)力這樣的事情,我這一輩子只遇到四次。
1994年,網(wǎng)景瀏覽器誕生,圖自網(wǎng)絡(luò)
第一次是見到 Netscape Navigator(網(wǎng)景瀏覽器)。那個時候感覺好像是打開了一個新世界,這也是與我見到ChatGPT 感覺最像的一次。第一次使用了這個瀏覽器的人興奮得不得了,可以連續(xù)玩三四個小時停不下來,像打了雞血一樣地抓著周圍的人一起去上網(wǎng),瘋狂地推薦給別人,就像病毒式的傳播一樣。雖然那個時候還需要花 29 美元買了以后才能上網(wǎng)。
這次 ChatGPT 給人的感覺就是用了之后很驚喜,有一種莫名的沖動想要拉著別人一起用。
第二次是我覺得跟 Google.Com 出來的時候很像。當(dāng)初我用 Google 的時候,其實(shí)里面是一個信息的荒原,它的搜索能力很強(qiáng),但因?yàn)樾畔⑻?,幾乎什么都搜不出來。我印象很深刻的一件事是?dāng)我去搜上海這個詞時,結(jié)果只有 4 個,一頁填不滿。
所以當(dāng)你看到 Google 出現(xiàn)的時候,你最該干的事情是什么?回過頭來看,其實(shí)我們最不應(yīng)該干的就是再去做一個 Google.Com,而應(yīng)該是趕緊去做網(wǎng)站,做了網(wǎng)站就很容易被 Google 索引。因?yàn)闆]有人給互聯(lián)網(wǎng)提供信息,尤其是中國本土相關(guān)的信息,所以那個時候我隨便寫一篇文章都會出現(xiàn)在 Google 搜索的第一名。
第三次是看到 iPhone 出來的時候。但相對來說,這次并沒有那么深刻。
第四次就是現(xiàn)在的 ChatGPT。它讓我們看到,人機(jī)交互這個事情原來是可以真實(shí)做到的,這對我來說,相當(dāng)于是一個時代的轉(zhuǎn)變?,F(xiàn)在很多自媒體文章都在說 ChatGPT 這款產(chǎn)品有多么優(yōu)秀,就像是94-95年,所有的新聞報(bào)道都說 Netscape Navigator 的創(chuàng)始人吉姆·克拉克(Jim Clark)和馬克·安德森(Marc Andreessen)多么厲害,年紀(jì)輕輕就做出來這么牛的產(chǎn)品。回看歷史,其實(shí)我們的關(guān)注點(diǎn)不應(yīng)該在這上面,也不應(yīng)該再關(guān)注瀏覽器,而是應(yīng)該關(guān)注一個互聯(lián)網(wǎng)時代的到來。
網(wǎng)景瀏覽器創(chuàng)始人吉姆·克拉克和馬克·安德森,圖自網(wǎng)絡(luò)
因?yàn)闆]有瀏覽器就沒有互聯(lián)網(wǎng)。瀏覽器出現(xiàn)后,它不僅僅是開創(chuàng)了一個瀏覽器的產(chǎn)業(yè),更是開創(chuàng)了一整個互聯(lián)網(wǎng)產(chǎn)業(yè)。事實(shí)上,瀏覽器產(chǎn)業(yè)占整個互聯(lián)網(wǎng)產(chǎn)業(yè)的1/1000都不到。
今天之所以跟大家做這個分享,我想的就是,我們應(yīng)該把注意力從 ChatGPT 這個產(chǎn)品和 OpenAI 這個公司本身移開,投入到未來星辰大海一樣的應(yīng)用領(lǐng)域。
那么,ChatGPT 將會有什么樣的應(yīng)用,如果要投入,又該如何去投入?
應(yīng)用
很多人說 ChatGPT 像 Google,像聊天機(jī)器人,像各種各樣的東西。在我看來,并不是這樣的。
簡單來說,ChatGPT 可以看成是由兩部分組成的,一部分是用 45TB 的訓(xùn)練數(shù)據(jù)+無數(shù) GPU +無數(shù)電力像“煉丹”一樣“煉”出來的一個含 1750 億個參數(shù)的 800G 容量的“大腦”,我們把它稱之為“大語言模型(Large language model,簡稱LLM)”。另外一部分是 45TB 的數(shù)據(jù)庫。
今天我們重點(diǎn)討論的是這個“大語言模型”。
“大語言模型”其實(shí)跟瀏覽器和 HTML 有點(diǎn)像。我們做網(wǎng)站需要有自己的數(shù)據(jù)庫,需要有搜索,有業(yè)務(wù)邏輯等等。很多人說,ChatGPT 出來了,感覺一切都會變了。
我認(rèn)為是不會的,即便是互聯(lián)網(wǎng)的出現(xiàn),也并沒有造成地動天搖一切都變了的情形。比如餐館現(xiàn)在用互聯(lián)網(wǎng)點(diǎn)餐了,但是我們吃的麻婆豆腐、魚香肉絲它還是大廚在做,只是餐從做出來到我們手里的流程變了而已,90% 的根基還是不變的。
ChatGPT 時代,我們也會需要數(shù)據(jù)庫,需要索引,需要業(yè)務(wù)支持系統(tǒng)等等,只不過是人機(jī)交互從 HTML 變成了 Chat,當(dāng)然這也不是絕對的,很多的 Chat 的界面還是需要用 HTML 來寫,只不過是核心變成了一個 text 入,一個 text 出這樣的交互。
一旦變成這樣了以后,現(xiàn)在很多的業(yè)務(wù)都需要重寫,但是重寫的部分不多,數(shù)據(jù)庫那部分基本都是平移過來的,而這種平移過程,就是我們所有從業(yè)者最大的機(jī)會。
大家要注意的是,ChatGPT 不是只有一種,就像并不是全世界只存在一臺阿帕奇服務(wù)器一樣。今天我們聊的并不僅僅指的是 OpenAI 開發(fā)的 ChatGPT,而是講它所建立的大語言模型。
而在這樣的大語言模型下,我看到是一片信息荒原。
什么是信息荒原,比如你去跟接入了 ChatGPT 的“機(jī)器人”聊天,會發(fā)現(xiàn)它其實(shí)就是“一本道”——一本正經(jīng)的胡說八道。比如你去問它今天的天氣、航班信息、財(cái)經(jīng)信息、推薦股票等等,它就胡說八道或者說“網(wǎng)站無法找到”、“暫無信息”等等,因?yàn)樗臄?shù)據(jù)是截止到2021年的,但如果你把這些信息告訴它,它就能給到你想要的回答。
在這種信息荒原之下,難道你就沒有一種沖動想要去做點(diǎn)什么嗎?其實(shí)這些信息都是有的,只需要我們“灌”給它就行,就像當(dāng)初1995年的時候,為了給互聯(lián)網(wǎng)提供信息,新浪每天都派人早早地去買紙質(zhì)的報(bào)紙,掃描進(jìn)計(jì)算機(jī)然后公布到網(wǎng)絡(luò)上,后來它成為了中國當(dāng)時最大的網(wǎng)站。
所以這個層面上,ChatGPT 僅僅只是一個“翻譯官”,給它信息的人才是“Google”。
我很清楚地記得,96年第一次看到 Netscape Navigator 出來的時候,我激動得一晚上沒有睡著覺,在宿舍里寫未來的各種可能。過了20多年,前一段時間 ChatGPT 或者更貼切地說是這種大語言模型出來,這樣的事情在我身上又發(fā)生了,我也是激動得寫了一晚上idea,寫到凌晨五六點(diǎn)。
以我這種“互聯(lián)網(wǎng)老兵”的身份回頭再去看的話,就會發(fā)現(xiàn),當(dāng)瀏覽器出來的時候,我們未來缺很多東西,首先缺新聞;其次缺電商,98年我第一次創(chuàng)業(yè)做的就是一個電商網(wǎng)站,比劉強(qiáng)東還早15年,但很顯然時機(jī)不成熟,廢掉了。但總有一天是需要電商的,需要像美團(tuán)這樣的東西。
不管是 ChatGPT 還是百度未來的“文心一言”或者王慧文要做的“光年之外”,其實(shí)相當(dāng)于是開啟了新的人機(jī)對話模式,這個世界未來的可能性太多了,機(jī)會非常大。比如在這個世界里,暫時沒有互聯(lián)網(wǎng)時代的“攜程”,沒有“eBay”,沒有“Google”,甚至連“雅虎”也沒有,“好123”、“新浪”也沒有......
在當(dāng)下這種情況下,確實(shí)是有很大的機(jī)會,但也有很大的坑。在我看來,整個世界都可能被2個大“黑洞”吸走。
第一個“黑洞”就是,大家都跟風(fēng)去做大模型。
很多人問我怎么看王慧文老師帶資入組做大模型,那在我看來這就像是當(dāng)年 Netscape Navigator 出來的時候一樣,著急忙慌的再去做一個瀏覽器意義并不大,也沒有那么必要。大模型是需要有人做,比如王慧文老師、百度等等,世界上一定需要像王慧文老師這樣的上頭派、熱血派,需要這樣仰望星辰大海的人去把大模型做出來。
但對于絕大多數(shù)創(chuàng)業(yè)者來說,世界不需要那么多瀏覽器,也不需要那么多大模型,有三四家就夠了,我們應(yīng)該把目光專注在應(yīng)用領(lǐng)域。
而在應(yīng)用領(lǐng)域,90%的人又會被另外一個“黑洞”吸走。
很多人遲遲沒有動手去做一些事情,其實(shí)不少人是一位做AI需要非常專業(yè)的人員,需要去招博士招搞自然語言處理的人才等等,但實(shí)際上,這就是一層窗戶紙的事兒。就像瀏覽器出來,真正進(jìn)入了你就會發(fā)現(xiàn),只需要懂得做建網(wǎng)站的所有基礎(chǔ)信息基本就足夠了。
在這個問題上,我當(dāng)初也被耽誤了兩三個月。當(dāng)我看到 Netscape Navigator 的時候,我特別想進(jìn)入互聯(lián)網(wǎng),我去圖書館查,所有的書都是關(guān)于怎么編程,怎么寫C++的,都是做瀏覽器的教程。但其實(shí),真正進(jìn)入互聯(lián)網(wǎng)之后,你只需要懂得怎么寫 html 就行了,不需要專業(yè)的基礎(chǔ)。
互動問答
答:簡單一句話回答就是:無法識別。
答:這是一個很顯然的問題,因?yàn)樗旧砭褪且粋€文科生。它是一個大語言模型,就是訓(xùn)練語法、行文的表達(dá)等功能的,所以在這個層面,它幾乎是不會犯錯的。那它在什么層面會犯錯呢?首先是事實(shí)錯誤,比如你問它:“意大利面和42號鋼筋一起怎么做菜”,它就會像模像樣的告訴你,需要切段,加上什么調(diào)料之類的。
為什么會出現(xiàn)這樣的狀況?這就要回到語言模型建立的原理上去。鑒于時間關(guān)系,我們不展開細(xì)說,可以給大家舉幾個例子說明一下。
大語言模型的工作原理,其實(shí)有點(diǎn)像是我們?nèi)顺挥绊懙囊粋€現(xiàn)象——“順口溜”,比如我說“床前明月X”,那你一定會馬上回答出來我們都在想的那個字,為什么?因?yàn)槲覀円姷锰噙@樣的組合了。ChatGPT 也是一樣,它閱讀了大量的資料和文獻(xiàn),它也能輕易補(bǔ)上這個字,甚至還能反著補(bǔ)齊“X前明月光”,這都已經(jīng)是2017年那個時候的技術(shù)了。
另外一個例子,我們問 ChatGPT:“1+1=?”,它會立刻回答2,但如果問它 3114×332=?它就回答不上來,它會隨機(jī)說一個數(shù),但我們也會發(fā)現(xiàn),最后個位上的數(shù)從來不會錯。比如這道題里,個位數(shù)就一定會是 8。因?yàn)?ChatGPT 見過太多這樣的模式了,就像我們的“順口溜”一樣出來了。
答:我認(rèn)為可能性是 99. 99%,我不是真正做大模型的,但是我問了一些專家,總結(jié)起來就是,中國做出一個大模型的難度,跟哥倫布第一訪問新大陸之后,第二次再去訪問新大陸的難度是一樣的。雖然過程會曲折,但整體流程是清晰的,不存在秘密和不確定性,就看愿不愿意投入那么多精力和金錢。
之所以最開始大家不愿意投入那么多的金錢,是因?yàn)檫@是一個完全未知的。比如 OpenAI 在做出來 GPT-3 之前,先投入了 5 億美金,沒做出來,又投入了 10 億美金,還是什么都沒做出來,再投入 20 億美金,錢燒沒了,又追加 30 億美金,這個時候全行業(yè)的人好像都在看笑話,就看他們怎么收場,因?yàn)樗腥硕疾恢澜酉聛磉€要投入多少,每個人心里都是沒底的,如果真的投入到了 100 億美金,1000 億美金的時候會是什么樣子?
這就有點(diǎn)像是哥倫布航海的時候,一直往西開,開到船上的補(bǔ)給剛好夠折返的時候,還要不要繼續(xù)往前?這個時候能決定這個事情的,就是人類的意志了。當(dāng)然最后哥倫布一直往西前進(jìn)了,他相當(dāng)于是堵上了一整船人的性命,與船上所有人為敵,好在最后找到了新大陸。
但是一旦找到新大陸之后,西班牙人、荷蘭人、葡萄牙人、法國人也都相繼找到了,為什么?因?yàn)樗麄冎懒诉@一趟行程是什么樣的了,知道需要花費(fèi)些什么。
所以不管是對于 Google 還是中國的廠商,只要這個路走通了,不管要花費(fèi)多少錢,投入進(jìn)去就好了,因?yàn)樽罱K肯定是能做到的,而且,由于已經(jīng)有了先例,后來者可能還會規(guī)避掉很多的彎路,更節(jié)省成本。
但實(shí)際上,對于行業(yè)來說,誰做出來大模型并不重要,有沒有這個模型很重要。
答:可能性都存在。但其實(shí)對于我們這些創(chuàng)業(yè)者來說,這場戰(zhàn)爭其實(shí)還沒開始,就已經(jīng)結(jié)束了,因?yàn)椴还苁?OpenAI 贏還是百度贏,最后能讓我們調(diào)它的 API,把我們的信息經(jīng)過它的語言大模型,最終翻譯成用戶可以理解的東西就可以了。所以我不在意這個問題的答案,我覺得也不重要。
答:我覺得這是一個很好的問題。
可能才能用100年前的農(nóng)民的眼光來看,我們都是一群“無用”的人,因?yàn)榭雌饋砗孟裎覀兠刻焓裁炊疾蛔觯挥孟碌?,不用種田,只是每天對著電腦“傻笑”就能有錢賺,一天就可能輕易收獲原來農(nóng)民干一年那么多的糧食。
在我看來,其實(shí)所有人的工作都將會被取代,但工資從來沒有被取代。
為什么這么說,你想想,你見過有人拿著計(jì)算器去考試考滿分的,但你見過計(jì)算器自己考滿分嗎?所有這些技術(shù)的東西,到目前為止,都只是人類的工具,使用工具的人效率越來越高,也使得越來越多的人慢慢走向100年前的人看來的“不勞而獲”。
大多數(shù)人都擔(dān)心自己被取代,但我認(rèn)為,這是最不可能出現(xiàn)的事情。
因?yàn)椴还茉谀膫€行業(yè),善于使用工具之后,行業(yè)的生產(chǎn)效率都會極大提高。不是被取代,相反而是這個行業(yè)的從業(yè)人數(shù)會增加。而那些不能被提升效率的行業(yè)從業(yè)人數(shù)則會越來越縮減。
比如在我看來,現(xiàn)在最容易取代的是程序員,但在未來5-6年時間內(nèi),成為程序員的人會越來越多。原來的代碼要寫得非常規(guī)整,一個分號一個括號出問題都會報(bào)錯或者是識別不出來,有了 ChatGPT 之后,只要是人能讀懂的東西,機(jī)器都可以執(zhí)行,這樣一來,大部分人都可能成為程序員,從業(yè)人員只會越來越多。并且,工作強(qiáng)度和工作時間一樣,但因?yàn)樾侍嵘?,工資可能會是原來的3-5倍甚至更高。
而畫家這個領(lǐng)域,從米開朗琪羅到現(xiàn)在,基本沒有什么專職的畫家了,大家現(xiàn)在使用 Midjourney 去畫畫,即便是我這種從來不會畫油畫的人,敲幾個字進(jìn)去,就能自動生成一幅漂亮的畫作。去年可能有1萬人左右從事畫畫,而在未來5年,估計(jì)全球會有2億人左右從事畫畫相關(guān)的工作。所以你看,Midjourney 究竟是取代了畫家的工作,還是創(chuàng)造了 2 億個“新畫家”的職位?
仔細(xì)思考這個事情,我們會發(fā)現(xiàn),其實(shí)本質(zhì)是一個領(lǐng)域生產(chǎn)效率的極大提升,而效率提升越多,從業(yè)人員就會更多。所以某種程度上,我們都是機(jī)器養(yǎng)活的人,未來的人在以前的人看來,可能會顯得更加“游手好閑、無所事事”。
答:這是一個關(guān)于整個 AI 未來走向的問題。作為一個狂熱的技術(shù)樂觀主義者,我相信未來肯定是好的。大家喜歡說 AI 統(tǒng)治人類什么,其實(shí)都是因?yàn)槲覀冊谶M(jìn)步的時候看到有風(fēng)險(xiǎn)的可能性,但其實(shí)我們也要看到對抗的部分。就好比我們知道酒駕危險(xiǎn),后來就不允許酒駕了。
我們的整個技術(shù)都是在發(fā)生發(fā)展的,所以我并不覺得前面一定是黑暗的。對于我們創(chuàng)業(yè)者來說,大的政策方向其實(shí)是我們無法把握的,那我們就需要把更多的時間和精力花在“真問題”的層面上,去思考如何抉擇和變化。對于關(guān)注圈之外的問題,不浪費(fèi)自己的“算力”。
非常感謝建碩老師。劉慈欣在他的小說《贍養(yǎng)人類》里寫過這樣一個場景,未來可能是某一個大佬養(yǎng)著全世界的人,所有的人都變得越來越“游手好閑”。當(dāng)然,這是不同人對于技術(shù)的不同看法,這是非常值得我們探討的問題。
最近也看到一個觀點(diǎn)特別有意思,它講的是在歷史上,價(jià)值鏈?zhǔn)遣粩嗟卦诒淮蚱?,而每一次被打破時,對應(yīng)的商業(yè)模式、商業(yè)機(jī)會就會被重塑。
就像書寫出現(xiàn)之前,內(nèi)容從創(chuàng)造到消費(fèi)必須是即時的,就像聽說書人講故事一樣的場景;而在印刷術(shù)出現(xiàn)后,再到互聯(lián)網(wǎng)信息分發(fā),價(jià)值在一步步被解綁,這個過程中也涌現(xiàn)了越來越多的機(jī)會。所以像建碩老師所說,某種意義上確實(shí)是會有新一代的“程序員”“畫家”群體出現(xiàn)。
ChatGPT 可以說是讓所有知識勞動者做一次個體的數(shù)字化轉(zhuǎn)型。
個體需要開始解綁自己的“工作”,拆解成不同的“任務(wù)”,對應(yīng)不同的“技能”,然后在不同技能上使用不同的AI來替換或支持,重新設(shè)計(jì)工作流,達(dá)到強(qiáng)化自己的效果。
這是最壞的時代,因?yàn)楸厝挥写罅康木蜆I(yè)崗位消失;這也是最好的時代,因?yàn)閷τ煤肁I的少數(shù)人來說,“組團(tuán)隊(duì)”只需要過去10%的資本量。
關(guān)于高山書院
高山書院(GASA)以“科學(xué)復(fù)興”為愿景,以“沒有受教,求知探索”為理念,以“公心大用,智識生活”為共識,引導(dǎo)企業(yè)家、創(chuàng)業(yè)者及各界知名人士學(xué)習(xí)科學(xué),同時向社會傳播科學(xué)精神和科學(xué)知識。(
高山書院是一個什么樣的地方?
)
關(guān)鍵詞: