作者 | 辛?xí)粤? 責(zé)編 | 唐小引
出品 | CSDN(ID:CSDNnews)
8 月 25 日,星爵創(chuàng)業(yè)的向量數(shù)據(jù)庫公司 Zilliz 宣布完成 B+ 輪 6000 萬美元融資,成功將其融資規(guī)模進?步擴?? 1.13 億美元,這已經(jīng)是星爵創(chuàng)業(yè)的第 5 年,能在當(dāng)前環(huán)境下還能取得這樣的成績實屬不易。
(資料圖片僅供參考)
開源創(chuàng)業(yè)是近兩年特別火的創(chuàng)業(yè)模式,基礎(chǔ)軟件也是備受關(guān)注,但是致力 AI 向量數(shù)據(jù)庫這個賽道仍是非常少見的,成功走向國際化的產(chǎn)品就少之又少,盡管在數(shù)據(jù)庫領(lǐng)域深耕二十年,星爵依然直言創(chuàng)業(yè)前期就遇到了“拿著錘子找釘子”的困境。
近日,CSDN 高端對話欄目《開談》邀請到 CSDN 創(chuàng)始人&董事長、極客幫創(chuàng)投合伙人蔣濤獨家對話 Zilliz 創(chuàng)始人星爵。我們得以近距離了解星爵在開源上的思考,聽聽他是怎么看待國內(nèi)外開源,以及技術(shù)人創(chuàng)業(yè)和開源國際化一路走來的思考與趟坑經(jīng)驗。
以下為對話實錄(CSDN 做了不改變原意的編輯,點擊下方視頻,可暢享完整對話)
創(chuàng)業(yè)之初的困難:“拿著錘子找釘子”不是個好選擇
蔣濤:星爵,先和大家簡單介紹一下,你創(chuàng)業(yè)的背景是什么,為什么選擇了 AI 向量數(shù)據(jù)庫這個新興的賽道,是因為你在數(shù)據(jù)庫領(lǐng)域這么多年的背景嗎?
星爵:我們做的是一個面向 AI 的新型數(shù)據(jù)庫,屬于基礎(chǔ)軟件的賽道,我自己從 2002 年開始一直在做數(shù)據(jù)庫方面的研究,之后又在 Oracle 工作多年,負責(zé)云數(shù)據(jù)庫產(chǎn)品的研發(fā),現(xiàn)在團隊里的很多成員也都是數(shù)據(jù)庫領(lǐng)域的老兵。
我們發(fā)現(xiàn)在 AI 到來的時代,企業(yè)處理數(shù)據(jù)的類型發(fā)生了根本變化。數(shù)據(jù)類型從傳統(tǒng)的基于數(shù)值、數(shù)據(jù)表等數(shù)據(jù)格式的結(jié)構(gòu)化數(shù)據(jù),變成了 AI 時代的圖片、視頻、自然語言、用戶行為,甚至生物領(lǐng)域分子結(jié)構(gòu)等等海量的非結(jié)構(gòu)化數(shù)據(jù),這些非結(jié)構(gòu)化數(shù)據(jù)成為 AI 領(lǐng)域里數(shù)據(jù)處理的重要對象。
數(shù)據(jù)對象的變化使得數(shù)據(jù)處理方式也發(fā)生了改變,傳統(tǒng)結(jié)構(gòu)化數(shù)據(jù)的處理方法,關(guān)系型數(shù)據(jù)庫的理論,在非結(jié)構(gòu)化數(shù)據(jù)領(lǐng)域就不那么高效,也起不到應(yīng)有的作用?;诖?,我們看到了這樣一個新興的機會,準備打造一個服務(wù) AI 應(yīng)用的新型數(shù)據(jù)庫,叫做向量數(shù)據(jù)庫系統(tǒng)?;谙蛄繑?shù)據(jù)的分析,挖掘后面非結(jié)構(gòu)化復(fù)用的含義。
過去幾年我們也看到以向量數(shù)據(jù)庫為代表的新型 AI 數(shù)據(jù)庫,在 AI 應(yīng)用處理的場景之下,發(fā)揮著越來越重要的作用。所以,未來十至二十年,隨著 AI 應(yīng)用的進一步落地和發(fā)展,現(xiàn)代數(shù)據(jù)庫能起到越來越重要的作用,去幫助各行各業(yè)更好地處理 AI 數(shù)據(jù)。
蔣濤:你從 2017 年開始創(chuàng)業(yè),回顧一下從創(chuàng)業(yè)之初到現(xiàn)在,創(chuàng)業(yè)的方向發(fā)生過變化嗎,背后的原因是什么?
星爵:其實在創(chuàng)業(yè)最開始時有過一次調(diào)整。2017 年時,我們對產(chǎn)品理念、形態(tài)還不是特別清楚,手上只有技術(shù),考慮要為 AI 服務(wù),我們就做了一個用 GPU 加速各種數(shù)據(jù)處理的引擎。通過使用 GPU 里高效并行的算法去加速各種結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。
有了這個技術(shù)之后,我們就拿著技術(shù)找場景,就是常所說的“拿著錘子找釘子”。然而找了很久后發(fā)現(xiàn),光有一個好技術(shù)、好算法,想要落地變成產(chǎn)品還是非常難。大概經(jīng)歷了一年半的時間,通過大量的用戶訪談和交互,我們發(fā)現(xiàn)用戶其實在處理這種 AI 數(shù)據(jù)時,已經(jīng)用 GPU 異構(gòu)的硬件來做加工,同時也發(fā)現(xiàn),他們有向量圖片搜索、視頻分析加速的需求。
根據(jù)市場的反饋,我們確立了這樣一個機會,堅定了把向量數(shù)據(jù)庫做成一個產(chǎn)品的決心,大概從 2018 年開始,我們堅定了公司和產(chǎn)品發(fā)展路徑,聚焦于新一代的面向 AI 的向量數(shù)據(jù)庫的研發(fā)。迄今為止,也取得了一定的成果。
融資并不是最大的困難,開源幫助我們打開了市場的大門
蔣濤:聽起來都要經(jīng)歷這么一個過程,就是技術(shù)找到市場真正的需求點。那么你是怎么拿到第一筆融資的,一般企業(yè)從 0 到 1 都是有難度的,你是怎么實現(xiàn)這個突破的,又是怎么組建第一個團隊的?這中間都遇到了什么困難?
星爵:蔣總這個問題特別好,因為創(chuàng)業(yè)最不缺的就是困難和挑戰(zhàn),我覺得估計給我三天三夜的時間都聊不完。任何一個階段,當(dāng)你解決了一個特別困難的挑戰(zhàn)時,就會安慰自己以后就是一馬平川了,但實際情況則是問題越來越多,困難挑戰(zhàn)也是越來越大。我認為從創(chuàng)業(yè)到 IPO,挑戰(zhàn)和困難會貫穿公司整個生命周期。
說到第一筆融資,我們可能和其他公司不太一樣,創(chuàng)業(yè)之初并沒有找投資,前期主要靠我個人的積蓄作為啟動資金,在公司完成了初步的探索和技術(shù)原型之后,才決定去接觸投資人。
這個過程也比較順利,主要是在朋友的介紹下認識了第一位投資人,這位投資人之前在 Google 有多年工作經(jīng)驗,同時也在長期研究基礎(chǔ)軟件的賽道,很快就對未來數(shù)據(jù)庫系統(tǒng)等基礎(chǔ)軟件的變化達成了默契。我們直接拿出代碼編譯測試,整個盡調(diào)(Due Diligence)過程比較簡單粗暴,也只聊了一次就敲定了投資的意向。在接下來的兩周內(nèi)就完成了融資,所以我們第一次的融資過程還是比較順利的,運氣也很好。
公司天使輪的時候,團隊一共只有四個人,其中一位是我本科的同學(xué),我回國后說服了他加入我們,然后又從社會面招聘了兩位年輕有為的工程師,組建了第一個天使小團隊。
蔣濤:剛才你提到了在 2018 年的時候確定了公司發(fā)展的方向,也取得了一些成果,那有沒有具體的瞬間就是你確信自己創(chuàng)業(yè)做對了,市場上有哪些標(biāo)志或者反饋?
星爵:我們從 2018 年開始做向量數(shù)據(jù)庫的產(chǎn)品,到了 2019 年把產(chǎn)品開源出來,開源半年之后,就在全球積累了超過 100 家的企業(yè)級客戶。這個時期,我們還是比較興奮的,終于把技術(shù)變成有用的產(chǎn)品,給我們的“錘子找到了一個特別好使力的釘子”。回過頭看,當(dāng)時應(yīng)該來說我們已經(jīng)找到了所謂的 PMF(Product Market Fit,產(chǎn)品市場匹配度)。
蔣濤:所以你認為開源的策略幫你打開了市場嗎?
星爵:對,開源不僅幫我們打開了市場,更多的是給我們的技術(shù)找到了一個很好的支點,可以讓更多的企業(yè)能夠迅速地使用上我們的技術(shù),并且基于技術(shù)和產(chǎn)品不斷提供反饋,再讓我們更好更快地去迭代。
開源國際化不是技術(shù)人創(chuàng)業(yè)的萬能藥
蔣濤:開源幫助你們打開了市場,最近幾年在國內(nèi)開源創(chuàng)業(yè)的模式也是備受關(guān)注,出現(xiàn)了一批新型的開源公司,你們平常有交流嗎,怎么看待國內(nèi)這些開源公司的發(fā)展?你認為對于技術(shù)創(chuàng)業(yè)尤其是基礎(chǔ)軟件賽道創(chuàng)業(yè)者來說,開源是個比較好的模式嗎?
星爵:我覺得首先來說,大家都處在一個比較好的時代。我們之所以能夠做開源,能夠利用開源進行商業(yè)化,其實是因為我們中國工程師的發(fā)展能夠撐起開源軟件的這種研發(fā)需要。同時,中國的經(jīng)濟與資本的發(fā)展,尤其是風(fēng)險投資行業(yè)的發(fā)展,也使得我們能夠去向基礎(chǔ)軟件這樣的賽道去探索開源。
所以對我們而言,是出生在了一個比較幸運的時代,但挑戰(zhàn)也很大。從第一天開始,我們就要面對全球化的競爭,因為在開源的世界里,國界意識是非常淡薄的,或者可以說開源是無國界的。那么不管你的技術(shù)、產(chǎn)品,甚至說商業(yè)化的成功,都需要放在國際化、有著更高要求的環(huán)境里去對比和競爭,這是很多開源兄弟廠商都面臨的一個挑戰(zhàn)。
對于國內(nèi)開源公司的發(fā)展,我非常樂觀。從本質(zhì)上來說,在過去二十多年的發(fā)展過程中,中國的工程師文化和能力有了全球范圍的外溢,這個外溢的效應(yīng)在未來會越來越明顯。所以我覺得在未來的十至二十年里,中國會有一批開源軟件的公司能夠從國內(nèi)出發(fā),走向全世界。
回到開源創(chuàng)業(yè),我想盡管我們依靠開源獲得了非常多的機會,但其實開源并不見得是一個萬能藥,還是要根據(jù)不同的項目,不同的團隊特征,找到一條真正適合自己的路徑。
比如美國有很多基礎(chǔ)軟件、SaaS 的公司,沒有采用開源的方式也取得了成功。最近美國成長最快的一批 SaaS 公司里就有一大半是閉源的,時至今日,在云時代,開源與閉源做軟件,都能找到很好的成長路徑。
對于我個人來說,有一個小技巧可以幫助大家判斷項目是否有必要開源。
越是底層的軟件,意味著服務(wù)的需求越通用,可以比較容易地打造一款小而精的通用產(chǎn)品去找到通用的需求。這時開源就是更好的選擇,可以幫助你快速獲取用戶更廣泛的需求,進而把產(chǎn)品進一步地做精做好。同時,因為需求比較普遍,你的產(chǎn)品更容易傳播和復(fù)制,這也是能在開源社區(qū)取得早期成功的先決條件。所以,越底層的軟件越容易被開源接受,也越容易在開源賽道取得成功。
但這并不意味著做一款上層的應(yīng)用型軟件就不適合開源,最終還是要根據(jù)自己團隊的特點、項目的不同階段,進入市場的戰(zhàn)略以及最終要采取的商業(yè)模型去做綜合判斷。
蔣濤:非常好的判斷方法,那你認為國內(nèi)現(xiàn)在哪些開源項目是有潛力發(fā)展起來的,會是像你們現(xiàn)在正在做的新興領(lǐng)域的前沿技術(shù)嗎,還是過去一些傳統(tǒng)領(lǐng)域的項目?你們已經(jīng)成功地走出國門,你認為國內(nèi)的開源公司和項目應(yīng)該如何參與全球競爭,更好地拓展國際化市場?
星爵:我覺得無論是傳統(tǒng)領(lǐng)域,還是新興的領(lǐng)域,關(guān)鍵詞都在于創(chuàng)新,尤其是在開源賽道。
開源的一個重要思想就是不要重復(fù)造輪子。從另一維度去解釋的話,就是我們提倡創(chuàng)新。只要這個技術(shù)、產(chǎn)品在通過一種之前無人做過的方式去解決問題,我認為都值得去推廣,值得去通過開源的方式運營發(fā)布。無論它是在既有問題上做的微觀創(chuàng)新、帶來效率提升,亦或是在一個全新領(lǐng)域里去拓展一些我們之前完全不曾做過的,創(chuàng)造一些全新領(lǐng)域和機會,我認為這都是創(chuàng)新。
如果說開源一個項目想獲得成功的話,關(guān)鍵決定因素還是項目創(chuàng)新的高度,或者說項目創(chuàng)新的可持續(xù)性,以及創(chuàng)新的稀缺性和原創(chuàng)性。
另外,其實整個國際化探索上,我們還是處于初級階段。我覺得想要更好地拓展全球化市場,首先要調(diào)整好心態(tài),在企業(yè)組織架構(gòu)和產(chǎn)品設(shè)計上,都需要根據(jù)海外市場去重新調(diào)整。
首先,我認為國際化不是個體,而是在實踐過程中無數(shù)個本地化的合體。無論是北美市場,還是歐洲市場,語言溝通方式、對產(chǎn)品形態(tài)的需求、對團隊成員的構(gòu)成都是完全不一樣的。
從我們的經(jīng)驗來說,全球化的第一步,就是找到自己認為最核心的市場,在這之中,用本地化的方式做精做好做透。本地化顧名思義就是把自己想象成當(dāng)?shù)氐谋镜毓荆灰炎约寒?dāng)成一個國際化公司,也不要想象成是外來公司,你就是本地原生的公司。公司從內(nèi)部組織架構(gòu)、文化、產(chǎn)品形態(tài),到外部用戶關(guān)系、客戶關(guān)系、生態(tài)合作伙伴的關(guān)系,都要重新打造。比較關(guān)鍵的一點是,要能招到足夠多本地的人才,然后用本地的方式,才能把本地的生意做起來。
同時,對于一家科技公司,如果在做本土化的過程中,能夠獲得當(dāng)?shù)氐暮献骰锇?,不管是生態(tài)的合作伙伴,還是資金與投資的合作伙伴,這對它的早期成果都是相當(dāng)重要的,這也是我們今后要重點發(fā)展的方向。
中國不缺軟件生態(tài)土壤,我們需要有更多的耐心
蔣濤:你提到國外非常多基礎(chǔ)軟件公司、SaaS 公司無論是開源還是閉源的都有很多取得了不錯的成果,是因為有天然的適合軟件生長的“土壤”嗎,你認為存在這個差異嗎,畢竟一個公司的產(chǎn)品技術(shù)尤其是基礎(chǔ)技術(shù),是需要一個好的生態(tài)做支撐的。
星爵:這點我非常贊同,任何一個軟件真正想要生根發(fā)芽,長成參天大樹,都需要廣泛的生態(tài)支持。
我認為國內(nèi)完全不缺生態(tài)的土壤,我們可能需要有更多的耐心,需要更多的公司去慢慢施肥澆水耕耘。因為無論是微軟、Oracle 還是 Salesforce 等企業(yè),都是短則十至二十年,長則花了三十至四十年的時間,去構(gòu)建整個上下游生態(tài)。
回顧國內(nèi)軟件發(fā)展歷程,加起來可能也就三十年左右的時間,所以我們要走的路依然很長。在這個過程中,我們要去注重生態(tài)的建設(shè),比如國內(nèi)有一批企業(yè)已經(jīng)基于開源項目去做服務(wù)和生態(tài),對于這樣的行為我們要無私地扶持。做生態(tài)的企業(yè)一定要比我們先掙到錢,才能為未來更強大的生態(tài)奠定基礎(chǔ)。
基金會的經(jīng)歷可以加速項目商業(yè)化嗎?
蔣濤:開源還是離不開懂生態(tài)的運營人才,你在國際開源社區(qū)也是很有影響力的,你是怎么參與到 Linux 基金會的,能講講你在基金會的經(jīng)歷嗎?
星爵:首先介紹一下,我們基金會的全稱是 Linux Foundation AI&DATA 基金會(簡稱 LF AI&DATA 基金會),它是 Linux Foundation 下面的一個子基金會,專注于開源 AI 和模型能力方面的創(chuàng)新,同時也包含了開源的數(shù)據(jù)分析和數(shù)據(jù)科學(xué)領(lǐng)域的創(chuàng)新。這個子基金會從 2018 年開始發(fā)起成立,到 2019 年正式成型,經(jīng)過幾年的發(fā)展,在全球也有了三十多家企業(yè)級的會員,二十多個開源項目。
我最早接觸基金會是想為 Milvus 項目尋找一個合適的基金會做托管,在市場上尋找了一圈,我們發(fā)現(xiàn)自己的項目既是一個基礎(chǔ)軟件的數(shù)據(jù)庫產(chǎn)品,同時又是一個面向 AI 場景的創(chuàng)新技術(shù)。這時看到 Linux Foundation AI&DATA 非常符合 Milvus。通過和基金會董事多次交流,發(fā)現(xiàn)基金會的理念與我們產(chǎn)品的未來方向是契合的,于是就將項目捐贈給了基金會做孵化,2021 年上半年正式畢業(yè)成為這個子基金會的頂級項目。
蔣濤:對你來說,加入 LF AI&DATA 基金會得到的幫助和成長是什么?你認為加入基金會和企業(yè)做商業(yè)化會有沖突嗎?基金會怎么看這個事情?
星爵:主要有兩個方面,首先開源項目的治理,最開始在制定開源項目的章程、議事規(guī)則、管理方法等方面,都是遵循基金會的最佳實踐和指導(dǎo)去執(zhí)行的。
其次,基金會里有許多開源的 AI 項目,在過去的幾年時間里,我們和這些項目建立了一些合作,使得自己的 Milvus 不僅僅作為一個創(chuàng)新的數(shù)據(jù)庫項目,更多的是能夠整合到整個開源生態(tài)中去,成為企業(yè) AI 生產(chǎn)環(huán)境項目部署鏈條里不可缺少的一環(huán)?;饡谶@些方面發(fā)揮了很好的連接作用。
關(guān)于基金會和企業(yè)商業(yè)化,我覺得本質(zhì)上沒有太多的沖突?,F(xiàn)在無論是傳統(tǒng)的 Apache 基金會,還是 Linux 基金會下的 CNCF,它們對開源項目的商業(yè)化都是秉承著中立甚至是鼓勵的態(tài)度。像基金會里很多優(yōu)秀的項目,他們的核心團隊出來成立公司,把項目商業(yè)化,基金會對這些事情也是支持和鼓勵的。
中國工程師聰明勤奮,但美國工程師成長更快
蔣濤:我們回到你最初招聘工程師的話題,你認為中國和美國年輕工程師的相同點和不同點有哪些,各自的優(yōu)缺點都是什么?最后,如果要給年輕的工程師們分享你個人在技術(shù)成長方面的一些建議,你準備說什么?
星爵:我覺得國內(nèi)外年輕的開發(fā)工程師,在勤奮程度和基礎(chǔ)知識扎實的程度上都相差不大。但是美國的年輕工程師,尤其是工作了 2-3 年甚至 5-6 年后的工程師,他們的進步要比中國的工程師更快。
具體來說,他們會有更多、更高的項目要求意見,可以看到一些更嚴格、更優(yōu)秀的標(biāo)準,也有一些更優(yōu)秀的工程師在周圍作為同事一起工作。
所以我認為,對國內(nèi)的工程師來說,尤其是新生代的程序員們,要走出國門,打開自己的視野,去看看全球最好的軟件標(biāo)準在什么地方,全球最佳的實踐在哪里。如果有機會可以和世界上最好的工程師一起協(xié)同工作,尤其是現(xiàn)在有了開源項目,開源的協(xié)作變得更加廣泛,與國際大神一起工作,已經(jīng)變成了一件觸手可及的事情。
如果說要提一點建議的話,我希望大家可以擁抱開源,擁抱全球化。因為在開源的過程中,你能夠認識全球最好的一批工程師,能夠?qū)W習(xí)到最好的代碼規(guī)范和實踐。同時,在擁抱開源和全球化的過程中,你也能第一時間發(fā)現(xiàn)全球化的機會,和全球最好的工程師去同臺競技,提升自己。
此外,中國工程師的聰明才智和勤奮都是全球數(shù)一數(shù)二的。在全球化的過程中,除了聰明和勤奮,還需要更多的軟實力,這些軟實力的提升一定要在全球化的競爭博弈格局內(nèi),才能得到歷練和發(fā)展。我認為早點擁抱全球化,早點參與國際化競爭,這是接下來中國年輕工程師能夠飛得更高、走得更遠的先決條件。
關(guān)鍵詞: 開源國際化不是技術(shù)人創(chuàng)業(yè)的萬能藥|開談