據(jù)外媒報道,特斯拉收購計算機(jī)視覺初創(chuàng)公司DeepScale的交易開始收獲回報,通過收購?fù)暾麍F(tuán)隊開始為這家電動汽車制造商提供新的專利。
2019年年底,有消息稱特斯拉收購了位于舊金山灣區(qū)的初創(chuàng)公司DeepScale,該公司專注于開發(fā)自動駕駛汽車的“深度神經(jīng)網(wǎng)絡(luò)”,收購金額未披露。DeepScale專注于計算節(jié)能的深度學(xué)習(xí)系統(tǒng),這也是特斯拉關(guān)注的重點領(lǐng)域,特斯拉決定設(shè)計自己的電腦芯片來驅(qū)動自動駕駛軟件。有猜測稱,特斯拉收購這個團(tuán)隊是為了加速其機(jī)器學(xué)習(xí)的發(fā)展。
現(xiàn)在,特斯拉公布了名為“用擴(kuò)充數(shù)據(jù)訓(xùn)練機(jī)器模型的系統(tǒng)和方法”的新專利,我們也看到了這筆收購帶來的成果。這項專利的發(fā)明者包括DeepScale的三名成員,分別是馬修·庫珀(Matthew Cooper)、帕拉斯·賈因(Paras Jain)和哈西姆蘭·辛格·西杜(Harsimran Singh Sidhu)。
目前在特斯拉旗下工作的DeepScale團(tuán)隊正在嘗試申請的這個系統(tǒng),它與利用幾個不同傳感器觀測場景的數(shù)據(jù)來訓(xùn)練神經(jīng)網(wǎng)絡(luò)有關(guān),比如特斯拉司機(jī)輔助駕駛系統(tǒng)Autopilot傳感器陣列中的八個攝像頭。
特斯拉在專利申請中描述了這種情況的困難:“在典型的機(jī)器學(xué)習(xí)應(yīng)用中,數(shù)據(jù)可以通過多種方式進(jìn)行擴(kuò)充,以避免過度擬合用于獲取訓(xùn)練數(shù)據(jù)的捕獲設(shè)備的特征模型。例如,在用于訓(xùn)練計算機(jī)模型的典型圖像集中,圖像可能代表許多不同捕獲環(huán)境的對象,這些環(huán)境具有與被捕獲對象相關(guān)的不同傳感器特征。例如,這樣的圖像可以通過不同的傳感器特性來捕獲,就像不同的尺度、焦距、鏡頭類型、預(yù)處理或后處理、軟件環(huán)境以及傳感器陣列硬件等等。這些傳感器在不同的外部參數(shù)方面也可能有所不同,例如成像傳感器的位置和方向相對于捕獲圖像時的環(huán)境。所有這些不同類型的傳感器特性都會導(dǎo)致所捕獲的圖像在圖像集中呈現(xiàn)不同的形式,使正確地訓(xùn)練計算機(jī)模型變得更加困難。”
對此,特斯拉團(tuán)隊總結(jié)了他們應(yīng)對這個問題的解決方案:
第一個部分是用于訓(xùn)練預(yù)測計算機(jī)模型一組參數(shù)的方法。該實施例可以包括:1)識別由一組攝像頭捕獲的圖像,該圖像被附加到一個或多個圖像收集系統(tǒng)中;2)對于圖像集合中的每一幅圖像,識別該圖像的訓(xùn)練輸出;3)對于該組圖像中的一幅或多幅圖像,通過以下特定步驟生成增強(qiáng)圖像:通過用維護(hù)圖像的攝像頭屬性的圖像操縱功能修改圖像來為該組圖像生成增強(qiáng)圖像,并將該增強(qiáng)訓(xùn)練圖像與該圖像的訓(xùn)練輸出相關(guān)聯(lián);4)訓(xùn)練預(yù)測計算機(jī)模型的該組參數(shù)以基于包括該圖像和該組增強(qiáng)圖像的圖像訓(xùn)練集來預(yù)測訓(xùn)練輸出。
第二部分包括具有一個或多個處理器和存儲指令的非暫時性計算機(jī)存儲介質(zhì)系統(tǒng),該指令在由一個或多個處理器執(zhí)行時,會使處理器執(zhí)行相關(guān)操作,這些操作包括:1)識別由一組攝像頭捕獲的、同時附著到一個或多個圖像采集系統(tǒng)的圖像集合;2)對于所述圖像集合中的每幅圖像,識別圖像的訓(xùn)練輸出;3)對于該組圖像中的一幅或多幅圖像,通過以下步驟為一組圖像生成增強(qiáng)圖像:通過用維護(hù)圖像的攝像頭屬性的圖像處理函數(shù)修改圖像來為該組圖像生成增強(qiáng)圖像,并將該增強(qiáng)訓(xùn)練圖像與該圖像的訓(xùn)練輸出相關(guān)聯(lián);4)訓(xùn)練預(yù)測計算機(jī)模型的參數(shù)集來預(yù)測基于圖像訓(xùn)練集的訓(xùn)練輸出,包括圖像和增強(qiáng)圖像集。
第三部分以包括具有供處理器執(zhí)行指令的非暫時性計算機(jī)可讀介質(zhì),該指令在由處理器執(zhí)行時使得處理器能夠:1)識別由一組攝像頭捕獲的、同時附著到一個或多個圖像采集系統(tǒng)的一組圖像;2)對于該組圖像中的每幅圖像,識別該圖像的訓(xùn)練輸出;3)對于該組圖像中的一幅或多幅圖像,通過以下步驟為一組圖像生成增強(qiáng)圖像:通過用維持圖像的攝像頭屬性的圖像操作功能修改圖像來為一組圖像生成增強(qiáng)圖像,并將增強(qiáng)的訓(xùn)練圖像與圖像的訓(xùn)練輸出相關(guān)聯(lián);4)訓(xùn)練計算機(jī)模型以學(xué)習(xí)基于包括圖像和該組增強(qiáng)圖像的圖像訓(xùn)練集來預(yù)測訓(xùn)練輸出。
正如之前報道的那樣,特斯拉正在經(jīng)歷“對特斯拉Autopilot的重大基礎(chǔ)性重寫”。作為重寫的一部分,首席執(zhí)行官埃隆·馬斯克(Elon Musk)表示:“神經(jīng)網(wǎng)絡(luò)正在吸收越來越多的問題。”
新專利中還將包括一個標(biāo)簽系統(tǒng),馬斯克稱3D標(biāo)簽將改變游戲規(guī)則:汽車進(jìn)入有八個攝像頭的場景,畫一條路,然后你可以用3D標(biāo)記那條路。這種用多個攝像頭訓(xùn)練機(jī)器學(xué)習(xí)系統(tǒng)的新方法,就像特斯拉的Autopilot一樣,帶有附加數(shù)據(jù),可以成為Autopilot更新的一部分。
關(guān)鍵詞: 特斯拉收購初創(chuàng)公司