HOME Original page: https://www.cool3c.com/article/157525 ------------------- 集團資訊 關於我們 集團介紹 我們的團隊 旗下媒體 關鍵評論網 every little d. INSIDE 運動視界 Cool3c 電影神搜 未來大人物 歐搜哇 商益 旗下節目 多元服務 Ad2 Taketla 拿票趣 關鍵議題研究中心 Cr.ED ShareParty 達思智能科技 士奇傳播 與我們合作 內容行銷與廣告業務 異業合作 原創內容暨內容媒體業者合作 加入我們 新聞中心 硬科技 首頁 專家觀點 硬科技:GPU虛擬化為何超級難搞(上) 硬科技:GPU虛擬化為何超級難搞(上) by 痴漢水球 2020.10.21 04:51PM 傳送 Twitter 連結 https://www.cool3c.com/article/157525 照片中跟英偉達有關,包含了英偉達、索泰GeForce GTX 660 NVIDIA、NVIDIA GeForce GTX TITAN系列、GeForce GTX 660 Ti、英偉達 專家觀點 硬科技 CPU gpu vmware x86 硬科技 筆者很久以前用了6篇文章,簡單解釋x86電腦虛擬化的困難之處與解決方案,但留下了1個尚未完成的結尾:相較於「比較單純」的CPU,「GPU虛擬化」更是個值得大書特書的複雜議題,絕對只有站在時代浪頭的科科們才有權獨享。 所以筆者試圖用僅僅3篇的規模,簡單解釋GPU虛擬化究竟有哪些棘手的挑戰。為了避免混淆,相關術語(Terminology)也優先採用VMware和NVIDIA的東西,畢竟十幾年的光陰過去了,在這個領域的領導者,依舊是他們2家。 > 硬科技:為何x86的虛擬化這麼難搞(上) > 硬科技:為何x86的虛擬化這麼難搞(中) > 硬科技:為何x86的虛擬化這麼難搞(下) > 硬科技:x86虛擬化由內到外還是繼續難搞(上) > 硬科技:x86虛擬化由內到外還是繼續難搞(中) > 硬科技:x86虛擬化由內到外還是繼續難搞(下) 在遙遠的20年或更早之前,就應用層面來看,顯示卡就像隻荒野孤狼,某個應用程式一旦要上下其手,如執行亟需3D運算資源的遊戲,就得全權佔有,油門踩到底,再加上過去缺乏統一的3D API規範與相對應的GPU指令集架構,形同作業系統眼中的化外之民。 VMware曾在2005年4月,首度在其Workstation 5.0加入實驗性(不保證穩定度和性能表現)3D虛擬化功能,2008年導入於Workstation 6.5和Fusion 2.0的SVGA,則是首次嘗試GPU共享虛擬化。後來被Oracle併購的Sun,其以功能強大又免費而著稱的VirtualBox,到了2009年6月的3.0版,才有比較像樣(但毛病還是不少)的DirectX 8/9和OpenGL 2.0支援度。 照片中提到了Virtual Graphics Stack、App、VMware SVGA Driver,包含了組織、的VMware、虛擬化、虛擬機、I / O虛擬化 就算不提虛擬機,作業系統要「充分掌握」GPU也是一件難事。其實2006年底的Windows Vista有一件少人記得的大事:將繪圖記憶體納入分頁(Paging)管理機制。為何微軟當時要這樣做?因為導入3D化的GUI後,意味著將會有大量應用程式須同時使用顯示卡,多工作業系統絕對有直接管理顯示記憶體內容的必要性,這就是Windows Vista之後,華麗的Flip 3D介面的技術基礎。 更進一步,各位科科可用力回想一件事:Windows是何時才能在工作管理員,看到GPU每個在驅動程式層面、由不同功能模組化身的不同引擎(Engine)?答案是Windows 10秋季創作者更新1709版本,足足是Windows Vista上市的10年之後,還發生過使用率測不準的狀況,這也充分證明了,要讓GPU可被作業系統或虛擬機Hypervisor完全掌控,困難度究竟有多高。 那麼,GPU虛擬化到底是哪裡難搞?原因很複雜也很簡單。 一、不像CPU,GPU並沒有統一的指令集標準,即使單一廠商的歷代產品之間,也是天差地遠(到了AMD的GCN和NVIDIA的Fermi後,才算「勉強」大致穩定下來),硬體規格的混亂度就更不用講了,配合持續推陳出新的3D API,GPU的硬體架構演進,遠比CPU迅速且激進,歷代GPU架構幾乎各自有其獨特的執行狀態格式,硬體底層的技術細節更是高度商業機密,外人難以一窺其全貌。 照片中提到了RADEON™ ARCHITECTURAL ADVANCES、OF PROGRAMMABLE GRAPHICS、PRE 2000,包含了進化架構和、迪蘭恆進Radeon RX 5700 XT、AMD Vega、Advanced Micro Devices公司、AMD公司 也因此,套句VMware的說法,GPU的驅動程式本質上也是1套編譯器(Compiler),管你GPU硬體採用哪種阿貓阿狗怪異指令集,將中間碼(Immediate)編譯成符合3D API規範的二進位執行檔即可,所以科科一定不難理解,為何指令集層面的Bug會造成CPU的大麻煩,但GPU卻有機會用驅動程式「蓋掉」的道理,你有聽說過那顆x86 CPU需要先安裝驅動程式才能開機的嗎? 照片中提到了Unique challenges、• API、The OpenGL IMachine,包含了角度、產品設計、產品、儀表、線 順便一題,要如何「因應來自於客戶的強烈要求,開源繪圖驅動程式,並隱藏硬體架構細節」,也是擺在NVIDIA和AMD眼前的大難題。假以時日,這2間廠商的旗艦GPU都偷偷塞了顆可自我開機的ARM指令集相容處理器(筆者故意不點破,請各位科科細細思量),也不是太讓人感到意外的發展。 二、如同多工作業系統,高效能的虛擬化奠基於「可迅速收集系統運行狀態資訊,並高速切換執行內容」,這也是科科們應當熟悉的x86 CPU虛擬化的基本原理:作業系統教科書絕對會提到的Context Switch。 但這些年來,因水漲船高的可程式化,3D API與其定義的繪圖管線,複雜度也持續破表,動輒數百個程式進入點和不同的程式語言規範,加上GPU在硬體實作層面帶來的龐大運算單元規模、如紡紗機般千絲萬縷的多重執行緒、數以萬計的資料暫存器檔案,都讓GPU能像CPU一樣的「換位子馬上跟著換腦袋」成為不可能的任務。 > 淺談GPU到底是什麼(上):不同的運算型態 > 淺談GPU到底是什麼(中):兼具SIMD與MIMD優點的SIMT > 淺談GPU到底是什麼(下):走向汎用化的GPGPU 別的不提,在2008年,也就是VMware發表 ”GPU Virtualization on VMware’s Hosted I/O Architecture” 一文並公佈SVGA之時,那時最具代表性的旗艦GPU是14億電晶體的NVIDIA GTX280(CPU則是將近3億電晶體的Intel Core 2 Duo “Penryn”)。 照片中提到了How much computation?、NVIDIA GeForce GTX 280:、1.4 billion transistors,包含了中央處理器、GeForce 200系列、中央處理器、英偉達、圖形處理單元 根據VMware的說法,那時的GPU硬體狀態的紀錄資訊量就是 “GB” 等級,切換「整顆」GPU的Context Switch的時間成本之高,完全讓人連想都不敢想。反觀Intel的Penryn,包含全部指令集架構(如暫存器的資料)和大多數處理器微架構(像執行單元的內容),1個CPU核心的狀態也只不過需要8kB而已,根本天差地遠。結果就是CPU的Context Switch或虛擬機切換,可能僅僅需要幾個ns,GPU卻是好幾百個ns甚至上看ms,這也讓虛擬GPU的調度策略,變成1個難搞的議題。 不過俗語說的好,出來混的,總是要還,既然時下已經四處可見所謂的「雲端GPU」,這10幾年來各家廠商也是一步一腳印的見招拆拆、提出解決方案,而VMware早在2008年就確立了GPU虛擬化的技術走向,遠比很多人認知中的時間點,還要早很多年。科科。 是科科就要追蹤 硬科技 猜你喜歡 Adobe「攝影計畫」AI智慧修圖,一鍵編修超輕鬆!首年每月不用300元 資料來源 NVIDIA 回應 0 0 則回應 痴漢水球 不良單身中年男子,從雜誌業逃難至產業界不知不覺已歷十多年光陰,從最沒實力技術編輯、轉型成最沒能力產品經理,仍無豐功偉業可供說嘴,反倒敗戰血淚磬竹難書,據說著作等身,現從事工業電腦產業,現在只關心何時日本旅行次數可以達陣70次。個人部落格:https://molesterwaterball.blogspot.com/ 文章共228篇 相關消息 產業消息 產業消息指稱 Windows 筆電品牌擔憂 M2 版 MacBook Air 上市後會衝擊它們同價位產品市場 專家觀點 硬科技:幻之處理器系列 Sun UltraSPARC RK「Rock」(2009年) 專家觀點 捍衛戰士獨行俠任務真實度高 台灣假想敵中隊避雷達偵測花東縱谷高速爬升 產業消息 Intel 4 製程預計 2023 年問世,較 Intel 7 提升 20% 效能與 2 倍高校能元件庫密度 專家觀點 硬科技:豆知識 CISC和RISC的差別究竟在哪裡? 產業消息 NVIDIA 與合作夥伴公布最新 MLPerf 基準測試,不僅效能出色且仍為唯一執行所有測試項目的運算平台 科技應用 NVIDIA 攜手聯合國衛星中心 利用 GPU 加速為基礎的人工智慧預測洪水、颱風等自然災害 產業消息 幫 AMD 規劃 Zen 架構的 Jim Keller 曾在 4 月份抱怨 AMD 砍掉 Arm 產品規劃是錯誤的決策 產業消息 Intel 新一代 Raptor Lake 處理器傳將突破 6GHz 時脈,因應 AMD Ryzen 7000 架構、時脈迎頭趕上的挑戰 產業消息 Intel 提供給中國媒體的評測指南指出 Arc A770M 效能高於行動版 RTX 3060 ,但功耗可能成致命傷 你可能有興趣的文章 產業消息 2022 AWS 台灣雲端高峰會即將盛大展開,最新雲端技術趨勢、產業佈局一次掌握! 癮特務 13 天前 2022 AWS 台灣雲端高峰會即將盛大展開,最新雲端技術趨勢、產業佈局一次掌握! 專家觀點 硬科技:豆知識 CISC和RISC的差別究竟在哪裡? 痴漢水球 5 天前 硬科技:豆知識 CISC和RISC的差別究竟在哪裡? 遊戲天堂 Sony 招募軟體工程師 工作包含新版模擬器設計 可能為擴充 PlayStation Plus 經典遊戲內容準備 Mash Yang 6 個小時前 Sony 招募軟體工程師 工作包含新版模擬器設計 可能為擴充 PlayStation Plus 經典遊戲內容準備 產業消息 歐盟正式提出數位服務子法案 蘋果、Google 等科技業者需調整現有服務運作模式 避免造成壟斷、影響競爭 Mash Yang 6 個小時前 歐盟正式提出數位服務子法案 蘋果、Google 等科技業者需調整現有服務運作模式 避免造成壟斷、影響競爭 新品資訊 次世代電競專武-Acer Nitro 5 開箱實測!為電競玩家量身打造,搭載12代Intel® Core™處理器,全方位強勁性能再升級! 癮特務 8 天前 次世代電競專武-Acer Nitro 5 開箱實測!為電競玩家量身打造,搭載12代Intel® Core™處理器,全方位強勁性能再升級! 遊戲天堂 微軟 Xbox Games with Gold 訂閱服務未來將只提供免費 Xbox One 遊戲與訂閱用戶專屬優惠 不再贈送 Xbox 360 遊戲 Mash Yang 8 個小時前 微軟 Xbox Games with Gold 訂閱服務未來將只提供免費 Xbox One 遊戲與訂閱用戶專屬優惠 不再贈送 Xbox 360 遊戲 專家觀點 硬科技:幻之處理器系列 Sun UltraSPARC RK「Rock」(2009年) 痴漢水球 8 個小時前 硬科技:幻之處理器系列 Sun UltraSPARC RK「Rock」(2009年) 新奇搞笑 如果把地球上所有的人做成一顆貢丸會有多大? Twelve 25 天前 如果把地球上所有的人做成一顆貢丸會有多大? 應用教學 Adobe「攝影計畫」AI智慧修圖,一鍵編修超輕鬆!首年每月不用300元 癮特務 5 天前 Adobe「攝影計畫」AI智慧修圖,一鍵編修超輕鬆!首年每月不用300元 Cool3c 關於 Cool3c 訂閱電子報 追蹤我們: Line@ Facebook Instagram RSS Youtube 關於我們 集團介紹 加入我們 新聞中心 我們的團隊 FAQ 條款與政策 隱私條款 使用條款 付費內容服務條款 編輯獨立聲明 廣告內容政策 業務發展 內容行銷與廣告業務 異業合作 原創內容暨內容媒體業者合作 旗下媒體與產品 關鍵評論網 INSIDE every little d. Cool3c 電影神搜 運動視界 未來大人物 歐搜哇 商益 自製節目 Taketla 拿票趣 關鍵議題研究中心 Ad2 Cr.ED ShareParty 達思智能科技 士奇傳播 聯絡我們 內容投稿或檢舉、其他意見editor@cool3c.com 新聞採訪、作者發文相關問題editor@cool3c.com 廣告採購、授權詢問和業務相關合作ad.service@cool3c.com Copyright © 2022 TNL Media Group 繁 / 简 主分類 應用教學 開箱評測 新奇搞笑 蘋果新聞 App 人物專訪 新品資訊 科學新知 產業消息 科技應用 雲端服務 遊戲天堂 文化創意 專家觀點 在地生活 快訊 電影劇線上看 汽車未來 專欄 活動 熱門科技議題 iPhone 13懶人包 改變世界的一次機會 六個實用修圖技巧 六個實用修圖技巧 AWS 2022 SUMMIT AWS 2022 SUMMIT ------------------- Text-only page created by https://toolsyep.com ©2022 ToolsYEP