驍龍8至尊版混合架構(gòu)、成本揭秘:更貴是不可避免的!
快科技10月25日消息,近日,高通發(fā)布了新一代旗艦移動平臺驍龍8至尊版,首次采用專為智能手機(jī)設(shè)計的第二代自研Oryon CPU架構(gòu),同時在GPU、NPU、影像、連接等各方面都實現(xiàn)了飛躍,各家手機(jī)廠商的終端產(chǎn)品也即將紛紛登場。
發(fā)布會后,快科技采訪了高通的多位技術(shù)高管,對于驍龍8至尊版的架構(gòu)設(shè)計、技術(shù)特性有了更深入的了解。
CPU架構(gòu)方面,驍龍8至尊版配備了兩個4.32GHz的超級內(nèi)核、六個3.53GHz的性能內(nèi)核,各自搭配12MB二級緩存。
高通表示,驍龍8至尊版在微架構(gòu)上實現(xiàn)了全方位的升級,主要有以下三點:
第一,每個CPU叢集都配備了迄今最大的緩存;第二,引入了全新的數(shù)據(jù)時序預(yù)取器(data-cache pre-fetcher);第三,引入了全新的性能內(nèi)核設(shè)計。
說到性能內(nèi)核、超級內(nèi)核之間的區(qū)別,它們在微架構(gòu)層面上確實有很多差異,尤其是性能內(nèi)核為了降低功耗,做了大量的微架構(gòu)調(diào)整。
兩類核心是不同的異構(gòu)計算核心,但在SoC和總線架構(gòu)中是緊密相連的,以確保高速的核間通信,同時二級緩存的大小加倍,以確保緊密同步。
同時,為了能讓超級內(nèi)核、性能內(nèi)核既保證能效,又不妥協(xié)性能,高通在設(shè)計之初就充分考慮到了芯片的各種物理限制,包括芯片架構(gòu)、手機(jī)主板架構(gòu)等。
不過,高通沒有也不會公布驍龍8至尊版的晶體管數(shù)量,未來產(chǎn)品也不考慮,這和蘋果、聯(lián)發(fā)科的做法不同——A18系列今年沒有公布大概率是因為“開倒車”而不好意思。
高通強調(diào),晶體管的數(shù)量不能直接代表性能表現(xiàn),并不是晶體管越多,芯片的性能就越好,我們要看的是如何實現(xiàn)最佳的性能和能效。
需要強調(diào)的是,二級緩存對能效的表現(xiàn)至關(guān)重要,所以驍龍8至尊版為每一個CPU叢集都配備了前所未有的12MB二級緩存,總計達(dá)24MB,這種緊密耦合的專用緩存也是移動領(lǐng)域迄今最大的。
總體上,高通做了巨大的投入,有效降低了驍龍8至尊版的時延,從第三代驍龍8的12ns大幅降低至5ns,這會顯著提升高性能游戲、網(wǎng)頁瀏覽等各種使用體驗。
正是得益于高通在這些領(lǐng)域的深厚經(jīng)驗,配合出色的軟件架構(gòu),才做出了這款性能和能效兼得的CPU。
說到網(wǎng)頁瀏覽性能,可以通過Speedometer測試最直觀地反映出來,實測驍龍8至尊版的成績?yōu)?6.0,酷睿Ultra 200V系列則只有17.0。
同時,驍龍8至尊版對比前代驍龍8 Gen3更是提升了多達(dá)62%,高通也有信心超越任何安卓平臺競品。
要知道,諸如微信、滴滴、美團(tuán)等很多主流應(yīng)用的底層功能,其實都是基于Web應(yīng)用的,因此,提升網(wǎng)頁瀏覽性能,對于增強整體用戶體驗至關(guān)重要,驍龍8至尊版將讓用戶感受到前所未有的流暢使用體驗。
高通強調(diào),之所以能在Speedometer上取得如此顯著的速度提升,關(guān)鍵在于驍龍8至尊版采用了定制架構(gòu)的CPU(Oryon CPU高達(dá)192KB的一級緩存就非常有幫助),這是公版架構(gòu)無法相媲美的,而縱觀全球,目前僅有兩家公司擁有定制CPU。
同時,驍龍8至尊版基于用戶真實需求和用例為基礎(chǔ),進(jìn)行了專門的網(wǎng)頁瀏覽性能優(yōu)化。
除了CPU部分的超大緩存,GPU部分也設(shè)置了12MB的專用緩存,它可以存儲部分畫面幀,以此降低帶寬占用,從而提高能效。
值得一提的是,驍龍8至尊版首次在移動端運行了虛幻引擎5的Nanite解決方案,可以實現(xiàn)虛擬紋理繪制(virtual texturing)、陰影貼圖(shadow maps)等功能。
在一些大型世界游戲中,通過陰影貼圖功能,可以實現(xiàn)高達(dá)16K甚至更高分辨率的畫面,并且畫面是分區(qū)渲染的,單次只渲染所在場景中的部分畫面,以實現(xiàn)更精美的、更高分辨率的畫面質(zhì)感。
內(nèi)存方面,驍龍8至尊版也支持到了行業(yè)最高的LPDDR5X 5.3GHz (等效于10.7GHz),與聯(lián)發(fā)科天璣9400相同。
高通解釋說,QRD(高通參考設(shè)計)在內(nèi)存方面其實有兩個版本,一個是4.8GHz(等效于9.6GHz),另一個是5.3GHz(等效于10.7GHz),基準(zhǔn)測試在兩個版本上運行的差異并不是很明顯。
目前來看,高通預(yù)計5.3GHz內(nèi)存在短期內(nèi)的采用率會相對低,因為它相對更新,成本也更高,到了明年可能會有所不同。
AI方面,驍龍8至尊版大幅提升了NPU的性能和AI的運用,比如NPU可以在后臺靈活調(diào)度大語言模型的推理。
這正是Hexagon NPU架構(gòu)設(shè)計的初衷,其不僅性能卓越,而且能效顯著提升,對比上代每瓦性能提升了多達(dá)45%。
同時,新的架構(gòu)可以針對廣泛的應(yīng)用場景,提供相應(yīng)的能效優(yōu)化,當(dāng)然包括后臺待命,通過輕觸屏幕或語音喚醒,迅速調(diào)用強大的AI功能。
針對AI大模型的快速進(jìn)化,高通也有充分的考慮,尤其是內(nèi)存占用方面。
比如Llama和百川的70億參數(shù)大模型版,即使壓縮到16位整數(shù)精度進(jìn)行處理,也會占用13GB左右的內(nèi)存,而通過高通的軟件和相應(yīng)的解決方案,將內(nèi)存需求大幅降至約3.5GB。
高通預(yù)計,未來對更有效壓縮技術(shù)的需求會日益增長,同時會出現(xiàn)越來越多的介于10億至40億參數(shù)之間的達(dá)模型。
五次,高通會從硬件和AI軟件棧兩個方面持續(xù)投入,一方面提升壓縮模型的性能表現(xiàn),實現(xiàn)更小的內(nèi)存占用,另一方面進(jìn)一步降低模型精度,應(yīng)對內(nèi)存資源爭搶,并降低成本。
最后說一下成本問題,行業(yè)傳聞驍龍8至尊版的價格又要貴很多,給終端廠商帶來了不小的壓力。
對此問題,高通解釋說,任何半導(dǎo)體行業(yè)從業(yè)者都清楚的是,這個行業(yè)的經(jīng)濟(jì)模式已經(jīng)出現(xiàn)了根本性的變化。
大約十年前,同樣的設(shè)計和晶體管規(guī)模過渡到新一代制程工藝后,會變得更加便宜,因此通過制程迭代工藝,能夠顯著節(jié)省成本,繼而用來開發(fā)新的技術(shù)特性和創(chuàng)新。
但是現(xiàn)在,晶體管和晶圓代工廠的經(jīng)濟(jì)模式出現(xiàn)了轉(zhuǎn)變之后,同樣的設(shè)計升級到下一代工藝制程,成本會大幅增加,這為半導(dǎo)體行業(yè)的各個領(lǐng)域都帶來了根本性的變化。
高通表示,關(guān)于成本問題,一直在與客戶保持著緊密的溝通,尤其是中國客戶。
為此,高通開展了很多工作,其中一點是通過打造豐富的產(chǎn)品層級和產(chǎn)品組合,滿足不同的市場需求。
比如面向有著最頂級旗艦定位和性能需求的產(chǎn)品層級,高通提供最高端的解決方案、最卓越的體驗。
面向其他價格段市場和沒有那么高預(yù)算的消費者,高通會跨越產(chǎn)品層級,將旗艦體驗下放,為更多消費者提供集成眾多旗艦平臺核心技術(shù)、同時價格更經(jīng)濟(jì)實惠的解決方案。
本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。
如果侵犯了你的權(quán)益請來信告知我們刪除。郵箱:business@qudong.com











