人工智能與邊緣計(jì)算的融合承諾為許多行業(yè)帶來(lái)變革。模型量化的快速創(chuàng)新在這方面發(fā)揮著關(guān)鍵作用,模型量化是一種通過(guò)提高可移植性和減小模型大小來(lái)加快計(jì)算速度的技術(shù)。
模型量化彌補(bǔ)了邊緣設(shè)備的計(jì)算限制與部署高精度模型的需求之間的差距,以實(shí)現(xiàn)更快、更高效、更具成本效益的邊緣AI解決方案。廣義訓(xùn)練后量化(GPTQ)、低秩適應(yīng)(LoRA)和量化低秩適應(yīng)(QLoRA)等突破有可能在數(shù)據(jù)生成時(shí)促進(jìn)實(shí)時(shí)分析和決策。
邊緣人工智能與正確的工具和技術(shù)相結(jié)合,可以重新定義我們與數(shù)據(jù)和數(shù)據(jù)驅(qū)動(dòng)的應(yīng)用交互的方式。
為什么選擇邊緣人工智能?
邊緣人工智能的目的是讓數(shù)據(jù)處理和模型更接近數(shù)據(jù)生成的地方,例如遠(yuǎn)程服務(wù)器、平板電腦、物聯(lián)網(wǎng)設(shè)備或智能手機(jī)。這可實(shí)現(xiàn)低延遲、實(shí)時(shí)的人工智能。到2025年,超過(guò)一半的深度神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)分析將發(fā)生在邊緣。這種模式的轉(zhuǎn)變將帶來(lái)多重優(yōu)勢(shì):
減少延遲:通過(guò)直接在設(shè)備上處理數(shù)據(jù),邊緣人工智能減少了與云來(lái)回傳輸數(shù)據(jù)的需要。這對(duì)于依賴實(shí)時(shí)數(shù)據(jù)并需要快速響應(yīng)的應(yīng)用至關(guān)重要。
降低成本和復(fù)雜性:在邊緣本地處理數(shù)據(jù)消除了來(lái)回發(fā)送信息的昂貴的數(shù)據(jù)傳輸成本。
隱私保護(hù):數(shù)據(jù)保留在設(shè)備上,減少數(shù)據(jù)傳輸和數(shù)據(jù)泄露的安全風(fēng)險(xiǎn)。
更好的可擴(kuò)展性:采用邊緣人工智能的去中心化方法可以更輕松地?cái)U(kuò)展應(yīng)用,而無(wú)需依賴中央服務(wù)器的處理能力。
例如,制造商可以在其流程中實(shí)施邊緣人工智能,以進(jìn)行預(yù)測(cè)性維護(hù)、質(zhì)量控制和缺陷檢測(cè)。通過(guò)運(yùn)行人工智能并在本地分析來(lái)自智能機(jī)器和傳感器的數(shù)據(jù),制造商可以更好地利用實(shí)時(shí)數(shù)據(jù)來(lái)減少停機(jī)時(shí)間,并改進(jìn)生產(chǎn)流程和效率。
模型量化的作用
為了使邊緣人工智能發(fā)揮作用,人工智能模型需要在不影響準(zhǔn)確性的情況下優(yōu)化性能。人工智能模型變得越來(lái)越復(fù)雜、越來(lái)越龐大,使得它們更難處理。這給在邊緣部署人工智能模型帶來(lái)了挑戰(zhàn),邊緣設(shè)備通常資源有限,支持此類(lèi)模型的能力也受到限制。
模型量化降低了模型參數(shù)的數(shù)值精度(例如從32位浮點(diǎn)到8位整數(shù)),使模型輕量化,適合部署在手機(jī)、邊緣設(shè)備、嵌入式系統(tǒng)等資源受限的設(shè)備上。
GPTQ、LoRA和QLoRA這三種技術(shù)已經(jīng)成為模型量化領(lǐng)域潛在的游戲規(guī)則改變者:
GPTQ涉及在訓(xùn)練后壓縮模型。它非常適合在內(nèi)存有限的環(huán)境中部署模型。
LoRA涉及微調(diào)大型預(yù)訓(xùn)練模型以進(jìn)行推理。具體來(lái)說(shuō),它對(duì)構(gòu)成預(yù)訓(xùn)練模型大矩陣的較小矩陣(稱(chēng)為L(zhǎng)oRA適配器)進(jìn)行微調(diào)。
QLoRA是一種內(nèi)存效率更高的選項(xiàng),它利用GPU內(nèi)存來(lái)進(jìn)行預(yù)訓(xùn)練模型。當(dāng)使模型適應(yīng)新任務(wù)或計(jì)算資源有限的數(shù)據(jù)集時(shí),LoRA和QLoRA特別有用。
從這些方法中進(jìn)行選擇在很大程度上取決于項(xiàng)目的獨(dú)特需求、項(xiàng)目是否處于微調(diào)階段或部署階段,以及是否擁有可供使用的計(jì)算資源。通過(guò)使用這些量化技術(shù),開(kāi)發(fā)人員可以有效地將人工智能帶到邊緣,在性能和效率之間取得平衡,這對(duì)于廣泛的應(yīng)用至關(guān)重要。
邊緣人工智能用例和數(shù)據(jù)平臺(tái)
邊緣人工智能的應(yīng)用非常廣泛。從處理火車(chē)站有軌車(chē)檢查圖像的智能相機(jī),到檢測(cè)佩戴者生命體征異常的可穿戴健康設(shè)備,再到監(jiān)控零售商貨架上庫(kù)存的智能傳感器,可能性是無(wú)限的。因此,IDC預(yù)測(cè)2028年邊緣計(jì)算支出將達(dá)到3170億美元,邊緣正在重新定義組織處理數(shù)據(jù)的方式。
隨著組織認(rèn)識(shí)到邊緣人工智能推理的好處,對(duì)強(qiáng)大的邊緣推理堆棧和數(shù)據(jù)庫(kù)的需求將會(huì)激增。此類(lèi)平臺(tái)可以促進(jìn)本地?cái)?shù)據(jù)處理,同時(shí)提供邊緣人工智能的所有優(yōu)勢(shì),從減少延遲到增強(qiáng)數(shù)據(jù)隱私。
為了使邊緣人工智能蓬勃發(fā)展,持久的數(shù)據(jù)層對(duì)于本地和基于云的數(shù)據(jù)管理、分發(fā)和處理至關(guān)重要。隨著多模態(tài)人工智能模型的出現(xiàn),能夠處理各種數(shù)據(jù)類(lèi)型的統(tǒng)一平臺(tái),對(duì)于滿足邊緣計(jì)算的運(yùn)營(yíng)需求變得至關(guān)重要。統(tǒng)一的數(shù)據(jù)平臺(tái)使人工智能模型能夠在線上和離線環(huán)境中,無(wú)縫訪問(wèn)本地?cái)?shù)據(jù)存儲(chǔ)并與之交互。此外,分布式推理有望緩解當(dāng)前的數(shù)據(jù)隱私和合規(guī)性問(wèn)題。
隨著我們向智能邊緣設(shè)備邁進(jìn),人工智能、邊緣計(jì)算和邊緣數(shù)據(jù)庫(kù)管理的融合將成為預(yù)示快速、實(shí)時(shí)和安全解決方案時(shí)代的核心。展望未來(lái),組織可以專(zhuān)注于實(shí)施復(fù)雜的邊緣策略,以高效、安全地管理人工智能工作負(fù)載并簡(jiǎn)化業(yè)務(wù)中數(shù)據(jù)的使用。
來(lái)源:千家網(wǎng)