在人工智能(AI)領(lǐng)域,一種觀念持續(xù)存在:更大的模型自動(dòng)意味著更好的結(jié)果?!按笳Z(yǔ)言模型”(LLM)這一術(shù)語(yǔ)本身就強(qiáng)化了這種想法,暗示著以數(shù)十億參數(shù)衡量的規(guī)模是終極優(yōu)勢(shì)。
雖然擁有數(shù)千億參數(shù)的前沿 AI 模型無(wú)疑功能強(qiáng)大,但這種假設(shè)并不總是成立——特別是在制造環(huán)境中,在這里,延遲、可靠性、成本、數(shù)據(jù)主權(quán)和系統(tǒng)集成與原始智能同等重要。
隨著制造商擁抱工業(yè) 4.0、智能工廠和互聯(lián)互通的運(yùn)營(yíng),一種不同的現(xiàn)實(shí)正在顯現(xiàn):更小、更高效的 AI 模型往往是更適合這項(xiàng)工作的工具。這些模型不僅在能力上正在追趕,而且在許多工業(yè)應(yīng)用場(chǎng)景中正變得具有戰(zhàn)略優(yōu)勢(shì)。
讓我們探討一下大模型與小模型之間不斷演變的平衡關(guān)系,以及為什么效率、專業(yè)化和可部署性正在重新定義現(xiàn)代制造業(yè)中的 AI 價(jià)值。
1. 小型模型愈發(fā)智能——這改變了工業(yè)AI的經(jīng)濟(jì)性
當(dāng)前AI領(lǐng)域最顯著的趨勢(shì)之一,是通用智能正被快速壓縮進(jìn)更小體量的模型中,且性能表現(xiàn)依然出色。行業(yè)內(nèi)常用大規(guī)模多任務(wù)語(yǔ)言理解測(cè)試(MMLU) 作為衡量 AI 通用能力的基準(zhǔn),該測(cè)試包含 15000 余道選擇題,覆蓋數(shù)學(xué)、歷史、法律、醫(yī)學(xué)等多個(gè)學(xué)科,要求模型兼具事實(shí)記憶與問(wèn)題解決能力。
以下測(cè)試分?jǐn)?shù)可直觀呈現(xiàn)模型能力水平:
●隨機(jī)猜測(cè)正確率:25%
●普通人類正確率:約 35%
●人類領(lǐng)域?qū)<艺_率:約 90%
●當(dāng)下前沿 AI 模型正確率:80% 以上
這一基準(zhǔn)測(cè)試清晰展現(xiàn)了AI的創(chuàng)新速度。2020 年,擁有 1750 億參數(shù)的超大模型 GPT-3 在該測(cè)試中僅取得 44% 的正確率,成績(jī)尚可但遠(yuǎn)未達(dá)到精通水平。我們以 60% 的正確率作為 “合格通用型模型” 的門檻,會(huì)發(fā)現(xiàn)模型效率的提升令人震驚 —— 達(dá)到這一標(biāo)準(zhǔn)所需的模型體量正快速縮減:
●2023年2月:Llama 1 – 650億參數(shù)
●2023年7月:Llama 2 – 340億參數(shù)
●2023年9月:Mistral – 70億參數(shù)
●2024年3月:Qwen 1.5 MoE – 激活參數(shù)低于30億
對(duì)于制造企業(yè)而言,這一趨勢(shì)直接決定了AI的部署場(chǎng)景與落地方式:
●AI模型如今可部署在更靠近生產(chǎn)線的位置,而非僅局限于中心化云端;
●更小的模型使得在工廠車間的硬件上進(jìn)行邊緣推理成為可能;
●成本大幅降低,讓AI得以在工廠、設(shè)備、生產(chǎn)流程中規(guī)模化應(yīng)用。
這是智能互聯(lián)制造的核心基礎(chǔ) ——AI必須在工業(yè)控制技術(shù)(OT)的約束下穩(wěn)定運(yùn)行,而非僅適配信息技術(shù)(IT)環(huán)境。
2.低成本高價(jià)值,完美適配智能工廠需求
在現(xiàn)實(shí)世界的業(yè)務(wù)任務(wù)中,較小的模型通常能提供與大型模型在統(tǒng)計(jì)上無(wú)顯著差異的結(jié)果,同時(shí)成本和速度優(yōu)勢(shì)巨大。
相關(guān)研究數(shù)據(jù)顯示:Mistral 70 億參數(shù)模型在新聞?wù)蝿?wù)中,性能與 GPT-3.5 Turbo 持平,成本與延遲優(yōu)化幅度可達(dá) 30 倍以上;IBM Granite 130 億參數(shù)模型在企業(yè)問(wèn)答任務(wù)中,與規(guī)模是其五倍的模型表現(xiàn)相當(dāng)甚至更優(yōu)。
這種效率優(yōu)勢(shì)與工業(yè) 4.0 的優(yōu)先事項(xiàng)完美契合,包括:
●生產(chǎn)報(bào)告和交接班摘要
●維護(hù)日志分析
●質(zhì)量檢查文檔
●標(biāo)準(zhǔn)作業(yè)程序(SOP)指導(dǎo)
●供應(yīng)商和物料分類
在這些場(chǎng)景中,制造商不需要跨越整個(gè)互聯(lián)網(wǎng)的開(kāi)放式推理。他們需要的是快速、準(zhǔn)確、特定領(lǐng)域的智能——并且要可靠、經(jīng)濟(jì)地交付。
3. 工業(yè)場(chǎng)景中,大型模型仍有不可替代的價(jià)值
盡管小型模型發(fā)展勢(shì)頭迅猛,但在部分高復(fù)雜度的制造任務(wù)中,模型體量依然是關(guān)鍵因素。
大型模型在以下場(chǎng)景中仍具備顯著優(yōu)勢(shì):
●跨領(lǐng)域工程推理(如在產(chǎn)品全生命周期中,實(shí)現(xiàn)機(jī)械、電氣、軟件系統(tǒng)的聯(lián)動(dòng)分析)
●大文檔量合規(guī)性分析(如 ISO 標(biāo)準(zhǔn)、安全法規(guī)、數(shù)百頁(yè)的技術(shù)規(guī)范文件解讀)
●全球運(yùn)營(yíng)與多語(yǔ)言協(xié)調(diào)(捕捉不同地區(qū)和供應(yīng)商之間的細(xì)微語(yǔ)言差異)
在實(shí)際應(yīng)用中,多數(shù)制造企業(yè)會(huì)采用混合AI架構(gòu)—— 在企業(yè)中心端部署大型模型,在現(xiàn)場(chǎng)端落地小型模型。
4. 在工業(yè) 4.0 和邊緣環(huán)境中,小模型更具適用性
在一些制造業(yè)場(chǎng)景中,小型模型并非僅僅是 “夠用”,更是很多情況下唯一具備實(shí)操性的選擇。小型模型能夠更好地實(shí)現(xiàn)以下功能:
●機(jī)器上的實(shí)時(shí)異常檢測(cè)
●低延遲的操作員輔助
●在物理隔離或安全關(guān)鍵環(huán)境中的離線操作
●專有生產(chǎn)數(shù)據(jù)的數(shù)據(jù)隱私
這對(duì)預(yù)測(cè)性維護(hù)、計(jì)算機(jī)視覺(jué)輔助檢查以及面向車間技術(shù)員的AI助手等方面至關(guān)重要。
一個(gè)經(jīng)過(guò)微調(diào)的70億至130億參數(shù)模型,如果訓(xùn)練數(shù)據(jù)包含維護(hù)手冊(cè),故障模式歷史數(shù)據(jù),傳感器元數(shù)據(jù)以及工廠特定的標(biāo)準(zhǔn)操作規(guī)程,其表現(xiàn)可能優(yōu)于通用的尖端模型——因?yàn)樗私饽愕墓S,而不是互聯(lián)網(wǎng)。這與工業(yè)4.0中嵌入運(yùn)營(yíng)的“情境感知智能”原則相契合。
制造業(yè)需要適配場(chǎng)景的AI工具
關(guān)于人工智能模型體量的爭(zhēng)論,并非一場(chǎng)非此即彼的零和博弈,核心在于是否適配應(yīng)用場(chǎng)景。大型模型擅長(zhǎng)廣泛的探索性推理任務(wù);小型模型在成本、速度、可部署性與工業(yè)場(chǎng)景可靠性上占據(jù)絕對(duì)優(yōu)勢(shì)。
對(duì)于追求智能工廠、互聯(lián)資產(chǎn)與高韌性生產(chǎn)的制造企業(yè)而言,AI的未來(lái)并非依賴單一的超大模型,而是打造一套體量適配的AI生態(tài)系統(tǒng)—— 從云端到邊緣端,從企業(yè)整體規(guī)劃到設(shè)備級(jí)實(shí)時(shí)執(zhí)行,各環(huán)節(jié)均有匹配的模型。
隨著AI模型不斷輕量化、能力持續(xù)提升,一個(gè)核心問(wèn)題擺在制造業(yè)管理者面前:在工業(yè) 4.0 的下一發(fā)展階段,當(dāng)超高效率、特定領(lǐng)域的AI深度融入生產(chǎn)系統(tǒng)后,將如何重新定義制造業(yè)的生產(chǎn)效率、產(chǎn)品質(zhì)量與運(yùn)營(yíng)智能水平?
























網(wǎng)站客服
粵公網(wǎng)安備 44030402000946號(hào)