在技術(shù)飛速發(fā)展的當(dāng)下,軟件領(lǐng)域正經(jīng)歷著深刻變革,從第二階段邁向第三階段的過(guò)程中,對(duì)靈活性的追求達(dá)到了新高度,軟件自主升級(jí)成為關(guān)鍵趨勢(shì)。以特斯拉軟件版本迭代為例,從V10到V12的演進(jìn),其軟件架構(gòu)圖發(fā)生了顯著變化。下圖中綠色部分代表規(guī)則算法,紅色部分代表感知算法,隨著版本更新,紅色部分占比逐漸增多,綠色部分重要性不斷降低。到V12時(shí),整個(gè)模型執(zhí)行過(guò)程基本以網(wǎng)絡(luò)模型為主,僅保留少量顯示代碼。這一變化反映出特斯拉在軟件迭代中,不斷強(qiáng)化神經(jīng)網(wǎng)絡(luò)模型的應(yīng)用,逐步減少對(duì)傳統(tǒng)規(guī)則算法的依賴(lài),以提升軟件的智能化水平。
在深入探討軟件發(fā)展趨勢(shì)時(shí),大模型是無(wú)法繞過(guò)的關(guān)鍵領(lǐng)域。大模型可以模擬人腦功能,在高維認(rèn)知空間下轉(zhuǎn)換不同模態(tài)的數(shù)據(jù),實(shí)現(xiàn)與人類(lèi)更廣泛的直接交互。它能夠完成多模態(tài)數(shù)據(jù)之間的轉(zhuǎn)化,如將視頻、文字、聲音等轉(zhuǎn)化為控制指令、文字、視頻、矢量結(jié)果等。相比傳統(tǒng)模型,大模型的參數(shù)規(guī)模通常在10億以上,其核心優(yōu)勢(shì)在于能夠理解環(huán)境的一般規(guī)律,如人類(lèi)問(wèn)答邏輯、物理世界規(guī)則等。雖然大模型的概念在一定程度上被濫用,但它在不同領(lǐng)域發(fā)揮著重要作用,且與傳統(tǒng)模型有著本質(zhì)區(qū)別。
從參數(shù)量來(lái)看,一般常用圖像模型參數(shù)量在1000萬(wàn)-5000萬(wàn),車(chē)端的端到端模型一般在1-3億,而真正的大模型則達(dá)到百億千億級(jí)別,如ChatGPT。不同類(lèi)型的大模型在處理任務(wù)上也有所不同。例如,將視覺(jué)定位、矢量信息、雷達(dá)原感知信息作為輸入,以語(yǔ)言、執(zhí)行指令等矢量作為輸出,構(gòu)成端到端模型;視頻和矢量進(jìn)出的屬于World Model范疇;語(yǔ)言進(jìn)、視頻或聲音出的類(lèi)似Sora;ChatGPT則以語(yǔ)言進(jìn)、語(yǔ)言出為主,如今也逐漸向多模態(tài)拓展。這些模型雖應(yīng)用于不同業(yè)務(wù)領(lǐng)域,但都采用Transformer結(jié)構(gòu),這與過(guò)去模型結(jié)構(gòu)多樣、數(shù)據(jù)固定的情況截然不同。
在大模型出現(xiàn)之前,模型研發(fā)多是嘗試不同結(jié)構(gòu),以適配固定數(shù)據(jù)和任務(wù),如同不斷更換人員來(lái)適應(yīng)固定工作環(huán)境。而大模型時(shí)代,Transformer成為通用結(jié)構(gòu),通過(guò)不同任務(wù)驅(qū)動(dòng)模型提升認(rèn)知,類(lèi)似改變教育方式培養(yǎng)人才。大模型在與人類(lèi)交互方面也與傳統(tǒng)模型有很大差異。傳統(tǒng)模型通常作為規(guī)則算法系統(tǒng)的附屬品,無(wú)法直接參與人類(lèi)社會(huì)活動(dòng),如酒店人臉識(shí)別模型,需與其他系統(tǒng)配合才能發(fā)揮作用。而大模型如ChatGPT,可在廣泛領(lǐng)域與人類(lèi)直接對(duì)話,實(shí)現(xiàn)無(wú)人類(lèi)或規(guī)則算法環(huán)節(jié)介入的平等交流。
大模型具有多方面的重要作用。在強(qiáng)化認(rèn)知方面,它能以通用模型支持多種任務(wù),如語(yǔ)言溝通、決策判斷、行為計(jì)劃分解和邏輯梳理等,背后是對(duì)知識(shí)背后一般邏輯和組織邏輯的把握。雖然在語(yǔ)言類(lèi)通用規(guī)則上已取得一定成果,但視覺(jué)、視頻和智能駕駛等領(lǐng)域的大模型,行業(yè)內(nèi)尚未形成統(tǒng)一觀點(diǎn),其整合也處于探索階段。在構(gòu)成生產(chǎn)力方面,大模型與以往工業(yè)革命成果有著本質(zhì)區(qū)別。過(guò)去的工業(yè)革命成果雖影響人員流轉(zhuǎn),但本身難以直接構(gòu)成生產(chǎn)力,人類(lèi)始終是生產(chǎn)的核心驅(qū)動(dòng)力。而大模型直接構(gòu)成生產(chǎn)力,在產(chǎn)業(yè)升級(jí)時(shí),可能導(dǎo)致勞動(dòng)力需求減少。例如,通用機(jī)器人概念的出現(xiàn),使機(jī)器人能在業(yè)務(wù)需求變化時(shí)無(wú)需改變產(chǎn)品形態(tài)即可適應(yīng)生產(chǎn)過(guò)程,這使得人類(lèi)作為生產(chǎn)銜接環(huán)節(jié)的價(jià)值面臨挑戰(zhàn)。若大模型與機(jī)器人形成閉環(huán),其影響范圍將進(jìn)一步擴(kuò)大,對(duì)就業(yè)結(jié)構(gòu)和社會(huì)經(jīng)濟(jì)產(chǎn)生深遠(yuǎn)影響。
智能駕駛和語(yǔ)言大模型原本屬于不同行業(yè),并無(wú)交集。但隨著技術(shù)發(fā)展,它們?cè)诩夹g(shù)架構(gòu)和邏輯上逐漸趨同,均朝著通用人工智能的方向發(fā)展。特斯拉涉足機(jī)器人和汽車(chē)領(lǐng)域,正是基于這兩種業(yè)務(wù)在技術(shù)層面呈現(xiàn)出的強(qiáng)耦合性。智能駕駛從可控性出發(fā),向可擴(kuò)展性發(fā)展,經(jīng)歷從規(guī)則邏輯向模型邏輯的迭代;語(yǔ)言模型則以泛用性為基礎(chǔ),如今越來(lái)越關(guān)注可控性和價(jià)值判斷問(wèn)題。在發(fā)展過(guò)程中,兩者均采用強(qiáng)化學(xué)習(xí)的策略,如RLHF,以Transformer為核心架構(gòu),遵循數(shù)據(jù)驅(qū)動(dòng)的邏輯。
大模型具有一些獨(dú)特的關(guān)鍵特點(diǎn)。涌現(xiàn)現(xiàn)象是其中之一,當(dāng)模型規(guī)模達(dá)到某個(gè)閾值時(shí),模型對(duì)某些問(wèn)題的處理性能會(huì)呈現(xiàn)快速增長(zhǎng),這被稱(chēng)為涌現(xiàn)能力。這種現(xiàn)象類(lèi)似于物理上的相變,即量變引發(fā)質(zhì)變。例如,在自然語(yǔ)言處理任務(wù)中,一些大模型在規(guī)模達(dá)到一定程度后,在算術(shù)運(yùn)算、單詞重組、語(yǔ)言翻譯、問(wèn)答等任務(wù)上的表現(xiàn)有顯著提升。目前,學(xué)界和業(yè)界都在深入研究涌現(xiàn)現(xiàn)象產(chǎn)生的原因,主流觀點(diǎn)是通過(guò)數(shù)學(xué)和物理學(xué)方法解釋其內(nèi)在機(jī)理,如從信息熵、自由能最小原則等角度進(jìn)行探索。這不僅對(duì)模型設(shè)計(jì)人員確定技術(shù)路線至關(guān)重要,也涉及到智慧產(chǎn)生的本源問(wèn)題。
從技術(shù)發(fā)展歷程來(lái)看,大模型的涌現(xiàn)現(xiàn)象帶來(lái)了技術(shù)范式的轉(zhuǎn)變。過(guò)去模型多采用微調(diào)方式,效果較為恒定。而大模型通過(guò)提示詞的方式實(shí)現(xiàn)了技術(shù)突破,盡管在發(fā)展初期不被看好,但隨著模型規(guī)模和能力的提升,這種方式逐漸成為主流,推動(dòng)了大模型技術(shù)的快速發(fā)展。
大模型目前主要作為基礎(chǔ)設(shè)施被使用。在“小模型”階段,算力需求相對(duì)較低,個(gè)體和小企業(yè)尚可負(fù)擔(dān),使用1張GPU卡即可開(kāi)展相關(guān)工作。但進(jìn)入超大規(guī)模預(yù)訓(xùn)練模型階段,大模型的超大參數(shù)和海量數(shù)據(jù)對(duì)算力提出了極高要求,普通玩家難以企及。例如,GPT的算力需求為18kpetaFLOPs,GPT-3達(dá)到310 Mpeta FLOPs,PaLM更是高達(dá)2.5 Bpeta FLOPs。從成本角度看,GPT-3的訓(xùn)練使用了上萬(wàn)塊英偉達(dá)v100GPU,總成本高達(dá)2760萬(wàn)美元,個(gè)人若要訓(xùn)練出一個(gè)PaLM,花費(fèi)在900至1700萬(wàn)美元之間。這使得大模型的研發(fā)和訓(xùn)練成為少數(shù)具備強(qiáng)大資源的機(jī)構(gòu)或企業(yè)的專(zhuān)屬領(lǐng)域,大多數(shù)使用者只能依賴(lài)現(xiàn)有的大模型作為基礎(chǔ),接入到各種應(yīng)用系統(tǒng)中,而無(wú)法獨(dú)立創(chuàng)建大模型。
在大模型的發(fā)展過(guò)程中,Data-centric的理念逐漸興起。與傳統(tǒng)以模型迭代為主(Model-centric)的AI開(kāi)發(fā)方式不同,大模型的成功很大程度上依賴(lài)于大量高質(zhì)量的數(shù)據(jù)以及對(duì)數(shù)據(jù)引擎的重視。以GPT系列模型為例,從GPT-1到GPT-4,模型結(jié)構(gòu)基本保持Transformer解碼器不變,主要是通過(guò)擴(kuò)大模型規(guī)模和數(shù)據(jù)規(guī)模來(lái)提升性能,這是典型的Data-centric過(guò)程。
Data-centric與Data-driven有著本質(zhì)區(qū)別。Data-driven僅強(qiáng)調(diào)使用數(shù)據(jù)指導(dǎo)功能系統(tǒng)搭建,而Data-centric關(guān)注的是通過(guò)數(shù)據(jù)迭代而非模型迭代來(lái)改善系統(tǒng)性能。在實(shí)際應(yīng)用中,Model-centric方式未充分考慮數(shù)據(jù)可能出現(xiàn)的問(wèn)題,如標(biāo)簽不準(zhǔn)確、數(shù)據(jù)重復(fù)和異常數(shù)據(jù)等,高準(zhǔn)確率的模型可能只是對(duì)數(shù)據(jù)的“過(guò)度擬合”。而Data-centric方式將重點(diǎn)放在數(shù)據(jù)本身,認(rèn)為數(shù)據(jù)在很大程度上決定了模型能力的上限,在實(shí)際場(chǎng)景中具有更大的潛力。
Data-centric AI主要包括三個(gè)目標(biāo):訓(xùn)練數(shù)據(jù)開(kāi)發(fā),即構(gòu)建足夠數(shù)量的高質(zhì)量數(shù)據(jù)以支持機(jī)器學(xué)習(xí)模型的訓(xùn)練;推理數(shù)據(jù)開(kāi)發(fā),構(gòu)建用于評(píng)估和解鎖模型能力的數(shù)據(jù),如通過(guò)對(duì)抗攻擊評(píng)估模型魯棒性,利用提示詞工程產(chǎn)生新業(yè)務(wù)價(jià)值;數(shù)據(jù)維護(hù),由于大模型需要不斷更新,需采取措施持續(xù)維護(hù)數(shù)據(jù)在動(dòng)態(tài)環(huán)境中的質(zhì)量和可靠性,包括數(shù)據(jù)收集、標(biāo)注、理解、質(zhì)量保證、存儲(chǔ)檢索以及數(shù)據(jù)增強(qiáng)等工作。
在Data-centric的大模型應(yīng)用中,數(shù)據(jù)運(yùn)維管理至關(guān)重要。與過(guò)去對(duì)數(shù)據(jù)管理相對(duì)粗放的方式不同,如今在模型應(yīng)用過(guò)程中,需要對(duì)數(shù)據(jù)進(jìn)行持續(xù)運(yùn)維。不僅要關(guān)注訓(xùn)練數(shù)據(jù),還要重視推理數(shù)據(jù)的開(kāi)發(fā),提示詞工程就是推理數(shù)據(jù)開(kāi)發(fā)的重要組成部分。通過(guò)設(shè)計(jì)合適的提示詞,可挖掘大模型的潛在價(jià)值,如利用提示詞讓模型進(jìn)行文本解釋、數(shù)學(xué)計(jì)算、情感分析等任務(wù)。提示詞工程的出現(xiàn),使得數(shù)據(jù)和模型的界限變得模糊,模型可被視為一種數(shù)據(jù)或數(shù)據(jù)的“容器”。通過(guò)提示詞,能夠利用大語(yǔ)言模型合成所需數(shù)據(jù),這些合成數(shù)據(jù)又可用于訓(xùn)練模型,在GPT-4上已驗(yàn)證了這種方法的可行性,展現(xiàn)出大模型自我進(jìn)化的可能性。
隨著大模型技術(shù)的不斷發(fā)展,在實(shí)際應(yīng)用中出現(xiàn)了一些新的概念和嘗試。例如,有觀點(diǎn)提出“藝人公司”模式,即除人員外,公司其他部分均由AI構(gòu)成。盡管目前在實(shí)踐中面臨一些問(wèn)題,但從長(zhǎng)遠(yuǎn)來(lái)看,當(dāng)智能機(jī)器人具備實(shí)際工作能力時(shí),如何管理智能體之間的組織關(guān)系將成為關(guān)鍵問(wèn)題。比如,如何確保審核模型準(zhǔn)確履行職責(zé),開(kāi)發(fā)模型高效完成任務(wù)等。目前,已經(jīng)出現(xiàn)利用語(yǔ)言模型進(jìn)行自動(dòng)化化學(xué)實(shí)驗(yàn)、代碼編寫(xiě)等應(yīng)用場(chǎng)景,通過(guò)語(yǔ)言模型的多維組織,實(shí)現(xiàn)數(shù)據(jù)產(chǎn)生和業(yè)務(wù)訓(xùn)練的相互推動(dòng),以一種類(lèi)似“套娃”的方式發(fā)揮作用。在這一過(guò)程中,人類(lèi)更多地扮演領(lǐng)導(dǎo)者或指導(dǎo)者的角色,負(fù)責(zé)梳理流程和進(jìn)行必要的修正,而模型和機(jī)器則在實(shí)際運(yùn)作中不斷自我優(yōu)化和完善。
綜上所述,從軟件架構(gòu)的迭代到智能駕駛與語(yǔ)言大模型的融合發(fā)展,再到Data-centric理念的興起和大模型的應(yīng)用探索,技術(shù)的發(fā)展正深刻改變著軟件領(lǐng)域的格局。大模型作為核心技術(shù),在提升認(rèn)知、構(gòu)成生產(chǎn)力等方面展現(xiàn)出巨大潛力,同時(shí)也帶來(lái)了諸如勞動(dòng)力結(jié)構(gòu)變化、數(shù)據(jù)管理挑戰(zhàn)等新問(wèn)題。在未來(lái),隨著技術(shù)的持續(xù)進(jìn)步,智能體的組織管理、模型的可解釋性和可控性等將成為研究和實(shí)踐的重點(diǎn)方向,推動(dòng)軟件領(lǐng)域朝著更加智能化、高效化的方向發(fā)展。
鄭重聲明:此文內(nèi)容為本網(wǎng)站轉(zhuǎn)載企業(yè)宣傳資訊,目的在于傳播更多信息,與本站立場(chǎng)無(wú)關(guān)。僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。