

當(dāng)前位置:走進(jìn)德成 > 德成動態(tài)
發(fā)布日期:2025-02-02 來源: 作者:北京德成經(jīng)濟(jì)研究院 加入收藏
2025年元月27,陰歷臘月28,Deep Seek AI模型橫空出世,對世界人工智能產(chǎn)業(yè)、生成大模型、硅谷科技界掀起驚天駭浪;或許也是中國春節(jié)最好的年飯佳肴、主菜;或許如同辰龍春節(jié)的股災(zāi)的主菜一樣。Deep Seek AI模型取得巨大成功浪潮后一天,元月28日,巨大爭議與質(zhì)疑也鋪天而來的,也包括許多非專業(yè)、非邏輯的、非理性的爭議。德成智庫是一所具有情懷、使命有智慧的智庫,作為在2020年武漢疫情時提出建議得到總理簽批的智庫,在Deep Seek AI模型橫空出世與質(zhì)疑聲聲的時間節(jié)點,應(yīng)該發(fā)出德成智庫獨立的、理性的聲音。
我希望能從經(jīng)濟(jì)學(xué)視角看Deep Seek AI模型。只用基本理論研究邏輯說話、只用數(shù)據(jù)說話。沒有政治立場,沒有愛國、賣國的動機(jī)。不談大國戰(zhàn)略博弈、不談陰謀論、不談彎道超車或換道超車等話語;假設(shè)不存在知識與數(shù)據(jù)侵權(quán)問題。只從經(jīng)濟(jì)學(xué)理論分析Deep Seek AI模型的成就在哪里,創(chuàng)新光譜的位置在哪些,今后演化、迭代與涌現(xiàn)的機(jī)會在哪里。
經(jīng)濟(jì)學(xué),英文是“Economics”。 “Economics”不僅是一個單數(shù)的英文單詞,更是一個復(fù)數(shù)的多學(xué)科領(lǐng)域。所以,我這里說的“經(jīng)濟(jì)學(xué)”不是政策經(jīng)濟(jì)學(xué)、不是宏觀經(jīng)濟(jì)學(xué),也不是人工智能產(chǎn)業(yè)經(jīng)濟(jì)學(xué)。只是新古典經(jīng)濟(jì)學(xué)、創(chuàng)新經(jīng)濟(jì)學(xué)及復(fù)雜性經(jīng)濟(jì)學(xué)/非線性經(jīng)濟(jì)學(xué)的分析。
我們知道,新古典經(jīng)濟(jì)學(xué)(Neoclassical Economics)也是一個龐大的科學(xué)體系有諸多視角與方法。我以為只需要用“約束條件—目標(biāo)函數(shù)分析框架”分析就可以“一條邏輯紅線貫之” ?!凹s束條件”我也最簡單的界定為兩個要素:技術(shù)與成本。還會用更直白的“成本與收益”來分析。
創(chuàng)新經(jīng)濟(jì)學(xué)我以為只需要借助熊彼特的“創(chuàng)造性顛覆”的理論分析Deep Seek AI模型。就是兩個標(biāo)準(zhǔn):一是是否帶來了技術(shù)革命性,比如電動顛覆蒸汽機(jī),智能化顛覆工業(yè)化;并導(dǎo)致+商業(yè)模式重構(gòu),如工廠顛覆工場,企業(yè)顛覆工廠、電商顛覆零售等。

復(fù)雜性經(jīng)濟(jì)學(xué)/非線性經(jīng)濟(jì)學(xué),我們也僅僅借助其學(xué)科的核心分析工具:涌現(xiàn)理論 。

一、從新古典經(jīng)濟(jì)學(xué)的“約束條件—目標(biāo)函數(shù)分析框架”分析其Deep Seek AI模型的成就
Deep Seek AI模型的開發(fā)只用了2048塊性能比較低的芯片,只用幾個月的訓(xùn)練,只用588萬美元,比 Open AI模型開發(fā)成本節(jié)約了98%;其效率和性能在許多方面已經(jīng)非常接近這個領(lǐng)域的領(lǐng)頭老大Open AI模型,甚至在一些基準(zhǔn)測試方面還超過了Open AI模型去年年底發(fā)布的新版本模型。
據(jù)有關(guān)信息,Deep Seek AI模型引發(fā)了美國科技界和科技類股的大震蕩。為AI提供算力的芯片廠商英偉達(dá),在1月27號它的股價下跌了16%這么多,市值蒸發(fā)了6,000億美元;在App在美國區(qū)蘋果應(yīng)用商店免費應(yīng)用下載榜登頂。
這些成就與震蕩,從“約束條件—目標(biāo)函數(shù)分析框架”看,就是效用同等情況下,降低了成本與推進(jìn)了技術(shù)創(chuàng)新。還可以說,Deep Seek AI語言模型,在成本更低、時間更短、所用芯片數(shù)量更少的約束條件下,效率更高、提供的知識更加準(zhǔn)確、專業(yè)關(guān)聯(lián)度更廣,與人類的思考邏輯更為接近。

從現(xiàn)有公開資料還可以分析到,Deep Seek AI模型是從已經(jīng)結(jié)果做逆向工程,是簡化要素與邏輯,是從確定性結(jié)果,逆索到原因,是從已知逆推已知。從科學(xué)方法論看,是一種演繹法+加剪枝法。我們知道演繹法是一個向外拓展的邏輯思維樹,如果知道結(jié)果,通過剪枝,就是演繹+剪枝就會減少邏輯路徑、只赴結(jié)果。
Deep Seek AI模型有一個“數(shù)據(jù)蒸餾”的過程,是一個邏輯的剪枝;雖然沒有增加知識的創(chuàng)新,但簡化了思維的路徑。而chatGPT橫空出世時,是從已知探索未知;是知識的創(chuàng)造,就是熊彼特的“創(chuàng)造性顛覆”。
因為不知道去哪里、在哪里,所以需要更多的前提要素。記得50年前,我們在宜昌船廠搞《軸的自動對焊機(jī)》的技術(shù)革新時,結(jié)果一直不好,逆推每個環(huán)節(jié)、每個要素,花三天三夜后,發(fā)現(xiàn),不過是一個設(shè)備的主動輪與次動輪次序按反。而Deep Seek AI語言模型,是知道結(jié)果的過程中的創(chuàng)新??梢越柚鹱炙季S,即只需要第一層的3個要素與第二層的3個要素,9個要素就好。
我以為從新古典經(jīng)濟(jì)學(xué)的“約束條件—目標(biāo)函數(shù)分析框架”分析看,成就是巨大的、不可忽視、詆毀與否定的。
二、從創(chuàng)新經(jīng)濟(jì)學(xué)視角看Deep Seek AI模型在創(chuàng)新光譜的哪個位子。
我不重述創(chuàng)新的類型、過程、分類等等,只從《技術(shù)創(chuàng)新經(jīng)濟(jì)學(xué)》 及《知識經(jīng)濟(jì)創(chuàng)新論》 為標(biāo)準(zhǔn),認(rèn)為Deep Seek AI模型的創(chuàng)新模式,一是具有可以被歸類為開放式創(chuàng)新。比如,完全采用了完全開源的策略,其模型代碼和訓(xùn)練方法對全球開發(fā)者開放;二是具有“技術(shù)二次創(chuàng)新”特征。包括采用MLA(Mixture of Experts)架構(gòu),實現(xiàn)效率和性能的提升,結(jié)合量化技術(shù)(如FP8低精度訓(xùn)練),顯著降低GPU內(nèi)存占用,同時保持模型性能穩(wěn)定;三是模仿創(chuàng)新與創(chuàng)新的疊加階段的創(chuàng)新。是在學(xué)習(xí)模仿率先創(chuàng)新者的方法,破譯率先創(chuàng)新者的核心技術(shù)和技術(shù)秘密,并以此為基礎(chǔ)進(jìn)行改進(jìn)和完善,并在現(xiàn)有基礎(chǔ)上的改進(jìn)和突破,通過引入新的思想、方法、技術(shù)或產(chǎn)品,滿足新的需求或優(yōu)化資源配置的創(chuàng)新;四是技術(shù)推動型創(chuàng)新。比如,Deep Seek AI模型通過優(yōu)化架構(gòu)和訓(xùn)練方式,實現(xiàn)了大模型效率和效能的提升,形成了以算法(高效率、低成本)為主線的新競爭范式。但客觀的說,還不具有熊彼特的“創(chuàng)造性顛覆”帶來了革命性的創(chuàng)新。一是還沒有帶來顛覆性的技術(shù)革命,比如電動顛覆蒸汽機(jī),智能化顛覆工業(yè)化;二是沒有導(dǎo)致商業(yè)模式重構(gòu),如工廠顛覆工場,企業(yè)顛覆工廠、電商顛覆零售等。

三、從復(fù)雜性經(jīng)濟(jì)學(xué)看Deep Seek AI模型
Deep Seek AI模型對層次神經(jīng)網(wǎng)絡(luò)架構(gòu),具有通過簡單的神經(jīng)元連接規(guī)則,形成復(fù)雜的認(rèn)知和學(xué)習(xí)能力,并將涌現(xiàn)新的知識有智能,這是從無機(jī)物涌現(xiàn)有機(jī)物;從有機(jī)物涌現(xiàn)生命、從跨界涌現(xiàn)新的思想、技術(shù)與生命。這是作者看好的地方,但不限于Deep Seek AI模型。這也是人類有識之士擔(dān)憂智能機(jī)器人超越人類可能性的機(jī)理。
四、結(jié)語
我曾在北京德成智庫公眾號 2024-07-31 上發(fā)表一篇《在從姜萍參賽,看中國優(yōu)秀數(shù)學(xué)人才為何難以脫穎而出?》隨筆。隨著事實真相的部分暴露,我的觀點是錯的。錯的原因是,在這篇文章中,在做了如下的一個假設(shè):“本推文把討論的問題做個界定:我們只關(guān)注姜萍參賽的中專生、刷題等話題,至于姜萍有沒有造假,阿里有沒有參與造假,那是中國制度設(shè)計之惡與人性放大之惡的話題,是另一個話題?!苯Y(jié)果出在“制度設(shè)計之惡與人性放大之惡”上。
現(xiàn)在Deep Seek AI模型受到諸多質(zhì)疑。一是數(shù)據(jù)與技術(shù)來源,模型蒸餾技術(shù)的合法性。OpenAI指控Deep Seek AI模型在訓(xùn)練其模型時使用了未經(jīng)授權(quán)的“模型蒸餾”技術(shù),即通過提取OpenAI模型的輸出數(shù)據(jù)來訓(xùn)練自己的模型,這種行為被OpenAI認(rèn)為違反了其服務(wù)條款;二的數(shù)據(jù)隱私問題。意大利數(shù)據(jù)隱私監(jiān)管機(jī)構(gòu)Garante對DeepSeek的數(shù)據(jù)收集和使用方式提出了質(zhì)疑,要求其提供詳細(xì)解釋,以確保符合隱私保護(hù)法規(guī);三是技術(shù)獨立性,即是否依賴開源模型。有觀點認(rèn)為Deep Seek AI模型可能在訓(xùn)練過程中使用了開源模型(如Mistral和Llama)進(jìn)行蒸餾,這種做法在行業(yè)內(nèi)雖不罕見,但引發(fā)了對其技術(shù)獨立性的質(zhì)疑;四是技術(shù)透明度問題。盡管Deep Seek AI模型在技術(shù)報告中聲稱未使用OpenAI模型的輸出數(shù)據(jù),但外界對其技術(shù)細(xì)節(jié)的披露仍存在疑慮;五是用戶體驗與性能問題。盡管Deep Seek AI模型在成本和性能上有一定優(yōu)勢,但部分用戶和專家認(rèn)為其在某些方面仍與OpenAI的模型存在差距,尤其是在復(fù)雜任務(wù)處理和推理能力上;六是API穩(wěn)定性。由于Deep Seek AI模型的API定價較低且使用量激增,其API穩(wěn)定性面臨挑戰(zhàn),未來可能需要引入并發(fā)限制;七是商業(yè)道德與市場競爭問題。部分人士質(zhì)疑DeepSeek是否通過不正當(dāng)手段獲取競爭優(yōu)勢,例如未經(jīng)授權(quán)使用競爭對手的技術(shù);八是公司背景與市場認(rèn)知。由于Deep Seek AI模型背后有幻方量化公司的背景,部分投資者和用戶對其存在誤解,認(rèn)為其與股票市場上的量化投資策略有關(guān),從而對其可靠性產(chǎn)生質(zhì)疑。
不知道,Deep Seek公司能否回答這些質(zhì)疑,但愿能回答。是否存在知識產(chǎn)權(quán)的侵權(quán)與數(shù)據(jù)侵權(quán)問題,但愿不是,但我不敢確定。信息渠道的單一性,使得我無法“博學(xué)之,審問之,慎思之,明辨之,篤行之”。
病榻之上、草就成之!
[2]柳卸林.技術(shù)創(chuàng)新經(jīng)濟(jì)學(xué)[M].清華大學(xué)出版社,1998年版。
[3]甘德安.知識經(jīng)濟(jì)創(chuàng)新論[M].華中科技大學(xué)出版社,1998年。
德成動態(tài)