我上週聽到AI一定得是“學習”系列打底才是AI。
這全球高階知識份子對AI認知都變成這樣了?
那我說學習系列連底層的數據驅動建模都沒做。他們的“學習”系列是空中閣樓呢。
可惜,一人之言沒用,少數人之想沒用。
還想等“不確定性”發作,一次性搞垮全球,按照機率模型來說,我有生之年希望不要被“自然”抽中。
AI底層數據建模Ph.D. of #Economics
⭐R&D of Durban-Watson test statistic
⭐ #Analyst of data modelling and analysis
📥Chairman of IDA laboratory.
Former Assistant Professor of Minghsin
University of Science and Technology, Yuanpei University of Science and Technology, and Chunghua University
Former Associate Professor of Wenzhou University
🪧interest: #AI #dataanalysis, Applied Economics, Number modelling and Number analysis.
Promote: #MathAI for numerical modelling (lines combined method) software (free)
| Book | Excel calculating the probability distribution simulated data |
| Book | Demythologize Durbin-Watson Test Statistic |
| Book | Accurate New Stock Analytic Model: Ability over moving average |
| Book | 統計學不能做為大數據分析的工具-原因與補正 |
我上週聽到AI一定得是“學習”系列打底才是AI。
這全球高階知識份子對AI認知都變成這樣了?
那我說學習系列連底層的數據驅動建模都沒做。他們的“學習”系列是空中閣樓呢。
可惜,一人之言沒用,少數人之想沒用。
還想等“不確定性”發作,一次性搞垮全球,按照機率模型來說,我有生之年希望不要被“自然”抽中。
這是AI底層數據(數字/文字)建模的核心技術
全都看得到數學結果
全都是各自的數學模型支撐
這樣的建模技術核心是標準的數學建模,各種數據排序或規律有各自的數學模型。數據建模有一套龐大的數據庫,數據庫內是萬萬個數學模型。
這不是通用模型套用所有數據的做法,而是真實為數據建模的核心技術與原理。
若沒有先做完這步,在AI後續所謂的轉換或各種MODEL都會從此處產生不確定性,後續成為隱性問題。
當我們測定2025年美國常規全配方汽油價格的機率分布,得到雙倍指數分布有什麼意義呢?
這個分布揭露什麼?
1) 價格由「衝擊」主導
Laplace 分布=大量小變動 + 少數巨大跳動
不連續、不平滑
2) 尾端事件回歸
上尾、下尾機率同時存在
暴漲與暴跌都「被允許」
3) 不存在自然邊界
與 2024 年的有界分布完全相反
系統不再封頂、不再托底
---
位置參數不是錨,是「短暫中心」,雖然對稱,但不穩定。
---
λ 的統計含義
λ 越大,代表系統越不容許偏離;
一旦偏離,修正必然是非連續、非漸進的。
意味:
多數時間價格被拉回中心
但一旦離開,移動速度極快
價格修正靠跳躍,不靠緩慢調整
---
P-value = 0.051 的訊息
不是漂亮的成立
是「勉強接受」
說明:分布正在轉型,系統仍未收斂
---
與 2024 的統計對比
2024:有界、平滑、無尾端
2025:無界、尖峰、厚尾
👉 統計結論:控制結構消失
---
2025 年的汽油價格,不再被「限制」,而是被「衝擊反覆拉扯」。
分布沒有情緒,但它清楚記錄了:穩定性已經離場。
前面貼文有2022年與2023年的美國常規全配方汽油價格機率分布,那在2024年(美國總統選舉年)時,全年度的油價數據會來自哪個分布呢?會不會跟2022年或2023年相同/同族群的分布?
結果測定出來是raised cosine分布,這是一個有範圍限制、斜率變化遵循正弦波的規律、不會產生劇烈的頻率抖動的機率分布。
這個分布說明什麼?
1) 不是市場自然生成的價格。
🔸自由市場價格常見:右偏、厚尾、突波
🔸Raised cosine:排除極端值
2) 價格波動被「刻意平滑」
🔸機率密度一階導數連續
🔸無高頻抖動 → 波動被抑制
3) 尾部被壓縮
🔸幾乎不給暴漲、也不給暴跌
🔸這不是隨機,是設計結果
這不是市場在告訴你什麼,
是分布在承認它被設計過。
2022年的美國常規全配方汽油價格的機率分布已經在前一個貼文發布。那下一年度的2023年結果會是怎樣呢?
按照相同的方式,2023年的美國常規全配方汽油價格機率分布,不再是log Normal了,而是Gumbel。此時你看到在不同參數值下的分布狀態也不太與2022年相同。
每年的數據可以設定為來自相同的機率分布嗎?
讓我以美國常規全配方汽油價格的數據進行測定。
人為設計:各年度數據範圍
AI設計:在數據庫中運算與判斷是來自哪個機率分布,並且模擬生成。
2022年的機率分配測定為 log Normal 機率分布。在不同的log Normal 機率分布參數μ值下,模擬生成的log Normal機率分布如圖。
這或許是美俄對全球狀態的另一種潛藏表現。當俄羅斯持倉自 2024 年 12 月的 約 6.6 億美元,快速回升至 2025 年 10 月的 約 25.6 億美元,平均每月增持 約 4,500 萬美元。這持倉行為連續、保守、可隨時撤回。這不是恐慌性操作,也不是長期戰略回歸,而是一種高度控制風險的「訊號型行為」。
在俄羅斯被經濟制裁時,海外資產是會被凍結的。如今卻能增持美國國債。這或許暗示美債不是「資產」,而是一種訊號載體:對俄方高層傳遞「協議仍在運作」;對美方可保留完全否認空間。
雙方在高度不信任的前提下,維持有限、可逆、非制度化的策略互動。若從國際關係的現實主義與交易型外交視角來看,這種行為並不需要建立在信任之上。相反,它更符合以下特徵:不以長期同盟為目標;不涉及制度化承諾
強調短期利益、可否認性與風險分散。
在這樣的框架下,美國國債的角色並非「信任象徵」,而是:一種低成本、非正式的互動訊號;一個不需公開聲明、卻可被對方理解的行為指標。
它更像是一個訊號:在舊秩序逐漸鬆動的過程中,主要行為者正在為下一階段的全球權力重組,預留操作空間。
轉換模型是固定的模型?
至少我的模型是適應數據,而不是數據適應模型。這非常重要,也是思路的差異。
沒有數學模型結果出來的,都可視為假。
通常他們「假設」有數學模型結果存在!但模型結果過於複雜或龐大,所以不予顯示,改採用各種評估指標呈現,只要評估指標優於閥值,就表示這個「數學模型」好,是值得採用的。
真相是這樣嗎?
原本直線模式就是為了讓自變數展現可解釋的部分。可解釋部分愈高,表示直線模式愈能代表這些數據。
後來發展到盡可能降低可解釋的部分,變成誤差代表應變數。此時就能用隨機的誤差分配來模擬M次,取平均做代表值。接著比較原值和代表值。兩者只要差小於特定數值,就表示成功。
看看!本來能夠有規律的模型被改造成無規律的部分主導模型。
問題就出在於,人類記錄的數據至少都會有承載時間的特徵。這個時間特徵隱含特定的規律,或者稱為趨勢。而我們主動將這樣的特徵想辦法降低到微乎其微,這樣合理嗎?
目前來說,是非常合理。
4/
這個數據分佈的問題,我曾在某R開頭的平台上遇到專業的博士回答。他說:應該是負二項式分配。
我看了原po附上的圖,這一看就是用軟體跑出來的結果,按照直方圖+用眼睛看,我也無法否認專業的博士回答。但我留言告訴原po要去測定數據的分配,可以用改良適合度檢定(improved goodness of fit),可以檢定45種機率分配。即使是間斷型數據,同樣也能被檢定出來。
方法(Pearson's test)有,但要做到測定各種的機率分配就得做一點變更,適用各種分配的檢定。甚至不在預設的45種分配當中,也要能為數值和發生機率建立數學模型。
3/