Skip to content

Latest commit

 

History

History
183 lines (99 loc) · 14.1 KB

07.md

File metadata and controls

183 lines (99 loc) · 14.1 KB

第七章 解問題前先談分類

現在這個時代, AI 這個議題很夯。但是,我個人雖然是資訊工程師,但是我並不太相信現在 AI 科學的水平。甚至認為覺得很多市面上 AI 所號稱的成就是吹噓。

怎麼說呢?現在絕大多數領域所稱的 AI,我認為只能稱上大數據。透過足夠夠大的歷史數據,觀察到數據一定的 pattern,從而進一步窮舉未來的發展,進而對做出相對勝率高的決策。

以前我們所知的下棋機器人,多是類似的設計機制。輸入大量棋譜,找到模式。或者是自我對下個幾千萬局,找到新解法。

理論上,我們希望AI 的終極完成品。發展出與人類相當,對任何環境變化皆能靈巧應變的通用人工智能 (Artificial General Intelligence,AGI),而不再侷限於特定的應用範圍。

這點,未來機器能做到嗎?我不敢打包票。

不過,我認為也無需慌張。因為現今的人類與 AI 都有同樣的致命侷限上的問題。我的觀點主要有二:

一、人類自我學習演化的演算法是 match 過去記憶,參考其他人答案,上網搜索,找到類似模式的答案。當今的 AI 也是類似如此,大量輸入過去資料,然後預測未來。

而因為機器的算力與資料庫遠遠大上人類。所以人類懼怕 AI 真能取代自己的崗位。

但是,我在書的前半章,已經解釋這個資料庫競賽的問題。資料酷競賽很有可能只會找到死胡同。真正解法根本不在同一個維度裡面。而是一個全新的解法。

二、資料庫搜尋法還有一個真正最致命的問題,就是原始資料分類錯誤。

為什麼股市 AI 難以預測股價?

我朋友知道我在研究價值投資,精通拆解財報。也投資了一個財報分析網站。一直很希望我給網站加個功能,希望我去研究當今技術分析相關的技術。並且還給我推薦了一本用數學破解股市的書,給我參考。

我看了卻很不高興。認為這本書是胡扯。當然,如果你有研究股市,就會覺得我發這個飆莫名其妙,股市分析有分兩派學說,一派分析財報經營數據推測股價(稱財報數據),一派分析股市股價漲跌數據推測股價(稱技術分析)。

江湖覺得這兩派各有優勝劣弊。我卻完全不這麼認為,甚至在我認真研究過後,我甚至覺得技術分析派很大部分的一幫人,是在胡扯。

為什麼我是念數學的,還覺得技術分析派用過去股價數據分析找出股價趨勢是胡扯呢?

這要扯到股價是怎麼計算出來的。因為這本書不是股票書,我在書中盡量不用高深字眼,以免讀者陷入五里霧,我會嘗試用國中數學解釋這個理論。

在財務理論裡面,有一個大家公認的股價推算法,叫做 DCF(現金流折算法)。具體公式我們這裡不展示,你只要理解這 F(x) = y。x 可能基於過去的營收、利潤、現金流,透過一些微積分公式,最後會產稱出 y 的股價。

假設所有公司都是用 F(x) 去估價,那理論上我們當然可以收集一大堆公司的 y 去跑大數據與統計,去逆推算 F(x) 的公式,然後再針對現在的營收、利潤,看看 y 是否顯然被低估。

但是,市面上所有的公司,並不是只有 F(x) = y 型。

更有

  • G(A) = W
  • H(B) = M
  • J( Q) = R
  • K( R) = S
  • ....

(以上的英文代號是我隨便謅的,只是讓各位讀者知道「每種」不同公司有不同類型,並不是同一個公式)

但是,如果我們把所有公司歷史上的股價,都倒入 F(x) = y 的模型,去跑 AI 去逆推股價,那這不就是張飛打岳飛的好笑局面。

所以我認為現在號稱 AI 算牌的,最好笑就是這樣的設計。因為幾千間公司怎麼可能都是用一個 F(X) = y 可以解釋。

如果我們要預測數據。起碼要分群才對。

比如說我們至少得將

  • G(A) = W
  • H(B) = M
  • J( Q) = R
  • K( R) = S
  • ....

不同類型的公司,先分群然後再去看他們的特徵才對。

而且,當今現在不論是財報分析派又或者是技術分析派,對於公司的分類一開始就分錯。比如說一個經典的錯誤,就是拿台積電與鴻海分在同一類,因為他們看起來「都是電子類」。

實際上台積電是 F(X) = Y,而鴻海是 G(Y) = Z。鴻海在財務結構上,其實跟 COSTO 這間公司更像才是。

而跑數據分析最致命的問題是。

如果一開始數據不分類,或分錯類。就會是 Garbage in Garbage Out,用 AI 再算一百年都算不出來。

股票要如何分類

每種股票,背後其實都代表的是一間公司。其實股價的方程式遠不止

  • G(A) = W
  • H(B) = M
  • J( Q) = R
  • K( R) = S
  • ....

更精確的拆分下去。公司大體上還分成三種類型:

  • 利潤型
  • 周轉型
  • 槓桿型

利潤型的公司,主要人拼技術競爭力,賺智商稅,而智商稅就顯示在高毛利上,有一定的技術領先力,才能賺取超級高的利潤。

周轉型的公司,如 COSTCO、Amazon,就是跟人拼渠道與資金談判、周轉力。這一類的公司淨利薄,但是可以一年做很多趟生意。鴻海為什麼跟 COSTCO 更像,因為鴻海本身做的是蘋果的統包整合組裝廠商生意,鴻海本質的生意模型是跟各上游廠商進貨,組裝成手機出貨買給蘋果。所以本質是批發商的生意。

然而 Amazon 為什麼可以節節增長,鴻海卻不行這幾年節節敗退呢?這是因為 Amazon 賣的是雜貨,面對的是廣大消費者。而鴻海的出貨對象卻只有蘋果而已,當蘋果出貨衰退,鴻海的業績就自然也跟著衰退了。

而槓桿型公司,代表如地產公司、航空業公司。這一類公司的具體特徵,就是資本大、重資產。利潤則可能大可能小。但是相同特徵都是需要拼資產抵押借貸、拼銀行交情,開槓桿玩超大資本遊戲擠利潤。

而這類型的公司,就是受景氣影響很大。當景氣好時,能賺很多錢。當景氣低迷時,賠破褲杈都很有可能。比如說 COVID-19。就幾乎搞死航空業。因為這類型行業,槓桿都開得太大了。

當你打開這三類型的公司的 ROE 的結構組成( ROE = 淨利率x周轉率x槓桿倍數)。就會發現這三類型的數據起伏形狀,是差別很大的。

因為利潤組成非常不一樣。為什麼又可以拿 F(x) = y 去逆推算呢?

再來。這三種是有存貨類型的公司。

接下來我們要談的是兩類特殊公司。前者是網路業,沒有存貨,幾乎大部分的支出都是營業費用。後者是銀行、保險、金融特殊產業,這類公司的存貨就是現金。

前者沒有存貨,所以只能看收款天數與毛利率去推估競爭力。後者的公司,因為法規的關係,大多數利潤有法令上限,利潤多半跟規模有關係。

這兩類公司的行為與前面三種又是不一樣的。

再來,還有公司的戰法,不是用利潤擴張的,而是用現金流擴張的,如 Amazon。Amazon 的戰法並不是盡量賺取利潤,而是盡量投資到能夠快收客戶現金,慢付給供應商的新生意模型裡面,利用中間付款的時間差與現金,擴大生意規模的玩法。

我可以再繼續講下去。不過這裡花了這麼多篇幅去敘述,只是為了讓讀者知道,股價與利潤產生模式可以很不一樣,我在這裡舉例的,甚至是很粗的分類。

更不用說股市裡面,還有一堆垃圾公司。而且大公司中公司小公司(比如說千億、百億、十億三種不同規模)的成長曲線為很不一樣。所以怎麼可以用同一種模型去推算。

聽到這裡你可能會覺得好像超複雜。

但其實也沒有那麼複雜。

其實,在實務上,某些經營一定年限、並且一定規模的某些類型的公司,股價函數真的是可以逆向預測的。而且可以測到非常準。

只是這些公司的名字,一般投機者都會覺得無法在幾天內致富,不想投資而已。

在我研究財報時,我發現因為股市牽涉到大量的數據資料,而且這個領域的人,在過去沒有太強的計算機,而且切入角度錯誤,連正確的分類都做不到。所以反而這個領域大部分的資料,都長期處於張飛打岳飛的狀態。如果在這個領域裡面死瞌,簡直是死胡同一條。

反而是跳脫財報書籍,重新對資料分類,反而能看出很多有意思的產業趨勢以及在數學上「證明常識」。(比如說我在用大數據研究相同類型公司股價時,反而發現利潤與存貨天數、收現天數有非常大的正相關。但在財報書上,這兩個數據卻常被人忽視,甚至覺得不重要。大家反而覺得毛利率、淨利率比較重要。但試問如果貨賣不出去,錢收不回來。貨賣不出去,於是把貨賣成三倍價錢。賣一個頂以前三個。那麼毛利率其實是不變的。淨利率甚至也可不變的。在財報上看不出來,但是生意卻是變爛了。這就解釋你明明開始覺得某些公司的產品變爛沒人買了,但是財報上數據依舊亮麗。)

從李約瑟問題談分類的重要性

我在 Bilibili 上非常喜歡一個經濟學家。陳平老師。他本身是物理學家背景出身的經濟學家。

陳平老師的特點,在於近年來預言中美關係以及外交、經濟進展,屢講屢中。其實以一般觀點來說,他的影片非常政治不正確,經常在Youtube 上得到紅叉(限流)。但是屢講屢中的背後,卻往往紮實的理論。

最近幾個月的更新,他提了一個很有意思的問題:「科學與資本主義為什麼誕生於西歐而非中國?」這個問題,俗稱李約瑟問題。

一直以來。學界對這個問題非常疑惑。照理來說,中國是五千年的古國,人口數量又多於歐美國家數倍,人才倍出。加上語言文字又統一,國力相對強大。為何偏偏在明清時代停滯、科技落後,反而敗給了歐美諸國。直至最近,才勉強趕上。

坊間很多有很多理論,卻都無法好好解釋這個問題。

為什麼歐美重科技與資本發展,還有專業分工。然而中國卻多年以來,重點在於自給自足。

他從戰爭型態找到了答案。

歐美與中國的戰爭型態自古以來是非常不同的。歐美的戰爭,規模更是比中國小了許多。

其中最值得一提的是,如果你近距離觀看,你會發現兩者本質戰爭型態的不同。中國的戰爭本身是圍繞著亞洲大陸的佔地。歐美多數的戰爭是圍繞著佔交通要道。

古代戰略有「兵馬未到,糧草先行」。為什麼?因為中國實在太大了,人也太多了。所以戰爭本身打的是補給線戰爭。甚至有屯田策略,派兵過去,無戰時耕田,戰爭時是士兵。中國圍繞著是佔地。本身是農業民族VS 游牧民族的內戰。

但歐美因為人少,不是玩佔地的戰爭。所以它們主要是控制交通樞紐,打下來做生意。因為人少,要以少擊多,拼的就是科技,拼的就是資本操作。

所以歐美國家要維持自己國家的優勢,必定是提高自己國家的科技水平,進行槓桿操作。而中國因為本身地夠大,資源也多,但幾千年以來,目光鎖在內部的資源攻防消長,而完全無視拓展廣闊的海外資源。

當這樣一分類後。你會發現,其實就國家發展與戰略方向,歐​​美與中國是非常不同的。

當然,你會覺得廢話,「不同」是當然的。但是「有那麼當然嗎?」

很多時候,我們會認為「民主」會帶來「富足」。但是這句話是真的嗎?我們看看「南非」的例子,菲律賓的例子,好像不是這樣。我們再看看新加坡的例子,又發現又再反了一次,說不太通。其實,就連美國本身的強大也不是民主所帶來的。而是美國的戰略位置與國家資源太好,加上誕生在一個特殊的時代,才有現在的局面。

但是我們卻會因為美國當今的強大,以為「民主」等於「強大」等於「富足」等於「現代化」。

但美國是因為地太大,玩不來,所以才搞的民主。中國是因為人太多,如果搞民主太容易因為一個動亂,搞到滅國大爆炸,才搞的專制。每種國家,因為地形與交通,都有自己適合的政治制度。並不是大家都適合同一政體政治制度。這次 COVID-19,就讓我們看到極端狀況下,不同政體與政府,控制疫情調度的手段與結果。

為什麼我們遇到大問題時,得先分類?

人世間有很多問題,為什麼看似無解。而是我們人在思考問題時,有個很嚴重的缺陷盲點,叫「一元思維」。指的是人類盲目認為總有一個強大原則與公式,能貫穿所有不同個體,解釋所有事情。

所以多半的戰略目標,就是窮一切資源,逆推出一個終極公式,追求領域最強者的攻略。帶入各種情況,就能得到最終想要的結果。

但事實上這個理論是不存在的。不但不存在,可能還會把你繞進死胡同裡。

比如說計算機現在還有一個聖杯,是研究寫作機器人。但是寫作機器人根本寫不出能用的散文、小說、廣告詞、等等等等。

我最新的研究成果是極速寫作法。一天寫完一本書。在研究這個議題過程與發明全新的寫作流程中。我得出一個是全新但也是廢話的結論。就是寫作雖然可以有模版,有結構。但是不同的文體,其實寫作流程、模版,甚至與分類切入結構是非常不一樣的。

而當今的寫作機器人卻很笨的把一堆張飛岳飛的文都倒在一起,難怪最後的寫作機器人文章寫出來的文章是那個熊樣。

所以,當今的壞消息雖然是 AI 的算力遠超過人類。但是,好消息卻是當今的 AI 算法與人類算法,都有致命性的分類盲點。

而你只要知道,在解決千古難題時,試著先把你遇到的問題或局面,分類一遍。搞不好你就可以更快找到關鍵的切入點。