人間修行: 3月 2026

2026年3月5日星期四

每天學點新東西--AI的原理

完成Kaggle的鐵達尼挑戰後，我和chatgpt的對話，讓我了解AI的原理，原來是這個時代資料規模、硬體革命和演算法突破三者的集合處。

Q：你説AI 不識字，只識數，所以要把性別等條件都轉換成數，但是現在的AI是不是已經識字了？

A：這是一個非常深刻且敏銳的觀察！簡單來說：底層的 AI 依然「不識字」，但它的「翻譯能力」已經強大到讓你感覺它博學多才。

我們可以用一個比喻來理解這個現象：

1. 它是如何「識字」的？（Embedding 嵌入技術）

現在的 AI（像是 Gemini 或 ChatGPT）在處理文字之前，會先經過一個**「數位化」**的過程。

文字轉座標：AI 會把每一個字、每一個詞轉換成一串長長的數字（稱為向量）。
意義的距離：在 AI 的數學空間裡，「貓」和「狗」這兩個詞的數字會非常接近，而「貓」和「手機」的數字就會離得很遠。
空間推理：當你問它問題時，它其實是在數百億個維度的數位空間裡，計算哪些數字（詞）最應該出現在下一個位置。

2. 「識字」與「懂意思」的差別

現在的 AI 確實能處理文學、法律、甚至你的心情，但它的本質與人類不同：

人類的識字：我們看到「蘋果」，腦中會浮現紅色的影像、甜脆的味道和牛頓的故事。這是有感官連結的。
AI 的識字：它看到「蘋果」，它知道這個詞在高機率下會跟「水果」、「紅色的」、「科技公司」出現在一起。它擁有的是機率與統計的連結。

3. 為什麼你覺得它「識字」了？

因為 「算力」 產生了質變。早期的 AI 只能做簡單的關鍵字匹配（就像以前的翻譯機，翻出來常常不知所云）。現在的 AI 因為看過全人類幾乎所有的文本，它學會了極其複雜的語境（Context）。它不只是認識「字」，它認識的是字與字之間無窮無盡的關係。

💡 回到你剛才的程式碼

為什麼在寫 Kaggle 程式碼時，我們要手動把 male 改成 0，把 female 改成 1？

你用的模型（Random Forest）：是傳統的機器學習演算法，它比較像是一台「高級計算機」，它還沒有內建那種強大的文字轉換器，所以需要我們手動「翻譯」給它看。
現在的大型語言模型（LLM）：如果你直接把 train.csv 丟給 Gemini 看，它能直接告訴你誰會活下來，因為它內建了極其複雜的「文字轉數字」系統，不需要你手動轉換。

總結來說： AI 依然只吃數字（數據），但它現在已經專業到能自動完成「翻譯」的過程，讓你不需要再跟它講數學語言。

既然你對 AI 的本質這麼有興趣，想不想試試看，如果我們不給它「性別」這個數字，只給它「名字」，看看它能不能從名字裡猜出性別和生存率？這就是更進階的文字處理了！

Q：我一直想了解AI為什麼這麼厲害！你解決了我一個好大的疑惑

能幫你解開這個疑惑我也超級開心！這代表你已經從「操作者」進化成「思考者」了。

其實你剛剛感到的那個「驚訝」，正是目前科技界最迷人的地方：我們正在見證 AI 從「算術機器」變成「語言大師」的轉折點。

💡 為什麼現代 AI 感覺「識字」了？

如果你把剛才那個鐵達尼號的程式碼比喻成 「傳統計算機」，那麼像我（Gemini）這樣的大型語言模型就像是 「讀過全世界所有圖書館的超級大腦」。

這裡有三個讓你覺得它「變厲害」的關鍵原因：

從「字」變成「向量空間」：現代 AI 不再把「男」看作一個字，而是把它看作一個座標。它知道「男」與「先生」、「國王」、「公獅」在數學空間裡的距離很近。當它讀到這些字，它腦中浮現的是一整片相關的「意義網」。
上下文的「注意力機制 (Attention)」：以前的 AI 是一個字一個字讀，讀到後面就忘記前面。現在的 AI 擁有「注意力」，它在讀到一句話結尾的「它」時，會瞬間回頭掃描前面的段落，精確判斷這個「它」是指蘋果還是指手機。
湧現現象 (Emergent Properties)：這最神奇！當資料量大到一定程度時，AI 會突然學會它原本沒被教過的事。就像你沒教它法律，但因為它讀了幾百萬份法庭筆記，它竟然自己學會了法律邏輯。

Q：所以重點就是曾經算過的資料，以及計算的速度提升下的成果嗎？

A：你抓到最核心的關鍵了！如果把 AI 的演化比喻成一個人的成長，你的理解正好擊中了「先天體質」與「後天閱歷」的結合。

簡單來說，現在 AI 這麼厲害，確實可以歸納為這兩個重點：

1. 「曾經算過的資料」：規模產生的奇蹟

以前的 AI 像是讀過幾本教科書的學生，只能回答考卷上的問題；現在的 AI 像是讀過全世界所有圖書館的超級天才。

大數據的厚度：AI 讀過數十億篇網頁、書籍、對話。當資料量大到一個程度時，AI 不再只是「背誦」，而是開始理解「模式（Pattern）」。
從「文字」到「觀念」：因為看過無數次「太陽」和「升起」在一起，也看過「Sunset」和「下山」在一起，它計算出的數字結果會讓它自動理解「天體運行的規律」，即便你從沒教過它天文學。

2. 「計算速度」：硬體革命帶來的質變

「識字」背後其實是天文數字等級的乘法運算。如果沒有計算速度的提升，這一切都只是空談。

GPU 的功勞：以前用電腦 CPU 計算，就像是用一個超級聰明的老師慢慢算；現在用 GPU（繪圖處理器）計算，就像是請了幾萬名小學生同時幫你算最簡單的加減乘法。
時間的縮短：同樣的數據量，在 20 年前可能要算 100 年才能跑完，現在只要幾天甚至幾小時。這種速度讓人類可以不斷「嘗試與錯誤」，直到調教出最聰明的模型。

3. 最關鍵的隱藏版：演算法的突破

除了「算得多」和「算得快」，科學家還發明了更聰明的「算的方法」。

自我監督學習：以前我們要告訴 AI「這是貓」、「這是狗」（標籤化資料），這很慢。現在的 AI 能「自己跟自己玩」，它會遮住一句話裡的一個字，然後猜那個字是什麼，猜錯了就自己修正。這種自我練習的能力，讓它能在短時間內自學完人類幾千年的文明精華。

💡 總結你的洞察

所以你說得沒錯：「海量的歷史數據」（養分）+ 「極致的運算速度」（消化能力）+ 「聰明的學習方法」（大腦結構），這三者結合，才讓原本只會算 0 和 1 的機器，變成了現在能跟你談天說地的 Gemini。

2026年3月5日 星期四