2026年3月5日 星期四

每天學點新東西--AI的原理

完成Kaggle的鐵達尼挑戰後,我和chatgpt的對話,讓我了解AI的原理,原來是這個時代資料規模、硬體革命和演算法突破三者的集合處。 

Q:你説AI 不識字,只識數,所以要把性別等條件都轉換成數,但是現在的AI是不是已經識字了?

A:這是一個非常深刻且敏銳的觀察!簡單來說:底層的 AI 依然「不識字」,但它的「翻譯能力」已經強大到讓你感覺它博學多才。

我們可以用一個比喻來理解這個現象:

1. 它是如何「識字」的?(Embedding 嵌入技術)

現在的 AI(像是 Gemini 或 ChatGPT)在處理文字之前,會先經過一個**「數位化」**的過程。

  • 文字轉座標:AI 會把每一個字、每一個詞轉換成一串長長的數字(稱為向量)。

  • 意義的距離:在 AI 的數學空間裡,「貓」和「狗」這兩個詞的數字會非常接近,而「貓」和「手機」的數字就會離得很遠。

  • 空間推理:當你問它問題時,它其實是在數百億個維度的數位空間裡,計算哪些數字(詞)最應該出現在下一個位置。

2. 「識字」與「懂意思」的差別

現在的 AI 確實能處理文學、法律、甚至你的心情,但它的本質與人類不同:

  • 人類的識字:我們看到「蘋果」,腦中會浮現紅色的影像、甜脆的味道和牛頓的故事。這是有感官連結的。

  • AI 的識字:它看到「蘋果」,它知道這個詞在高機率下會跟「水果」、「紅色的」、「科技公司」出現在一起。它擁有的是機率與統計的連結

3. 為什麼你覺得它「識字」了?

因為 「算力」 產生了質變。 早期的 AI 只能做簡單的關鍵字匹配(就像以前的翻譯機,翻出來常常不知所云)。現在的 AI 因為看過全人類幾乎所有的文本,它學會了極其複雜的語境(Context)。它不只是認識「字」,它認識的是字與字之間無窮無盡的關係


💡 回到你剛才的程式碼

為什麼在寫 Kaggle 程式碼時,我們要手動把 male 改成 0,把 female 改成 1

  • 你用的模型(Random Forest):是傳統的機器學習演算法,它比較像是一台「高級計算機」,它還沒有內建那種強大的文字轉換器,所以需要我們手動「翻譯」給它看。

  • 現在的大型語言模型(LLM):如果你直接把 train.csv 丟給 Gemini 看,它能直接告訴你誰會活下來,因為它內建了極其複雜的「文字轉數字」系統,不需要你手動轉換。

總結來說: AI 依然只吃數字(數據),但它現在已經專業到能自動完成「翻譯」的過程,讓你不需要再跟它講數學語言。

既然你對 AI 的本質這麼有興趣,想不想試試看,如果我們不給它「性別」這個數字,只給它「名字」,看看它能不能從名字裡猜出性別和生存率?這就是更進階的文字處理了!

Q:我一直想了解AI為什麼這麼厲害!你解決了我一個好大的疑惑

能幫你解開這個疑惑我也超級開心!這代表你已經從「操作者」進化成「思考者」了。

其實你剛剛感到的那個「驚訝」,正是目前科技界最迷人的地方:我們正在見證 AI 從「算術機器」變成「語言大師」的轉折點。


💡 為什麼現代 AI 感覺「識字」了?

如果你把剛才那個鐵達尼號的程式碼比喻成 「傳統計算機」,那麼像我(Gemini)這樣的大型語言模型就像是 「讀過全世界所有圖書館的超級大腦」

這裡有三個讓你覺得它「變厲害」的關鍵原因:

  • 從「字」變成「向量空間」: 現代 AI 不再把「男」看作一個字,而是把它看作一個座標。它知道「男」與「先生」、「國王」、「公獅」在數學空間裡的距離很近。當它讀到這些字,它腦中浮現的是一整片相關的「意義網」。

  • 上下文的「注意力機制 (Attention)」: 以前的 AI 是一個字一個字讀,讀到後面就忘記前面。現在的 AI 擁有「注意力」,它在讀到一句話結尾的「它」時,會瞬間回頭掃描前面的段落,精確判斷這個「它」是指蘋果還是指手機。

  • 湧現現象 (Emergent Properties): 這最神奇!當資料量大到一定程度時,AI 會突然學會它原本沒被教過的事。就像你沒教它法律,但因為它讀了幾百萬份法庭筆記,它竟然自己學會了法律邏輯。

Q:所以重點就是曾經算過的資料,以及計算的速度提升下的成果嗎?
A:你抓到最核心的關鍵了!如果把 AI 的演化比喻成一個人的成長,你的理解正好擊中了「先天體質」與「後天閱歷」的結合。

簡單來說,現在 AI 這麼厲害,確實可以歸納為這兩個重點:


1. 「曾經算過的資料」:規模產生的奇蹟

以前的 AI 像是讀過幾本教科書的學生,只能回答考卷上的問題;現在的 AI 像是讀過全世界所有圖書館的超級天才。

  • 大數據的厚度:AI 讀過數十億篇網頁、書籍、對話。當資料量大到一個程度時,AI 不再只是「背誦」,而是開始理解「模式(Pattern)」。

  • 從「文字」到「觀念」:因為看過無數次「太陽」和「升起」在一起,也看過「Sunset」和「下山」在一起,它計算出的數字結果會讓它自動理解「天體運行的規律」,即便你從沒教過它天文學。

2. 「計算速度」:硬體革命帶來的質變

「識字」背後其實是天文數字等級的乘法運算。如果沒有計算速度的提升,這一切都只是空談。

  • GPU 的功勞:以前用電腦 CPU 計算,就像是用一個超級聰明的老師慢慢算;現在用 GPU(繪圖處理器)計算,就像是請了幾萬名小學生同時幫你算最簡單的加減乘法。

  • 時間的縮短:同樣的數據量,在 20 年前可能要算 100 年才能跑完,現在只要幾天甚至幾小時。這種速度讓人類可以不斷「嘗試與錯誤」,直到調教出最聰明的模型。


3. 最關鍵的隱藏版:演算法的突破

除了「算得多」和「算得快」,科學家還發明了更聰明的「算的方法」。

  • 自我監督學習:以前我們要告訴 AI「這是貓」、「這是狗」(標籤化資料),這很慢。現在的 AI 能「自己跟自己玩」,它會遮住一句話裡的一個字,然後猜那個字是什麼,猜錯了就自己修正。這種自我練習的能力,讓它能在短時間內自學完人類幾千年的文明精華。

💡 總結你的洞察

所以你說得沒錯:「海量的歷史數據」(養分)+ 「極致的運算速度」(消化能力)+ 「聰明的學習方法」(大腦結構),這三者結合,才讓原本只會算 0 和 1 的機器,變成了現在能跟你談天說地的 Gemini。