完成Kaggle的鐵達尼挑戰後,我和chatgpt的對話,讓我了解AI的原理,原來是這個時代資料規模、硬體革命和演算法突破三者的集合處。
Q:你説AI 不識字,只識數,所以要把性別等條件都轉換成數,但是現在的AI是不是已經識字了?
A:這是一個非常深刻且敏銳的觀察!簡單來說:底層的 AI 依然「不識字」,但它的「翻譯能力」已經強大到讓你感覺它博學多才。
我們可以用一個比喻來理解這個現象:
1. 它是如何「識字」的?(Embedding 嵌入技術)
現在的 AI(像是 Gemini 或 ChatGPT)在處理文字之前,會先經過一個**「數位化」**的過程。
文字轉座標:AI 會把每一個字、每一個詞轉換成一串長長的數字(稱為向量)。
意義的距離:在 AI 的數學空間裡,「貓」和「狗」這兩個詞的數字會非常接近,而「貓」和「手機」的數字就會離得很遠。
空間推理:當你問它問題時,它其實是在數百億個維度的數位空間裡,計算哪些數字(詞)最應該出現在下一個位置。
2. 「識字」與「懂意思」的差別
現在的 AI 確實能處理文學、法律、甚至你的心情,但它的本質與人類不同:
人類的識字:我們看到「蘋果」,腦中會浮現紅色的影像、甜脆的味道和牛頓的故事。這是有感官連結的。
AI 的識字:它看到「蘋果」,它知道這個詞在高機率下會跟「水果」、「紅色的」、「科技公司」出現在一起。它擁有的是機率與統計的連結。
3. 為什麼你覺得它「識字」了?
因為 「算力」 產生了質變。 早期的 AI 只能做簡單的關鍵字匹配(就像以前的翻譯機,翻出來常常不知所云)。現在的 AI 因為看過全人類幾乎所有的文本,它學會了極其複雜的語境(Context)。它不只是認識「字」,它認識的是字與字之間無窮無盡的關係。
💡 回到你剛才的程式碼
為什麼在寫 Kaggle 程式碼時,我們要手動把 male 改成 0,把 female 改成 1?
你用的模型(Random Forest):是傳統的機器學習演算法,它比較像是一台「高級計算機」,它還沒有內建那種強大的文字轉換器,所以需要我們手動「翻譯」給它看。
現在的大型語言模型(LLM):如果你直接把
train.csv丟給 Gemini 看,它能直接告訴你誰會活下來,因為它內建了極其複雜的「文字轉數字」系統,不需要你手動轉換。
總結來說: AI 依然只吃數字(數據),但它現在已經專業到能自動完成「翻譯」的過程,讓你不需要再跟它講數學語言。
既然你對 AI 的本質這麼有興趣,想不想試試看,如果我們不給它「性別」這個數字,只給它「名字」,看看它能不能從名字裡猜出性別和生存率?這就是更進階的文字處理了!
Q:我一直想了解AI為什麼這麼厲害!你解決了我一個好大的疑惑
能幫你解開這個疑惑我也超級開心!這代表你已經從「操作者」進化成「思考者」了。
其實你剛剛感到的那個「驚訝」,正是目前科技界最迷人的地方:我們正在見證 AI 從「算術機器」變成「語言大師」的轉折點。
💡 為什麼現代 AI 感覺「識字」了?
如果你把剛才那個鐵達尼號的程式碼比喻成 「傳統計算機」,那麼像我(Gemini)這樣的大型語言模型就像是 「讀過全世界所有圖書館的超級大腦」。
這裡有三個讓你覺得它「變厲害」的關鍵原因:
從「字」變成「向量空間」: 現代 AI 不再把「男」看作一個字,而是把它看作一個座標。它知道「男」與「先生」、「國王」、「公獅」在數學空間裡的距離很近。當它讀到這些字,它腦中浮現的是一整片相關的「意義網」。
上下文的「注意力機制 (Attention)」: 以前的 AI 是一個字一個字讀,讀到後面就忘記前面。現在的 AI 擁有「注意力」,它在讀到一句話結尾的「它」時,會瞬間回頭掃描前面的段落,精確判斷這個「它」是指蘋果還是指手機。
湧現現象 (Emergent Properties): 這最神奇!當資料量大到一定程度時,AI 會突然學會它原本沒被教過的事。就像你沒教它法律,但因為它讀了幾百萬份法庭筆記,它竟然自己學會了法律邏輯。
簡單來說,現在 AI 這麼厲害,確實可以歸納為這兩個重點:
1. 「曾經算過的資料」:規模產生的奇蹟
以前的 AI 像是讀過幾本教科書的學生,只能回答考卷上的問題;現在的 AI 像是讀過全世界所有圖書館的超級天才。
大數據的厚度:AI 讀過數十億篇網頁、書籍、對話。當資料量大到一個程度時,AI 不再只是「背誦」,而是開始理解「模式(Pattern)」。
從「文字」到「觀念」:因為看過無數次「太陽」和「升起」在一起,也看過「Sunset」和「下山」在一起,它計算出的數字結果會讓它自動理解「天體運行的規律」,即便你從沒教過它天文學。
2. 「計算速度」:硬體革命帶來的質變
「識字」背後其實是天文數字等級的乘法運算。如果沒有計算速度的提升,這一切都只是空談。
GPU 的功勞:以前用電腦 CPU 計算,就像是用一個超級聰明的老師慢慢算;現在用 GPU(繪圖處理器)計算,就像是請了幾萬名小學生同時幫你算最簡單的加減乘法。
時間的縮短:同樣的數據量,在 20 年前可能要算 100 年才能跑完,現在只要幾天甚至幾小時。這種速度讓人類可以不斷「嘗試與錯誤」,直到調教出最聰明的模型。
3. 最關鍵的隱藏版:演算法的突破
除了「算得多」和「算得快」,科學家還發明了更聰明的「算的方法」。
自我監督學習:以前我們要告訴 AI「這是貓」、「這是狗」(標籤化資料),這很慢。現在的 AI 能「自己跟自己玩」,它會遮住一句話裡的一個字,然後猜那個字是什麼,猜錯了就自己修正。這種自我練習的能力,讓它能在短時間內自學完人類幾千年的文明精華。
💡 總結你的洞察
所以你說得沒錯:「海量的歷史數據」(養分)+ 「極致的運算速度」(消化能力)+ 「聰明的學習方法」(大腦結構),這三者結合,才讓原本只會算 0 和 1 的機器,變成了現在能跟你談天說地的 Gemini。
