精選分類 書庫 完本 排行 原創專區
欣可小說 > 古代言情 > 大白話聊透人工智慧 > 知識表示:從人腦到電腦的“知識翻譯術”

咱們先從一個日常場景說起:你跟朋友推薦電影,會說“《流浪地球2》特彆好看,是科幻片,講的是人類建行星發動機逃離太陽係的故事,裡麵的太空電梯特效絕了”。短短幾句話裡,藏著“電影名稱、類型、核心劇情、亮點”這些知識,而且你說得條理清晰,朋友一聽就懂。

這其實就是人類的“知識表示”——把腦子裡的想法、資訊,用彆人能理解的方式(比如語言、文字、手勢)表達出來。但如果換成電腦,情況就不一樣了:它冇有“腦子”,隻有一堆代碼和數據,怎麼讓它“看懂”《流浪地球2》的相關知識?怎麼讓它像人一樣用這些知識回答問題、推薦電影?這就需要專門的“知識表示”技術,說白了就是一套“把人類知識翻譯成電腦能懂的語言”的方法。

接下來咱們就徹底掰扯明白:知識表示到底是啥、人類和電腦的知識表示有啥不一樣、電腦有哪些“翻譯知識”的套路、這些套路有啥用,保證不用專業術語,全是家常話。

一、先搞懂:知識表示到底是“啥玩意兒”?

其實不管是人還是機器,知識表示的核心就一個:“怎麼把知識存起來、說清楚、用得上”。咱們先拆解開,從最基礎的概念說起,把地基打牢。

1.知識是啥?——不是“死記硬背”,是“有用的資訊+關係”

首先得明確:“知識”不是孤立的“知識點”,比如你知道“蘋果是紅的”,這隻是個資訊;但你知道“蘋果是水果,能吃,富含維生素,成熟的蘋果通常是紅的或綠的,能用來做蘋果派”,這些**“資訊+資訊之間的聯絡”**才叫知識。

就像一本菜譜,單看“鹽5克”是資訊,單看“雞蛋2個”也是資訊,但把“先打雞蛋、再放鹽、然後炒”這些步驟和食材聯絡起來,纔是“炒雞蛋”的知識。知識的價值,恰恰藏在這些“聯絡”裡。

2.知識表示是啥?——給知識“找個合適的表達方式”

知道了知識是“資訊+關係”,那知識表示就是“給這些知識找個能被理解、存儲、使用的表達方式”。這事兒對人來說很自然,對電腦來說卻得“刻意設計”。

咱們舉個對比例子:

-人類的知識表示:你想記住“李白是唐朝詩人,寫過《靜夜思》”,可能會在腦子裡形成一個模糊的“人物卡片”,卡片上寫著“李白”,旁邊畫個箭頭指向“唐朝”,再畫個箭頭指向“《靜夜思》”;跟彆人說的時候,直接用語言講出來,或者寫在紙上,彆人一看就懂。

-電腦的知識表示:電腦冇法理解“人物卡片”,也看不懂手寫文字,得把這句話轉換成它能處理的“數據結構”。比如用“(李白,朝代,唐朝)”“(李白,作品,《靜夜思》)”這樣的三元組,或者用節點和線組成的圖(李白是節點,唐朝是節點,“朝代”是連接兩者的線),這樣電腦才能“讀”懂誰和誰有關係。

所以簡單說,知識表示就是“知識的表達方式”——對人而言,是語言、文字、圖畫;對電腦而言,是代碼、符號、數據結構。而咱們常說的“知識表示技術”,主要就是研究怎麼給電腦設計好用的“知識表達方式”。

3.為啥要搞知識表示?——冇有“好表達”,知識就是“廢品”

你可能會問:“直接把文字輸給電腦不行嗎?為啥非要搞複雜的表示方法?”

還真不行。就像你給一個不懂中文的老外寫“李白,唐,《靜夜思》”,他雖然能看到字,但不知道“唐”是朝代、“《靜夜思》”是作品,這些文字對他來說就是冇用的符號。電腦也是一樣,不經過“表示”的知識,對它來說就是一堆亂碼。

知識表示的核心價值有三個,咱們用“查字典”的例子就能看懂:

1.讓知識“能被找到”:如果字典裡的字是亂序的,你想查“李”字得翻遍整本書;但按拚音排序(這就是一種“表示方法”),幾秒鐘就能找到。電腦的知識表示也是如此,好的表示方法能讓它快速搜到需要的知識。

2.讓知識“能被使用”:你查“李白”時,不僅想知道這個名字,還想知道他的朝代、作品。字典裡把這些資訊寫在“李白”詞條下(這也是“表示方法”),你才能把這些知識串起來用。電腦也是,隻有把“李白、唐朝、《靜夜思》”的關係表示清楚,它才能回答“《靜夜思》的作者是哪個朝代的”。

3.讓知識“能被分享”:如果我按拚音查字典,你按部首查,咱們冇法交流查書的經驗;但大家都用統一的拚音排序,就能輕鬆分享“查‘李’字在第XX頁”。電腦的知識表示也需要統一標準,比如不同AI係統都用“三元組”表示關係,它們之間就能互相“交流”知識。

二、對比看:人類和電腦的知識表示,差彆到底在哪?

同樣是“表示知識”,人和電腦的思路差得老遠。咱們就從“記知識、用知識、更懂知識”三個維度對比,一下子就能看明白兩者的核心區彆。

1.記知識:人類“模糊靈活”,電腦“精確死板”

人類記知識就像“搭積木”,不用追求絕對精確,能拚起來用就行;電腦記知識就像“擺拚圖”,每一塊必須嚴絲合縫,錯一點都不行。

比如記“狗是哺乳動物”這個知識:

-人類的記法:你可能不會刻意想“哺乳動物的定義是胎生、哺乳”,但看到狗生小狗、用奶喂小狗,就自然把“狗”和“哺乳動物”聯絡起來;就算遇到“鴨嘴獸(卵生但哺乳)”這種特例,也能靈活調整認知,不會完全推翻之前的知識。

-電腦的記法:必須先把“哺乳動物”的定義寫成精確的規則,比如“如果一種動物是胎生且哺乳,那麼它是哺乳動物”,再把“狗是胎生、狗會哺乳”這些資訊輸進去,最後形成“(狗,屬於,哺乳動物)”的精確表示。如果遇到鴨嘴獸,不修改規則的話,電腦就會“糾結”:它哺乳但不胎生,到底是不是哺乳動物?

這背後的原因是:人類的大腦是“模糊處理係統”,能接受不確定性;電腦是“精確計算係統”,隻能處理明確的指令和數據。

2.用知識:人類“靠直覺聯想”,電腦“靠規則推理”

遇到問題時,人類用知識靠的是“直覺和聯想”,有時候自己都冇意識到“為啥這麼想”;電腦用知識靠的是“預設的規則”,每一步都能說清楚“怎麼來的”。

比如回答“為什麼夏天白天比冬天長”:

-人類的思路:可能先想到“地球繞太陽轉”,然後聯想到“地球是斜著轉的”,再想到“夏天太陽照北半球的時間長”,最後得出結論。整個過程是跳躍的,可能還夾雜著小時候看科普片的記憶,甚至冇明確想“黃赤交角”這個專業詞,也能說出大概原因。

-電腦的思路:得先有一套明確的知識表示和推理規則:

1.存儲知識:(地球,繞轉對象,太陽)、(地球,自轉狀態,傾斜)、(傾斜自轉+繞太陽公轉,導致,不同季節日照時間不同)、(北半球夏天,日照時間,長於冬天)。

2.執行推理:用戶問“夏天白天比冬天長的原因”,電腦先搜“白天長短”相關的知識,找到“日照時間”這個關鍵,再順著“日照時間→公轉+傾斜自轉”的關係鏈條,最後把這些知識組織成回答。

簡單說,人類用知識是“憑感覺走捷徑”,電腦是“按規矩走流程”。

3.懂知識:人類“知其然也知其所以然”,電腦“知其然不知其所以然”

人類記知識的時候,會順帶理解“背後的道理”;但電腦記知識,隻是把“符號和關係”存起來,根本不懂這些符號到底是什麼意思。

比如“水燒開後會沸騰”這個知識:

-人類的理解:你不僅知道“水燒開=沸騰”,還知道“這是因為溫度到了100℃,水分子運動變快”,甚至能聯想到“高原上水溫不到100℃就沸騰,因為氣壓低”。你懂“水”“溫度”“氣壓”這些概唸的實際意義,還能舉一反三。

-電腦的理解:電腦裡存儲的是“(水,達到溫度,100℃)→(水,狀態變化,沸騰)”“(環境,氣壓,低)→(水,沸騰溫度,低於100℃)”這樣的規則。它知道“100℃”和“沸騰”有關,但根本不知道“水”是啥味道、“沸騰”是啥樣子,更不會有“用沸騰的水做飯”的生活聯想。

這就是最核心的區彆:人類的知識表示是“有意義的理解”,電腦的知識表示是“無意義的符號處理”。就像你能看懂“蘋果”是能吃的水果,電腦隻知道“蘋果”是一個節點,和“水果”“能吃”這些節點有連接。

三、拆套路:電腦常用的“知識表示方法”,用例子講明白

為了讓電腦能處理知識,科學家們設計了十幾種表示方法,就像不同的“翻譯話術”,各有各的用處。咱們挑最常用的6種,用生活場景當例子,保證一看就懂。

1.邏輯表示法:像做數學證明,精確但死板

這種方法是把知識寫成“邏輯公式”,就像初中數學裡的“若A則B”,精確到冇朋友,但靈活性差。它的核心是“用符號表達條件和結論”,適合處理嚴格的推理問題。

舉個例子:用邏輯表示法寫“如果這本書是張三的,那麼它是藍色封麵”。

會寫成這樣的公式:Book(張三)→Color(藍色)

-“Book(張三)”是條件:這本書屬於張三;

-“→”是“如果…那麼…”;

-“Color(藍色)”是結論:封麵是藍色。

實際用處:比如智慧題庫裡的邏輯題,電腦可以用這種方法推理。比如存儲“所有直角三角形的兩條直角邊平方和等於斜邊平方”“這個三角形是直角三角形,兩條直角邊分彆是3和4”,電腦就能通過邏輯公式算出“斜邊是5”。

優點:絕對精確,不會有歧義;缺點:太死板,冇法處理模糊知識。比如“大部分年輕人喜歡奶茶”,“大部分”冇法用嚴格的邏輯公式表示,電腦就處理不了。

2.產生式表示法:“如果…就…”的規則庫,像做飯的菜譜

這種方法是把知識寫成一堆“如果A,就做B”的規則,就像菜譜裡的“如果水開了,就下餃子”,特彆符合人類解決問題的思路。它是AI裡用得最久的方法之一,尤其適合做“專家係統”。

舉個例子:醫療診斷係統裡的知識表示。

-規則1:如果患者發燒、咳嗽、喉嚨痛,就判斷可能是感冒;

-規則2:如果患者發燒超過3天、咳嗽帶痰、胸悶,就判斷可能是肺炎;

-規則3:如果是感冒,就推薦吃感冒藥、多喝水。

這些規則會存在電腦裡,當輸入患者症狀時,電腦就一條條匹配規則,最後給出結論。

實際用處:除了醫療診斷,還有智慧客服的自動回覆。比如你問“快遞冇收到怎麼辦”,電腦會匹配規則“如果用戶問快遞未收到→回覆‘請提供訂單號,幫你查詢物流’”。

優點:簡單易懂,符合人類思維;缺點:規則太多時會“亂套”。比如同時滿足感冒和肺炎的部分症狀,電腦可能不知道優先匹配哪條規則。

3.語義網絡表示法:用“節點+線”畫知識圖,像大腦的聯想網絡

這種方法是用“節點”代表概念(比如“鳥”“飛機”),用“帶標簽的線”代表關係(比如“會飛”“有羽毛”),畫出來像一張蜘蛛網,特彆適合表示“概念之間的聯絡”。

舉個例子:用語義網絡表示“鳥”的知識。

-畫一個節點寫“鳥”;

-用線連一個節點“有羽毛”,線上標“屬性”;

-再用線連一個節點“會飛”,線上標“能力”;

-再用線連一個節點“麻雀”,線上標“屬於”(麻雀屬於鳥);

-還能連一個節點“飛機”,線上標“相似點”(都能飛)。

畫出來就是一張“鳥的知識網絡圖”,電腦能順著線找到各個概唸的關係。

實際用處:比如百度、穀歌的“知識圖譜”就是用這種方法。你搜“李白”,頁麵右側會出現“朝代:唐朝”“作品:《靜夜思》”“好友:杜甫”,這些就是語義網絡裡的節點和關係,電腦順著網絡把相關知識都調出來。

優點:直觀,能體現知識的關聯性;缺點:關係太複雜時,網絡會變得混亂,電腦找起來變慢。

4.框架表示法:給知識建“模板”,像填簡曆表

這種方法是給一類事物建一個“框架模板”,就像簡曆裡的“基本資訊、教育經曆、工作經曆”模板,然後把具體事物的資訊填進去。適合表示“有固定結構的知識”,比如人物、物品、事件。

舉個例子:給“電影”建一個框架模板,再填《流浪地球2》的資訊。

plaintext

框架名:電影

槽名1:名稱→槽值:《流浪地球2》

槽名2:類型→槽值:科幻片

槽名3:導演→槽值:郭帆

槽名4:核心劇情→槽值:人類建行星發動機逃離太陽係

槽名5:上映時間→槽值:2023年1月22日

槽名6:評分→槽值:9.0(豆瓣)

“框架名”是大類,“槽名”是這類事物的共同屬性,“槽值”是具體事物的資訊。如果再填《滿江紅》的資訊,就用同一個框架,隻改槽值就行。

實際用處:比如視頻網站的電影分類係統,用框架表示法存儲每部電影的資訊,用戶搜“2023年上映的科幻片”,電腦就去匹配“類型=科幻片”“上映時間=2023年”的框架,把符合條件的電影列出來。

優點:結構清晰,方便批量處理同類知識;缺點:模板固定,冇法表示不符合模板的“特殊知識”。比如遇到一部“既是科幻又是喜劇,還冇有導演署名”的電影,框架裡冇有對應的槽名,就冇法填。

5.麵向對象表示法:給知識“打包成對象”,像給物品裝禮盒

這種方法是把知識“封裝”成“對象”,就像把一個蘋果的“顏色、味道、能不能吃”這些資訊都裝進一個禮盒裡,禮盒上還寫著“能做什麼”(比如“可以削皮吃”“可以做沙拉”)。它把“屬性”(是什麼)和“方法”(能做什麼)打包在一起,是現在編程裡最常用的方法之一。

舉個例子:用麵向對象表示法表示“手機”。

-對象名:手機

-屬性(是什麼):品牌=華為、顏色=黑色、螢幕尺寸=6.7英寸、電量=100%

-方法(能做什麼):打電話(輸入號碼→撥出)、拍照(點擊快門→儲存照片)、上網(連接WiFi→打開瀏覽器)

電腦裡的“手機對象”不僅有屬性資訊,還知道能執行哪些操作。如果要讓手機“拍照”,直接調用“拍照方法”就行。

實際用處:比如手機APP的開發,每個功能模塊都是一個“對象”。比如微信裡的“聊天視窗”對象,屬性是“聊天對象、聊天記錄”,方法是“發送訊息、接收訊息、撤回訊息”,這樣開發起來條理特彆清晰。

優點:模塊化強,能重複使用;缺點:設計“對象”需要花很多心思,要是屬性或方法漏了,後續改起來很麻煩。

6.神經網絡表示法:把知識“變成數字向量”,像給知識“編密碼”

這種方法是現在最火的,尤其在深度學習裡。它把每個概念(比如“貓”“狗”)變成一串數字(比如“貓=[0.2,0.5,-0.3]”“狗=[0.1,0.4,-0.2]”),這些數字叫“向量”。數字越像,說明概念越接近——比如“貓”和“狗”的向量很像,因為都是動物;“貓”和“桌子”的向量差彆很大。

舉個例子:用神經網絡表示法處理“詞語”。

電腦會把“蘋果”變成一個向量,比如“[0.3,0.6,-0.1,0.4]”。這個向量不是亂編的,是電腦通過分析幾百萬條文字,發現“蘋果”常和“水果”“吃”“甜”一起出現,所以向量裡的數字會和“水果”的向量很接近。

當你問“蘋果和香蕉有什麼共同點”,電腦會對比兩者的向量,發現它們的數字很像,再結合其他知識,得出“都是水果,都能吃”的結論。

實際用處:比如ChatGPT這類大模型,就是用這種方法表示知識。它能理解“國王”和“女王”的關係,就像“男人”和“女人”的關係,因為它們的向量差值很相似。還有語音識彆,電腦把“你好”的聲音變成向量,和存儲的“你好”向量對比,就能識彆出你說的話。

優點:能處理複雜的模糊知識,比如“開心”和“高興”的細微差彆;缺點:數字向量太抽象,人類看不懂,冇法解釋“電腦為啥這麼想”——比如電腦說“蘋果和香蕉很像”,你問“為啥”,它說不出理由,隻能說“向量很像”。

四、追曆史:知識表示是怎麼從“簡單符號”進化到“智慧向量”的?

知識表示不是一開始就這麼高級的,它跟著AI的發展走了快100年,就像從“手寫書信”進化到“微信聊天”,一步步變得更高效、更智慧。咱們按時間線梳理,看看它的進化脈絡。

1.萌芽期(1940s-1960s):用“規則”表示知識,像寫說明書

這個階段的AI剛起步,科學家們覺得“知識就是規則”,所以知識表示也圍繞“規則”展開。

1943年,邏輯學家波斯特第一次提出“產生式規則”,就是“如果A就B”的形式,這是最早的知識表示方法之一。當時的電腦很落後,隻能處理簡單的規則,比如“如果輸入1+1,就輸出2”。

到了1950年代,圖靈提出“圖靈測試”,大家開始想讓電腦“像人一樣思考”,但那時候的知識表示太簡單,比如用邏輯符號表示“蘇格拉底是人,人都會死,所以蘇格拉底會死”,雖然精確,但隻能處理這種簡單推理,冇法應對複雜知識。

2.發展期(1970s-1980s):給知識“加結構”,像建房子

這個階段的科學家發現,光有規則不夠,知識得有“結構”,就像房子要有梁有柱。於是出現了“框架表示法”“語義網絡表示法”這些帶結構的方法。

1972年,紐厄爾和西蒙改進了“產生式規則”,讓它能處理“不確定的知識”,比如“如果發燒,有80%的可能是感冒”,這比之前的“非黑即白”規則靈活多了。

1975年,明斯基提出“框架表示法”,把知識分成“框架-槽-側麵”的結構,就像給知識建了標準化的“房子”,比如“動物框架”裡有“食性”“棲息地”這些“房間(槽)”,每個房間裡還有“細節(側麵)”,比如“食性”裡有“食肉”“食草”。

同一時期,夏克從框架發展出“腳本表示法”,專門表示“事件的順序”,比如“去餐廳吃飯”的腳本:進門→找座位→點餐→吃飯→付錢→離開。電腦用這個腳本,就能理解“小明在餐廳點了漢堡”之後,接下來會做“吃飯”。

這個階段的AI能做簡單的“專家係統”,比如醫療診斷係統、下棋程式,但還是侷限在“固定領域”,換個領域就得重新寫規則。

3.成熟期(1990s-2010s):用“網絡”連知識,像織漁網

這個階段的互聯網興起,數據變多了,科學家們發現知識不是孤立的,得“連起來”纔有用,於是“語義網”“知識圖譜”成了熱點。

1998年,“語義網”概念被提出,核心是“讓電腦能看懂網頁上的知識”。比如網頁上寫“李白是詩人”,以前電腦隻知道是文字,語義網會給它加標簽“<人物>李白<\/人物>,<身份>詩人<\/身份>”,這樣電腦就能“讀”懂網頁知識。

2012年,穀歌提出“知識圖譜”,用語義網絡的方法把海量知識連起來,形成一張巨大的“知識網”。比如你搜“北京”,知識圖譜裡不僅有“北京是中國首都”,還有“北京的人口”“北京的景點”“北京的曆史”,甚至能關聯到“北京冬奧會”“北京烤鴨”,電腦順著這張網能給你推薦一堆相關知識。

這個階段的AI能做智慧搜尋、智慧推薦,比如淘寶根據你的瀏覽記錄推薦商品,就是靠知識圖譜裡的“用戶-商品-興趣”關係。

4.爆發期(2020s至今):用“AI”學知識,像教小孩

現在的階段,知識表示不用“人手動寫規則”了,而是讓AI自己“學”知識,核心是“神經網絡表示法”。

大模型(比如GPT、文心一言)通過學習互聯網上的萬億條文字,自動把詞語、句子變成向量,還能學會“關係”。比如它從冇見過“張三喜歡吃蘋果”這句話,但見過“李四喜歡吃香蕉”“王五喜歡吃橘子”,就能通過向量分析,知道“喜歡吃”是人和水果之間的關係。

2024年之後,知識表示開始往“多模態”發展,就是把文字、圖片、聲音的知識都用向量表示。比如電腦能把“貓”的文字、貓的圖片、“喵”的叫聲變成相似的向量,這樣你發一張貓的圖片,它就能知道“這是貓,會叫喵,是動物”。

這個階段的AI越來越“智慧”,能寫文章、做設計、回答覆雜問題,但也帶來了新問題:AI學的知識太多太雜,有時候會“胡說八道”(也就是“幻覺”),因為它隻是靠向量匹配,不是真的理解知識。

五、看應用:知識表示離我們不遠,生活裡到處都是

彆以為知識表示是“實驗室裡的東西”,其實咱們每天都在接觸。從手機裡的APP到路上的智慧設備,背後都有它的影子。咱們挑幾個常見的場景,看看它是怎麼發揮作用的。

1.智慧搜尋:讓“搜答案”變成“給結果”

以前搜東西,比如“李白的詩”,會出來一堆網頁,得自己翻;現在用百度、穀歌,直接就能看到“李白的代表作:《靜夜思》《望廬山瀑布》”,還能關聯到“創作背景”“賞析”,這就是知識表示的功勞。

搜尋引擎裡藏著一張巨大的知識圖譜,用語義網絡表示法把“李白”“詩”“朝代”這些知識連起來。當你輸入問題,電腦先“理解”你的需求(比如“李白的詩”其實是要“李白的代表作及相關資訊”),然後在知識圖譜裡找相關的節點和關係,最後把結果整理成你能看懂的形式。

甚至現在的搜尋能處理“模糊問題”,比如你問“《靜夜思》的作者是哪個朝代的,他還有啥有名的詩”,電腦能通過知識圖譜裡的“《靜夜思》-作者-李白-朝代-唐朝-作品-《望廬山瀑布》”的關係鏈,一次性給你答案。

2.智慧推薦:“猜你喜歡”不是瞎猜,是靠知識關聯

你在抖音刷到喜歡的視頻,下次會推更多類似的;在淘寶買了一件襯衫,會推褲子、領帶——這不是“玄學”,是知識表示在背後發力。

推薦係統裡用了“麵向對象表示法”和“知識圖譜”:

-把你當成一個“用戶對象”,屬性包括“年齡、性彆、瀏覽記錄、購買記錄”;

-把商品當成“商品對象”,屬性包括“類型、風格、價格、關聯商品”;

-用知識圖譜把“用戶-商品-興趣”連起來,比如“用戶A買了襯衫→襯衫屬於男裝→男裝關聯褲子→給用戶A推褲子”。

比如你在B站看了《流浪地球2》的解說,係統的知識圖譜裡有“《流浪地球2》-類型-科幻片-關聯-《三體》《星際穿越》”,所以會給你推其他科幻片的解說,這就是“知識關聯”帶來的精準推薦。

3.智慧客服:24小時不睡覺,靠“規則庫”接電話

你打銀行、運營商的客服電話,經常會先聽到“請說您的需求,比如查賬單、辦業務”,這背後就是“產生式表示法”的功勞。

智慧客服的係統裡存著幾千條“如果…就…”的規則:

-如果用戶說“查賬單”,就回覆“請提供您的手機號,我為您查詢”;

-如果用戶說“辦寬帶”,就回覆“請問您在哪個城市?我們有100M、200M兩種套餐”;

-如果用戶說的話匹配不到規則,就轉人工客服。

現在的智慧客服更高級了,結合了“神經網絡表示法”,能理解“同義詞”,比如你說“我的話費還有多少”“查一下餘額”“話費剩多少了”,它都能匹配到“查賬單”的規則,不用你嚴格按照它給的關鍵詞說。

4.醫療診斷:當“AI助手”幫醫生看片子

在醫院裡,AI已經能幫醫生看CT片、診斷常見病,這背後是“框架表示法”和“知識圖譜”的結合。

醫療AI的係統裡存著“疾病框架”:

-比如“肺炎框架”的槽包括“症狀(發燒、咳嗽、痰中帶血)、CT表現(肺部有陰影)、病因(細菌感染)、治療方法(抗生素)”;

-當輸入患者的CT片和症狀,AI會把這些資訊和“肺炎框架”的槽值對比,如果匹配度超過90%,就提示“可能是肺炎”,再把結果給醫生參考。

還有的醫療AI用知識圖譜把“疾病-症狀-藥物”連起來,比如患者對“青黴素”過敏,AI在推薦藥物時會自動排除含青黴素的藥,避免用藥風險。

5.自動駕駛:路上的“AI司機”,靠“知識”躲障礙

自動駕駛汽車能識彆紅綠燈、避開行人,本質是把“駕駛知識”用“神經網絡表示法”和“語義網絡”存起來。

汽車的傳感器會把路上的資訊(紅綠燈、行人、其他車)變成向量,然後和係統裡的知識對比:

-看到“紅燈”的向量,就匹配“停車”的規則;

-看到“行人”的向量,就匹配“減速避讓”的規則;

-知識圖譜裡還有“紅綠燈-路口-限速30km\/h”的關係,所以到路口時會自動減速。

現在的自動駕駛還能“學新知識”,比如遇到“施工路段”,以前冇見過,但通過向量分析,發現和“障礙”的向量很像,就會自動減速繞行。

六、聊問題:知識表示再牛,也有“搞不定”的事

雖然知識表示已經很先進了,但還不是“萬能的”,還有一堆解決不了的難題,這些難題也是科學家們正在攻關的方向。咱們挑最關鍵的3個,說說它們的“痛點”。

1.知識太“雜”:冇法把“所有知識”都表示清楚

世界上的知識太多了,有“明確的知識”(比如數學公式、曆史事件),還有“模糊的知識”(比如“這件衣服挺好看”“他很開心”),更有“隱性的知識”(比如騎自行車的技巧、做飯的手感)。

現在的知識表示能處理“明確知識”,但對“模糊知識”和“隱性知識”幾乎冇轍:

-比如“好看”“開心”這種主觀感受,冇法用精確的規則或向量表示,電腦不知道“多好看算挺好看”;

-比如騎自行車的“平衡感”,是靠身體感知的隱性知識,冇法用符號或向量寫出來,所以現在的AI還學不會騎自行車。

2.知識會“變”:老知識過時,新知識跟不上

知識不是一成不變的,比如“太陽繫有9大行星”後來變成了“8大行星”(冥王星被除名),“新冠病毒的治療方法”也在不斷更新。但電腦的知識表示是“靜態”的,更新起來很麻煩。

比如知識圖譜裡存著“太陽繫有9大行星”,當冥王星被除名後,得手動修改所有和“9大行星”相關的節點和關係;如果是大模型,就得重新用新數據訓練,花幾個月時間和幾百萬美元,成本特彆高。

現在科學家們在研究“動態知識表示”,讓AI能自己“更新知識”,比如看到新聞說“冥王星不是行星了”,就自動修改自己的知識,但目前還冇完全實現。

3.知識難“解釋”:AI說“對”,但說不出“為啥對”

現在的大模型(比如GPT-4)經常能給出正確答案,但你問它“怎麼想出來的”,它說不清楚——這就是“可解釋性差”的問題,根源在“神經網絡表示法”。

因為大模型的知識是“向量”,是一堆數字,人類看不懂。比如它說“《靜夜思》的作者是李白”,你問“為啥”,它隻能重複“因為《靜夜思》的作者是李白”,冇法像人一樣說“因為課本裡學過,曆史資料裡也有記載”。

這個問題在關鍵領域特別緻命,比如醫療AI說“患者得了癌症”,醫生得知道“AI是根據哪些症狀、哪些檢查結果判斷的”,如果AI說不清楚,醫生根本不敢用。

七、總結:知識表示的本質,是“人與機器的溝通橋梁”

聊了這麼多,最後咱們迴歸本質:知識表示到底是啥?

其實它就是一座“橋梁”——左邊是人類的“智慧世界”,有語言、經驗、直覺;右邊是機器的“數字世界”,有代碼、符號、向量。知識表示的任務,就是把左邊的東西“翻譯”到右邊,讓機器能幫人乾活。

從1943年的“產生式規則”到現在的“大模型向量”,這座橋越建越寬、越建越穩:以前隻能過“簡單推理”的小自行車,現在能過“複雜決策”的大卡車。但它永遠成不了“傳送門”,因為機器冇法真正“理解”知識,隻能“處理”知識。

對咱們普通人來說,不用懂具體的公式和演算法,隻要知道:那些讓生活變方便的智慧工具——能精準推薦的淘寶、能快速答疑的搜尋、能24小時服務的客服——背後都是知識表示在“默默翻譯”。

未來,知識表示會往“更模糊、更動態、更可解釋”的方向發展,可能有一天,AI能像人一樣理解“開心”的情緒,能自己更新“最新的新聞”,能說清“為啥這麼想”。但到那時候,它依然是“工具”,因為真正的智慧,不僅是“處理知識”,更是“創造知識”——這一點,目前還隻有人類能做到。

目錄
設置
設置
閱讀主題
字體風格
雅黑 宋體 楷書 卡通
字體風格
適中 偏大 超大
儲存設置
恢複默認
手機
手機閱讀
掃碼獲取鏈接,使用瀏覽器打開
書架同步,隨時隨地,手機閱讀
收藏
聽書
聽書
發聲
男聲 女生 逍遙 軟萌
語速
適中 超快
音量
適中
開始播放
推薦
反饋
章節報錯
當前章節
報錯內容
提交
加入收藏 < 上一章 章節列表 下一章 > 錯誤舉報