精選分類 書庫 完本 排行 原創專區
欣可小說 > 純愛耽美 > 職場小聰明 > 第603章 機器學習裡的分類問題和迴歸問題,一個故事解釋

用故事解釋分類問題和迴歸問題

1.分類問題的故事——森林裡的神秘果子

在一片神秘的森林裡,小明發現了許多奇怪的果子。有些果子可以吃,而有些果子有毒。他想找到一個方法來區分這些果子。

他觀察到:

?顏色:紅色的果子通常是可食用的,紫色的果子通常是有毒的。

?形狀:圓形的果子大多能吃,尖尖的果子往往有毒。

?大小:太小的果子似乎更危險。

於是,小明決定建立一個“吃不吃果子”的規則係統:

?如果果子是紅色且圓形,就吃!

?如果是紫色且尖尖的,就不吃!

?其他情況要謹慎判斷。

這個過程就是分類問題——它的目標是給每個果子打上一個“可吃”或“不可吃”的標簽。

分類問題的典型特征:

答案是離散的類彆(例如:“可吃”vs.“不可吃”)

數據用於區分不同類彆(紅色vs.紫色,圓形vs.尖形)

最終輸出是一個標簽(1=可吃,0=不可吃)

現實中的應用:

?郵件是否是垃圾郵件?(垃圾vs.非垃圾)

?貸款申請者是否值得批準?(批準vs.拒絕)

?識彆圖片中的動物是什麼?(貓vs.狗)

2.迴歸問題的故事——小明賣檸檬水

夏天到了,小明在街頭賣檸檬水。他想預測明天應該準備多少杯檸檬水,以免浪費或賣不夠。

他發現:

?溫度越高,賣出的檸檬水越多。

?天氣越晴朗,賣出的檸檬水也越多。

?濕度太高時,人們反而不太想買檸檬水。

他收集了一些數據,比如:

?昨天30°C,賣出50杯

?昨天35°C,賣出70杯

?昨天28°C,賣出45杯

他想建立一個預測模型,比如:

這樣,如果明天預測是32°C,他可以計算:

那麼,他就應該準備大約76杯檸檬水。

這個過程就是迴歸問題——它的目標是預測一個連續的數值,而不是一個固定類彆。

迴歸問題的典型特征:

答案是一個數值,而不是分類標簽(如“明天賣76杯”而不是“賣得多”或“賣得少”)

數據之間有連續性的關係(溫度從20°C到40°C,銷量隨之變化)

最終輸出是一個數值預測(如“銷量=76”)

現實中的應用:

?預測房價(基於麵積、地段等因素預測房價)

?預測股票價格(基於曆史數據預測未來走勢)

?預測某人未來的收入(基於年齡、教育、工作經驗等)

用比喻解釋分類問題和迴歸問題

1.分類問題——“選擇哪種衣服?”

想象你站在衣櫃前,思考今天穿什麼衣服。你會根據天氣決定:

?晴天→穿T恤

?下雨→穿雨衣

?下雪→穿羽絨服

這是一個分類問題,因為你的決策結果是幾個固定選項之一(T恤、雨衣、羽絨服)。

2.迴歸問題——“決定穿多厚?”

如果你不僅要決定穿什麼,還想確定該穿多厚的衣服,就成了迴歸問題。

你會想:

?10°C,應該穿厚毛衣+外套(厚度8分)

?20°C,應該穿薄外套(厚度5分)

?30°C,應該穿短袖(厚度2分)

這樣,你的決定不隻是T恤\/雨衣\/羽絨服,而是一個連續數值(衣服的厚度),這就類似於迴歸問題。

總結

對比點分類問題迴歸問題

輸出類型固定類彆(離散值)連續數值

目標識彆類彆(蘋果or橘子)預測數值(溫度vs.檸檬水銷量)

典型應用垃圾郵件分類、疾病診斷房價預測、銷量預測

示例這封郵件是垃圾郵件嗎?(是\/否)明天應該賣多少杯檸檬水?(75杯)

分類問題適合選出某個類彆,而迴歸問題適合預測一個數值。希望這些比喻能幫你更容易理解它們的區彆!

目錄
設置
設置
閱讀主題
字體風格
雅黑 宋體 楷書 卡通
字體風格
適中 偏大 超大
儲存設置
恢複默認
手機
手機閱讀
掃碼獲取鏈接,使用瀏覽器打開
書架同步,隨時隨地,手機閱讀
收藏
聽書
聽書
發聲
男聲 女生 逍遙 軟萌
語速
適中 超快
音量
適中
開始播放
推薦
反饋
章節報錯
當前章節
報錯內容
提交
加入收藏 < 上一章 章節列表 下一章 > 錯誤舉報