• <cite id="u60o2"><nav id="u60o2"></nav></cite>
    
    
  • <samp id="u60o2"><pre id="u60o2"></pre></samp>
  • <tr id="u60o2"></tr>
    <th id="u60o2"></th>
    <td id="u60o2"></td><kbd id="u60o2"><acronym id="u60o2"></acronym></kbd>
      首頁 > 未分類 > 偏最小二乘法判別分析(pls-da)

      偏最小二乘法判別分析(pls-da)

      偏最小二乘法判別分析(pls-da ,Partial least squares discrimination analysis)

      偏最小二乘法判別分析原理:

      偏最小二乘法判別分析是一種用于判別分析的多變量統(tǒng)計(jì)分析方法。判別分析是一種根據(jù)觀察或測量到的若干變量值,來判斷研究對(duì)象如何分類的常用統(tǒng)計(jì)分析方法。其原理是對(duì)不同處理樣本(如觀測樣本、對(duì)照樣本)的特性分別進(jìn)行訓(xùn)練,產(chǎn)生訓(xùn)練集,并檢驗(yàn)訓(xùn)練集的可信度。

      例如,肺炎和普通感冒兩類患者群體利用最小偏二乘法判別分析,第一步歸納總結(jié)出肺炎和普通感冒的區(qū)別(特性),這一步就可以得到具有什么癥狀的人是肺炎,具有什么癥狀的人是普通感冒。第二步可以驗(yàn)證我們得到的普通感冒和肺炎區(qū)別(特性)判別的準(zhǔn)確率,我們雖然建立了訓(xùn)練集,但由于樣方少,樣方不足以代表總體,樣方受污染,所收納樣方的特性不足,等等原因都是影響我們訓(xùn)練集準(zhǔn)確率因素,換個(gè)方向思考,我們建立一個(gè)較為具有代表意義的訓(xùn)練集,我們就可以反過來驗(yàn)證樣本,可以得出醫(yī)生可能誤診,原本是肺炎患者誤診成普通感冒,原本是普通感冒誤診為肺炎,并算出誤診率。誤診產(chǎn)生的原因可能由于現(xiàn)有技術(shù)不夠發(fā)達(dá),醫(yī)師經(jīng)驗(yàn)不足等等原因。

       

      偏最小二乘法判別分析好處:

      解釋樣本觀測數(shù)目少

      可以減少變量間多重共線性產(chǎn)生的影響

      所謂的多重共線性是指一些自變量之間存在較強(qiáng)的線性關(guān)系。這種情況在實(shí)際應(yīng)用中非常普遍,如研究高血壓與年齡、吸煙年限、飲白酒年限等因素的關(guān)系,這些自變量通常是相關(guān)的,如果這種相關(guān)程度非常高,使用最小二乘法建立回歸方程就有可能失效。

      偏最小二乘法判別分析pls-da所需數(shù)據(jù):

      分組信息

      因變量和自變量

      因變量隨著自變量的改變而改變。比如y=3x+2此處x為自變量y為因變量,y隨著x的改變而改變。消費(fèi)和收入關(guān)系,收入就是自變量,消費(fèi)就是因變量。

      賦值規(guī)則當(dāng)樣本屬于哪類樣本其值為1,否則為0

      所謂的Y矩陣

      對(duì)照樣本 觀測樣本
      Y1 1 0
      Y2 1 0
      Y3 0 1

      樣本與變量之間的數(shù)據(jù)矩陣

      所謂的X矩陣

      x1 x2
      y1
      y2
      Y3

       

    • <cite id="u60o2"><nav id="u60o2"></nav></cite>
      
      
    • <samp id="u60o2"><pre id="u60o2"></pre></samp>
    • <tr id="u60o2"></tr>
      <th id="u60o2"></th>
      <td id="u60o2"></td><kbd id="u60o2"><acronym id="u60o2"></acronym></kbd>