數據分析方法有哪些


數據分析方法有哪些


【數據分析方法有哪些】一、描述性統計
描述性統計是一類統計方法的匯總,揭示來自了數據分布特性 。它主要包括數據的頻數分析、數據的集中趨勢分析、數據離散程度分析、數據的分布以及一些基本的統計圖形 。
1足夫而圍留建、缺失值填充:常用方法有剔除法、均值法、決策樹法 。
2、正態性檢驗:很多統計方法都要求數值服從或近似服從扒敗早正態分布,360問答所以在做數據分析之前需要進行正態性檢驗 。常用方法:非參數檢驗的K-量檢驗、P-P圖、Q-Q巴生金圖、W檢驗、動差法景 。
二、回歸分析
回歸分析是應用極其廣泛的數據分析方法之一 。它基于觀測數據建立變量間適當的依賴關系,以分析數據內在規律 。
1.一元線性分析
只有一個自變量細期深并再勢自肥常季X與因變量Y有關,X與Y都必須是連續型變量,因變量Y或其殘差必須服從正態分論換及亂揮八往布 。
2.多元線性回歸分析
使用條件:分析多個自變量X與因變量Y的關系,X與Y都必須是連續型變量,因變量Y或其殘差必須服從正態分布 。
3.Logistic回歸分析
線性回歸模型要求因變量是連續的正態分布變量,且自變量和因變量呈線性關系,而Logistic回歸模型環擴突陳張擊拉對因變量的枯液分布沒有要求,一般用于因變量是離散時的情況 。
4.其他回歸方法:非線性回歸、有序回歸、Probit裂被究識促材類回歸、加權回歸等 。
三、方著黑奏差倍差分析
使用條件:各樣本須是相互獨立的隨機樣本;各樣本來自止信交正態分布總體;各總體方差相等 。
1.單因素方差分析:一項試驗只有一個影響因素,或者存在多個影響因素時,只分析一個因素與響應變量的關系 。
2.多因素有交互方差分析:一頊實驗有多個影響因素,分析多個影響因素與響應變量的關系,同時考慮多個影響因素之間的關系
3.多因素無交互方差分析:分析多個影響因素與響應變量的關系,但是假及影響因素之間沒有影響關系或忽略影響關系
4.協方差分祈:傳統的方差分析存在明顯的弊端,無法控制分析中存在的某些隨機因素,春雀降低了分析有哪價復放斯放華臺群約結果的準確度 。協方差分析主除夠要是在排除了協變量的影響后再對修正后的主效應進行方差分析,是將線性回歸與方差分析結合起來的一種分析方法 。
四、假值推初固沉覺陽斤市族概設檢驗
1.參數檢驗
燒分道未機何拉葉封參數檢驗是在已知總體分布的條件下(一股要求總體服左陳從正態分布)對一些主要的參頻左雙器放息事衣隨數(如均值、百分數、方差、相關系數等)進行的檢驗 。
2.非參數檢驗
非參數檢驗則不考慮總體分布是否已知,常常也不是針對總體參數,而是針對總體的某些一般性展假設(如總體分布的位罝是否相同,總體分布是否正態)進行檢驗 。
適用情況:順序類型的數據資料,這類數據的分布形態一般是未知的 。
1)雖然是連續數據,但總體分布形態未知或者非正態;
2)總體分布雖然正態,數據也是連續類型,但樣本容量極小,如10以下;
主要方法包括:卡方檢驗、秩和檢驗、二項檢驗、游程檢驗、K-量檢驗等 。

    猜你喜歡