Covariate shift
- What is covariate shift
- 粗淺
- 假設x是屬於特徵空間的某一樣本點,y是標籤。
- covariate,就是這裡的x。
- covariate shift 根據字面意思就是樣本點x的變化
- 規範
- 假設
- q1(x)是測試集中一個樣本點的機率密度,
- q0(x)是訓練集中一個樣本點的機率密度。
- 最終我們估計一個條件機率密度p(y|x, θ), 它是由x和一組參數θ={θ1, θ2, ..., θm}所決定。
- 對於一組參數來說,可用loss(θ)函數去評估性能的好壞
- 這裡有一個問題,當我們找出在q0(x)分布上最優的一組θ'時,能否保證q1(x)上的測試時也最好呢?
- 傳統機器學習
- 假設訓練集和測試集是獨立同分布的,即q0(x)=q1(x), 所以可以推出最優θ',進而保證q1(x)是最優的。
- 現實
- 假設往往不成立,伴隨新數據產生,老數據會過時,當q0(x)不再等於q1(x),就被稱作covariate shift
- 傳統機器學習
- 假設
- 粗淺
- How to solve the problem of covariate shift
- 附加一個由x決定的權值
- w(x)=q1(x)/q0(x)
- 重要
- q1(x) 很大
- q0(x) 很小
- 老數據
- q1(x) 很小
- q0(x) 很大
- 附加一個由x決定的權值
- 從遷移學習的角度來看
- 一種用source domain的標籤數據,結合target domain的無標籤數據,指導進行知識遷移的方法。
reference:https://blog.csdn.net/mao_xiao_feng/article/details/54317852