Browsing: Machine Learning

شماره خاله #شماره خاله تهران #شماره خاله تهرانپارس #شماره خاله اصفهان شماره خاله کرج #شماره خاله شیراز #شماره خاله قم#…

今天簡單介紹Xaier Initialization這個方法這個方法的目的是在初始化神經網路參數的時候穩定梯度避免梯度爆炸或是梯度消失可以看到下方算式代表的是一層神經網路參數W乘以輸入x得到輸出yW是矩陣 x是向量n_in n_out代表輸入的維度跟輸出的維度我們的目標就是讓輸出的變異數等於輸入的變異數(見第二個算式)藉此來穩定我們signal 傳遞我們假設W跟x是獨立變數 所以變異數就可以拆開變成相乘接下來W代表初始化根據正態分布 均值0 變異數sigma平方x則是輸入 輸入通常都會正則化 代表均值0 變異數1接著帶入rearange得出sigma平方=1/_in接著可以看到下面第一行我們要將損失函數做一個反向傳播的動作那這邊我們關注的就會是損失函數梯度變異數是否跟輸入的變異數一樣我們用chain rule來反向到xi 輸入層第二行就是對xi 偏微分其他變成0 剩下Wji接下來對損失函數梯度指定它為小delta套上變異數 跟昨天一樣 輸入跟神經網路參數獨立所以可以變成相乘接下來解開sigma得到結果你會發現說正向傳播跟反向傳播怎麼一個分母是輸入維度一個是輸出維度 那無法同時滿足兩個要求所以就有學者提出第二張最終的公式參數wji 就會從正態分布均值0標準差為根號變異數當中提取數字 Source…