\( MSE( \hat{\theta}) = var( \hat{\theta} ) + \left( E(\theta)-\theta \right)^2 \)
Az első tag a varianciát, a második tag a várható értéktől való eltérést, vagyis a torzítottságot méri. Ha a becslés torzítatlan, $E( \hat{\theta}) = \hat{\theta}$ így ez a második tag nulla. Két becslés közül azt részesítjük előnyben, amelyre MSE kisebb.
Az $E(\hat{\theta})-\theta$ különbségre, vagyis a torzítás mértékére az angol bias szó alapján a $Bs \hat{\theta} $ jelölés van forgalomban. Használatos tehát az
\( MSE ( \hat{\theta}) = var(\hat{\theta}) + Bs^2 (\hat{\theta}) \)
Képlet is.
Két becslés közül azt részesítjük előnyben, amelyre MSE kisebb.