In statistica, regressio ratio est ad implicationem mentiendam inter duas variabiles. Singillatim adest variabilis dependens Y, cuius valor dependit a valore variabilis independentis X.

Mundi inter res quasdam implicationes rarenter totales sunt; saepe variabilis dependens, cum a variabili independenti dependat, aliarum multarum rerum vi quoque inflectitur. Exempli gratia, quamquam temperatura aëris a tempore anni dependit, etiam aliae res tamquam pluvia ac nubes hanc inflectunt. Utcumque haec implicatio describi potest.

Itaque sic definimus ratio regressionis:

Verbis dictu, variabilis dependens functio est variabilis independentis, addito residuo, quod in unun numerum omnes res complectitur, quae variabilem dependentem commutavisse putatae sint.

Regressio linearis

recensere

Cum ratione regressionis functio f(x) est lineae aequatio, regressio linearis dicitur.

Itaque coniecturamus posse implicationem functione istius generis scribere:

 

Omne enim quod est faciendum, est ut computentur numeri  . Id fieri potest per methodum quadratorum minimorum cum e populatione elementa extracta sint: numeri enim quaeruntur qui minimum errorem existimandi faciant, immo si   est valor variabilis independentis qui a ratione regressionis computatur ( ), et   valor elementi inspectus, hunc numerum minimum faciat:

 

Demonstrari potest hos esse eos numeros:

 

 

Patet esse summam numeratoris primi eorum duorum coefficientis inter charactera codeviantiam alteramque denominatoris deviantia characteris X; quo potest rescribi:

 

itaque est covariantia variantia characteris X divisa.

Quibus computatis ascribitur linea regressionis:

 

Singillatim coefficiens   valorem praedictum variabilis dependentis significat variabili independenti nulla, et   quanto numero augeatur variabilis dependens uno variabili independenti addito. Itaque semper punctum   linea regressionis contingit.

Differentia inter valores variabilis dependentis eosque praedictos   residuum appellatur:  . Residuorum summa semper nulla est:  . Valet enim:  

Demonstratio methodi minimorum quadratorum

recensere

Haec functio minima facienda est:

 

Primum numero   inveniendo, sit  , cuius membra a   non dependunt. Ob proprietates medietatis arithmeticae, summa   minima fit cum   sit medietas arithmetica numerorum  . Ergo habetur:  .

Tum nunc cuncta functio minima possumus facere numero   in ipsam functionem supposito:

 

Quod sic potest evolvi:

 

Patet hanc esse aequationem parabolae ab imo adsurgentis, quod coefficiens membri quadrati est positivus; minima igitur fit in parabolae vertice:

 

quae erant demonstranda.

Idoneitas lineae regressionis

recensere

Pluraeque lineae regressionis non perfecte data contingunt. Index enim exstruendus est eius idoneitatem mensurus.

Sit haec decompositio deviantiae:

 

ubi   dicitur deviantia explicita ac   deviantia residua.

Ex his duabus nunc definitur index determinationis:

 

Quae postrema aequatio educitur differentiam   in locum deviantiae explicitae supponendo.

Aliter demonstrari potest hunc indicem ita quoque posse scribi:

 

Nam quod, ut subtus demonstrabitur,  , scribimus:

 

e quo computationibus simplicibus educitur quod erat demonstrandum.

Sic scripta magis praestat formula indicem computare.

Demonstratio supradictae decompositionis deviantiae

recensere

Sic summa quadratorum deviantiae residuae potest evolvi:

 

 

 

Ac cum postremum membrum ita commutetur:

 

Sic summa fit:

 

quod erat demonstrandum.

Proprietates indicis determinationis

recensere
  1. Inter   comprehenditur.
  2. Nullus est nulla deviantia explicita, linea igitur regressionis parallela assi horizontali plani Cartesiani.
  3. Unus est nulla deviantia residua, cum igitur omnia puncta in linea regressionis perfecte iaceant.

His tribus intellegitur indicem augeri, cum propiora sint puncta lineae regressionis.

Demonstratio tertiae proprietatis indicis
recensere

Cum omnia puncta in linea perfecte iaceant, aequatione certe hac inveniuntur:

 

Quod si verum est, ita regressionis coefficientes fiunt:

 

 

 

In qua igitur iacent puncta linea est linea regressionis, obque id quaeque distantia inter puncta valoresque a linea regressionis praedictos nulla fit:  , quod est deviantia residua; habetur igitur  . Contra facile demonstratur proprietas inversa: cum enim index unus sit, nulla est deviantia residua, patetque:

 

quod erat tertia proprietas demonstranda.

Error medius praedictionis

recensere

Hic index mentitur quantus error fiat, cum in loco valorum spectatorum variabilis dependentis subdantur valores praedicti. E deviantia residua definitur:

 

Curvamen regressionis

recensere

Curvamen regressionis e medietatibus conditionatis unius characteris exstruitur. Singillatim si   valores sunt characteris X,   medietates conditionatae, curvamen regressionis est curvamen coniungens puncta  .

Quod linea non est, id propius versatur datis observatis. Eius enim index determinationis est:

 

Semper id viget:  

Bibliographia

recensere