Indices varietatis statistici
Indices varietatis sunt res statisticae, singillatim numeri, quae metiuntur quantum elementa copiae inter se differant. Hi generaliter medietates supplent, ut non modo in valorem unum omnia elementa cohibeantur, sed etiam sciatur quomodo inter se differant.
Varietas datorum statisticorum multis causis exstare potest. Saepe data varia sunt, cum in multis rebus vel hominibus inspecta, tum quia rerum proprietates a multis viribus naturalibus aut socialibus conformantur: id accidit investigationibus medicis, quibus si exempli gratia medicamentum aegris sumministraverimus quibusdam, erunt qui curabuntur et qui etiam postea aegrotabunt, quia omnibus hominibus sunt variae geneticae vel valetudines; alias, data variant cum una res vel homo ipse variet ob horam diei, instrumentum mensorium, aliasve vires naturales.
Ob hanc varietatem, praeter medietatem, oportet scire quantum elementa copiae varient, singillatim circumne medietatem subiecta sint, an multum dispergantur. Hi enim indices varietatis generaliter nulli sunt nulla varietate, quoque igitur elemento aequali.
Saepe indices varietates in tres genera dividuntur: indices dispersionis vel amotiones mediae, indices disaequalitatis vel differentiae mediae, atque intervalla variationis.
Amotiones mediae
recensereSit selectio exemplorum numericorum . Videlicet est medietatem arithmeticam , et ab ipsa quicque elementum distare .
Quod nobis subicit posse aliquem varietatem elementorum mentiri per medietatem arithmeticam distantiarum a medietate arithmetica, quae amotio simplex media appellatur; exempli distributioni est amotio media . Rite scribitur:
At saepe non simplici utimur, sed amotione quadratica media, quae est radix quadratica medietatis arithmeticae distantiarum ad secundam potentiam dignatarum:
quam plerique appellant deviationem canonicam.
Quae formula computari potest breviori, e medietate quadratica atque arithmetica exstructa:
Proprietates amotionum mediarum
recensere- Nullae sunt nulla varietate, ergo cum quicque elementum aequale sit: .
- Numero constante elementis addito non mutantur: .
- Multiplicatis numero constante elementis indices duo multiplicantur magnitudine absoluta ipsius numeri: .
Variantia et deviantia
recensereAppellatur variantia deviatio canonica ad secundam potentiam dignata:
Atque appellatur N-upla variantia deviantia:
Adaptatio deviationis canonicae distributioni frequentiarum
recensereCum copiae elementorum indices dispersionis adhibeantur, cui adest distributio frequentiarum, totiens differentiae quadraticae multiplicandae sunt, quotiens adsunt elementa valore . Itaque si numeri sunt frequentiae absolutae et relativae, sic deviatio canonica fit:
Formula brevior non mutatur, medietates tamen quadratica atque arithmetica ut distributionibus frequentiarum computantur.
Cum frequentiae in classes subdividantur, in valorum locum subdendae sunt earum medietates arithmeticae aut eis absentibus valores centrales, ut computandis medietatibus frequentiis in classes subdivisis:
ubi postremum membrum est adaptatio formulae brevioris supradictae.
Differentiae mediae
recensereDifferentiae mediae ab amotionibus mediis ob id differunt, quod non a medietate elementorum distantiae computantur, sed a quoque alio elemento. Cum sit multum usitatior deviatio canonica, his indicibus magna est gravitas rationalis.
Itaque definiri potest differentia simplex media:
quae est medietas arithmetica distantiarum cuiusque elementi a quoque alio elemento.
Quia binis elementis est distantia reflexiva , supradicta definitio sic quoque rescribi potest:
Differentiae simplici mediae eaedem sunt proprietates atque amotionibus mediis supradictae.
Quae cum frequentiarum distributioni computetur, distantiaque igitur adhibeatur omnibus binis elementis valoribus et , tum sic mutatur definitio?:
Intervalla variationis
recensereCampus variationis
recensereCampus variationis modo est differentia inter maximum minimumque elementum:
Huic eaedem sunt proprietates atque amotionibus differentiisque mediis.
Differentia interquartilis
recensereElementorum copiae dicitur differentia interquartilis differentia inter eius primum tertiumque quartile:
Ut campi variationis, huius differentiae descriptione de varietate distributionis non multum potest cognosci; differentia interquartilis enim nulla potest esse, etiam nonnulla varietate.
Indices varietatis percentuales
recensereOmnes indices varietatis supradicti absoluti dicuntur. Indices absoluti aliquando idonei non sunt; inter alia eis non oportet uti, cum distributiones duae (aut plures) committendae sint, quod earum magnitudines possunt inter se differre. Exempli gratia sint hae duae distributiones:
Distributionis B elementa modo sunt illa distributionis A ducentupla ac quinquagintupla: earum varietas non vere commutatur. Absoluti vero indices varietatis cum id non comprehendant, magnitudinem varietatis distributionis B inflant.
Itaque oportet definiri indices varietatis percentuales, qui sunt centupli indices varietatis absoluti medietate arithmetica divisi.
Inter eos potissimus est coefficiens variationis, qui est deviatio canonica percentualis:
Concentratio
recensereCum character transferibile (et positivum) sit, possit igitur in elemento deminui vel augeri, quasi ab elemento ad aliud transferatur, eius potest computari concentratio, quae metitur cuiquene elemento sit characteris valor similis an paucis elementis sit valor maior at omnibus aliis minor. Ergo cum pleramque summam characteris habeant elementa maximis valoribus, maior est concentratio, quam si omnia similia essent.
Singillatim habetur aequidistributio cum omnibus elementis sit isdem valor ( ), et maxima concentratio cum uni elemento soli sit valor positivus ( ). Hic signum elementum significat -esimum cum omnia elementa ordinata sint a minore ad maius.
Index Ginianus
recensereAd concentrationem metiendam usitatissimus index est index concentrationis Ginianus. Ante pauca dicenda sunt, quam definiatur.
Oportet mentiri quantam partem summae characteris elementa minoribus valoribus obtineant. Ad hoc faciendum, definimus numerum :
Hic ergo est valorum summa numeri elementorum minoribus valoribus. Itaque modo est summa valorum characteris omnium. Nunc appellamus i-esima pars characteris numerus , et i-esima pars elementorum numerus . Notandum est aequidistributione partes characteris easdem et partes elementorum.
Itaque sic potest definiri index Ginianus:
Quod posuimus et numeros positivos, numerator est minor denominatore; index igitur hic inter 0 et 1 comprehenditur, nullusque est aequidistributione unusque maxima concentratione. Ob eam rem, index Ginianus idoenus est ad distributiones committendas.
Etiam potest definiri corrationalitas? concentrationis ; limite cardinalitatis ad infinitatem corrationalitas concentrationis atque index Ginianus adaequant.
Inter eius proprietates:
- Index Ginianus deminuitur addito omnibus elementis numero positivo: .
- Constat multiplicatis omnibus elementis numero positivo: .
- Augetur deminuto valore elementi auctoque valore elementi aliius cui valor erat maior valore deminuendo (ergo charactere "translato" ab elemento valore minore ad aliud valore maiore): .
Demonstratio proprietatum indicis Giniani
recenserePrimum demonstramus indicem deminui addito elementis numero positivo. -esima enim pars characteris sic fit: , ubi est additus numerus; et verum id est: , quia medietas arithmetica copiae omnium elementorum certe maior est medietate unius subcopiae, cuius elementa sunt omnia minora quam illa quae subcopiae desint, sed copiae adsint. Itaque:
Partes enim characteris augentur, quod deminutionem concentrationis exprimit.
Similiter, ut demonstretur indicem constare elementis multiplicatis, est satis id perspicere: , ergo partes characteris non mutantur, neque index.
Ad tertiam proprietatem demonstrandam, solam novam explicemus distributionem charactere translato:
Ergo partes characteris non mutantur; partes autem deminuuntur, quod augmentum exprimit concentrationis.
Curvamen Lorenzianum
recensereCurvamen Lorenzianum imago curvaminis est concentrationem depingentis. Si enim ad indicem Ginianum computandum inventae sunt elementorum partes charaterisque partes , curvamen Lorenzianum est curvamen quod puncta in plano Cartesiano coniungit. In ipso plano saepe etiam depingitur linea recta ab puncto ad punctum , appellata linea aequidistributionis, atque altera per puncta , appellata curvamen maximae concentrationis.
Aequidistributione enim curvamen Lorenzianum atque linea aequidistributionis adaequant; idem maxima concentratione accidit ipsius curvamini.
Per curvamen Lorenzianum etiam potest alio modo computari index Ginianus. Si enim appellamus littera aream inter curvamen Lorenzianum ac linea aequidistributionis:
ubi expressio aream inter lineam aequidistributionis curvamenque maximae concentrationis designat.
Demonstratio indicis Giniani computabilis per curvamen Lorenzianum
recensereSint puncta curvaminis Lorenziani, quorum coordinatae sint . Nunc appellemus signo aream polygoni a punctis designati, signoque aream alterius polygoni a punctis designati. Id patet:
ubi signum areas polygonorum a punctis designatorum significat, quae coniuncta aream efficiunt. Quod licet scribi:
Nunc cum haec vera sciamus:
Potest computari , et quod , denique liquet:
quod erat demonstrandum.
Concentratio distributionum frequentiarum
recensereSi distributioni frequentiarum a nobis index Ginianus computandus est, formula non simplex fit, aliquasque adaptationes necesse est facere. Definiamus littera frequentias cumulatas, et deinde hos numeros:
Itaque potest corrationalitas concentrationis definiri:
Eadem formula haec ad frequentias in classes subdivisas adaptari potest, cum in valorum locum subdantur classium valores centrales aut cognotae classium medietates arithmeticae.
Heterogeneitas atque homogeneitas
recensereOmnes indices supradicti characteribus quantitativis excogitati sunt. Multum difficilius est characterum qualitativorum in unum numerum varietatem colligere, oportet enim homogeneitatem atque heterogeneitatem definire.
Distributioni frequentiarum est minima heterogeneitas maximaque homogeneitas cum cuique elemento sit isdem valor characteris; est autem maxima heterogeneitas cum cuique valori sit eadem frequentia.
Exempli gratia:
Valor | x1 | x2 | x3 | Omnes |
---|---|---|---|---|
Frequentia | 0 | 0 | N | N |
Hic omnibus elementis est valor .
Valor | x1 | x2 | x3 | Omnes |
---|---|---|---|---|
Frequentia | N/3 | N/3 | N/3 | N |
Hic omnibus valoribus est frequentia .
Itaque duo indices heterogeneitatis possunt definiri, index heterogeneitatis Ginianus atque entropia:
ubi litterae frequentias relativas designant.
Utendi delectus indicis varietatis
recensereVarietati mentiendae plerique deviatione canonica utuntur, quod inter alia, ipsa eiusque functiones potissimae sunt in inferentia statistica. Deviatio canonica enim aptissima est varietati elementorum eadem magnitudine vel mensura.
Cum id non accidat, potius quam ea differentiis mediis utendum est. Quod autem saepe non evenit, cum programmata computatralia statistica pleraque ad inferentiam statisticam conceptentur et deviationem canonicam praeponant; idem campo variationis intervalloque interquartili accidit, quibus iam non praestet uti facilius computandis, quod nunc computatores celeriter facileque computant deviationem canonicam.
Indicibus percentualibus tamen uti oportet cum distributiones elementorum magnitudine diversa conferantur; atque indices concentrationis heterogeneitatisque saepe prosunt, primi characteribus trasferibilibus, secundique qualitativis.
Nexus interni
recensereBibliographia
recensere- Cicchitelli, D'Urso, Minozzo, 2018. Statistica: principi e metodi. Pearson. ISBN 9788891902788.