mercoledì 9 gennaio 2019

Normale o gaussiana?

In un sito di statistica il riferimento è evidente: distribuzione normale o distribuzione gaussiana? E di conseguenza: test di normalità o test di gaussianità?

Per basare la risposta su qualche dato oggettivo, anche se di per sé non dirimente, ho effettuato, sul motore di ricerca che rende disponibile anche lo spazio web di questo blog, queste query [1], mettendo il testo all'interno dei doppi apici al fine di effettuare una ricerca "esatta" delle espressioni:

Espressione Numero di risultati
"distribuzione normale"112 000
"distribuzione gaussiana"26 000
"test di normalità" 44 700
"test di gaussianità" 319

Il rapporto tra il numero di risultati dell'espressione "distribuzione normale" e dell'espressione "distribuzione gaussiana" è all'incirca di 4 a 1. Il divario è importante, ma non ancora tale da far sì che il numero dei risultati possa rappresentare il razionale per fare optare decisamente per l'una o per l'altra delle due espressioni.

Ho quindi cercato "normale" su un vocabolario. Per rendere riproducibile e consultabile da chiunque il risultato ho effettuato la ricerca online sul "Vocabolario" della italianissima "Treccani".

Ebbene, nel vocabolario l'espressione "normale" è come prima cosa riferita al punto 1 come "perpendicolare", al punto 2 come "che segue la norma".

Solamente dopo questi due significati principali sono ripresi al punto 3 ed elencati in quanto "... sign. specifici in varie scienze e discipline" gli altri che il termine può avere: da quelli più generali a quelli che in campo scientifico vanno dalla botanica alla chimica, dalla fisica alla matematica e (finalmente) - alla lettera h (cioè ben all'ottavo posto del punto 3) - alla statistica.

L'inflazione di significati attribuiti al termine "normale" e la sua conseguente svalutazione per l'impiego in campo statistico forniscono il razionale per passare all'impiego sistematico dell'espressione "distribuzione gaussiana", che io qui ho ritenuto pertanto di adottare.

Molto diversa invece è la situazione che riguarda i test per verificare il tipo di distribuzione dei dati in esame. Perché se, per analogia con l'aggettivo riferito alla distribuzione, non dovremmo più parlare di "test di normalità" ma dovremmo parlare di "test di gaussianità", questa soluzione pare essere stata adottata in meno dell'1% dei casi. A causa di questo e nonostante vada in senso opposto alla scelta precedente, ho finito per adottare in questo sito l'espressione "test di normalità (gaussianità)" affiancando salomonicamente le due espressioni. Anche se spero che prima o poi la "gaussianità" possa uscire dalla parentesi in cui l'ho dovuta relegare per la necessità di adeguarmi (spero temporaneamente) alla "normalità" [2].


----------

[1] Dati aggiornati al gennaio 2023.

[2] Quanto sia considerato normale, ancora attualmente, nella letteratura scientifica, l'impiego dell'espressione "test di normalità", lo si può desumere anche dai titoli di due recenti lavori sull'argomento:
 Székely, G. J. and Rizzo, M. L. A new test for multivariate normality. Journal of Multivariate Analysis 2005;93;58-80. URL consultato il 05/01/2019: https://doi.org/10.1016/j.jmva.2003.12.002
 Ghasemi A, Zahediasl S. Normality Tests for Statistical Analysis: A Guide for Non-Statisticians. Int J Endocrinol Metab. 2012;10(2);486–489. URL consultato il 05/01/2019: https://goo.gl/AkoUdn

Nessun commento:

Posta un commento