Distinguere un segnale da un rumore di fondo. Terza puntata: zone di rumore di fondo controllato

Avvertenza: questa è la terza puntata di una serie, se non avete letto la prima e la seconda andate a farlo, altrimenti la comprensione potrebbe esservi ostica. Se fare moltiplicazioni, divisioni e radici quadrate vi crea problemi, verificate di avere la calcolatrice a portata di mano!

Come dicevamo alla fine della scorsa puntata, se si conoscono alla perfezione le proprietà del fenomeno (o dei fenomeni) che imita il manifestarsi dell'oggetto di cui siamo alla ricerca, insomma del nostro rumore di fondo, un'analisi statistica delle nostre osservazioni permetterà di capire se un eventuale eccesso osservato sia compatibile con la presenza di un segnale genuino sovrapposto al rumore, oppure al solo rumore. Nel caso invece che le proprietà del rumore di fondo non siano note con sufficiente precisione, le probabilità di sbagliare aumentano. Nel caso in cui si sottostimi il rumore di fondo, si penserà di vedere un segnale quando invece non ce n'è traccia. Per evitare di cadere in questa trappola, i fisici cercano sempre di misurare le proprietà dei rumori di fondo dagli stessi dati, per non doversi fidare troppo delle predizioni teoriche.

Riprendiamo l'esempio del puzzone di Piggs e del suo fastidioso rumore di fondo, il bruglione di Yan. Quello che sappiamo è che entrambi si manifestano nel rivelatore con l'accensione di una lampadina rossa. Se la storia fosse tutta qui, non ci sarebbe molto altro da aggiungere. Ma immaginate invece di essere talmente furbi da riuscire a isolare uno o più modi di manifestarsi del solo bruglione di Yan: immaginiamo per esempio che abbiate scoperto che il bruglione di Yan si manifesta anche con l'accensione di una lampadina verde e di una lampadina blu, supponendo per semplicità con lo stesso ritmo con cui accende quella rossa. E immaginiamo invece che il fenomeno di cui siete alla ricerca, il puzzone di Piggs, per nessuna ragione possa far accendere né la lampadina verde né quella blu. In questo caso siete a cavallo: invece di fidarvi delle predizioni del vostro amico teorico, che vi ha garantito che il bruglione di Yan si manifesta con 10 accensioni ogni 10000 collisioni, andate direttamente a misurare questo valore con le lampadine verdi e blu.

Inizialmente, avendo pochi dati, non avrete una grande precisione. Immaginiamo infatti che la previsione del vostro amico teorico sia corretta, e che in 10000 collisioni le tre lampadine si accendano in media 10 volte a causa del bruglione. Come abbiamo visto la volta scorsa, esiste una probabilità importante che invece di vedere 10 accensioni ne vediate invece 13, oppure 7, oppure 11.

In questo caso, facendo l'ipotesi che il ritmo di accensione sia costante nelle varie lampadine (non è necessariamente il caso, ma facciamola semplice), potete per esempio fare una media delle misure delle due lampadine che sapete non saranno accese dal puzzone di Piggs. Meglio ancora, se masticate di analisi dati, farete una media pesata o una regressione, considerando come errore sulle misure la radice quadrata della misura stessa (in sostanza, facendo l'ipotesi che la vostra misura sia poissoniana, e che la misura stessa sia una buona stima della media stessa: ecco il senso delle barre di errore nel grafico precedente). Nel nostro caso semplificato, il risultato della stima del rumore del fondo usando le due lampadine verdi e blu è circa 9 (la linea tratteggiata nera), con una precisione di circa 2 conteggi (la banda gialla): meglio della sola lampadina verde e della sola lampadina blu da sole, come ci si aspetterebbe dalla combinazione di due misure. 9 conteggi in 10000 eventi più o meno 2 è una buona stima dei 10 conteggi teorici, e potete certo usare questo numero per valutare quanto l'eccesso di conteggi della lampadina rossa sia significativo. Purtroppo ancora non molto! 13 meno 9 fa 4, che è poco più di 3, la radice quadrata di 9. Si tratta sempre di un eccesso si poco superiore a 1 sigma. Continuate dunque a raccogliere dati, e ripetete l'operazione di media delle lampadine di controllo. In un milione di eventi la lampadina verde si sarà accesa 981 volte, quella blu 1014, e quella rossa (come già nella puntata precedente) 1103 volte.

Il rumore di fondo stimato con la lampadina verde e blu è di 997 (più o meno 22 accensioni), un'ottima stima del 1000 teorico. L'eccesso che osservate (1103 - 997 = 106) è maggiore di più di 5 sigma del livello del rumore di fondo misurato dai dati (essendo adesso la sigma da considerare l'errore sul livello medio del fondo, cioè 22): avete una bella evidenza sperimentale della presenza di un nuovo fenomeno. E vi prego di notare che, quando avevamo considerato solo la lampadina rossa, lo stesso eccesso corrispondeva solo a 3 sigma: dove abbiamo guadagnato? In questo caso avete due misure del fondo, non una sola (o una sola predizione teorica), e il fatto che siano due ne migliora di molto la precisione, e rende lo stesso eccesso più significativo. Immaginate dunque che cosa potreste fare se aveste a disposizione 30 lampadine invece di 3, e 29 di queste potessero essere usate per misurare il livello di produzione del bruglione di Yan. Qualcosa del genere:

Come vedete, il livello di precisione sulla misura del rumore di fondo (la banda gialla) migliora notevolmente, e il vostro eccesso (la lampadina rossa ha indice 15) inizia a svettare sopra il fondo. D'altra parte, ingrandendo la regione in cui andate a misurare le proprietà del rumore di fondo, aumentate anche le possibilità di osservare una fluttuazione larga a sufficienza da essere confusa con un eccesso. Cosa direste se il quadro fosse piuttosto questo qui sotto?

L'eccesso alla lampadina rossa è sempre lo stesso, gli altri punti sono generati esattamente come nel grafico precedente: numeri causali distribuiti poissonianamente con media 1000. Questa volta però c'è un punto corrispondente alla seconda lampadina che mostra un eccesso assolutamente casuale, che è una fluttuazione del fondo. Se non sapeste che il puzzone di Piggs deve manifestarsi con l'accensione della lampadina rossa, ma soltanto che potrebbe manifestarsi in una delle 30 lampadine, come fate a distinguere quale dei due eccessi sia significativo? In due parole: non potete. Dovete (come sempre!) raccogliere più dati, e verificare se - aumentando la statistica - l'eccesso resta tale o si rivela soltanto una fluttuazione.

Nell'attesa, dovete anche essere cauti nel dichiarare al mondo quale è la significatività statistica del vostro eccesso. Se localmente la lampadina rossa mostra un eccesso di 3 sigma, il fatto che non sapete quale lampadina possa accendersi vi obbliga a correggere questo "3 sigma" per quello che si chiama in gergo il "Look Elsewhere Effect" (Effetto del Guardare Altrove) - per gli amici LEE - ovvero per la probabilità che una tale fluttuazione appaia in un'altra qualsiasi delle tante lampadine che state monitorando. Più sono le lampadine in cui il puzzone di Piggs potrebbe manifestarsi, maggiore sarà la correzione, minore il valore globale del vostro effetto locale. Per stappare lo champagne dovrete aspettare ancora un po'.

 

(Questa è la terza ed ultima puntata della serie "Distinguere un segnale da un rumore di fondo". Ci sarebbero ancora molte cose da dire, ma questo è un sito che fa divulgazione, e non corsi di analisi dati. Se avete seguito fin qui, potreste avere abbastanza strumenti per seguire il seminario di oggi pomeriggio. Il puzzone di Piggs è ovviamente una metafora per il bosone di Higgs, il bruglione di Yan il nome di fantasia per uno dei molti rumori di fondo che mascherano la sua potenziale apparizione in uno dei canali di decadimento in cui lo cerchiamo. Se per esempio studiamo il suo potenziale decadimento in due fotoni, il bruglione sarà la produzione dovuta alla QCD di coppie di fotoni. Siccome non sappiamo bene quale massa abbia il bosone di Higgs, dobbiamo cercarlo in regioni ampie, ovvero in tante possibili lampadine. Sempre nel caso del decadimento in due fotoni, la produzione di coppie di fotoni dovuta alla QCD genera coppie che corrispondono a valori di massa sparpagliati in modo continuo su un largo intervallo, mentre il decadimento del bosone di Higgs si manifesterebbe a un valore di massa ignoto ma ben definito.)

Questo inserimento è stato pubblicato in Fisica e il tag , , , , , , , , . Metti un segnalibro su permalink. Inserisci un commento o lascia un trackback: Trackback URL.

15 Commenti

  1. Pasquale
    Pubblicato il 13 dicembre 2011 alle 11:46 | Permalink

    Davvero un'ottima serie di articoli che per quanto evidentemente scritti in fretta e nei ritagli mostrano una grande cura, competenza e passione.
    E nonostante l'apparente freddezza della materia (nemmeno colorita da un familiare "Arf arf") la passione riesci a trasmetterla al lettore.
    Complimenti!

  2. Mattia
    Pubblicato il 13 dicembre 2011 alle 11:58 | Permalink

    @Marco: Ma la conferenza di oggi si può seguire liberamente in webcast in diretta, oppure era necessario iscriversi? Dove la si può seguire?

    Bellissime queste tre puntate...

  3. Pubblicato il 13 dicembre 2011 alle 12:04 | Permalink

    http://webcast.web.cern.ch/webcast/

    (solo se volevi una connessione HD garantita era necessario iscriversi. Per una connessione normale, devi solo sperare che i server reggano)

  4. lallo
    Pubblicato il 13 dicembre 2011 alle 15:47 | Permalink

    Spiegazione eccezionale ancora grazie!!

  5. Pubblicato il 14 dicembre 2011 alle 11:02 | Permalink

    Grazie per queste tre puntate, ho aspettato a leggere tutti gli episodi prima di farti i miei complimenti, sopra tutto perché si tratta di un argomento abbastanza complicato, secondo me, e sei riuscito ad avvicinarlo a tutti noi. Grazie ancora e buone feste.
    Danilo Severnini

  6. My_May
    Pubblicato il 21 giugno 2012 alle 16:44 | Permalink

    Leggo soltanto oggi l'ultima puntata (le altre due le avevo seguite in diretta), per questo sembrerò un po' in ritardo e me ne scuso.
    Ho letto tutto con molto interesse (visti anche i rumors recenti :D).

    L'occhio mi è caduto questa volta molto in basso, nell'ultima frase scritta tra parentesi

    "...mentre il decadimento del bosone di Higgs si manifesterebbe a un valore di massa ignoto ma ben definito".

    Mi è sorta questa domanda. Per decadimento del bosone si intende il "meccanismo di Higss"? Spero di essere chiaro. Tu hai giustamente fatto un bel po' di supposizioni, del tipo se : le proprietà del rumore di fondo non sono note con sufficiente precisione, le probabilità di sbagliare aumentano.
    La domanda che mi sono posto quindi e questa: vi è noto il meccanismo di decadimento del puzzone o anche quello non è ben definito? E se vi fosse noto solo in quanto teorizzato ma il meccanismo che la natura ha adottato fosse diverso da quello teorizzato... ?

  7. Pubblicato il 21 giugno 2012 alle 17:10 | Permalink

    @My_May: una piccola precisazione prima della risposta: il bosone di Higgs è (sarebbe) una particella che esiste come effetto collaterale del meccanismo di Higgs, che è invece un fenomeno per la quale la simmetria elettrodebole è imperfetta, e il bosoni W e Z hanno una massa mentre il fotone no.

    Quanto alla tua domanda: le proprietà dei rumori di fondo vanno misurate sui dati, si tratta di fenomeni noti le cui proprietà sono ben predette, ma che preferiamo sempre verificare sui dati. Fa parte integrante di ogni ricerca di nuove particelle, ed è probabilmente la parte più importante e delicata.

    I meccanismi di decadimento del puzzone sono noti (e devono esserli! Altrimenti che cosa cercheresti?) nel quadro di una certa teoria, ogni teoria e ogni tipi di puzzone ne ha di diversi, o di simili ma a ritmi diversi. Noi cerchiamo tutto, o perlomeno tutto quello che ci è venuto in mente, e che può essere osservato sopra il fondo. Possiamo esserci persi qualcosa? Non impossibile, ma molto improbabile, visto la caterva di stati finali che studiamo.

  8. Pubblicato il 9 luglio 2012 alle 09:17 | Permalink

    Di nuovo complimenti per l'articolo ed alcune altre segnalazioni:
    "la correzioni"
    "e il vostro eccesso"
    "una sigma"
    Grazie!

  9. Pubblicato il 9 luglio 2012 alle 09:48 | Permalink

    @Fabio: grazie, corretti!

  10. Salvatore
    Pubblicato il 12 luglio 2012 alle 13:38 | Permalink

    Ma la precisione sulla stima del fondo (i valori 2 e 22 negli esempi) come si calcola?

  11. Pubblicato il 12 luglio 2012 alle 13:48 | Permalink

    @Salvatore: è l'errore sulla media dei valori della lampadina vede e quella blu, tenendo conto delle relative incertezze. Lo puoi fare con un media pesata, oppure con un qualche genere di regressione (e non posso entrare nei dettagli qui, mi serve solo darti un'idea vaga della procedura).

  12. Salvatore
    Pubblicato il 19 luglio 2012 alle 15:15 | Permalink

    ok chiaro, grazie

  13. Enzo
    Pubblicato il 10 agosto 2012 alle 16:41 | Permalink

    Mi piace leggere articoli di fisica a livello divulgativo. Ed ho trovato la serie di questi tre articoli chiari, piacevoli ed utili. Grazie. Spero questo sito continui a fornire la possibilità di leggere di particelle e teorie.

  14. Carlo
    Pubblicato il 18 ottobre 2012 alle 20:12 | Permalink

    Quindi riassumendo si può dire che quando in un esperimento si parla di un evidenza di 6sigma significa che il valore trovato è maggiore del fondo + 6 sigma?
    So che non c'entra niente ma mi sapresti spiegare in DAMA a cosa corrisponde l'evidenza di 8sigma se lì si misura una modulazione annuale?

  15. Pubblicato il 20 ottobre 2012 alle 11:01 | Permalink

    @Carlo: si, in sostanza si tratta di questo. DAMA pretende dunque di vedere un segnale che evidentemente non è compatibile con una fluttuazione statistica del fondo. Che poi questo segnale sia veramente una traccia di materia oscura è un altro discorso, perché la modulazione annuale del segnale potrebbe essere segno sia di una localizzazione della sorgente, ma anche del fatto che il segnale viene da altre sorgenti astronomiche più convenzionali che non sono state tenute in conto in modo corretto negli errori sistematici.

6 Trackback

Scrivi un Commento

Il tuo indirizzo email non verrà mai pubblicato o condiviso.

Puoi usare questi tag e attributi HTML <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

  • Mi chiamo Marco Delmastro, sono un fisico delle particelle che lavora all'esperimento ATLAS al CERN di Ginevra.

    Su Borborigmi di un fisico renitente divago di vita all'estero lontani dall'Italia, fisica delle particelle e divulgazione scientifica, ricerca fondamentale, tecnologia e comunicazione nel mondo digitale, educazione, militanza quotidiana e altre amenità.

    Ho scritto un libro, Particelle familiari, che prova a raccontare cosa faccio di mestiere, e perché.

  • feed RSS articoli
  • feed RSS commenti
  • Cinguettii