Guida ai dataset WiFi sensing: CSI, etichette e validazione RuView

Chi cerca un WiFi sensing dataset di solito vuole dati CSI pubblici, un benchmark per confrontare modelli o esempi realistici per testare una demo senza videocamera. Ogni obiettivo richiede dati diversi.

Per RuView il dataset stabilisce cosa il modello ha imparato davvero. La demo mostra l’interfaccia, GitHub mostra il codice, ESP32 spiega la cattura; i dati fissano i limiti della validazione.

Cosa rende valido un dataset WiFi sensing

Un buon dataset WiFi sensing documenta come è stato catturato il CSI, non solo le classi. Deve indicare hardware, banda, antenne, ritmo dei pacchetti, stanza, partecipanti, protocollo, sincronizzazione e split di valutazione.

Il task è il filtro principale. HAR richiede azioni ripetute, presenza richiede stanza vuota e occupata, respirazione richiede riferimento indipendente, e multiutente richiede etichette di interazione.

Preferisci dataset con hardware, stanza, partecipanti ed etichette esplicite.
Cerca baseline vuote e test negativi.
Controlla se lo split separa persone, stanze, sessioni o dispositivi.

Benchmark pubblici da confrontare

Le risorse pubbliche hanno ruoli diversi. Awesome-WiFi-CSI-Sensing è una directory, SenseFi aiuta a confrontare modelli PyTorch, WiMANS copre attività multiutente e CSI-Bench si avvicina a scenari reali.

Una directory aiuta a scoprire, una libreria a riprodurre, un dataset sul campo a misurare robustezza.

Risorsa	Uso migliore	Da verificare
Awesome-WiFi-CSI-Sensing	Trovare paper e dataset	Accesso e documentazione
SenseFi	Benchmark modelli	Dataset, modelli e split
WiMANS	Attività multiutente	Etichette, utenti e video
CSI-Bench	WiFi sensing realistico	Task, dispositivi e accesso

Come scegliere dati per RuView

Parti dalla domanda RuView. Per la presenza, non iniziare da un dataset di gesti fini. Per generalizzazione, evita split della stessa sessione.

La checklist pratica include CSI grezzo, metadati, etichette, baseline e split. Senza questi elementi, l’accuratezza può essere memoria di una stanza.

Registra baseline locali anche usando dati pubblici.
Conserva tempi e test negativi per movimento o pose.
Documenta consenso e accesso se esiste video sincronizzato.

Errori comuni nei dataset

L’errore comune è scambiare alta accuratezza su un dataset per garanzia in un’altra stanza. CSI cambia con muri, mobili, antenne, firmware e traffico.

Si mescolano anche task incompatibili. Un dataset di gesti non prova presenza multiutente, e un benchmark con video può essere troppo sensibile per una demo leggera.

Errore	Rischio	Approccio migliore
Una sola stanza	Il modello memorizza multipath	Testare stanze e sessioni
Nessuna baseline	Falsi positivi nascosti	Catturare vuoto e negativi
Privacy ignorata	Video e routine sensibili	Spiegare consenso e accesso
Task mescolati	Etichette incompatibili	Scegliere per task

Piccolo piano con ESP32 e RuView

Se nessun dataset pubblico corrisponde, crea un piccolo dataset locale: stanza vuota, ingresso, uscita, camminata, seduta, porta senza persona e traffico router senza movimento.

Separa CSI grezzo, feature filtrate, etichette, note della stanza e split. Ogni previsione deve essere tracciabile fino a una sessione.

Nomina le sessioni per data, stanza, dispositivo, banda e scenario.
Separa CSI grezzo da feature processate.
Riserva una sessione o una stanza per il test.

WiFi sensing dataset checklist with raw CSI, labels, baseline, and validation stages — Dataset quality improves when capture, labels, baseline, and validation are planned before modeling.

Perché questa pagina non cannibalizza altre pagine RuView

Questa pagina non sostituisce home, guida GitHub, guida ESP32 o motion capture. Si concentra su dataset, benchmark, etichette, split e validazione.

Chi cerca “ruview github” deve arrivare alla guida GitHub. Chi cerca “wifi sensing dataset” ha bisogno di criteri sui dati prima di RuView, ESP32 o un corpus pubblico.

Mappa dell'intento: dataset, benchmark, tutorial o cattura locale

WiFi sensing dataset può indicare corpus CSI, libreria benchmark, dati tutorial per ESP32 o piano di validazione per una demo RuView.

Per imparare usa un benchmark documentato. Per validare un prodotto raccogli baseline locali. Per HAR servono label ripetute. Per presenza contano stanza vuota e falsi positivi.

Record the source, hardware, labels, validation limits, and negative cases.
Keep the page intent separate from related RuView pages.
Use local validation before making safety, health, or security claims.

Fonti e riferimenti dataset

Directory Awesome-WiFi-CSI-Sensing dataset and paper directory Benchmark SenseFi WiFi CSI sensing benchmark Dataset WiMANS multi-user WiFi activity sensing dataset Benchmark CSI-Bench in-the-wild multitask WiFi sensing dataset

FAQ sui dataset WiFi sensing

Qual è il dataset migliore per iniziare?

Per imparare i modelli, usa un benchmark documentato come SenseFi. Per una demo RuView reale, raccogli anche baseline locali.

Posso addestrare RuView con qualsiasi dataset CSI?

Non in modo affidabile. Hardware, stanza, etichette e task devono corrispondere.

Perché serve la baseline della stanza vuota?

Aiuta a separare cambiamenti ambientali e falsi positivi dall’attività umana.

I dataset WiFi sensing sono sensibili?

Sì. CSI può rivelare presenza e routine; i video sincronizzati richiedono ancora più cautela.

Meglio usare un dataset pubblico o raccoglierne uno proprio?

Usa dati pubblici per imparare e confrontare metodi, ma raccogli una baseline locale se vuoi un risultato RuView in una stanza specifica.

WiFi Sensing Dataset: scegliere dati CSI per RuView, HAR e presenza