GUIDA DATASET WIFI

WiFi Sensing Dataset: scegliere dati CSI per RuView, HAR e presenza

Un buon dataset WiFi sensing deve descrivere hardware, etichette, baseline, limiti del task e split di valutazione.

Infografica con dati WiFi che passano da una stanza a etichette, baseline e validazione
Un dataset utile collega CSI grezzo, contesto della stanza, etichette, baseline e split di validazione.

Chi cerca un WiFi sensing dataset di solito vuole dati CSI pubblici, un benchmark per confrontare modelli o esempi realistici per testare una demo senza videocamera. Ogni obiettivo richiede dati diversi.

Per RuView il dataset stabilisce cosa il modello ha imparato davvero. La demo mostra l’interfaccia, GitHub mostra il codice, ESP32 spiega la cattura; i dati fissano i limiti della validazione.

Cosa rende valido un dataset WiFi sensing

Un buon dataset WiFi sensing documenta come è stato catturato il CSI, non solo le classi. Deve indicare hardware, banda, antenne, ritmo dei pacchetti, stanza, partecipanti, protocollo, sincronizzazione e split di valutazione.

Il task è il filtro principale. HAR richiede azioni ripetute, presenza richiede stanza vuota e occupata, respirazione richiede riferimento indipendente, e multiutente richiede etichette di interazione.

  • Preferisci dataset con hardware, stanza, partecipanti ed etichette esplicite.
  • Cerca baseline vuote e test negativi.
  • Controlla se lo split separa persone, stanze, sessioni o dispositivi.

Benchmark pubblici da confrontare

Le risorse pubbliche hanno ruoli diversi. Awesome-WiFi-CSI-Sensing è una directory, SenseFi aiuta a confrontare modelli PyTorch, WiMANS copre attività multiutente e CSI-Bench si avvicina a scenari reali.

Una directory aiuta a scoprire, una libreria a riprodurre, un dataset sul campo a misurare robustezza.

Risorsa Uso migliore Da verificare
Awesome-WiFi-CSI-Sensing Trovare paper e dataset Accesso e documentazione
SenseFi Benchmark modelli Dataset, modelli e split
WiMANS Attività multiutente Etichette, utenti e video
CSI-Bench WiFi sensing realistico Task, dispositivi e accesso

Come scegliere dati per RuView

Parti dalla domanda RuView. Per la presenza, non iniziare da un dataset di gesti fini. Per generalizzazione, evita split della stessa sessione.

La checklist pratica include CSI grezzo, metadati, etichette, baseline e split. Senza questi elementi, l’accuratezza può essere memoria di una stanza.

  • Registra baseline locali anche usando dati pubblici.
  • Conserva tempi e test negativi per movimento o pose.
  • Documenta consenso e accesso se esiste video sincronizzato.

Errori comuni nei dataset

L’errore comune è scambiare alta accuratezza su un dataset per garanzia in un’altra stanza. CSI cambia con muri, mobili, antenne, firmware e traffico.

Si mescolano anche task incompatibili. Un dataset di gesti non prova presenza multiutente, e un benchmark con video può essere troppo sensibile per una demo leggera.

Errore Rischio Approccio migliore
Una sola stanza Il modello memorizza multipath Testare stanze e sessioni
Nessuna baseline Falsi positivi nascosti Catturare vuoto e negativi
Privacy ignorata Video e routine sensibili Spiegare consenso e accesso
Task mescolati Etichette incompatibili Scegliere per task

Piccolo piano con ESP32 e RuView

Se nessun dataset pubblico corrisponde, crea un piccolo dataset locale: stanza vuota, ingresso, uscita, camminata, seduta, porta senza persona e traffico router senza movimento.

Separa CSI grezzo, feature filtrate, etichette, note della stanza e split. Ogni previsione deve essere tracciabile fino a una sessione.

  • Nomina le sessioni per data, stanza, dispositivo, banda e scenario.
  • Separa CSI grezzo da feature processate.
  • Riserva una sessione o una stanza per il test.
WiFi sensing dataset checklist with raw CSI, labels, baseline, and validation stages
Dataset quality improves when capture, labels, baseline, and validation are planned before modeling.

Perché questa pagina non cannibalizza altre pagine RuView

Questa pagina non sostituisce home, guida GitHub, guida ESP32 o motion capture. Si concentra su dataset, benchmark, etichette, split e validazione.

Chi cerca “ruview github” deve arrivare alla guida GitHub. Chi cerca “wifi sensing dataset” ha bisogno di criteri sui dati prima di RuView, ESP32 o un corpus pubblico.

Fonti e riferimenti dataset

FAQ sui dataset WiFi sensing

Qual è il dataset migliore per iniziare?

Per imparare i modelli, usa un benchmark documentato come SenseFi. Per una demo RuView reale, raccogli anche baseline locali.

Posso addestrare RuView con qualsiasi dataset CSI?

Non in modo affidabile. Hardware, stanza, etichette e task devono corrispondere.

Perché serve la baseline della stanza vuota?

Aiuta a separare cambiamenti ambientali e falsi positivi dall’attività umana.

I dataset WiFi sensing sono sensibili?

Sì. CSI può rivelare presenza e routine; i video sincronizzati richiedono ancora più cautela.