WIFI-DATASET-GUIDE

WiFi Sensing Dataset: CSI-Daten für RuView, HAR und Präsenz auswählen

Ein gutes WiFi-Sensing-Dataset braucht Hardwareangaben, Labels, Baselines, klare Aufgaben und Evaluationssplits.

Infografik zu WiFi-Sensing-Daten, Labels, Baselines und Validierung
Ein belastbares Dataset verbindet rohes CSI, Raumkontext, Labels, Baselines und Validierungssplits.

Wer nach einem WiFi sensing dataset sucht, braucht meist öffentliche CSI-Daten, einen Modellbenchmark oder realistische Beispiele für eine kamerafreie Demo. Diese Ziele ähneln sich, verlangen aber unterschiedliche Daten.

Für RuView entscheidet das Dataset, was das Modell wirklich gelernt hat. Demo, GitHub und ESP32-Anleitung zeigen Oberfläche, Code und Erfassung; die Daten setzen die Grenzen der Aussage.

Was ein gutes WiFi-Sensing-Dataset ausmacht

Ein gutes WiFi-Sensing-Dataset dokumentiert die CSI-Erfassung, nicht nur Klassenlabels. Wichtig sind Hardware, Band, Antennen, Paketrate, Raum, Teilnehmer, Protokoll, Synchronisierung und Evaluationssplit.

Die Aufgabe entscheidet. HAR braucht wiederholte Aktionen, Präsenz braucht leere und belegte Räume, Atmung braucht Referenzdaten, und Multi-User-Sensing braucht Interaktionslabels.

  • Bevorzuge Datasets mit klarer Hardware-, Raum- und Labeldokumentation.
  • Achte auf Leeraum-Baselines und negative Tests.
  • Prüfe, ob Splits Personen, Räume, Sessions oder Geräte trennen.

Öffentliche Benchmarks zum Vergleich

Öffentliche Ressourcen erfüllen unterschiedliche Zwecke. Awesome-WiFi-CSI-Sensing ist ein Verzeichnis, SenseFi ein Benchmark-Framework, WiMANS ein Multi-User-Dataset und CSI-Bench näher an realen Umgebungen.

Ein Verzeichnis hilft beim Finden, eine Bibliothek beim Reproduzieren, ein Feld-Dataset beim Robustheitstest.

Ressource Bester Einsatz Prüfen
Awesome-WiFi-CSI-Sensing Papers und Datasets finden Zugriff und Dokumentation
SenseFi Modellbenchmark Datasets, Modelle, Splits
WiMANS Multi-User-Aktivität Labels, Nutzer, Referenzvideo
CSI-Bench Realistisches WiFi sensing Aufgaben, Geräte, Zugriff

Daten für einen RuView-Workflow auswählen

Starte mit der RuView-Frage. Für Präsenz ist ein feines Gesten-Dataset falsch. Für Generalisierung sind Splits aus derselben Session zu schwach.

Die Checkliste umfasst rohes CSI, Metadaten, Labels, Baselines und Splits. Fehlt das, kann Genauigkeit nur Raum-Memorisierung sein.

  • Erfasse lokale Baselines auch bei öffentlichen Daten.
  • Bewahre Timing und negative Tests für Bewegung oder Pose.
  • Dokumentiere Einwilligung und Zugriff bei synchronem Video.

Häufige Dataset-Fehler

Der häufigste Fehler ist, Dataset-Genauigkeit als Beweis für neue Räume zu sehen. CSI hängt stark von Wänden, Möbeln, Antennen, Firmware und Traffic ab.

Auch Aufgaben werden oft vermischt. Gesten beweisen keine Multi-User-Präsenz, und Video-Referenzen können für eine Demo zu sensibel sein.

Fehler Risiko Sicherer Ansatz
Ein Raum Modell merkt sich Multipath Räume und Sessions trennen
Keine Baseline False Positives bleiben verborgen Leere und negative Tests
Datenschutz ignoriert Video und Routinen sind sensibel Einwilligung und Zugriff klären
Aufgaben vermischt Labels passen nicht Dataset nach Aufgabe wählen

Kleiner Datensatzplan mit ESP32 und RuView

Passt kein öffentliches Dataset, erstelle ein kleines lokales Set: leerer Raum, Eintritt, Austritt, Gehen, Sitzen, Tür ohne Person und Router-Traffic ohne Bewegung.

Speichere rohes CSI, Features, Labels, Raumnotizen und Splits getrennt. Jede Vorhersage sollte auf eine Session zurückführbar sein.

  • Benenne Sessions nach Datum, Raum, Platzierung, Band und Szenario.
  • Trenne rohes CSI von Features.
  • Reserviere eine Session oder einen Raum für Tests.
WiFi sensing dataset checklist with raw CSI, labels, baseline, and validation stages
Dataset quality improves when capture, labels, baseline, and validation are planned before modeling.

Warum diese Seite andere RuView-Seiten nicht kannibalisiert

Diese Seite ersetzt weder Homepage, GitHub-Guide, ESP32-Guide noch Motion-Capture-Seite. Sie behandelt Datasets, Benchmarks, Labels, Splits und Validierung.

Wer “ruview github” sucht, soll den GitHub-Guide finden. Wer “wifi sensing dataset” sucht, braucht Datenkriterien vor RuView, ESP32 oder einem öffentlichen Corpus.

Quellen und Dataset-Referenzen

FAQ zu WiFi-Sensing-Datasets

Welches Dataset eignet sich für Anfänger?

Für Modelllernen ist ein dokumentierter Benchmark wie SenseFi sinnvoll. Für eine RuView-Demo solltest du zusätzlich lokale Baselines erfassen.

Kann RuView mit jedem CSI-Dataset trainiert werden?

Nicht zuverlässig. Hardware, Raum, Labels und Aufgabe müssen passen.

Warum sind Leeraum-Baselines wichtig?

Sie trennen Umgebungsänderungen von menschlicher Aktivität und helfen gegen False Positives.

Sind WiFi-Sensing-Datasets datenschutzsensibel?

Ja. CSI kann Präsenz und Routinen zeigen; synchronisiertes Video braucht besondere Regeln.