Wer nach einem WiFi sensing dataset sucht, braucht meist öffentliche CSI-Daten, einen Modellbenchmark oder realistische Beispiele für eine kamerafreie Demo. Diese Ziele ähneln sich, verlangen aber unterschiedliche Daten.
Für RuView entscheidet das Dataset, was das Modell wirklich gelernt hat. Demo, GitHub und ESP32-Anleitung zeigen Oberfläche, Code und Erfassung; die Daten setzen die Grenzen der Aussage.
Was ein gutes WiFi-Sensing-Dataset ausmacht
Ein gutes WiFi-Sensing-Dataset dokumentiert die CSI-Erfassung, nicht nur Klassenlabels. Wichtig sind Hardware, Band, Antennen, Paketrate, Raum, Teilnehmer, Protokoll, Synchronisierung und Evaluationssplit.
Die Aufgabe entscheidet. HAR braucht wiederholte Aktionen, Präsenz braucht leere und belegte Räume, Atmung braucht Referenzdaten, und Multi-User-Sensing braucht Interaktionslabels.
- Bevorzuge Datasets mit klarer Hardware-, Raum- und Labeldokumentation.
- Achte auf Leeraum-Baselines und negative Tests.
- Prüfe, ob Splits Personen, Räume, Sessions oder Geräte trennen.
Öffentliche Benchmarks zum Vergleich
Öffentliche Ressourcen erfüllen unterschiedliche Zwecke. Awesome-WiFi-CSI-Sensing ist ein Verzeichnis, SenseFi ein Benchmark-Framework, WiMANS ein Multi-User-Dataset und CSI-Bench näher an realen Umgebungen.
Ein Verzeichnis hilft beim Finden, eine Bibliothek beim Reproduzieren, ein Feld-Dataset beim Robustheitstest.
| Ressource | Bester Einsatz | Prüfen |
|---|---|---|
| Awesome-WiFi-CSI-Sensing | Papers und Datasets finden | Zugriff und Dokumentation |
| SenseFi | Modellbenchmark | Datasets, Modelle, Splits |
| WiMANS | Multi-User-Aktivität | Labels, Nutzer, Referenzvideo |
| CSI-Bench | Realistisches WiFi sensing | Aufgaben, Geräte, Zugriff |
Daten für einen RuView-Workflow auswählen
Starte mit der RuView-Frage. Für Präsenz ist ein feines Gesten-Dataset falsch. Für Generalisierung sind Splits aus derselben Session zu schwach.
Die Checkliste umfasst rohes CSI, Metadaten, Labels, Baselines und Splits. Fehlt das, kann Genauigkeit nur Raum-Memorisierung sein.
- Erfasse lokale Baselines auch bei öffentlichen Daten.
- Bewahre Timing und negative Tests für Bewegung oder Pose.
- Dokumentiere Einwilligung und Zugriff bei synchronem Video.
Häufige Dataset-Fehler
Der häufigste Fehler ist, Dataset-Genauigkeit als Beweis für neue Räume zu sehen. CSI hängt stark von Wänden, Möbeln, Antennen, Firmware und Traffic ab.
Auch Aufgaben werden oft vermischt. Gesten beweisen keine Multi-User-Präsenz, und Video-Referenzen können für eine Demo zu sensibel sein.
| Fehler | Risiko | Sicherer Ansatz |
|---|---|---|
| Ein Raum | Modell merkt sich Multipath | Räume und Sessions trennen |
| Keine Baseline | False Positives bleiben verborgen | Leere und negative Tests |
| Datenschutz ignoriert | Video und Routinen sind sensibel | Einwilligung und Zugriff klären |
| Aufgaben vermischt | Labels passen nicht | Dataset nach Aufgabe wählen |
Kleiner Datensatzplan mit ESP32 und RuView
Passt kein öffentliches Dataset, erstelle ein kleines lokales Set: leerer Raum, Eintritt, Austritt, Gehen, Sitzen, Tür ohne Person und Router-Traffic ohne Bewegung.
Speichere rohes CSI, Features, Labels, Raumnotizen und Splits getrennt. Jede Vorhersage sollte auf eine Session zurückführbar sein.
- Benenne Sessions nach Datum, Raum, Platzierung, Band und Szenario.
- Trenne rohes CSI von Features.
- Reserviere eine Session oder einen Raum für Tests.
Warum diese Seite andere RuView-Seiten nicht kannibalisiert
Diese Seite ersetzt weder Homepage, GitHub-Guide, ESP32-Guide noch Motion-Capture-Seite. Sie behandelt Datasets, Benchmarks, Labels, Splits und Validierung.
Wer “ruview github” sucht, soll den GitHub-Guide finden. Wer “wifi sensing dataset” sucht, braucht Datenkriterien vor RuView, ESP32 oder einem öffentlichen Corpus.
Quellen und Dataset-Referenzen
FAQ zu WiFi-Sensing-Datasets
Welches Dataset eignet sich für Anfänger?
Für Modelllernen ist ein dokumentierter Benchmark wie SenseFi sinnvoll. Für eine RuView-Demo solltest du zusätzlich lokale Baselines erfassen.
Kann RuView mit jedem CSI-Dataset trainiert werden?
Nicht zuverlässig. Hardware, Raum, Labels und Aufgabe müssen passen.
Warum sind Leeraum-Baselines wichtig?
Sie trennen Umgebungsänderungen von menschlicher Aktivität und helfen gegen False Positives.
Sind WiFi-Sensing-Datasets datenschutzsensibel?
Ja. CSI kann Präsenz und Routinen zeigen; synchronisiertes Video braucht besondere Regeln.