WiFi sensing datasetを探す人は、多くの場合、公開CSIデータ、モデル比較用benchmark、またはカメラなしデモを検証する現実的なサンプルを求めています。目的が違えば、適したdatasetも変わります。
RuViewではdatasetが信号層の前提を決めます。デモは体験、GitHubはコード、ESP32ガイドは取得方法を示しますが、モデルが何を学んだかはデータで決まります。
良いWiFi sensing datasetの条件
良いWiFi sensing datasetは、class labelだけでなくCSIの取得方法を説明します。hardware、WiFi band、antenna、packet rate、部屋、参加者、protocol、同期方法、評価splitが確認できることが重要です。
最初に見るべきなのは目的との一致です。HARには反復された行動label、在室検知には空室と在室のtrial、呼吸には独立したreference、multi-userには複数人の相互作用labelが必要です。
- hardware、部屋、参加者、labelが明記されたdatasetを優先します。
- 成功例だけでなく空室baselineとnegative trialを確認します。
- splitが人、部屋、session、deviceを分けているか確認します。
比較したい公開benchmark
公開resourceには役割の違いがあります。Awesome-WiFi-CSI-Sensingはpaperとdatasetのdirectory、SenseFiはPyTorch benchmark、WiMANSはmulti-user活動、CSI-Benchは実環境に近いWiFi sensingを扱います。
directoryは発見に、benchmarkは再現に、実環境datasetはrobustness確認に向いています。
| Resource | 向いている用途 | 確認点 |
|---|---|---|
| Awesome-WiFi-CSI-Sensing | paperとdataset探索 | 現在もアクセス可能か |
| SenseFi | model benchmark | dataset、model、split |
| WiMANS | multi-user activity | label、人数、reference video |
| CSI-Bench | 実環境WiFi sensing | task、device、access条件 |
RuViewワークフロー向けデータの選び方
まずRuViewで答えたい問いを決めます。在室検知なら細かいgesture datasetから始めるべきではありません。汎化を見たいなら同一session内のrandom splitは弱い根拠です。
実用的なchecklistはraw CSI、metadata、scenario label、baseline、validation splitです。これがないと、精度は部屋の記憶を示しているだけかもしれません。
- 公開dataを使う場合でもlocal baselineを取ります。
- motionやposeではtimestampとnegative trialを残します。
- video同期がある場合は同意とaccess制限を記録します。
よくあるdatasetの失敗
最も多い失敗は、1つのdatasetで高精度なら別の部屋でも使えると考えることです。CSIは壁、家具、antenna、firmware、trafficに強く影響されます。
taskの混同も危険です。gesture datasetはmulti-user presenceを証明せず、video付きbenchmarkは軽量demoにはprivacy面で重い場合があります。
| 失敗 | 問題 | 安全な進め方 |
|---|---|---|
| 1部屋だけで証明 | multipathを記憶する | 部屋とsessionを分ける |
| baselineなし | false positiveを見逃す | 空室とnegativeを取る |
| privacy軽視 | videoやroutineが敏感 | 同意とaccessを説明 |
| task混同 | labelが一致しない | taskからdatasetを選ぶ |
ESP32とRuView向けの小さな収集計画
公開datasetが合わない場合は、小さなlocal datasetを作ります。空室、入室、退室、歩行、着席、人なしのドア開閉、動きなしのrouter trafficを記録します。
raw CSI、filtered feature、label、room note、split定義を分けて保存します。将来の予測はcapture sessionまで追跡できるべきです。
- session名に日付、部屋、device配置、band、scenarioを入れます。
- raw CSIと処理済みfeatureを分離します。
- 少なくとも1つのsessionまたは部屋をtest用に残します。
既存RuViewページと競合しない理由
このページはhomepage、GitHub guide、ESP32 guide、motion captureページの代替ではありません。dataset選択、benchmark比較、label、split、validation planningを扱います。
“ruview github”検索はGitHub guideへ、“wifi sensing dataset”検索はRuViewやESP32の前にdata quality criteriaへ進むべきです。
データセット参考資料
WiFi Sensing Dataset FAQ
初心者に最適なdatasetは何ですか?
モデル学習ならSenseFiのような文書化されたbenchmarkから始め、RuView実験ではローカルbaselineも収集します。
RuViewを任意のCSI datasetで直接学習できますか?
安全とは言えません。hardware、部屋、label、taskが一致する必要があります。
空室baselineはなぜ重要ですか?
環境や通信による変化と人による変化を分け、false positiveを見つけるためです。
WiFi sensing datasetはプライバシー上敏感ですか?
はい。CSIでも在室や行動パターンを示す可能性があり、同期video付きdatasetは特に注意が必要です。