WIFI DATASET GUIDE

WiFi Sensing Dataset: RuView、HAR、在室検知向けCSIデータの選び方

有用なWiFi sensing datasetには、ハードウェア、ラベル、空室ベースライン、タスク範囲、評価分割が必要です。

WiFi sensingデータが部屋からラベル、ベースライン、検証へ流れる情報図
信頼できるdatasetは、raw CSI、部屋の条件、ラベル、ベースライン、評価分割を結びます。

WiFi sensing datasetを探す人は、多くの場合、公開CSIデータ、モデル比較用benchmark、またはカメラなしデモを検証する現実的なサンプルを求めています。目的が違えば、適したdatasetも変わります。

RuViewではdatasetが信号層の前提を決めます。デモは体験、GitHubはコード、ESP32ガイドは取得方法を示しますが、モデルが何を学んだかはデータで決まります。

良いWiFi sensing datasetの条件

良いWiFi sensing datasetは、class labelだけでなくCSIの取得方法を説明します。hardware、WiFi band、antenna、packet rate、部屋、参加者、protocol、同期方法、評価splitが確認できることが重要です。

最初に見るべきなのは目的との一致です。HARには反復された行動label、在室検知には空室と在室のtrial、呼吸には独立したreference、multi-userには複数人の相互作用labelが必要です。

  • hardware、部屋、参加者、labelが明記されたdatasetを優先します。
  • 成功例だけでなく空室baselineとnegative trialを確認します。
  • splitが人、部屋、session、deviceを分けているか確認します。

比較したい公開benchmark

公開resourceには役割の違いがあります。Awesome-WiFi-CSI-Sensingはpaperとdatasetのdirectory、SenseFiはPyTorch benchmark、WiMANSはmulti-user活動、CSI-Benchは実環境に近いWiFi sensingを扱います。

directoryは発見に、benchmarkは再現に、実環境datasetはrobustness確認に向いています。

Resource 向いている用途 確認点
Awesome-WiFi-CSI-Sensing paperとdataset探索 現在もアクセス可能か
SenseFi model benchmark dataset、model、split
WiMANS multi-user activity label、人数、reference video
CSI-Bench 実環境WiFi sensing task、device、access条件

RuViewワークフロー向けデータの選び方

まずRuViewで答えたい問いを決めます。在室検知なら細かいgesture datasetから始めるべきではありません。汎化を見たいなら同一session内のrandom splitは弱い根拠です。

実用的なchecklistはraw CSI、metadata、scenario label、baseline、validation splitです。これがないと、精度は部屋の記憶を示しているだけかもしれません。

  • 公開dataを使う場合でもlocal baselineを取ります。
  • motionやposeではtimestampとnegative trialを残します。
  • video同期がある場合は同意とaccess制限を記録します。

よくあるdatasetの失敗

最も多い失敗は、1つのdatasetで高精度なら別の部屋でも使えると考えることです。CSIは壁、家具、antenna、firmware、trafficに強く影響されます。

taskの混同も危険です。gesture datasetはmulti-user presenceを証明せず、video付きbenchmarkは軽量demoにはprivacy面で重い場合があります。

失敗 問題 安全な進め方
1部屋だけで証明 multipathを記憶する 部屋とsessionを分ける
baselineなし false positiveを見逃す 空室とnegativeを取る
privacy軽視 videoやroutineが敏感 同意とaccessを説明
task混同 labelが一致しない taskからdatasetを選ぶ

ESP32とRuView向けの小さな収集計画

公開datasetが合わない場合は、小さなlocal datasetを作ります。空室、入室、退室、歩行、着席、人なしのドア開閉、動きなしのrouter trafficを記録します。

raw CSI、filtered feature、label、room note、split定義を分けて保存します。将来の予測はcapture sessionまで追跡できるべきです。

  • session名に日付、部屋、device配置、band、scenarioを入れます。
  • raw CSIと処理済みfeatureを分離します。
  • 少なくとも1つのsessionまたは部屋をtest用に残します。
WiFi sensing dataset checklist with raw CSI, labels, baseline, and validation stages
Dataset quality improves when capture, labels, baseline, and validation are planned before modeling.

既存RuViewページと競合しない理由

このページはhomepage、GitHub guide、ESP32 guide、motion captureページの代替ではありません。dataset選択、benchmark比較、label、split、validation planningを扱います。

“ruview github”検索はGitHub guideへ、“wifi sensing dataset”検索はRuViewやESP32の前にdata quality criteriaへ進むべきです。

データセット参考資料

WiFi Sensing Dataset FAQ

初心者に最適なdatasetは何ですか?

モデル学習ならSenseFiのような文書化されたbenchmarkから始め、RuView実験ではローカルbaselineも収集します。

RuViewを任意のCSI datasetで直接学習できますか?

安全とは言えません。hardware、部屋、label、taskが一致する必要があります。

空室baselineはなぜ重要ですか?

環境や通信による変化と人による変化を分け、false positiveを見つけるためです。

WiFi sensing datasetはプライバシー上敏感ですか?

はい。CSIでも在室や行動パターンを示す可能性があり、同期video付きdatasetは特に注意が必要です。