WiFi Sensing Dataset Guide: CSIデータ、ラベル、RuView検証

WiFi sensing datasetを探す人は、多くの場合、公開CSIデータ、モデル比較用benchmark、またはカメラなしデモを検証する現実的なサンプルを求めています。目的が違えば、適したdatasetも変わります。

RuViewではdatasetが信号層の前提を決めます。デモは体験、GitHubはコード、ESP32ガイドは取得方法を示しますが、モデルが何を学んだかはデータで決まります。

良いWiFi sensing datasetの条件

良いWiFi sensing datasetは、class labelだけでなくCSIの取得方法を説明します。hardware、WiFi band、antenna、packet rate、部屋、参加者、protocol、同期方法、評価splitが確認できることが重要です。

最初に見るべきなのは目的との一致です。HARには反復された行動label、在室検知には空室と在室のtrial、呼吸には独立したreference、multi-userには複数人の相互作用labelが必要です。

hardware、部屋、参加者、labelが明記されたdatasetを優先します。
成功例だけでなく空室baselineとnegative trialを確認します。
splitが人、部屋、session、deviceを分けているか確認します。

比較したい公開benchmark

公開resourceには役割の違いがあります。Awesome-WiFi-CSI-Sensingはpaperとdatasetのdirectory、SenseFiはPyTorch benchmark、WiMANSはmulti-user活動、CSI-Benchは実環境に近いWiFi sensingを扱います。

directoryは発見に、benchmarkは再現に、実環境datasetはrobustness確認に向いています。

Resource	向いている用途	確認点
Awesome-WiFi-CSI-Sensing	paperとdataset探索	現在もアクセス可能か
SenseFi	model benchmark	dataset、model、split
WiMANS	multi-user activity	label、人数、reference video
CSI-Bench	実環境WiFi sensing	task、device、access条件

RuViewワークフロー向けデータの選び方

まずRuViewで答えたい問いを決めます。在室検知なら細かいgesture datasetから始めるべきではありません。汎化を見たいなら同一session内のrandom splitは弱い根拠です。

実用的なchecklistはraw CSI、metadata、scenario label、baseline、validation splitです。これがないと、精度は部屋の記憶を示しているだけかもしれません。

公開dataを使う場合でもlocal baselineを取ります。
motionやposeではtimestampとnegative trialを残します。
video同期がある場合は同意とaccess制限を記録します。

よくあるdatasetの失敗

最も多い失敗は、1つのdatasetで高精度なら別の部屋でも使えると考えることです。CSIは壁、家具、antenna、firmware、trafficに強く影響されます。

taskの混同も危険です。gesture datasetはmulti-user presenceを証明せず、video付きbenchmarkは軽量demoにはprivacy面で重い場合があります。

失敗	問題	安全な進め方
1部屋だけで証明	multipathを記憶する	部屋とsessionを分ける
baselineなし	false positiveを見逃す	空室とnegativeを取る
privacy軽視	videoやroutineが敏感	同意とaccessを説明
task混同	labelが一致しない	taskからdatasetを選ぶ

ESP32とRuView向けの小さな収集計画

公開datasetが合わない場合は、小さなlocal datasetを作ります。空室、入室、退室、歩行、着席、人なしのドア開閉、動きなしのrouter trafficを記録します。

raw CSI、filtered feature、label、room note、split定義を分けて保存します。将来の予測はcapture sessionまで追跡できるべきです。

session名に日付、部屋、device配置、band、scenarioを入れます。
raw CSIと処理済みfeatureを分離します。
少なくとも1つのsessionまたは部屋をtest用に残します。

WiFi sensing dataset checklist with raw CSI, labels, baseline, and validation stages — Dataset quality improves when capture, labels, baseline, and validation are planned before modeling.

既存RuViewページと競合しない理由

このページはhomepage、GitHub guide、ESP32 guide、motion captureページの代替ではありません。dataset選択、benchmark比較、label、split、validation planningを扱います。

“ruview github”検索はGitHub guideへ、“wifi sensing dataset”検索はRuViewやESP32の前にdata quality criteriaへ進むべきです。

検索意図の整理: dataset、benchmark、tutorial、local capture

WiFi sensing dataset という語は、CSI コーパス、benchmark ライブラリ、ESP32 チュートリアル用データ、RuView デモの検証計画など複数の意味を持ちます。

学習なら文書化された benchmark、製品検証なら local baseline、HAR なら反復ラベル、presence なら空室と false positive を優先します。

Record the source, hardware, labels, validation limits, and negative cases.
Keep the page intent separate from related RuView pages.
Use local validation before making safety, health, or security claims.

データセット参考資料

Directory Awesome-WiFi-CSI-Sensing dataset and paper directory Benchmark SenseFi WiFi CSI sensing benchmark Dataset WiMANS multi-user WiFi activity sensing dataset Benchmark CSI-Bench in-the-wild multitask WiFi sensing dataset

WiFi Sensing Dataset FAQ

初心者に最適なdatasetは何ですか？

モデル学習ならSenseFiのような文書化されたbenchmarkから始め、RuView実験ではローカルbaselineも収集します。

RuViewを任意のCSI datasetで直接学習できますか？

安全とは言えません。hardware、部屋、label、taskが一致する必要があります。

空室baselineはなぜ重要ですか？

環境や通信による変化と人による変化を分け、false positiveを見つけるためです。

WiFi sensing datasetはプライバシー上敏感ですか？

はい。CSIでも在室や行動パターンを示す可能性があり、同期video付きdatasetは特に注意が必要です。

公開 WiFi sensing dataset と自分の収集データのどちらを使うべきですか？

公開データは pipeline 学習と比較に使い、特定の部屋で RuView 型の結果を出すなら自分の baseline を収集します。