GUIA DE DATASETS WIFI

WiFi Sensing Dataset: como escolher dados CSI para RuView, HAR e presença

Um bom dataset de WiFi sensing precisa de hardware documentado, rótulos, baseline vazio, limites de tarefa e divisões de avaliação.

Infográfico de dados WiFi passando de uma sala para rótulos, baseline e validação
Um dataset confiável conecta CSI bruto, contexto da sala, rótulos, baselines e divisões de validação.

Quem procura um WiFi sensing dataset normalmente quer dados CSI públicos, um benchmark para comparar modelos ou exemplos realistas para testar uma demo sem câmera. Cada objetivo pede um tipo de dado.

Para RuView, o dataset define o que o modelo aprendeu. A demo mostra a interface, GitHub mostra o código e ESP32 mostra captura; os dados definem a validação.

O que um bom dataset WiFi sensing deve ter

Um bom dataset WiFi sensing documenta como o CSI foi capturado, não apenas as classes. Deve informar hardware, banda, antenas, ritmo de pacotes, sala, participantes, protocolo, sincronização e split de avaliação.

A tarefa é o filtro principal. HAR precisa de ações repetidas, presença precisa de sala vazia e ocupada, respiração precisa de referência independente e multiusuário precisa de rótulos de interação.

  • Prefira datasets com hardware, sala, participantes e rótulos explícitos.
  • Procure baselines vazias e testes negativos.
  • Verifique se o split separa pessoas, salas, sessões ou dispositivos.

Benchmarks públicos para comparar

Recursos públicos têm papéis diferentes. Awesome-WiFi-CSI-Sensing é um diretório, SenseFi ajuda a comparar modelos PyTorch, WiMANS cobre atividade multiusuário e CSI-Bench se aproxima de ambientes reais.

Um diretório ajuda a descobrir, uma biblioteca ajuda a reproduzir e um dataset de campo ajuda a medir robustez.

Recurso Melhor uso O que verificar
Awesome-WiFi-CSI-Sensing Encontrar papers e datasets Acesso e documentação
SenseFi Benchmark de modelos Datasets, modelos e splits
WiMANS Atividade multiusuário Rótulos, usuários e vídeo
CSI-Bench WiFi sensing realista Tarefas, dispositivos e acesso

Como escolher dados para RuView

Comece pela pergunta de RuView. Para presença, não use primeiro um dataset de gestos finos. Para generalização, evite splits da mesma sessão.

A checklist prática inclui CSI bruto, metadados, rótulos, baselines e splits. Sem isso, precisão pode ser memorização de uma sala.

  • Registre baseline local mesmo usando dados públicos.
  • Guarde tempos e testes negativos para movimento ou pose.
  • Documente consentimento e acesso quando houver vídeo sincronizado.

Erros comuns de dataset

O erro comum é tratar alta precisão em um dataset como garantia em outra sala. CSI muda com paredes, móveis, antenas, firmware e tráfego.

Também é comum misturar tarefas. Um dataset de gestos não prova presença multiusuário, e vídeo sincronizado pode ser sensível demais para uma demo leve.

Erro Risco Caminho melhor
Uma sala só Modelo memoriza multipath Testar salas e sessões
Sem baseline Falsos positivos passam Capturar vazio e negativos
Privacidade ignorada Vídeo e rotinas são sensíveis Explicar consentimento e acesso
Tarefas misturadas Rótulos não coincidem Escolher por tarefa

Plano pequeno com ESP32 e RuView

Se nenhum dataset público serve, crie um pequeno dataset local: sala vazia, entrada, saída, caminhada, sentar, porta sem pessoa e tráfego de roteador sem movimento.

Separe CSI bruto, features filtradas, rótulos, notas da sala e splits. Cada predição deve ser rastreável até uma sessão.

  • Nomeie sessões por data, sala, dispositivo, banda e cenário.
  • Separe CSI bruto de features processadas.
  • Reserve uma sessão ou sala para teste.
WiFi sensing dataset checklist with raw CSI, labels, baseline, and validation stages
Dataset quality improves when capture, labels, baseline, and validation are planned before modeling.

Por que esta página não compete com outras páginas RuView

Esta página não substitui a home, o guia GitHub, o guia ESP32 nem motion capture. Ela trata de datasets, benchmarks, rótulos, splits e validação.

Quem busca “ruview github” deve ir ao guia GitHub. Quem busca “wifi sensing dataset” precisa de critérios de dados antes de RuView, ESP32 ou um corpus público.

Fontes e referências de datasets

FAQ sobre datasets WiFi sensing

Qual dataset é melhor para começar?

Para aprender modelos, comece com um benchmark documentado como SenseFi. Para uma demo RuView real, colete uma baseline local.

Posso treinar RuView com qualquer dataset CSI?

Não de forma segura. Hardware, sala, rótulos e tarefa precisam coincidir.

Por que a sala vazia importa?

Ela revela mudanças ambientais e ajuda a encontrar falsos positivos.

Datasets WiFi sensing são sensíveis?

Sim. CSI pode revelar presença e rotinas; vídeo sincronizado exige ainda mais cuidado.