No modelo Cross-Industry Standard Process for Data Mining (CRISP-DM), a relação entre as fases é caracterizada pela natureza iterativa. Sobre o paradigma desse modelo, é correto afirmar:
- A) O CRISP-DM é intrinsecamente cíclico, permitindo que o conhecimento descoberto em uma fase force o retorno a etapas anteriores.
- B) O CRISP-DM é um modelo em cascata (Waterfall), onde o avanço para a fase seguinte impede o retrocesso em qualquer hipótese.
- C) O modelo é linear e o foco visual das provas complexas deve estar exclusivamente no avanço sequencial das etapas.
Durante a execução de um projeto de mineração de dados, um cientista percebe, na Fase 2 (Entendimento de Dados), que as informações disponíveis são insuficientes para resolver o problema definido na Fase 1. Segundo o CRISP-DM, essa situação exige:
- A) O prosseguimento imediato para a Fase 3 para tentar imputar os dados faltantes de forma sintética.
- B) Um retorno à Fase 1 (Entendimento de Negócio) para redefinir o escopo do projeto.
- C) O cancelamento definitivo do projeto, visto que a Fase 2 nunca permite o retorno à Fase 1.
A Fase de Preparação de Dados (Data Preparation) é uma das etapas mais críticas do CRISP-DM. De acordo com o texto, essa fase é caracterizada por:
- A) Consumir entre 60% e 80% do tempo total do projeto e entregar como output o Dataset final pronto para consumo matemático.
- B) Ser uma etapa puramente passiva, focada apenas na descrição teórica das bases e mapeamento de nulos.
- C) Ocorrer sempre em apenas 10% do tempo do projeto, focando exclusivamente na calibração de hiperparâmetros.
Diferenciar a Fase 2 (Data Understanding) da Fase 3 (Data Preparation) é essencial para o sucesso em avaliações. Conforme a 'Regra de Ouro' apresentada nas fontes, a principal distinção reside no fato de que:
- A) A Fase 2 envolve ações ativas como imputação de dados, enquanto a Fase 3 é meramente passiva.
- B) A Fase 2 é passiva (identificar problemas), enquanto a Fase 3 é ativa (alterar dados e integrar bases).
- C) Ambas as fases são idênticas em termos de ação, focando exclusivamente no treinamento de algoritmos.
A banca examinadora costuma confundir o candidato sobre onde ocorre cada tipo de avaliação. Segundo a teoria do CRISP-DM, as métricas técnicas (como Acurácia e F1-Score) e a avaliação de negócio ocorrem, respectivamente, nas fases de:
- A) Modeling (Fase 4) e Evaluation (Fase 5).
- B) Evaluation (Fase 5) e Deployment (Fase 6).
- C) Data Understanding (Fase 2) e Business Understanding (Fase 1).
Mostrando 5 de 145 questões. Inicie o simulado para ver todas!