Summary
Full Transcript
---------------------------------------------------------------------------------------------------------------------- ⇒Aprofunde seus conhecimentos em estatística e ciência de dados com meu livro: •https://maironchaves.manus.space/ ⇒Podcast de apresentação do livro: •https://www.youtube.com/watch?v=8QoNOpgDWqY ---------------------------------------------------------------------------------------------------------------------- 📊 Resumo do Vídeo: "Curso Ciência de Dados - Do Zero ao Iniciante (Aula 7: Analisando Relação entre Variáveis)" Neste vídeo, StatiR aborda como analisar a relação entre variáveis, explorando gráficos de dispersão e o coeficiente de correlação linear. A aula é essencial para entender interações entre variáveis numéricas em projetos de ciência de dados. 📈 1. Análise de Relação com Gráficos de Dispersão Gráfico de Dispersão (Scatterplot): Usado para visualizar se existe relação entre duas variáveis numéricas. Exemplo: Relação entre o preço de um café e o volume de vendas. Padrão observado: Conforme o preço aumenta, as vendas diminuem (relação negativa). Interpretação: Pontos mais próximos indicam relação mais forte entre as variáveis. Padrões podem ser positivos (ambas aumentam) ou negativos (uma aumenta e outra diminui). 📊 2. Coeficiente de Correlação Linear Definição: Mede a força e a direção da relação linear entre duas variáveis. Valores variam de -1 a 1: 1: Relação positiva perfeita (uma variável cresce com a outra). -1: Relação negativa perfeita (uma cresce enquanto a outra diminui). 0: Nenhuma relação linear (as variáveis são independentes). Exemplo: Correlação entre preço e vendas = -0,84: Forte correlação negativa. Interpretação: Quanto maior o preço, menor a venda. 📐 3. Força da Correlação Tabela de Referência: 0,70 a 1,0: Correlação positiva forte. 0,30 a 0,69: Correlação positiva moderada. 0,00 a 0,29: Correlação positiva fraca. -0,30 a -0,69: Correlação negativa moderada. -0,70 a -1,0: Correlação negativa forte. Importância de Visualizar o Gráfico: Algumas relações não lineares podem ter coeficiente elevado, mas exigem atenção especial para interpretação. 🔧 4. Aplicação Prática Previsão de Tempo de Entrega: Variáveis: Número de itens e distância até o cliente. Gráfico de dispersão entre número de itens e tempo de entrega: Correlação positiva de 0,71: Relação forte e direta. Conclusão: Mais itens no pedido aumentam o tempo de entrega. Importância do Contexto: Alta correlação indica que a variável pode ser usada em modelos preditivos. Outras variáveis (como distância) podem complementar o modelo.
