Future City Lab: estatísticas de bairros

Estatísticas qui-quadrado

Interdisciplinar

Palavras-chave: hipótese nula, viés, significância estatística, qui-quadrado, valor de p, ciências sociais
Imagem
Fonte: www.flickr.com/franciscodaum

Objetivos

Os alunos

  • Derive e use testes qui-quadrado  

  • Explicar o uso deste teste no contexto da demografia da cidade de Nova York 

  • Comparar e contrastar ciências sociais com a chamada "ciência difícil" 

  • Considere até que ponto as estatísticas são úteis no estudo de humanos 

Materiais

  • Um saco de 30 contas (ou Skittles) por par de alunos. Deve haver cinco cores diferentes. 

  • Folhetos (dois folhetos de atividades do aluno, uma folha de dados e uma chave do professor)

  • Calculadoras 

Normas: 

  • CCSS.ELA-LITERACY.RST.9-10.7: Traduza informações quantitativas ou técnicas expressas em palavras em um texto em forma visual (por exemplo, uma tabela ou gráfico) e traduza informações expressas visual ou matematicamente (por exemplo, em uma equação) em palavras. 

  • CCSS.MATH.CONTENT.HSS.MD.A.4: Desenvolva uma distribuição de probabilidade para uma variável aleatória definida para um espaço de amostra no qual as probabilidades são atribuídas empiricamente; encontre o valor esperado.  

Questões Guia

  1. Como você pode testar se um grupo é distribuído aleatoriamente? 

  2. Quais são as principais diferenças entre as “ciências duras” e as “ciências sociais” e quais são as limitações de dados em cada uma? 

  3. Como podemos usar as estatísticas de hoje para nos ajudar a entender o passado? 

    Procedimentos

    As tabelas qui-quadrado são ferramentas para ajudar os cientistas a entender se os dados são significativamente diferentes de um resultado aleatório - em outras palavras, se existe algum fator externo em jogo que precisa ser explicado. Eles são frequentemente ilustrados na sala de aula usando objetos inanimados ou atores não humanos (contas, resultados genéticos). Esta lição considera se métodos estatísticos como os qui-quadrados podem ser úteis para avaliar o comportamento humano e se pode ser uma ferramenta a ser considerada na sala de aula de história. Um tutorial útil para o professor de sala de aula não científica pode ser encontrado aqui: http://www.ling.upenn.edu/~clight/chisquared.htm . 

    Na primeira parte da lição, os alunos derivam os valores do qui-quadrado testando a distribuição das contas. Em seguida, os alunos são apresentados a um problema mais difícil: os diferentes grupos étnicos em Nova York são distribuídos aleatoriamente? Os alunos podem determinar isso usando calculadoras. (Todos os bairros da cidade de Nova York que receberão têm valores significativamente altos de qui-quadrado.) O professor então conduzirá os alunos por uma discussão sobre se esses tipos de ferramentas podem ser significativos na análise do comportamento humano e uma discussão sobre o diferenças entre ciências sociais e “ciências duras” de forma mais geral Finalmente, a lição termina com uma discussão sobre se essas ferramentas são úteis na análise da história e aponta para recursos que exploram fatores históricos que influenciam o motivo pelo qual as pessoas na cidade de Nova York são agrupadas de forma não aleatória. 

    Faça o download da planilha de atividades de contas de bairro

    Faça o download do folheto demográfico de estatísticas de bairro

    Faça o download da tabela de dados de estatísticas de bairro

    Faça o download da chave do professor de Estatísticas do bairro

  1. Gancho
  2. Faça uma afirmação bizarra para os alunos, algo como "Pessoas que usam camisas de botões podem pular mais alto do que aquelas que usam camisetas". Encontre um aluno para discordar de você. Pergunte à classe: Quem tem o ônus da prova? O que devemos presumir sem evidências? Por quê? Peça aos alunos que compartilhem as respostas. 

    Explique que o objetivo de todas as experiências é testar o hipótese nula. Hipóteses são explicações testáveis ​​para fenômenos. A hipótese nula é a hipótese que explica quaisquer diferenças como resultado da aleatoriedade / acaso. Até que evidências suficientes sejam descobertas, não podemos adotar novas hipóteses (alternativas).  

    A hipótese alternativa específica proposta pelo professor (Halt) foi: As diferenças entre as alturas das pessoas podem ser previstas pelo tipo de camisa que elas vestem. 

    A hipótese nula (H0) para o exemplo de camiseta seria: As diferenças entre as alturas de salto das pessoas não estão relacionadas à camisa que vestem. 

    Como podemos descobrir o que é correto? É aqui que entra a análise do qui-quadrado. 

  3. Prática
  4. Explique aos alunos que você encheu cada sacola com 30 contas de cinco cores diferentes. O trabalho deles é determinar se você fez isso aleatoriamente ou com um viés. Verifique os alunos: Qual explicação é a hipótese nula? (Resposta: A hipótese nula é que eles foram distribuídos aleatoriamente, sem viés.) 

    Pergunte: se a hipótese nula (sem viés) for verdadeira, qual você esperaria que fosse a distribuição das contas? (Resposta: eu esperaria que com 30 contas e 5 cores houvesse 6 de cada.)  

    Como um cientista / estatístico pode determinar a que distância os números reais (observados) estão do esperado? Dê aos alunos tempo para debater possíveis soluções matemáticas. Eles devem ter a subtração como a maneira de medir a diferença. 

    A equação para o qui-quadrado é: 

    x2 = [SOMA] (o - e)/ e

    o = observado (isso seria quantos de cada categoria realmente existem) 

    e = esperado (este é o valor previsto por acaso) 

    A diferença representa o quão longe cada valor está da previsão do H0

    As diferenças são quadradas para eliminar números negativos. Então eles são divididos pelo valor esperado. É como fazer uma média. 

    Os valores resultantes são todos somados (denotados pela soma, ou sigma na apostila) Quanto maiores as diferenças, maior será o valor do qui-quadrado. Observe que não há consideração sobre o tamanho da amostra aqui, portanto, uma amostra maior em geral significará um valor qui-quadrado maior. 

    Explicação: Qui-quadrado é um valor que mede a distância entre o observado e o esperado. Se estiver longe o suficiente, podemos rejeitar a hipótese nula. Em outras palavras, podemos dizer neste caso que você, o professor, não agiu de forma aleatória. Em vez disso, por algum motivo, você selecionou quais contas dar a cada grupo e, portanto, agiu com parcialidade. Naturalmente, este teste não pode determinar de onde vem esse viés. Peça aos alunos que apresentem suas próprias hipóteses alternativas. Os exemplos podem incluir: 

    1.) O professor prefere usar uma conta de determinada cor em vez de contas de outra cor. 

    2.) A escolha do professor foi aleatória, mas a fonte original das contas não tinha o mesmo número de cada cor.  

    Peça aos alunos que sigam as instruções na apostila para testar sua própria bolsa. O precisará calcular os graus de liberdade (número de cores - 1) e aprender a usar o gráfico de valor p. Todas as tabelas e gráficos são fornecidos na planilha.  

  5. Resumo
  6. Os alunos compartilham os resultados em grupo, tomam a decisão do grupo de saber se houve algum viés na distribuição das contas. 

  7. Aplicar
  8. Os alunos são apresentados a dados demográficos reais de bairros na cidade de Nova York do Departamento de Educação. A primeira tarefa é determinar qual é a hipótese nula: Se o censo dos EUA nos diz que 29% dos nova-iorquinos se identificam como hispânicos, o que a hipótese nula afirmaria sobre a população de pessoas em um determinado bairro da cidade? (Resposta: Esperamos que 29% das pessoas em cada bairro sejam de origem hispânica.) 

    Os alunos escolhem um bairro no folheto de dados fornecido para testar. Como o qui-quadrado só funciona bem com tamanhos de amostra menores, eles não devem usar os dados brutos. Eles podem usar as porcentagens como amostra, como se cada bairro tivesse apenas 100 pessoas. Esse trabalho pode ser feito na apostila com calculadoras. 

  9. Analisar os dados
  10. Peça aos alunos que compartilhem seus resultados. Por que todos os bairros têm um valor qui-quadrado significativo? O que isso significa estatisticamente? (Cada bairro tem um valor significativo de qui-quadrado. Isso significa que podemos rejeitar a hipótese nula de que as pessoas são distribuídas aleatoriamente.) 

    Reforçar: os dados mostram que as populações não estão distribuídas aleatoriamente nesses bairros de Nova York - mas os dados também não podem nos dizer por quê. A análise do qui-quadrado simplesmente nos permite saber que algum tipo de viés está em jogo e que a diferença entre os resultados reais e os esperados é estatisticamente significativa. Neste cenário, determinar porque esse pode ser o caso é tradicionalmente o domínio das ciências sociais - não estatísticas. 

  11. Discussão: a natureza das ciências sociais
  12. Use essas perguntas para orientar uma discussão aprofundada e / ou atividade de redação sobre as possíveis aplicações das habilidades que os alunos acabaram de aprender. 

    Explique aos alunos que os qui-quadrados são tradicionalmente usados ​​com populações que não exercem escolha (como no caso das contas ou bolinhos na primeira atividade). A análise do comportamento humano geralmente tem sido o domínio das chamadas “ciências sociais” (por exemplo, psicologia, economia, sociologia, ciência política e história).  

    perguntar: O que as “ciências duras” e as “ciências sociais” têm em comum?  

    perguntar: Quais são os desafios exclusivos das ciências sociais? Por que é mais difícil tirar conclusões de um estudo com seres humanos do que uma de plantas ou até modelar animais como ratos? É útil quantificar o comportamento humano? Que uso potencial são os dados demográficos? Quais são as limitações de estudos estatísticos como este? 

    perguntar: Por que faz sentido que possamos rejeitar a hipótese nula em todos os bairros que analisamos? (Espere respostas na linha de: as pessoas escolhem onde moram ou as pessoas são limitadas pelo que podem pagar.)  

    Sobre o tema das escolhas dos imigrantes: Por que grupos de pessoas podem optar por morar perto um do outro? 

    Sobre o tema de outros fatores externos: Que outros fatores podem limitar a escolha dos imigrantes em termos de onde eles podem morar? 

  13. Discussão: Introdução aos fatores históricos
  14. Ao longo da história da cidade de Nova York, certos grupos de pessoas foram coagidos ou forçados a viver em determinadas áreas - ou, pelo menos, foram impedidos de viver nas partes mais "desejáveis" da cidade. Em meados do século 20, redlining - em que os afro-americanos eram negados com hipotecas em bairros tradicionalmente negros - impediram muitos afro-americanos de possuir casas (e, assim, ingressaram na classe média), e ajudaram a concentrar os afro-americanos em certas seções da cidade. Por outro lado, muitos afro-americanos se mudaram para bairros tradicionalmente negros como o Harlem, que serviram como um espaço seguro em meio à violência de Jim Crow America e permitiram a liberdade de criação, pensamento e expressão que fomentou o Renascimento do Harlem.  

    Com o empurra-empurra da história em jogo e múltiplos fatores e contextos históricos informando as escolhas (ou falta de escolha) dos atores humanos, podemos usar a análise estatística como uma ferramenta significativa na história? Se você estivesse escrevendo um artigo de história, consideraria incluir a análise do qui-quadrado para apoiar seu argumento? 

Recursos adicionais 

Use este site para ensinar sobre a história da redlining: como as políticas da década de 1940 resultaram na segregação de fato nas cidades: https://dsl.richmond.edu/panorama/redlining/ 

Para uma história abrangente de redlining, consulte Richard Rothstein A cor da lei: uma história esquecida de como o nosso governo segregou a América (Live Right, 2017). 

Viagens de campo: este conteúdo é inspirado no Cidade mundial, 1898-2012 e Laboratório da Cidade do Futuro galerias na principal exposição do Museu, Nova York no seu núcleo. Se possível, considere levar seus alunos em uma excursão! Visita http://mcny.org/education/field-trips para saber mais. 

Agradecimentos

Esta série de planos de aula para Nova York no seu núcleo foi desenvolvido em conjunto com um grupo focal de professores de escolas públicas de Nova York: Joy Canning, Max Chomet, Vassili Frantzis, JoAnn Gensert Ph.D., Jessica Lam, Patty Ng e Patricia Schultz.

Este projeto foi possibilitado em parte pelo Instituto de Serviços de Museus e Bibliotecas.

As opiniões, descobertas, conclusões ou recomendações expressas nessas lições não representam necessariamente as do Instituto de Serviços de Museus e Bibliotecas.