Eu quero criar um gráfico de dispersão onde cada ponto de dados é diferente (ícone diferente, cor diferente, etc.) baseado no valor de uma coluna.
Estou aprendendo modelos de classificação e quero fazer um gráfico de dispersão no Excel que (1) mapeie duas variáveis independentes nos eixos xey, e (2) altere o ponto de dados com base em uma terceira variável independente.
Exemplo: tenho uma tabela com três colunas: Erros (erros de ortografia em um email), Destinatários (número de destinatários na seção Para de um email) e Spam (1 para mensagens de spam, 2 para mensagens não spam). Parece assim:
Errors, Recipients, Spam
20,200,1
18,175,1
32,100,1
15,123,1
2,10,0
5,8,0
9,27,0
15,20,1
15,20,0
8,300,0
9,357,1
De relance, as mensagens com altos erros e altos destinatários têm maior probabilidade de ser spam. Mensagens com erros baixos e destinatários baixos provavelmente não serão spam. Mensagens com mixagens altas e baixas são menos previsíveis. Eu quero mostrar isso em um plano de dispersão.
Eu posso fazer um gráfico de dispersão com Erros no eixo Y e Destinatários no eixo X. O que eu também preciso fazer é alterar cada ponto de dados para ser um "+" ou "-" com base em se a célula de spam é um 1 ou 0.
Eu sei que é possível alterar a aparência de todos os pontos de dados e alterar manualmente os pontos de dados individuais. Mas é possível, automaticamente, alterar condicionalmente a aparência dos pontos de dados com base em um valor de coluna?