Qual é a melhor maneira de visualizar dados de alta dimensão?
Não acho que haja uma melhor maneira universal de visualizar dados de alta dimensão. Depende dos dados. Se você usar [matemática]{ggplot2}[/math] existem facilidades para sub-configuração, bem como para mapear cores, formas, tamanho, transparência em variáveis.Geralmente eu aconselharia as pessoas a evitarem o uso de um método de plot-method exótico e em vez disso, primeiro pergunte-se se existem realmente 12 dimensões de interações interessantes, ou se você pode reduzir a dimensionalidade, seja traçando menos dimensões de cada vez (por exemplo, R's default 2-way interaction plot)
>>br> ou subtraindo, dividindo, sub-configurando, projetando, e/ou mudando a base (por exemplo, PCA). Por exemplo, gráficos de faceta em ggplot podem ser usados quando o subconjunto A é coerente e notavelmente diferente do subconjunto B (também coerente consigo mesmo).
>
Também discordo que as pessoas não consigam entender dimensões elevadas. Aqui está minha resposta para Como você pode visualizar algo que tem mais de 3 dimensões? O truque principal que uso é pensar em ℤⁿ como um gráfico com 2n vértices por nó. (Então pense em apenas um canto de um cubo: ele tem 3 linhas saindo dele. Apenas um canto de um quadrado: tem 2 linhas saindo dele). Há "mais vizinhos" assim como mais direções para ir no espaço em alto-D.
>
Há várias maneiras de imaginar >3D.
>
>
- >
- >>br>>br>>>>br>>>/li>>>>img src="https://qph.fs.quoracdn.net/main-qimg-9ea4cbb1b0c8171538259e9aee963a28.webp">
- >>br>>>br>>>/li>>li>Outro é por projecção (a "sombra" de um objecto de dimensão superior em 3-D. Tony Robbin dá o exemplo de "Como é a sombra de uma cadeira [3-D] no chão [2-D]?").
<
- <
- >br>>>/li>
- >li>>pode fazer uso de variações gráficas como pontos' forma, cor (ou obter 3 dimensões a partir da cor com ex. Lab), ou tempo.
- >
>>/li>- Isto não é um visual útil, mas você pode trivialmente refutar alguém que diz "People don't deal in higher than three dimensions", apontando que cada pixel na sua tela é um dado que pode variar - assim mesmo lendo esta mensagem você're olhando para um espaço de alta dimensão. (E a resposta apropriada para "Como você vê o espaço tetradimensional?" é "Como você vê o espaço tetradimensional?").>li>meu favorito é pensar em planilhas do Excel. (aqui eu mostro o código R para gerar um cubo 4-dimensional [0,1]×[0,1]×[0,1]×[0,1], cujos cantos se parecem com isto:
>br>0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 1 1 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 1 0 0 0 1 0 0 0 1
0 1 0 1 0 1
1 1 0 1 1 0 1
0 1 1 1 1 1 1
0 1 1 1 1 1 1 1
>1 1 1 1 1 1
- >>br>>>br>>>/li>>li>Outro é por projecção (a "sombra" de um objecto de dimensão superior em 3-D. Tony Robbin dá o exemplo de "Como é a sombra de uma cadeira [3-D] no chão [2-D]?").
Se você trabalha com planilhas com muitas colunas, você trabalha com colunas altasdados dimensionais. Às vezes você precisa invocar uma tabela Pivot onde você apenas olha (coluna 4 == 9) ou algo assim. Esse é o subconjunto inferior de dados que contém a coluna 4 constante.
>br>Check out Bill Thurston and isomorphismes: higher dimensions for longer explanations.
>p>>>p>---------------------------
>p>
p>P>Regarding Hinton's quote, eu discordei disso quando ouvi e ainda ouço. It's not how I visualise 4+ dimensions and I don't think it's how others do either. Por um lado as relações de vizinhança engrossam (pense em uma projeção gráfica de cubos de dimensões superiores.
<
> O número de bordas por vértice aumentará em dimensões superiores, mesmo quando o número de vértices também aumentar. Assim, sua "onda 3-D suas mãos" teria basicamente buracos de minhoca por toda parte se a dimensionalidade for grande o suficiente. Nas palavras de Hinton' em uma mercearia de 10 dimensões (ou biblioteca) mais coisas poderiam estar próximas umas das outras. É por isso que a topologia low-D é mais interessante do que a topologia high-D: it'é difícil para um nó ficar atado quando ele pode passar por dimensões "extras".
>br>Eu também tenho em mente a relação entre esferas e cubos como dois tipos básicos de formas em um espaço high-D: a maior parte da massa de um cubo está em seus muitos cantos pontiagudos.
tl,dr: Pense em colunas em uma planilha do Excel. Cada coluna é uma variável. Quando os valores em 5 das colunas permanecem os mesmos (ordenados) e a 6ª coluna está mudando, você está observando a variação na sexta dimensão .
Also: require(ggplot2); data(msleep); qplot(data=msleep, x=sleep_rem/sleep_total, y = log(awake/bodywt), cor = ordem, tamanho = log(brainwt)) + facet_wrap(~ vore)
<
>
>>p>>p>p> Dito isto, se você pode't descobrir quais são as dimensões sensatas a mostrar, como combiná-las ou enrolá-las, etc., há alguns métodos exóticos para plotar, por exemplo, 50 dimensões, como as faces de Chernoff. Elas podem ser bastante divertidas para o público, mas não necessariamente esclarecedoras: FMS Symphony - Bicoastal Datafest
Artigos semelhantes
- Armazenamento de dados: O que é dimensão degenerada?
- Como pode uma dimensão ser PEQUENA?
- Como eliminar 'Erro: Todos os sabores devem agora pertencer a uma dimensão de sabor nomeada' no Android Studio 3.0.1
- Demonstrações de produtos: Qual é a melhor forma de visualizar/demover um website offline num evento?