Casa > Q > Qual É A Melhor Maneira De Visualizar Dados De Alta Dimensão?

Qual é a melhor maneira de visualizar dados de alta dimensão?

Não acho que haja uma melhor maneira universal de visualizar dados de alta dimensão. Depende dos dados. Se você usar [matemática]{ggplot2}[/math] existem facilidades para sub-configuração, bem como para mapear cores, formas, tamanho, transparência em variáveis.

Geralmente eu aconselharia as pessoas a evitarem o uso de um método de plot-method exótico e em vez disso, primeiro pergunte-se se existem realmente 12 dimensões de interações interessantes, ou se você pode reduzir a dimensionalidade, seja traçando menos dimensões de cada vez (por exemplo, R's default 2-way interaction plot)

main-qimg-45753200d0269dec1177eca82e4fd95e.webp main-qimg-a481ba1006990f3ab788cde6c5a59403

>>br> ou subtraindo, dividindo, sub-configurando, projetando, e/ou mudando a base (por exemplo, PCA). Por exemplo, gráficos de faceta em ggplot podem ser usados quando o subconjunto A é coerente e notavelmente diferente do subconjunto B (também coerente consigo mesmo).

>

Também discordo que as pessoas não consigam entender dimensões elevadas. Aqui está minha resposta para Como você pode visualizar algo que tem mais de 3 dimensões? O truque principal que uso é pensar em ℤⁿ como um gráfico com 2n vértices por nó. (Então pense em apenas um canto de um cubo: ele tem 3 linhas saindo dele. Apenas um canto de um quadrado: tem 2 linhas saindo dele). Há "mais vizinhos" assim como mais direções para ir no espaço em alto-D.

>
Há várias maneiras de imaginar >3D.
>

>ul>Um é por "corte" (pensando apenas em um subconjunto tridimensional, mantendo constante o resto dos parâmetros).
>main-qimg-5c2c2266420df5816ce8e72bd4dccc94.webp
  • >
  • >>br>>br>>>>br>>>/li>>>>img src="https://qph.fs.quoracdn.net/main-qimg-9ea4cbb1b0c8171538259e9aee963a28.webp">
    • >>br>>>br>>>/li>>li>Outro é por projecção (a "sombra" de um objecto de dimensão superior em 3-D. Tony Robbin dá o exemplo de "Como é a sombra de uma cadeira [3-D] no chão [2-D]?").
      <
    >main-qimg-ba7d59b21e7d64044d39c466ad1e95cf.webp<
    • <
    • >br>>>/li>
    • >li>>pode fazer uso de variações gráficas como pontos' forma, cor (ou obter 3 dimensões a partir da cor com ex. Lab), ou tempo.
    >>>img src="https://qph.fs.quoracdn.net/main-qimg-e4bbeac552ff7fb9c6f30dd9eb661763">
    • >

    • >>/li>
    • Isto não é um visual útil, mas você pode trivialmente refutar alguém que diz "People don't deal in higher than three dimensions", apontando que cada pixel na sua tela é um dado que pode variar - assim mesmo lendo esta mensagem você're olhando para um espaço de alta dimensão. (E a resposta apropriada para "Como você vê o espaço tetradimensional?" é "Como você vê o espaço tetradimensional?").>li>meu favorito é pensar em planilhas do Excel. (aqui eu mostro o código R para gerar um cubo 4-dimensional [0,1]×[0,1]×[0,1]×[0,1], cujos cantos se parecem com isto:
      >br>0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 1 1 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 1 0 0 0 1 0 0 0 1
      0 1 0 1 0 1
      1 1 0 1 1 0 1
      0 1 1 1 1 1 1
      0 1 1 1 1 1 1 1
      >1 1 1 1 1 1

Se você trabalha com planilhas com muitas colunas, você trabalha com colunas altasdados dimensionais. Às vezes você precisa invocar uma tabela Pivot onde você apenas olha (coluna 4 == 9) ou algo assim. Esse é o subconjunto inferior de dados que contém a coluna 4 constante.

>br>Check out Bill Thurston and isomorphismes: higher dimensions for longer explanations.

>p>>>p>---------------------------

>p>

p>P>Regarding Hinton's quote, eu discordei disso quando ouvi e ainda ouço. It's not how I visualise 4+ dimensions and I don't think it's how others do either. Por um lado as relações de vizinhança engrossam (pense em uma projeção gráfica de cubos de dimensões superiores.


<

main-qimg-a6f8164cf62154ec7ba7a7f9042e8d5f.webp


> O número de bordas por vértice aumentará em dimensões superiores, mesmo quando o número de vértices também aumentar. Assim, sua "onda 3-D suas mãos" teria basicamente buracos de minhoca por toda parte se a dimensionalidade for grande o suficiente. Nas palavras de Hinton' em uma mercearia de 10 dimensões (ou biblioteca) mais coisas poderiam estar próximas umas das outras. É por isso que a topologia low-D é mais interessante do que a topologia high-D: it'é difícil para um nó ficar atado quando ele pode passar por dimensões "extras".

>br>Eu também tenho em mente a relação entre esferas e cubos como dois tipos básicos de formas em um espaço high-D: a maior parte da massa de um cubo está em seus muitos cantos pontiagudos.

tl,dr: Pense em colunas em uma planilha do Excel. Cada coluna é uma variável. Quando os valores em 5 das colunas permanecem os mesmos (ordenados) e a 6ª coluna está mudando, você está observando a variação na sexta dimensão .

Also: require(ggplot2); data(msleep); qplot(data=msleep, x=sleep_rem/sleep_total, y = log(awake/bodywt), cor = ordem, tamanho = log(brainwt)) + facet_wrap(~ vore)
<

main-qimg-43475ab547927504e9a5a932c238ee35.webp">

>

>>p>>p>p> Dito isto, se você pode't descobrir quais são as dimensões sensatas a mostrar, como combiná-las ou enrolá-las, etc., há alguns métodos exóticos para plotar, por exemplo, 50 dimensões, como as faces de Chernoff. Elas podem ser bastante divertidas para o público, mas não necessariamente esclarecedoras: FMS Symphony - Bicoastal Datafest

De Darill

Qual chipset é melhor entre Snapdragon 665 e Exynos 9609? :: Qual SoC é melhor, Samsung Exynos 9611 ou Qualcomm Snapdragon 845?