O que é a aprendizagem de tiro zero?
E se eu te mostrar uma imagem de um animal, dado que nunca viste esse animal antes, consegues adivinhar o nome do animal? Talvez, se você tiver lido em algum lugar sobre esse animal em particular. Let's say I show a picture of zebra to a child who has never seen a zebra but has seen a horse and also she is taught that a zebra looks like a horse but with stripes. Ela pode identificá-lo agora? Muito provavelmente, sim!Simplesmente, a nossa máquina também pode ser capaz de prever a etiqueta de uma imagem ou um objecto que não está presente nos dados de treino. Isto é possível?
Se você já esteve em tarefas de processamento de linguagem natural, você já deve ter ouvido falar de palavras-embarcadas. Word-Embedding é simplesmente uma representação de uma palavra na forma de um vector. Se duas palavras têm significados semelhantes, seus vetores de incorporação também serão semelhantes. Uma palavra-encarnada é um vector, por isso tem múltiplas dimensões. Cada dimensão representa uma característica da palavra. Let's consideram uma incorporação de palavras de três dimensões (embora na prática a incorporação varie de 100 a 300 vectores dimensionais). Deixe estas três dimensões representarem características como listras, animalidade e brancura. Assim para um tigre, seria [1, 1, 0], ou seja, um tigre tem listras, é um animal mas não é de cor branca e para um coelho seria [0, 1, 1] como um coelho não tem listras, mas é um animal e branco de cor.
Então voltando à nossa questão de identificar uma imagem nunca vista - antes da imagem de uma zebra mas tendo alimentado uma imagem de um tigre e coelho com o nosso algoritmo de aprendizagem, podemos fazer o nosso algoritmo de aprendizagem CNN para aprender a detectar as características das palavras-embarcadas como listras, animalidade, e brancura nas imagens também. Nós só temos que substituir o rótulo da imagem com a sua palavra-encarnada durante o treinamento. E agora, quando alimentamos uma imagem de uma zebra para este modelo, essas características podem ser extraídas da imagem, será gerada uma palavra-embedição para essa imagem e a palavra-embedição mais próxima no nosso dicionário a essa palavra-embedição gerada será muito provavelmente de uma zebra, e assim podemos prever a etiqueta apropriadamente.
Então fomos capazes de identificar uma imagem de uma zebra que não tínhamos'tínhamos em nossos dados de treinamento, mas tínhamos uma palavra-embedição para ela. As palavras pré-formadas podem ser baixadas e utilizadas com o modelo CNN de reconhecimento de objetos.
Esta técnica de classificação não-padrão é conhecida como aprendizagem de tiro zero. A técnica ZSL está ainda na sua infância e é um tópico relativamente activo na pesquisa.
Artigos semelhantes
- Como comercializar seus aplicativos Android quando você tem orçamento zero ou quase zero
- Qual é a diferença entre a aprendizagem supervisionada e a aprendizagem de reforço?
- Qual é a sua aplicação de educação/aprendizagem favorita? Qual é a sua aplicação de educação/aprendizagem favorita?
- Que peças precisam ser substituídas para um mecânico repor legalmente um odómetro a zero? A que está ligada a leitura do odómetro?