Quais são as aplicações industriais do algoritmo do vizinho K-nearest?
k-NNN é frequentemente usado em aplicações de busca onde você está procurando por itens "similares"; ou seja, quando sua tarefa é alguma forma de "encontrar itens similares a esta". Você chamaria isso de uma pesquisa k-NN.
A maneira de medir a similaridade é criando uma representação vetorial dos itens, e então comparar os vetores usando uma métrica de distância apropriada (como a distância euclidiana, por exemplo).
Então, alguns exemplos concretos de pesquisa k-NN:
- Se você estiver pesquisando por documentos semanticamente similares (ou seja documentos contendo tópicos semelhantes), isto é referido como Pesquisa de Conceito.
- Pesquisa de Conceito é um recurso que você encontrará em muitos pacotes de software de e-Discovery, que são usados para ajudar empresas a encontrar todos os e-mails, contratos, etc. que são relevantes para um processo judicial. Por exemplo, veja Concept Search no software Relativity do kCura para e-Discovery.
- O maior caso de uso da pesquisa k-NN pode ser Sistemas Recomendados. Se você sabe que um usuário gosta de um item em particular, então você pode recomendar itens similares para eles. Para encontrar itens semelhantes, você compara o conjunto de usuários que gostam de cada item - se um conjunto semelhante de usuários gosta de dois itens diferentes, então os itens em si provavelmente são semelhantes!>ul>>li> Isto se aplica a recomendar produtos, recomendar mídia para consumir, ou até mesmo 'recomendar' anúncios para mostrar a um usuário!k-NN não é tão sexy quanto uma rede neural ou um SVM, e geralmente funciona mais lentamente e tem menor precisão que essas abordagens, mas tem algumas qualidades práticas agradáveis. É fácil de treinar (porque não há treino :-P), fácil de usar, e é fácil de entender os resultados. Aposto que a classificação k-NN é usada mais na indústria do que um académico poderia pensar (admito que tenho tendência a olhar para a classificação k-NN).
Aqui está pelo menos um exemplo concreto que vos posso dar:
>ul><Herta Security usa algoritmos de aprendizagem profunda para gerar vectores de características que representam as caras das pessoas. Eles então usam k-NN para identificar uma pessoa, comparando o rosto com a sua lista de relógios. A razão? k-NN é suficientemente boa e seria impraticável treinar um classificador separado para cada pessoa na lista de observação.Artigos semelhantes
- O Algoritmo de Dijkstra é um algoritmo ganancioso ou um algoritmo de programação dinâmico?
- Quais são as aplicações da vida real do algoritmo de Dijkstra?
- Quais são as aplicações reais do algoritmo de busca e classificação?
- Devo chamar a polícia se o meu vizinho acender uma lanterna no seu quintal durante várias horas em cada duas noites nos EUA?
- Quão perto se pode construir da linha de propriedade de um vizinho?