Porque é que a CNN é utilizada para classificação de imagens, e porque não outros algoritmos?
Há muitos algoritmos que as pessoas usavam para classificação de imagens antes da CNN se tornar popular. As pessoas costumavam criar funcionalidades a partir de imagens e depois alimentar essas funcionalidades com algum algoritmo de classificação como o SVM. Alguns algoritmos também utilizavam os valores de nível de pixel das imagens como um vetor de características. Para dar um exemplo, você poderia treinar um SVM com 784 características onde cada característica é o valor de pixel para uma imagem 28x28.Então porque CNN e porque eles funcionam muito melhor?
CNNs podem ser pensados em extratores automáticos de características a partir da imagem. Enquanto que se eu usar um algoritmo com vetor de pixels eu perco muita interação espacial entre pixels, uma CNN efetivamente usa informações de pixels adjacentes para efetivamente reduzir a imagem primeiro por convolução e depois usa uma camada de predição no final.
Este conceito foi apresentado pela primeira vez por Yann le cun em 1998 para classificação de dígitos onde ele usou uma única camada de convolução. Mais tarde foi popularizado por Alexnet em 2012, que usou várias camadas de convolução para alcançar o estado da arte na imagenet. Assim, tornando-as um algoritmo de escolha para os desafios de classificação de imagens de agora em diante.
Artigos semelhantes
- Qual é a diferença entre CNN e R-CNN?
- Quais são os 10 algoritmos que se deve saber para resolver a maioria dos problemas de algoritmos?
- Porque é que as imagens autocolantes espelham imagens, enquanto as imagens da câmara traseira não espelham?
- Quais são as vantagens dos diferentes algoritmos de classificação?