Qual é a diferença entre CNN e R-CNN?
Quero explicar sobre CNN, RCNN, FAST RCNN, FASTER RCNN em breve. Então será mais fácil falar da diferença com CNN e R-CNNN.
A visão do computador criou uma área distinta como um ramo que é muito importante hoje em dia. Embora tenha sido aceite como um ramo de inteligência artificial e aprendizagem artificial no passado, tornou-se uma área de investigação em si mesma em linha com as necessidades industriais e sociais. Basicamente, a visão por computador visa fazer o processamento do olho humano em um momento normal com a ajuda de computadores. Neste ponto, vou simplesmente falar sobre os principais tipos de aprendizagem profunda que precisamos conhecer e tentar compreender as diferenças entre eles.
>ul>li>CNN (Convolution Neural Network) A CNN é um tipo de rede de aprendizagem profunda desenvolvida para o processamento de imagens e vídeos que tem feito progressos significativos desde 2010 e é hoje amplamente utilizada no mundo. Este tipo de rede é geralmente composta por 4 camadas. Na camada Convolution, o filtro é usado como um navegador sobre a imagem. Esse filtro paira sobre nossa imagem e faz cálculos sobre os pixels do local onde o filtro está localizado, fazendo de cada pixel desse pixel um pixel na nova imagem. Esta matriz mais recentemente alcançada é chamada de mapa de características. Vários filtros são usados em uma rede CNN, e o mapa de características acessado mais recentemente é moldado de acordo com a propriedade no filtro. A camada Relu segue a camada de convolução e a função de ativação Relu é usada para definir os valores negativos nos dados recebidos para 0. Na camada Pooling Layer, o pooling é feito com o método de redução do tamanho do mapa de características. Outro objetivo é reduzir o número de parâmetros e manter os parâmetros mais marginais ou críticos. E finalmente, Flattening Layer converte a última matriz que temos em um único vetor e a coloca em nossa rede neural artificial através de nossos neurônios. Rede Neural Convolucional Baseada na Região (R-CNNN)No R-CNN, a imagem é primeiramente dividida em aproximadamente 2000 recomendações de região (propotas de região) e depois CNN (ConvNet) é aplicada para cada região respectivamente. O tamanho das regiões é determinado e a região correta é inserida na rede neural artificial. O maior problema deste método é o tempo. Como cada região da figura é aplicada CNN separadamente, o tempo de treinamento é de aproximadamente 84 horas e o tempo previsto é de aproximadamente 47 seg.
- Fast R-CNNN
A diferença deste método do R-CNNN é que ele não se divide primeiro em recomendações de zona oficial, mas primeiro aplica a CNN e depois o aloca às recomendações de zona no mapa de propriedades covn5. Além disso, na parte de classificação, o método é o uso da classificação softmax, que é uma classificação de aprendizagem profunda que pode ser realizada em camadas de redes neurais artificiais, e não SVM. Como ele usa CNN uma vez, há um grande ganho em tempo. O tempo de treinamento é de aproximadamente 8,75 horas e o tempo estimado é de cerca de 2,3 segundos.
- Faster on R-CNN
Artigos semelhantes
- Qual é a diferença entre o Bluetooth no Android e no iPhone? Por que não somos capazes de transferir arquivos entre eles?
- A diferença entre 9 e 45 pontos de foco (Canon 800d Vs. Canon 200d) faz uma enorme diferença nas DSLRs?
- Qual é a diferença entre a Cyber Monday e a Black Friday, e qual é a melhor para fazer compras?
- Qual é a diferença entre os vários modelos de Saregama Carvaan (se houver) e qual é o melhor modelo?
- Qual é a diferença entre '1080p FHD (18.7:9)' e '1080p FHD (60fps)'? E qual é o melhor para gravar?