Regularizando uma rede profunda de reconhecimento de rostos para reconhecimento de expressões – por Felipe José de Paula, Guilherme Rutcoski Bach e Marco Antônio Schamne.
março 20, 20191. Neste artigo, é apresentado o FaceNet2ExpNet, um novo algoritmo de aprendizado que incorpora o conhecimento do domínio facial para regularizar o treinamento de uma rede de reconhecimento de expressão, propondo uma nova função de distribuição para modelar os neurônios da rede de expressão. Planejamento de um algoritmo de dois estágios, onde no primeiro estágio ocorre um treinamento das camadas convolucionais da rede de expressão facial, e na segunda etapa ocorre a união das camadas totalmente conectadas às camadas pré-treinadas e treinando toda a rede em conjunto.
2. Deep Convolutional Neural Networks (DCNN) demonstraram impressionantes melhorias de desempenho para muitos problemas na visão computacional, disponibilizando um banco de dados de treinamento de larga escala, para classificação de imagens, reconhecimento de cenas, reconhecimento facial, etc..
Outros trabalhos sobre reconhecimento de expressão utilizam conjuntos de dados de reconhecimento facial para pré-treinar a rede, que é então afinado no conjunto de dados de expressão. A grande quantidade de rostos rotulados torna possível treinar uma rede com um tamanho bem expressivo. Mas, refinando a aplicação, os resultados não são satisfatórios. Sendo assim, a abordagem é ajustar uma rede pré-treinada, para que, com as imagens geradas, seja possível o reconhecimento das diferentes expressões, e que a rede tenha melhoria de ajuste das camadas treinadas e melhore o rendimento de processamento de expressão facial.
3. Neste artigo, apresentamos o FaceNet2ExpNet, um novo algoritmo de treinamento de dois estágios para reconhecimento de expressão. Na primeira etapa, propomos uma função de distribuição probabilística para modelar a resposta de neurônios de alto nível com base na rede de rosto já ajustada, levando à regularização do nível de recursos que explora as informações ricas da face da rede. No segundo estágio, realizamos supervisão de rótulo para aumentar a capacidade discriminativa final. Como resultado, o FaceNet2ExpNet melhora a representação de recursos visuais e supera vários métodos de última geração em quatro conjuntos de dados públicos. No futuro, planejamos aplicar esse método de treinamento a outros domínios com conjuntos de dados pequenos.
4. Neste estudo aprofundado sobre um algoritmo de dois estágios para reconhecimento de expressões faciais, foram utilizadas referências dos anos compreendidos entre 2002 e 2016, referências estas publicadas em jornais, livros, artigos, conferências, plataforma online, no qual tem como base artigos e pesquisas publicadas, sobre capacidade de mineração de dados, transferência de conhecimento para reconhecimento de emoções, geometria temporal para reconhecimento facial, variações de expressões, data-bases, reconhecimento de imagem longitudinal. As referências mais recentes são de conferências e congressos que abordaram o assunto.
5. Considerando-se a metodologia utilizada, é possível observar que o experimento envolve grande complexidade além do conteúdo mostrar alguns resultados parciais em determinados momentos, o que torna difícil a tentativa de reprodução do experimento que demanda de um nível de informações e comparações elevadas. Assim, é possível concluir que reproduzir o experimento pode apresentar resultados muito diferentes além de inconsistentes devido à dificuldade apresentada neste estudo.
6. Os autores sugerem a aplicação dos recursos em conjuntos de dados pequenos, ou seja, tornar a aplicação mais eficiente com uma necessidade menor de informações. Esse estudo tem relevância para sistemas interativos que usam como recurso o reconhecimento facial tornando-os mais eficazes e precisos.
7. Algumas dúvidas ainda permanecem não esclarecidas como por exemplo:
- Qual a real motivação para o experimento?
- Em que área específica ele deve ser aplicado?
8. Através da leitura do Artigo você será capaz de responder perguntas como:
Os tipos de bases utilizadas para o estudo são acessíveis para o público com interesse nesse experimento?
Existem algumas expressões que podem tornar-se inferiores quanto à precisão no reconhecimento de expressões faciais?
O que é o FaceNet2ExpNet?
9. Por tratar-se de um artigo relacionado a um experimento tecnológico, é importante observar que este deve-se à área de tecnologia e não possui grande relevância para usuários comuns. Possui uma linguagem que facilita a compreensão do tema mas a implementação do experimento requer uma qualificação mais específica.
Considerando-se os autores, é notável que possuem grande conhecimento referente ao tema e os resultado obtidos são de notável importância pois servem para mostrar que a tecnologia pode constantemente evoluir.
O artigo é recomendado ao público com interesse na tecnologia de reconhecimento de imagens que possua um certo conhecimento do assunto, caso contrário as informações contidas nesta obra podem não ser de grande relevância.
Quanto a aplicabilidade do tema em questão, seria interessante uma abordagem na área de segurança pública para reconhecimento das intenções de um determinado indivíduo e estudos psicológicos.
Referência: FaceNet2ExpNet: Regularizing a Deep Face Recognition Net for Expression Recognition
Autores: Hui Ding, Shaohua Kevin Zhou and Rama Chellappa.