Campo de atuação nivelado para reconhecimento de rosto em escala de milhões – Por: Cleiton Medeiros Knor, Rafael Pugsley e Luiz Filipe Pinel Talignani

março 19, 2019 Off Por pugsley


Introdução

A ideia do artigo é criar um conjunto de treinamento que possa ser usado por todos (disponível publicamente), verificar se algum algoritmo particular supera os outros ou que tenha acesso aos dados de treinamento grandes / bons é a chave para o sucesso?

Exigir que os grupos treinassem apenas esses dados e avaliem em escala, incluindo conjuntos privados.

Isso deve nivelar o campo da área e comparar os algoritmos reais em vez dos dados que eles usam. Criar um grande conjunto de treinamento público é um desafio.

Dados esses recursos, digamos que se deseje criar um aplicativo que use o melhor algoritmo de reconhecimento de faces, como eles saberiam qual algoritmo é melhor?

A maioria desses algoritmos de reconhecimento facial quando testado na escala de milhões, exibe uma variação dramática em sua precisão.

Com esse problema surgem duvidas do tipo:

Os algoritmos são muito diferentes? O acesso a bons / grandes treinamentos é a arma secreta? Onde devemos melhorar o reconhecimento facial?

Objetivo

Para resolver essas questões, foi criada uma referência, chamada MF2, que exige que todos os algoritmos sejam treinados nos mesmos dados e testados na escala de milhões.

O MF2 é um conjunto público de larga escala com 672K de identidade e 4,7 milhões de fotos criadas com o objetivo de nivelar o campo de treinamento para reconhecimento facial de grande escala.

Os resultados obtidos no MF2 foram comparados com os resultados das outras duas marcas de referências de grande escala, a MegaFace Chal- lenge e a MS-Celebs-1M

Onde foi descoberto que:

1) algoritmos, treinados em MF2, foram capazes de alcançar o estado da arte e resultados comparáveis a algoritmos treinados em conjuntos privados massivos.

2) alguns superaram quando treinados em MF2.

3) invariância ao envelhecimento sofre de baixas precisões como no MegaFace, identificando a necessidade de maiores variações de idade possivelmente dentro de identidades ou ajustes de algoritmos em futuros testes

Atualidade e relevância do Tema

De acordo com o Google Acadêmico, apenas no ano de 2016, foram publicados 938 algoritmos de reconhecimento de rosto, 34 patentes e dezenas de startups de reconhecimento facial foram criadas. Então podemos dizer que é um tema que está sendo muito estudado e que está evoluindo muito,

pela quantidade de pesquisas e de startups relacionadas ao assunto.

Lista de duvidas

– Como as empresas tem acesso a arquivos com essas faces mesmo sendo claro que as mesmas não podem ser tornadas públicas?

– O humor que tem suas características como dar risada ou estar triste no momento da captura pode interferir diretamente segundo o texto, nesse caso, é feita uma leitura de perfil no momento de cada reação e assemelhar diretamente na pessoa?

Perguntas

– Em locais públicos, para reconhecimento facial, a qualidade do equipamento dependendo da distancia pode interferir, como resolução da câmera, que quanto mais alta é melhor o rendimento e chance de acerto, porem, isso não é um empecilho por haver grande uso de banda e memoria, atrasando a implementação?

– O texto comenta que essa tecnologia pode ser usada em diversas finalidades, e que o benchmark é usado como base para saber a taxa de acerto e aproveitamento do sistema, porem, ele é usado apenas como taxa de acerto? Por exemplo, um sistema pode ser melhor em determinada circunstancia que outro, mas se colocar na forma geral apenas do benchmark, muitas vezes ele pode não ser o ideal.

– A segurança dos dados e principalmente a privacidade realmente estão sendo respeitados completamente? Como a base de dados é feita de diversas imagens e situações de determinada pessoa, ela sempre está de acordo para o recebimento das mesmas?

Conclusão

O artigo se destaca pelas amplas informações e termos técnicos, sendo fácil entender as porcentagens de acerto utilizadas e o quanto evolui constantemente, porem, algumas coisas ficam abertas a duvidas de outras questões que são ligadas diretamente ao assunto como a segurança e recebimento da base de dados. Sendo assim, fica recomendável a leitura para ter a noção detalhada do procedimento de reconhecimento. Um tema sugerido para que se complete ao artigo, seria da privacidade, do meio de como se obteve os dados e como é feito o trafico de informações desde o momento da captação até o resultado final.

REFERENCIAS

Dentre as referências, foram utilizados um total de 33 fontes, em sua maioria foram retiradas de artigos dos anos de 2010 a 2016 e alguns livros de 1953, 1967, 1996 e 2004. Os veículos utilizados para publicação em sua maioria foram a web.