Se algum dia você assistiu a um dos filmes do Exterminador do Futuro e pensou que ainda estamos muito longe de criar um software capaz de analisar e entender imagens capturadas por câmeras em tempo real, como a visão do robô assassino, então talvez seja hora de pensar novamente. Usando uma rede neural e a webcam de um MacBook, Kyle McDonald conseguiu mostrar que talvez esse futuro não seja tão distante assim.
Usando uma versão do NeuralTalk, feito por pesquisadores de Stanford e da Google e modificado para rodar a partir do feed da câmera embutida do computador da Apple, McDonald vagou pelas ruas de Amsterdã, na Holanda, e permitiu que a máquina interpretasse o que estava “vendo”. Embora o resultado nem sempre esteja correto e a gravação esteja bastante tremida, ainda é interessante ver como o software consegue interpretar rapidamente os pixels e o brilho das imagens recebidas.
Feito com código aberto, o NeuralTalk foi revelado originalmente no ano passado e vem recebendo atualizações constantes, que aumentam suas capacidades dia após dia. Enquanto isso, companhias privadas vêm trabalhando em tecnologias similares, com o exemplo máximo sendo a rede neural que está sendo desenvolvida pelo Facebook para dar descrições de fotos para pessoas com deficiência visual.
O que você acha da capacidade dos PCs de compreender imagens em tempo real? Comente no Fórum do TecMundo
Fontes
Categorias