Cientistas da computação do MIT e Laboratório de Inteligência Artificial criaram um algoritmo que vai utilizar do aprendizado profundo para entender os sinais sociais humanos. O código permitiu fazer testes de inteligência artificial (IA) e descobrir se ela tinha capacidade para compreender e prever interações só pelos gestões que as antecedem. A expectativa é que os resultados positivos abram caminho para a criação de eficientes sistemas de assistência domiciliar, além de câmeras de segurança inteligentes, que podem chamar uma ambulância ou carro de policia.
Se você tem alguma dúvida sobre tecnologia, escreva para 33giga@33giga.com.br e suas questões podem ser respondidas
Para fazer os testes, os pesquisadores alimentaram a inteligência artificial com 600 horas de vídeos do YouTube e sitcoms cheios de interações sociais humanas para checar se ela “aprenderia” o suficiente para começar a prever as ações. Entre as escolhas dos pesquisadores estavam seriados como The Office, Desperate Housewives e Scrubs, isso porque, além de ser um conteúdo de fácil acesso, ele é mais realista na descrição de interações comuns ao cotidiano.
Foi mostrado programas e vídeos de pessoas a um segundo de fazer ações como abraçar, beijar, apertar as mãos e fazer o famoso “toca aqui”. Logo, a IA foi capaz de prever o que aconteceria na sequência de forma correta em 43% das vezes, enquanto os humanos estavam certos em 71% das vezes.
Leia também:
Conheça quatro exemplos de inteligência artificial disponíveis na internet
Esta não é a primeira tentativa de previsão de vídeo, mas foi a que teve os resultados mais positivos até agora. O sucesso pode ser explicado pelo fato de que o novo algorítimo se difere das outras tentativas, nas quais a representação de pixel por pixel era a prioridade. Agora, ele aprende por si próprio e usa representações visuais para diferenciar os estímulos visuais que são importantes nas interações sociais humanas. Comportamento natural para os humanos, mas muito mais complexo e delicado para as IA.
O vídeo abaixo traz alguns gráficos que mostram as previsões do algorítimo com base nas cenas exibidas. Veja como ele acertou em quase todas as tentativas: