O DEV Paraná consiste em conferências e palestras que propiciam o compartilhamento de conhecimentos e para o desenvolvimento de diversas áreas do conhecimento. Na modalidade DEV Paraná na Estrada, o objetivo é levar conteúdos e oportunidades de encontros a várias cidades gratuitamente. A edição de setembro de 2022, em parceria com as empresas DB1, REd Hat e Ambevtech, passou por 12 cidades: Francisco Beltrão, Campo Mourão, Cascavel, Maringá, Toledo, Guarapuava, Cianorte, Foz do Iguaçu, Pato Branco, Umuarama e Ciudad del Este (PY).
O prof. Jéfer Benedett Dörr, integrante do Manna Team e doutorando em Ciência da Computação sob orientação da prof.ª Linnyer Aylon, participou do evento em Toledo compartilhando um pouco de sua pesquisa sobre o reconhecimento de sons com Edge AI.
Em sua intervenção, o professor Jéfer expôs que a fala é uma forma natural de comunicação, logo, uma interface de comunicação praticamente imperceptível com a tecnologia. Isso torna viável a Computação ubíqua ou pervasiva, que é aquela que está entre nós, mas não é necessariamente percebida. A melhor forma para interagir sem perceber é com o uso da voz ou reconhecimento dos sons. O som é fonte rica de informações, assim o trabalho partiu da premissa que as máquinas também podem compreendê-lo.
Para que isso aconteça, é necessário que os sistemas aprendam e interajam, o que caracteriza uma computação cognitiva. Para tanto, são utilizadas técnicas de Inteligência Artificial (IA) com métodos estatísticos, assim o aprendizado (Machine Learning) permite reconhecer padrões ou realizar previsões.
Segundo o professor Jéfer, compreender o mundo pela interpretação do som ou qualquer outra atividade de IA é uma atividade de alto custo computacional, o que torna o reconhecimento de sons uma tarefa desafiadora para a Internet das Coisas (IoT). Neste contexto, o processamento e o armazenamento dos dados são levados próximos ao problema a ser resolvido (nessa caso, captação e processamento de sons), o que é chamado de computação de borda ou Edge Computing, que pode ser aplicada especificamente a IA, sendo chamada então de Edge AI.
O processamento e a análise de áudio são feitos a partir da captação das ondas de áudio, transformadas em um espectograma para se extrair características que permitem a classificação dos sons. A classificação é feita com a utilização da linguagem Python, com ajuda da biblioteca Librosa e do Tensorflow.
O reconhecimento de sons pode contribuir com diversos fatores cotidianos, como controle de qualidade na indústria, segurança pública, detecção de problemas na área médica e preservação ambiental a partir da classificação de sons, o que não deixa de demonstrar mais uma aplicação prática da IoT para melhoramentos em diversas áreas da sociedade.
Saiba mais sobre a Trilha de Aprendizagem em Reconhecimento de sons com IA aqui!
Deixe um comentário