El desarrollo del software de reconocimiento de voz para manejo de dispositivos de mesa

No Thumbnail Available

Date

2023-05-04

Journal Title

Journal ISSN

Volume Title

Publisher

Universidad Santiago de Cali

Abstract

Voice recognition is one of the methods with which human beings advance in their interaction with technology, the man-machine relationship is developed through actions such as facial recognition, fingerprints, voice recognition, everything that allows technology to recognize people, and at the same time allows them to communicate with it to order the machine to perform actions. In this work, we will take a look at these advances, the models that were designed to respond to the requirements that arose as this system evolved, the methods applied for these evaluations, which consist of 4 stages, starting with preprocessing the audio , performing the analysis of its duration, its amplitude and the frequency in which it is transmitted, segmenting it to obtain the content of the audio, extracting its characteristics such as the presence of ambient noise and the language of the audio to distinguish the presence of an accent that It is possible to evaluate, and finally the comparison of the results obtained in the evaluation, all those processes made applying the Mozilla Deepspeech methodology, with which tests are carried out comparing the text obtained by the methodology and the real one obtained from the audio, with the objective that the system can obtain the clearest possible interpretation of the audio it is receiving, resulting in the understanding of the au He said that he receives the program, the way in which he receives it, and the capacity he has to analyze it, and this result will give continuity to the evolution of the capabilities of technology, being another demonstration of how the human being also evolves for each time make a closer relationship with technology.

Description

El reconocimiento de voz es uno de los métodos con los que el ser humano avanza en su interacción con la tecnología, la relación hombre-máquina se desarrolla a través de acciones como el reconocimiento facial, las huellas dactilares, el reconocimiento de voz, todo lo que le permite a la tecnología reconocer a las personas, y a la vez les permite a estas comunicarse con esta para ordenar a la máquina a realizar acciones. En este trabajo se muestran dichos avances, los modelos que se diseñaron para dar respuesta a los requerimientos que se presentaron a medida que este sistema evoluciona, los métodos aplicados para estas evaluaciones, que consisten en 4 etapas, empezando con preprocesar el audio, realizando el análisis de su duración, su amplitud y la frecuencia en la que se transmite, segmentarlo para conseguir el contenido del audio, extraer sus características como la presencia de ruido de ambiente y el idioma del audio para distinguir la presencia de un acento que sea posible evaluar, y por último la comparación de los resultados obtenidos en la evaluación, todos esos procesos hechos aplicando la metodología de Mozilla Deepspeech, con la que se realiza pruebas comparando texto obtenido por la metodología y el real obtenido del audio, con el objetivo de que el sistema pueda obtener la interpretación más clara posible del audio que está recibiendo, dando como resultado el entendimiento del audio que recibe el programa, la forma en la que lo recibe, y la capacidad que tiene para analizarlo, y este resultado dará continuidad a la evolución de las capacidades de la tecnología, siendo otra demostración a como el ser humano evoluciona también para cada vez hacer más estrecha a relación con la tecnología.

Keywords

tecnología, evolución, interacción, reconocimiento de voz

Citation

Loaiza Quiñonez, Johan Eduardo; Murillo Palacios, S. M. (2023). El desarrollo del software de reconocimiento de voz para manejo de dispositivos de mesa. Universidad Santiago de Cali