El desarrollo del software de reconocimiento de voz para manejo de dispositivos de mesa

Loaiza Quiñonez, Johan Eduardo; Murillo Palacios, Sally Maryuri

El desarrollo del software de reconocimiento de voz para manejo de dispositivos de mesa

dc.contributor.advisor	Martínez, Alejandro Marcus
dc.contributor.author	Loaiza Quiñonez, Johan Eduardo; Murillo Palacios, Sally Maryuri
dc.date.accessioned	2024-10-18T19:34:12Z
dc.date.available	2024-10-18T19:34:12Z
dc.date.issued	2023-05-04
dc.description	El reconocimiento de voz es uno de los métodos con los que el ser humano avanza en su interacción con la tecnología, la relación hombre-máquina se desarrolla a través de acciones como el reconocimiento facial, las huellas dactilares, el reconocimiento de voz, todo lo que le permite a la tecnología reconocer a las personas, y a la vez les permite a estas comunicarse con esta para ordenar a la máquina a realizar acciones. En este trabajo se muestran dichos avances, los modelos que se diseñaron para dar respuesta a los requerimientos que se presentaron a medida que este sistema evoluciona, los métodos aplicados para estas evaluaciones, que consisten en 4 etapas, empezando con preprocesar el audio, realizando el análisis de su duración, su amplitud y la frecuencia en la que se transmite, segmentarlo para conseguir el contenido del audio, extraer sus características como la presencia de ruido de ambiente y el idioma del audio para distinguir la presencia de un acento que sea posible evaluar, y por último la comparación de los resultados obtenidos en la evaluación, todos esos procesos hechos aplicando la metodología de Mozilla Deepspeech, con la que se realiza pruebas comparando texto obtenido por la metodología y el real obtenido del audio, con el objetivo de que el sistema pueda obtener la interpretación más clara posible del audio que está recibiendo, dando como resultado el entendimiento del audio que recibe el programa, la forma en la que lo recibe, y la capacidad que tiene para analizarlo, y este resultado dará continuidad a la evolución de las capacidades de la tecnología, siendo otra demostración a como el ser humano evoluciona también para cada vez hacer más estrecha a relación con la tecnología.
dc.description.abstract	Voice recognition is one of the methods with which human beings advance in their interaction with technology, the man-machine relationship is developed through actions such as facial recognition, fingerprints, voice recognition, everything that allows technology to recognize people, and at the same time allows them to communicate with it to order the machine to perform actions. In this work, we will take a look at these advances, the models that were designed to respond to the requirements that arose as this system evolved, the methods applied for these evaluations, which consist of 4 stages, starting with preprocessing the audio , performing the analysis of its duration, its amplitude and the frequency in which it is transmitted, segmenting it to obtain the content of the audio, extracting its characteristics such as the presence of ambient noise and the language of the audio to distinguish the presence of an accent that It is possible to evaluate, and finally the comparison of the results obtained in the evaluation, all those processes made applying the Mozilla Deepspeech methodology, with which tests are carried out comparing the text obtained by the methodology and the real one obtained from the audio, with the objective that the system can obtain the clearest possible interpretation of the audio it is receiving, resulting in the understanding of the au He said that he receives the program, the way in which he receives it, and the capacity he has to analyze it, and this result will give continuity to the evolution of the capabilities of technology, being another demonstration of how the human being also evolves for each time make a closer relationship with technology.
dc.format	application/pdf
dc.format.extent	19 páginas
dc.identifier.citation	Loaiza Quiñonez, Johan Eduardo; Murillo Palacios, S. M. (2023). El desarrollo del software de reconocimiento de voz para manejo de dispositivos de mesa. Universidad Santiago de Cali
dc.identifier.uri	https://repositorio.usc.edu.co/handle/20.500.12421/5778
dc.language.iso	es
dc.publisher	Universidad Santiago de Cali
dc.publisher.faculty	Facultad de Ingeniería
dc.publisher.program	Tecnología en sistemas de información
dc.pubplace.city	Santiago de Cali
dc.pubplace.state	Valle del Cauca
dc.rights.acceso	Acceso público
dc.rights.cc	Reconocimiento 4.0 Internacional (CC BY 4.0)
dc.source.institution	Universidad Santiago de Cali
dc.source.repository	Repositorio Institucional USC
dc.subject	tecnología
dc.subject	evolución
dc.subject	interacción
dc.subject	reconocimiento de voz
dc.subject.keyword	technology
dc.subject.keyword	Evolution
dc.subject.keyword	Interaction
dc.subject.keyword	Speech recognition
dc.title	El desarrollo del software de reconocimiento de voz para manejo de dispositivos de mesa
dc.type	Thesis
dc.type	Artículo