El desarrollo del software de reconocimiento de voz para manejo de dispositivos de mesa

dc.contributor.advisorMartínez, Alejandro Marcus
dc.contributor.authorLoaiza Quiñonez, Johan Eduardo; Murillo Palacios, Sally Maryuri
dc.date.accessioned2024-10-18T19:34:12Z
dc.date.available2024-10-18T19:34:12Z
dc.date.issued2023-05-04
dc.descriptionEl reconocimiento de voz es uno de los métodos con los que el ser humano avanza en su interacción con la tecnología, la relación hombre-máquina se desarrolla a través de acciones como el reconocimiento facial, las huellas dactilares, el reconocimiento de voz, todo lo que le permite a la tecnología reconocer a las personas, y a la vez les permite a estas comunicarse con esta para ordenar a la máquina a realizar acciones. En este trabajo se muestran dichos avances, los modelos que se diseñaron para dar respuesta a los requerimientos que se presentaron a medida que este sistema evoluciona, los métodos aplicados para estas evaluaciones, que consisten en 4 etapas, empezando con preprocesar el audio, realizando el análisis de su duración, su amplitud y la frecuencia en la que se transmite, segmentarlo para conseguir el contenido del audio, extraer sus características como la presencia de ruido de ambiente y el idioma del audio para distinguir la presencia de un acento que sea posible evaluar, y por último la comparación de los resultados obtenidos en la evaluación, todos esos procesos hechos aplicando la metodología de Mozilla Deepspeech, con la que se realiza pruebas comparando texto obtenido por la metodología y el real obtenido del audio, con el objetivo de que el sistema pueda obtener la interpretación más clara posible del audio que está recibiendo, dando como resultado el entendimiento del audio que recibe el programa, la forma en la que lo recibe, y la capacidad que tiene para analizarlo, y este resultado dará continuidad a la evolución de las capacidades de la tecnología, siendo otra demostración a como el ser humano evoluciona también para cada vez hacer más estrecha a relación con la tecnología.
dc.description.abstractVoice recognition is one of the methods with which human beings advance in their interaction with technology, the man-machine relationship is developed through actions such as facial recognition, fingerprints, voice recognition, everything that allows technology to recognize people, and at the same time allows them to communicate with it to order the machine to perform actions. In this work, we will take a look at these advances, the models that were designed to respond to the requirements that arose as this system evolved, the methods applied for these evaluations, which consist of 4 stages, starting with preprocessing the audio , performing the analysis of its duration, its amplitude and the frequency in which it is transmitted, segmenting it to obtain the content of the audio, extracting its characteristics such as the presence of ambient noise and the language of the audio to distinguish the presence of an accent that It is possible to evaluate, and finally the comparison of the results obtained in the evaluation, all those processes made applying the Mozilla Deepspeech methodology, with which tests are carried out comparing the text obtained by the methodology and the real one obtained from the audio, with the objective that the system can obtain the clearest possible interpretation of the audio it is receiving, resulting in the understanding of the au He said that he receives the program, the way in which he receives it, and the capacity he has to analyze it, and this result will give continuity to the evolution of the capabilities of technology, being another demonstration of how the human being also evolves for each time make a closer relationship with technology.
dc.formatapplication/pdf
dc.format.extent19 páginas
dc.identifier.citationLoaiza Quiñonez, Johan Eduardo; Murillo Palacios, S. M. (2023). El desarrollo del software de reconocimiento de voz para manejo de dispositivos de mesa. Universidad Santiago de Cali
dc.identifier.urihttps://repositorio.usc.edu.co/handle/20.500.12421/5778
dc.language.isoes
dc.publisherUniversidad Santiago de Cali
dc.publisher.facultyFacultad de Ingeniería
dc.publisher.programTecnología en sistemas de información
dc.pubplace.citySantiago de Cali
dc.pubplace.stateValle del Cauca
dc.rights.accesoAcceso público
dc.rights.ccReconocimiento 4.0 Internacional (CC BY 4.0)
dc.source.institutionUniversidad Santiago de Cali
dc.source.repositoryRepositorio Institucional USC
dc.subjecttecnología
dc.subjectevolución
dc.subjectinteracción
dc.subjectreconocimiento de voz
dc.subject.keywordtechnology
dc.subject.keywordEvolution
dc.subject.keywordInteraction
dc.subject.keywordSpeech recognition
dc.titleEl desarrollo del software de reconocimiento de voz para manejo de dispositivos de mesa
dc.typeThesis
dc.typeArtículo

Files

Original bundle
Now showing 1 - 4 of 4
No Thumbnail Available
Name:
Constancia.pdf
Size:
379.08 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Formato de Autorizacion.pdf
Size:
328.34 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Trabajo de Grado.pdf
Size:
916.43 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Acta.pdf
Size:
769.43 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: