Non-invasive prediction of cholesterol levels from photoplethysmogram (PPG)-based features using machine learning techniques: a proof-of-concept study

Abstract

Regular monitoring of cholesterol levels is crucial to reducing the risk of vascular blockage and preventing atherosclerotic cardiovascular diseases. However, standardized cholesterol measurement tests involve 8–12 hours of strict fasting and blood extraction via finger pricking, which may cause pain and discomfort. This study explores the usefulness of fiducial-based features extracted from the photoplethysmogram (PPG) in estimating blood cholesterol by combining feature selection methods and machine learning techniques. We extracted 150 features from forty-six 2-minute PPG recordings and included participants’ age as a feature. Several variations of linear regressions (LR), regression trees (RT), support vector regressions (SVR), and Gaussian process regressions (GPR) were trained with the most relevant features. The rational quadratic GPR model achieved the lowest errors (MAE = 11.70, MSE = 281.57, and RMSE = 16.78 mg/dL) and the highest coefficient of determination (r2 = 0.832) when combined with ReliefF. The proposed method holds promise for developing lightweight and non-invasive approaches for blood cholesterol estimation, although it may require further validation due to the limited sample size.

Description

El control regular de los niveles de colesterol es crucial para reducir el riesgo de obstrucción vascular y prevenir las enfermedades cardiovasculares ateroscleróticas. Sin embargo, las pruebas estandarizadas de medición de colesterol implican de 8 a 12 horas de ayuno estricto y extracción de sangre mediante pinchazos en el dedo, lo que puede causar dolor e incomodidad. Este estudio explora la utilidad de las características basadas en la referencia extraídas del fotopletismografía (PPG) en la estimación del colesterol en sangre mediante la combinación de métodos de selección de características y técnicas de aprendizaje automático. Extrajimos 150 características de cuarenta y seis grabaciones PPG de 2 minutos e incluimos la edad de los participantes como una característica. Varias variaciones de regresiones lineales (LR), árboles de regresión (RT), regresiones de vectores de soporte (SVR) y regresiones de procesos gaussianos (GPR) se entrenaron con las características más relevantes. El modelo GPR cuadrático racional logró los errores más bajos (MAE = 11.70, MSE = 281.57 y RMSE = 16.78 mg/dL) y el coeficiente de determinación más alto (r2 = 0.832) cuando se combinó con ReliefF. El método propuesto es prometedor para el desarrollo de enfoques ligeros y no invasivos para la estimación del colesterol en sangre, aunque puede requerir una validación adicional debido al tamaño limitado de la muestra.

Keywords

Biomedical Engineering, blood lipid test, cholesterol, Computer Science (General), Electrical & Electronic Engineering, feature extraction, machine learning, non-invasive monitoring, Photoplethysmogram

Citation

Argüello-Prada, E. J., Villota Ojeda, A. V., & Villota Ojeda, M. Y. (2025). Non-invasive prediction of cholesterol levels from photoplethysmogram (PPG)-based features using machine learning techniques: a proof-of-concept study. Cogent Engineering, 12(1). https://doi.org/10.1080/23311916.2025.2467153