Selección de Electrodos Basada en k-means para la
Clasificación de Actividad Motora en EEG
R. Lemuz-López * W. Gómez-López* I. Ayaquica-Martínez* C. Guillén-Galván* * Benemérita Universidad Autónoma de Puebla. Facultad de Ciencias de la Computación Correspondencia: Rafael Lemuz López Av. San Claudio y 14 Sur. FCC-BUAP, Edificio 104-C, Cubículo 303-A. C.P. 72000. Puebla, Pue. Correo electrónico: rafalemuz@gmail.com Fecha de recepción: 10 de Octubre de 2013 Fecha de aceptación: 15 de Mayo de 2014 |
Palabras clave: EEG, k-means, patrones espaciales comunes, correlación, selección, electrodos
Keywords: EEG, k-means, common spatial patterns, correlation, selection, electrodes. |
INTRODUCCIÓNLa clasificación de las ondas cerebrales que provienen de electroencefalógrafos tienen diferentes aplicaciones, por ejemplo la detección temprana de enfermedades como el Alzheimer, la epilepsia y los trastornos del sueño [1]. Otro ejemplo son las interfaces cerebro-computadora (BCI por sus siglas en inglés), que permiten a las personas con inmovilización física interactuar con diferentes componentes electro-mecánicos como sillas de ruedas y con aplicaciones de comunicación asistidas por computadora [2, 3]. La clasificación de las señales de un Electroencefalograma (EEG) relacionadas con el movimiento de extremidades, tradicionalmente se realiza promediando la información de varios experimentos para mejorar la calidad de la señal [3, 4], posteriormente se calculan características invariantes que se utilizan en algoritmos de aprendizaje automático como redes neuronales, árboles de decisión, discriminantes lineales y no lineales, entre otros [5]. Recientemente en [4] se ha propuesto un método llamado Patrones Espaciales Comunes (CSP) que utiliza la información de todos los canales de un EEG proyectándola en un espacio de dimensión menor, maximizando las diferencias entre los eventos que permiten obtener una clasificación precisa utilizando discriminantes lineales [6]. La selección de los electrodos directamente relacionados con actividades específicas, como el movimiento de las manos, es importante porque simplifica la colocación de sensores especialmente en personas con alguna discapacidad que llevan consigo los sensores por largos periodos de tiempo [7]. En [8] se propone seleccionar electrodos mediante el uso de distancias de Riemann entre las matrices de covarianza de clases específicas. En [9], para la selección de electrodos se utiliza información mutua entre los datos de los sensores y las etiquetas de los eventos. En este trabajo se presenta un algoritmo para seleccionar el grupo de electrodos relacionados con la imaginación del movimiento. Posteriormente se muestra que al integrar este algoritmo al método CSP y utilizando un clasificador lineal, al reducir el número de electrodos se mejora el índice de clasificación. La organización del trabajo es la siguiente: En la sección II se describen los datos experimentales y los métodos en los que se basa la propuesta (métrica de correlación, k-means, CSP y discriminante lineal), además se explica el criterio de selección del grupo de electrodos que están ligados a la actividad motora. En la sección III se discuten los resultados experimentales y finalmente en la sección IV se presentan las conclusiones. En la Figura 1 se muestra el flujo de información del algoritmo de pre-procesamiento propuesto y su integración al clasificador de eventos de época única, basado en el método CSP y un discriminante lineal. Los datos iniciales son una matriz de datos que representa las señales provenientes de 118 electrodos de un EEG. Esta información se agrupa mediante el algoritmo k-means utilizando la métrica de correlación. En cada grupo se mide la correlación intra-grupo y posteriormente se selecciona el grupo cuya correlación es mayor, reduciendo la cantidad de información procesada de 118 a 35 electrodos. Finalmente, las señales de los electrodos de este grupo son los datos de entrada a la etapa de clasificación de imaginación del movimiento mano izquierda vs pie derecho. Para esta etapa de clasificación primero se aplica el método CSP para proyectar los datos en un espacio de dimensión menor donde las clases son más fácilmente separables y posteriormente se aplica un discriminante lineal para distinguir los eventos de imaginación motora.
METODOLOGÍA
MaterialesLos datos experimentales se obtuvieron de Fraunhofer FIRST, Intelligent Data Analysis Group y Campus Benjamin Franklin of the Charité - University Medicine Berlin, Department of Neurology, Neurophysics Group (Gabriel Curio) [10]. La señal consiste de 118 canales de EEG obtenidos de un sujeto sano comodamente sentado en una silla en un cuarto con iluminación tenue, mientras imagina el movimiento de mano izquierda y pie derecho. En cada experimento se presenta en la pantalla una indicación visual durante 3.5 segundos para cada actividad motora seguido de un periodo de reposo aleatorios de al menos 2 segundos. Estas señales contienen etiquetas que corresponden a cada evento de imaginación de movimiento realizado en el experimento. Los artefactos provocados por movimientos involuntarios se eliminaron previamente de forma manual analizando visualmente la señal para excluir los segementos contaminados. MétodosDiversas métricas se han utilizado en el análisis de señales EEG para detectar regiones de la corteza cerebral con actividad funcional similar, como la correlación en el dominio del tiempo; mientras que en el dominio de la frecuencia, la coherencia y el índice de retardo de fase han sido de las más utilizadas. Sin embargo, como se demuestra en [11], la coherencia es asintóticamente equivalente a la correlación entre pares de señales filtradas. En este trabajo utilizamos la correlación debido a que su cálculo utiliza menos recursos de cómputo. La correlación se utiliza en el algoritmo k-means para identificar el grupo de sensores relacionados con la actividad motora en un espacio en donde las diferencias entre los eventos no son fácilmente distingibles. Por esta razón, posteriormente se utiliza el algoritmo CSP para obtener una nueva representación de la información [12] , donde los eventos de movimiento mano izquierda vs pie derecho son fácilmente separables.
Coeficiente de CorrelaciónSea D = {x1,x2,…,xm} el conjunto de vectores en ℝn, donde m es el número de electrodos y xi = (xi1,xi2,…,xin). El coeficiente de correlación provee una medida de similaridad entre las variables xi y xi′, está definido como:
donde μi y μi′ son las medias de los vectores de datos xi y xi′ respectivamente y sus valores están en el intervalo [-1,1].
Algoritmo k-meansEl algoritmo k-means [13, 14] es uno de los algoritmos de agrupamiento más utilizados diseñado para agrupar datos numéricos, donde cada agrupamiento contiene un centro llamado centroide. Definición 1. Sea O un conjunto de m objetos, D = {x1,x2,…,xm} el conjunto de vectores en ℝn de características de los objetos. Si G1,G2,…,Gk son k grupos disjuntos de O definimos el centroide del grupo i como
El procedimiento básico de k-means se resume a continuación:
Algunas propiedades y variantes del algoritmo k-means se discuten en [15] y [16].
Patrones Espaciales ComunesEl método CSP (por sus siglas en Inglés Commom Spatial Pattern) proyecta las señales originales multicanal en un espacio alternativo mediante una matriz de proyección W, la cual maximiza la separación espacial de los datos para dos eventos contenidos en las señales originales. Sea Xi ∈ ℝm×k un segmento de la señal de un EEG correspondiente al i-ésimo de N ensayos de imaginación de movimiento, donde m es el número de electrodos, k el número de muestras en el tiempo para Xi; con yi ∈{+1,-1} denotamos la etiqueta correspondiente (mano izquierda o pie derecho) a cada Xi . Además, sea Σ+ ∈ ℝm×m y Σ- ∈ ℝm×m las estimaciones de las matrices de covarianza de la señal EEG filtrada con un filtro pasa banda, luego: Esto se puede lograr resolviendo el problema generalizado de eigenvalores correspondiente.
La Ec. (4) se satisface en W, la cual consiste de eigenvectores generalizados wj (j = 1,…,m) de la Ec. (5) [12].
Clasificación de eventos EEGEn esta sección se describe el proceso de clasificación de las señales basado en el discriminante lineal y en el uso de la matriz de proyección que se obtiene mediante el método CSP. Definición 2. Un clasificador se define como una función f que predice las etiquetas de entrenamiento {+1,-1} de Xi mediante:
El clasificador representado en (6) proyecta la señal mediante J filtros espaciales (número de eigenvectores utilizados) j=1J ∈ ℝm×k, toma el logaritmo de las potencias de la señal proyectada y realiza la combinación lineal de las características J dimensionales con los umbrales βj determinados mediante el análisis del discriminante lineal. El valor de f es un número real cuyo signo es la clase correspondiente a la imaginación de movimiento de mano izquierda o pie derecho; ver [10] para consultar los detalles del método.
RESULTADOS y DISCUSÓNExisten regiones del cerebro relacionadas con actividades funcionales específicas como la actividad motora que se ubica en la región central, además se sabe que en tareas complejas varias regiones del cerebro se relacionan [17]. Sin embargo, la mayoría de las variantes del algoritmo CSP utilizan configuraciones densas de electrodos. En este trabajo se identifica el grupo de electrodos relacionados con la actividad de imaginación motora usando el algoritmo k-means en una tarea de clasificación de los eventos de movimiento mano izquierda vs pie derecho combinando el algoritmo CSP con el algoritmo disciminante lineal de Fisher. Este enfoque reduce significativamente el número de electrodos mejorando el indice de clasificación.
Montajes ManualesInicialmente se utilizaron tres montajes manuales para tener un marco de comparación con los resultados que se obtienen al automatizar la selección de electrodos con k-means. En este trabajo consideramos 3 configuraciones de electrodos: el estándar 10-20 extendido de 118 electrodos, el estándar 10-20 de 20 electrodos y una distribución de electrodos en el área central de 21 electrodos. La Figura 2 muestra los tres montajes manuales. Para estimar el rendimiento del clasificador, los datos disponibles se dividieron en conjuntos de entrenamiento y prueba. Los datos de entrenamiento se utilizan para obtener los parámetros del clasificador y posteriormente se utilizan para evaluar la capacidad de generalización del clasificador en el conjunto de datos de prueba calculando el índice de error. Para cada configuración el experimento se repite veinte veces con particiones de datos diferentes obtenidas aleatoriamente siguiendo la técnica de validación cruzada. Los resultados de la evaluación se presentan a continuación. Dos parámetros que influyen en el rendimiento del método CSP son, la ventana de tiempo que limita la cantidad de datos utilizados por ensayo después de que se presenta la indicación visual para imaginar el movimiento y el número de eigenvectores empleados para proyectar la información original a un espacio de dimensión menor que mejora la separación entre los dos eventos de imaginación motora. La tabla 1 muestra los errores de clasificación para las tres configuraciones manuales con sus desviaciones estándar respectivas. Observe que la mejor configuración es la correspondiente al estándar 10-20 extendido de 118 electrodos con un índice de clasificación del 88.4% seguida por la configuración central de 21 electrodos que alcanza el 88.27% de clasificación. Mientras que la configuración del 10-20 únicamente alcanza 86.98%.
Como se puede observar en la tabla 1 los montajes 10-20 extendido y central tienen los mejores índices de clasificación, sin embargo la configuración central tiene sólo 21 electrodos, casi 100 electrodos menos que la configuración 10-20 extendida. Selección Automática de ElectrodosComo la distribución de electrodos tiene un efecto importante en el índice de clasificación en la imaginación del movimiento, se evaluó el uso del algoritmo k-means para la selección automática de electrodos relacionados a la imaginación motora. Cuando el algoritmo k-means obtiene un mínimo local se selecciona el grupo de electrodos en el cual la suma de las correlaciones entre la señal promedio y todas las señales del grupo es mayor. Posteriormente se utiliza este grupo de electrodos como entrada en el algoritmo CSP para obtener el número de eigenvectores y la ventana de tiempo que mejor clasifica a los datos etiquetados. La tabla 2 muestra los errores de clasificación de la actividad motora cuando el algoritmo k-means obtiene desde cinco hasta diez grupos de electrodos. Observe que cuando se forman ocho y nueve grupos, el desempeño del algoritmo de clasificación es mejor, incluso superando los resultados que se obtienen al usar los 118 electrodos de la configuración 10-20 extendida (ver tabla 1). La figura 5 muestra como se agrupan los electrodos al utilizar el algoritmo k-means para obtener ocho y nueve grupos. Además, presenta el grupo con la suma de correlación intragrupo más alta. Observe que en el grupo seleccionado los electrodos se distribuyen en la parte pre-frontal y central de la corteza craneal con un sesgo a la derecha. Como se ha descrito en [18] la corteza contralateral motora primaria no es la única región del cerebro involucrada en el control motor. Dependiendo de la tarea motora específica, las áreas activas en los hemisferios contra-e ipsilateral son las áreas, pre-motoras, pariental, subcortical y del cerebelo. La figura 6 muestra la superficie de error de clasificación cuando se utiliza únicamente el grupo de electrodos más correlacionados (35 electrodos) de los nueve grupos obtenidos con el algoritmo k-means.
Con esta configuración se obtiene el menor error de todas las configuraciones estudiadas en este trabajo. ConclusionesEn este trabajo, se ha mostrado cuantitativamente que es posible seleccionar el conjunto de electrodos correlacionados con los eventos de imaginación motora mano izquierda y pie derecho utilizando el algoritmo k-means. Además, se muestra que los índices de clasificación mejoran al disminuir el número de electrodos (de 118 a 35) al seleccionar el grupo con el índice de correlación más alto. La identificación automática de un conjunto de electrodos relacionados con una actividad mental es importante porque puede mejorar la usabilidad de dispositivos BCI en personas con alguna discapacidad, al utilizar menos canales en el proceso de entrenamiento y evaluación del clasificador. Estudiar la dinámica de grupos de sensores en tareas colaborativas como el problema de coordinación ojo-mano y mejorar la selección de electrodos es parte del trabajo futuro. Referencias
[1] W.O. Tatum, A. M. Husain, S.R. Benbadis, and P.W. Kaplan. Handbook of EEG interpretation. Demos Medical Publishing, Cambridge, MA, 2007. [2] B. Blankertz, M. Kawanabe, R. Tomioka, F.U. Hohlefeld, V. Nikulin, and K.R. Müller. Invariant common spatial patterns: Alleviating nonstationarities in brain-computer interfacing. Advances in Neural Information Processing Systems 20, pages 113–120, 2008. [3] G. Dornhege, J. del R. Millán, T. Hinterberger, D. McFarland, and K.R. Müller, editors. Toward Brain-Computer Interfacing. MIT Press, Cambridge, MA, 2007. [4] H. Ramoser, J. Müller-Gerking, and G. Pfurtscheller. Optimal spatial filtering of single trial eeg during imagined hand movement. IEEE Trans. Rehab. Eng, 8:441–446, 1998. [5] Y. LI, H. Kambara, Y. Koike, and M. Sugiyama. Application of covariate shift adaptation techniques in brain-computer interfaces. IEEE Trans. Biomed. Engineering, 57(6):1318–1324, 2010. [6] S. Mika, G. Rätsch, J Weston, B Schölkopf, A. Smola, and K. R. Müller. Invariant feature extraction and classification in kernel spaces. Advances in Neural Information Processing Systems 12, pages 526–532, 2000. [7] P. Rajesh and N. Rao. Brain-Computer Interfacing: An Introduction. Cambridge, 2013. [8] A. Barachant and S. Bonnet. Channel selection procedure using riemannian distance for bci applications. Proc. Int. IEEE Eng. Med. Biol. Soc. Conf. Neural Eng., pages 348–51, 2011. [9] T. Lan, D. Erdogmus, A. Adami, M. Pavel, and S. Mathan. Salient eeg channel selection in brain computer interfaces by mutual information maximization. Proc. Int. IEEE Eng. Med. Biol. Soc. Conf., pages 7064–7, 2005. [10] B. Blankertz, R. Tomioka, S. Lemm, M. Kawanabe, and K.R. Müller. Optimizing spatial filters for robust eeg single-trial analysis. IEEE Signal Processing Magazine, 25(1):41–56, 2008. [11] H. Ombao and S. van Bellegem. Coherence analysis: A linear filtering point of view. IEEE transactions of Signal processing, 6(56):2259–2266, 2008. [12] H. Ramoser, J. Müller-Gerking, and G. Pfurtscheller. Optimal spatial filtering of single trial eeg during imagined hand movement. IEEE Transactions on Rehabilitation Engineering, 8(4):441–446, 2000. [13] J. Macqueen. Some methods for classification and analysis of multivariate observations. In Proceedings of the 5th Berkeley symposium on mathematical statistics and probability, 1:281–297, 1967. [14] E. Forgy. Cluster analysis of multivariate data: efficiency vs. interpretability of classifications. Boiometrics, 21:768–780, 1965. [15] R. Xu and Donald C. Wunsch II. Clustering. IEEE Computational Intelligence Society, John Wiley & Sons, 2008. [16] G. Gan, C. Ma, and J. Wu. Data Clustering. Theory, Algorithms, and Applications. Series on Statistics and Applied Probability ASA. Society for Industrial and Applied Mathematics SIAM, 2007. [17] L. Cocchi, A. Zalesky, T. Ulrike, T. J. Whitford, M. De-Lucia, M. M. Murray, and O. Carter. Dynamic changes in brain functional connectivity during concurrent dual-task performance. PLoS ONE, 6(11):e28301, 11 2011. [18] B. van Wijk, C. M. Bernadette, P.J. Beek, and A. Daffertshofer. Neural synchrony within the motor system: what have we learned so far? Frontiers in Human Neuroscience, 6(252), 2012. |