Introducción
La neurociencia estudia el sistema nervioso en diferentes niveles. Examina las moléculas, las células nerviosas, las redes neurales y la estructura del cerebro, de forma individual y en conjunto y cómo estos componentes interactúan para realizar diferentes actividades. Los neurocientíficos estudian cómo se desarrolla y funciona un sistema nervioso típico, así como los trastornos y las enfermedades que causan problemas al crecimiento o funcionamiento del sistema nervioso.1 La neurociencia actual solo se entiende relacionada con las nuevas tecnologías. El desarrollo de la computación, el big data,2 las redes neuronales artificiales,3 la interfaz cerebro computadora (BCI por sus siglas en inglés Brain Computer Interface),4 entre otras tecnologías, están redefiniendo esta ciencia.5
La neuroinformática es el campo que combina la informática y la neurociencia; está relacionada con el procesamiento de datos e información de neurociencia mediante redes neuronales artificiales,6 la aplicación de modelos computacionales y herramientas analíticas.7,8 Estas áreas de investigación son importantes por la cada vez mayor integración y análisis de grandes volúmenes de datos en detalle. Para poder continuar el estudio y entendimiento del cerebro, se necesitan nuevas tecnologías que permitan a estas áreas compartir datos y hallazgos de una manera estructurada y disciplinada. La neuroinformática viene a facilitar esa tarea. Existen tres direcciones principales en las que se debe aplicar: el desarrollo de modelos computacionales del sistema nervioso y procesos neurales; el desarrollo de herramientas para analizar y modelar datos de neurociencia; el desarrollo de herramientas y bases de datos para la gestión y el intercambio de datos de neurociencia en todos los niveles de análisis.8
Hace un siglo, la única manera de hacer un diagnóstico de los trastornos neurológicos era realizar una autopsia después de la muerte del paciente.9 En el año 1895 surgió la primera técnica de adquisición de imágenes médicas analógicas con el descubrimiento de los Rayos X por Wilhelm Roentgen.10 Años más tarde, aparecieron otros métodos de adquisición de datos neurocientíficos para detectar y analizar señales producidas por el cerebro, entre ellos el descubrimiento de la Electroencefalografía (EEG) por Hans Berger en 1920, 11 los neurocirujanos Wilder Penfield y Herbert Jasper fueron los primeros en utilizar la Electrocorticografía (ECoG) en la década de 1950, 12),(13 un protocolo quirúrgico utilizado para tratar a los pacientes con epilepsia severa, y a finales del año 1969 el neurocientífico David Cohen descubrió la primera Magnetoencefalografía (MEG) para medir la actividad neuromagnética dentro del cerebro. 14
En 1942 fue introducido por el neurólogo Karl Dussik, el ultrasonido como medio de diagnóstico en medicina para explorar anomalías cerebrales.15 Con la llegada de la imagen por resonancia magnética (MRI por sus siglas en inglés Magnetic Resonance Imaging) en el año 1946, por los físicos Edward Purcell y Félix Bloch, se logró otro notable avance en el desarrollo de las investigaciones del cerebro. 16 Los avances en el diagnóstico médico mediante la imagen radiológica, las señales cerebrales y otros tipos de datos neurocientíficos no hubiesen sido posible sin la invención de la computadora y el desarrollo paralelo de la informática. 17
Los datos de neurociencias que se obtienen en la actualidad pueden ser imágenes, señales, videos, audio, etc. Obtenidos a partir de escáneres como: Rayos X, (10 EEG, 18 Ultrasonido, 15 TC/TAC (Tomografía Computarizada o Tomografía Axial Computarizada), (10 MRI, 16 Tomografía por Emisión de Positrones (PET por sus siglas en inglés de Positron Emission Tomography), (19 MEG. 18
Estas técnicas de adquisición de datos generan gran cantidad de información, que requieren de herramientas especializadas para ser almacenados, transmitidos y, principalmente, analizados. Algunos de los programas utilizados en la actualidad, para su procesamiento, aplicados a la práctica médica son los siguientes: ITK (del inglés Insigth Segmentation and Registration Toolkit), VTK (del inglés Visualization Toolkit), MITK (del inglés Medical Imaging Interaction Toolkit), Volumizer y 3D Slicer.20EEGmagic,21EEGLAP,22 SPM (del inglés Statistical Parametric Mapping), 23 FSL (del inglés FMRIB Software Library), 24 MNE. 25
En la última década también se han desarrollado múltiples proyectos para facilitar el almacenamiento, algunos de los que se destacan: The National fMRI Data Center, un repositorio público que busca proporcionar un depósito para los enormes conjuntos de datos generados por los experimentos de fMRI 26; OpenNeuro es una base de datos de neuroinformática de ciencia abierta que almacena conjuntos de datos de estudios de investigación de imágenes del cerebro humano;27Neurodata Without Borders proporciona un formato o lenguaje común para los datos cerebrales con el objetivo de facilitar el intercambio libre y abierto de información compleja sobre el cerebro;28 y Chonux que es un paquete de software de código abierto para el análisis de datos neuronales.29
Estos datos involucran archivos en diferentes formatos, que van desde archivos de textos simples hasta datos de imágenes multidimensionales, que se pueden organizar de formas diferentes. Hasta la fecha no ha habido consenso sobre cómo organizar y compartir estos datos, lo que conduce a malentendidos y pérdida de tiempo. Algunos de estos formatos pueden ser: dcm o también llamados archivos de imágenes DICOM sinónimo de Digital Imaging and Communications in Medicine, el formato mnc, nifti (Neuroimaging Informations Technology Initiative) y Analyz. 30) Así como edf,31 PAR/REC, 32 ECAT7, 33 BIDS(Brain Imaging Data Structure), 34 entre otros.
Es un serio desafío para los neurocientíficos realizar un seguimiento de la abrumadora cantidad de datos y metadatos generados en cada investigación y extraer con precisión la información relevante. Además, el conocimiento detallado de los procesos completos de registro y análisis de los datos es crucial para la interpretación correcta de los resultados, y es un requisito mínimo para que los investigadores puedan construir su propia investigación sobre los hallazgos anteriores. La información sobre una determinada investigación puede ser transmitida por comunicación personal, a través de cuadernos escritos a mano o como conocimiento implícito de los neurocientíficos, dicha información a menudo no se comunica o se comunica de una manera ambigua que conduce a malentendidos. 35
Para evitar tales escenarios, el principio general debería ser mantener tanta información sobre una investigación como sea posible desde el principio, incluso si la información parece ser trivial o irrelevante en ese momento. Además, se deben anotar los datos con sus metadatos de forma clara y concisa. En la actualidad falta una investigación detallada sobre cómo incorporar la gestión de datos y metadatos en las investigaciones clínicas del cerebro en términos de: organizar los datos y metadatos en una colección completa, recopilar e ingresar los datos y metadatos, y sacar provecho de dicha recopilación resultante en el proceso de análisis de los datos. 35
No se han identificado en la literatura especializada investigaciones relacionadas con la recopilación, catalogación y clasificación de los datos de neurociencias y sus metadatos. Esto provoca que el diseño y desarrollo de bases de datos de neurociencias se complejice por no contar con la información antes descrita. Constantemente es necesario la modificación de las propiedades de las BD para incluir datos y metadatos. Adicionalmente existen metadatos asociados a datos que no son útiles para las investigaciones clínicas, sin embargo, estos no están documentados, solo se encuentra como conocimiento empírico de los investigadores, lo cual atenta contra la gestión del conocimiento y la retención del “know how” de la institución correspondiente.
La creciente complejidad de las investigaciones y la cantidad de datos adquiridos en el campo de las neurociencias plantean demandas crecientes en la gestión de datos y metadatos. El presente trabajo tiene como objetivo realizar una caracterización de los datos y metadatos de neurociencias para apoyar futuras investigaciones relacionadas al desarrollo de repositorios cubanos.
Materiales y métodos
Se consultaron diferentes plataformas en línea, artículos científicos, bases de datos referenciadas y repositorios que resultaron provechosos y prácticos en la recopilación de la información relacionada con las características de los datos y metadatos neurocientíficos. A continuación, se presentan las fuentes bibliográficas más destacadas en la realización de la investigación:
Pubmed es un motor de búsqueda de libre acceso que permite consultar principal y mayoritariamente los contenidos de la base de datos MEDLINE, aunque también una variedad de revistas científicas de similar calidad pero que no son parte de MEDLINE. A través de este buscador es posible acceder a referencias bibliográficas y resúmenes de estos artículos de investigación biomédica. 36
Scielo es un proyecto de biblioteca electrónica que permite la publicación electrónica de ediciones completas de las revistas científicas mediante una plataforma de software que posibilita el acceso a través de distintos mecanismos como el motor de búsqueda. Además, cuenta con el apoyo de diversas instituciones nacionales e internacionales vinculadas a la edición y divulgación científica. 37
Frontiers es una editorial de publicaciones científicas de acceso abierto y ResearchGate es una red social en internet y una herramienta de colaboración dirigida a personas que hacen ciencia en cualquier disciplina. 38,39
Se consultaron repositorios o bases de datos más destacadas como OpenNeuro, fMRI Data Center y Neurodata Without Borders.
Libros como “Positron Emission Tomography”, “An introduction to the event-related potential technique” y “Human Time Data: Working with iEEG Data: an introduction”
Se revisaron diversos artículos científicos publicados en revistas académicas como Nature/Scientific Data y Journal Frontiers.
Resultados
Desarrollo de la neurociencia, ámbito internacional
En los últimos años han venido apareciendo en todo el mundo iniciativas que buscan mapear el cerebro. Todas tienen diferentes objetivos y áreas de especialización, pero ahora los investigadores intentarán aplicar sus conocimientos colectivos en un impulso global para comprender mejor el cerebro. (40 Cientos de neurocientíficos han construido el mapa más completo y detallado de la corteza motora, sentando las bases para cartografiar todo el cerebro y comprender a fondo las enfermedades mentales. (41
El BigBrain y el Allen Brain Atlas son solo dos entre diversas iniciativas que están abordando la cartografía del cerebro por diferentes técnicas y a distintos niveles de complejidad y detalle. El Human Connectome Project, impulsado por los Institutos Nacionales de la Salud de EEUU (NIH), reunió datos de neuroimágenes del cerebro de 1.200 personas para crear un conectoma, un gran mapa de conexiones, las autopistas por las que discurren los procesos cerebrales; EEUU tiene su apuesta en la BRAIN Initiative del NIH, mientras que Japón lanzó el proyecto Brain/MINDS. 42
La Iniciativa Internacional del Cerebro fue anunciada el 19 de septiembre del 2016 en una reunión organizada por la Asamblea General de las Naciones Unidas en Nueva York. En esta se encontraban los representantes de los principales proyectos de investigación cerebral del mundo, los cuales incluían iniciativas de Japón, Corea, la Unión Europea, Estados Unidos, Australia, China y Canadá. Como se mencionó anteriormente, el objetivo de este proyecto es darle acceso a los neurocientíficos a mayores bases de datos a través de una colaboración internacional, para así poder acelerar la investigación y el desarrollo de la neurociencia. 43
Este proyecto básicamente unificó formalmente esfuerzos que ya existían. Como la Iniciativa BRAIN de Estados Unidos establecida en el 2013, con un presupuesto estimado por encima de los 1.000 millones de dólares; el Proyecto Cerebro Humano con una inversión inicial de 1.200 millones de euros por parte de la Unión Europea; y el Proyecto Cerebro de China establecido en el 2016. A partir de estas alianzas, este ambicioso proyecto global busca conseguir uno de los mayores retos de la neurociencia: Mapear y replicar toda la actividad neuronal del cerebro humano. 43
El mapeo cerebral se refiere a un conjunto de técnicas de la neurociencia que nos ayudan a generar un esquema de las conexiones neuronales que hay dentro de nuestro cerebro. 43 Existen herramientas experimentales prometedoras, pero los laboratorios hacen sus propias variaciones y tienden a realizar experimentos de forma personal. Esto hace que sea más difícil para los diferentes equipos colaborar o intercambiar información. (39
Para obtener un mapa óptimo del cerebro, el cual replique precisamente todo el conectoma humano, sería necesario cartografiar cada una de las neuronas que conforma el tejido cerebral. No obstante, el cerebro humano en promedio cuenta con 100,000 millones de neuronas, y cada neurona tiene aproximadamente 10,000 dendritas o ramificaciones que interactúan con otras neuronas. Con esto se puede evidenciar la magnitud de los retos a los que se enfrenta la neurociencia. Adicionalmente, las tecnologías más avanzas de neuroimagenología actuales permiten obtener resoluciones en escalas de milímetros, mientras que para escanear una sinapsis o conexión neuronal se necesita una resolución de por lo menos una micra, lo que equivale a una milésima parte de un milímetro. (43
Dicho esto, es evidente que el proceso de mapear por completo el cerebro humano resultaría muy largo y costoso para un solo organismo de investigación. Y es por ello por lo que los recientes esfuerzos de colaboración acordados en la Iniciativa Internacional del Cerebro (IBI) representan un paso histórico para la medicina y todas sus ramas. Esto es porque a pesar de los diferentes intereses que puede tener cada país u organización individual, se puede llegar a estar todos de acuerdo que descifrar de una vez por todas el mecanismo que hay detrás de la mente humana será un beneficio para la humanidad en su conjunto. 43
Desarrollo de la neurociencia, ámbito nacional
Entre las líneas de trabajo de las neurociencias en Cuba se encuentran actualmente la producción de tecnología para detectar trastornos auditivos y del aprendizaje, sobre todo en función del neurodesarrollo escolar, la telemedicina, nuevos aportes al diagnóstico y tratamiento de la epilepsia, el monitoreo del sistema nervioso central durante los procesos quirúrgicos y la Neuroinformática, en especial el proyecto de mapeo cerebral, campo novedoso en el que Cuba no solo asimila resultados del primer mundo sino que también contribuye con nuevos saberes. 44
La evolución de los esfuerzos cubanos se describe en tres etapas sucesivas: Trabajo en n / qEEG-top que lleva a cabo una comparación estadística de topografías espectrales EEG individuales con respecto a una base de datos normativos - contribuyendo así al ahora popular SPM de parámetros descriptivos del cerebro; contribución al desarrollo de (n / qEEG-TOM), que emplea BET para calcular mapas SPM de voxelwise de características de fuentes espectrales con respecto a una norma; contribución al desarrollo de un n / qMN más general mediante la sustitución de los parámetros de EEG con parámetros descriptivos de neuroimagen multimodal para obtener mapas de SPM. 45
CNEURO ha estado involucrado en la creación y aplicación de la tecnología qEEG y n / qMN desde el año 1969, el trabajo inicial se inició con dispositivos informáticos neurofisiológicos de propósito especial: el CAT-400 C1 para la obtención de potenciales evocados y el detector de coincidencia de polaridad para analizar la simetría del electroencefalograma. Las exploraciones tentativas iniciales de variables electrofisiológicas en pacientes fueron transformadas en 1970 por la creación de una mini-computadora cubana, la CID 201. Esto permitió una extracción de características más sofisticada de potenciales evocados y medidas de EEG, así como la creación de una extensa base de datos normativa. La CID 201 también permitió el uso de métodos multivariados para agrupar sujetos y análisis lineales discriminantes entre sujetos normales y pacientes neurológicos. 45
Este trabajo inició un frenesí de estudios colaborativos que se resumieron en un artículo que describe los métodos y aplicaciones de la neurometría, un nombre temprano para n / qEEG. Después de esta etapa inicial, Cuba creó su propia tecnología nacional de qEEG. Con esta plataforma, el sistema de salud cubano construyó una red nacional de neurofisiología clínica basada en los siguientes principios: (1) Estrictas pruebas, antes de la aprobación, de n / qEEG equipos y métodos. La organización de estas pruebas condujo al uso sistemático de las curvas de características operativas del receptor (ROC), para la toma de decisiones objetivas. (2) Creación de una base de datos normativa de EEG de la población cubana en el rango de edad de 5-97 años como base de pruebas cuantitativas de normalidad. (3) Uso de n / qEEG como complemento de la práctica clínica aprobada en neurología y psiquiatría codificada en directrices sanitarias internacionales. 45
El Proyecto Cubano de Mapeo Cerebral Humano (por sus siglas en inglés CHBMP) se inició en 2005 para lograr los siguientes objetivos: (1) La creación de una población basada en Base de datos clínica / de neuroimagen multimodal de sujetos sanos, en riesgo y enfermos que proporcionaría datos epidemiológicos generales y serviría como base para estudios adicionales. (2) La creación de software / herramientas estadísticas para comparar sujetos con respecto a la información en la base de datos con el fin de abordar: (a) Detección temprana en programas de detección; (b) Investigación en neurociencias; (c) Ensayos clínicos. (3) Evaluación de la utilidad de las herramientas para entidades específicas de riesgo y enfermedad con el fin de evaluar las mejores prácticas para el uso de diferentes tecnologías. 45
El CHBMP está creando una base de datos multimodal que puede verse como una combinación de los esfuerzos normativos más tradicionales de bases de datos de EEG con esfuerzos más recientes de mapeo del cerebro humano, como el del Consorcio Internacional para el Mapeo del Cerebro (ICBM) que inició el desarrollo de bases de datos estandarizadas y herramientas neuroinformáticas con el fin de obtener atlas de variabilidad cerebral normal y patológica. Este esfuerzo inicial ha generado un número creciente de estudios normativos que, sin embargo, carecen de los datos electrofisiológicos-lógicos correspondientes. 45
En la Fig.1 se muestra el flujo de trabajo de procesamiento de neuroimagen multimodal de CHBMP.
a) Las imágenes T1 / T2 / PD / DTIMRI están preprocesadas, incluido el registro conjunto con la plantilla de ICBM. b) IBASPM (software ad-hoc) para la segmentación de imágenes cerebrales en 116 estructuras anatómicas de materia gris. c) Información de imagen ponderada por difusión (DWI) para evaluar la matriz de conectividad anatómica. d) La información anatómica se utiliza para estimar el campo de derivación para el problema de EEG directo de cada sujeto. e) Las medidas de mapas topográficos de EEG de 64 canales para cada frecuencia se utilizan en combinación con el campo de derivación. (f) Tomografía eléctrica cerebral de medidas espectrales de EEG. (41
Descripción general de los tipos de datos de neurociencias
Analyze: La gran idea del formato Analyze fue que ha sido diseñado para datos multidimensionales (volumen). De hecho, es posible almacenar en un archivo datos 3D o 4D (la cuarta dimensión suele ser la información temporal.30
Archivos dcm o también llamados archivos de imágenes DICOM, se utiliza para guardar imágenes de ultrasonido, MRI, TAC, entre otros.30
Nifti es un tipo de formato con extensión nii que se utilizan con frecuencia en la informática de imágenes para la neurociencia e incluso la investigación en neurorradiología.30
Edf es una extensión de archivo comúnmente asociada con los archivos ESRF Data Format utilizado para fotos o imágenes digitales y objetos 3D.31
PAR/REC es el formato en el que se encuentran una serie de imágenes tras haber sido obtenidas por el escáner. El archivo .rec contiene los bytes de todas las imágenes, y el archivo *.par contiene meta-información, como número de imágenes por corte y tamaño de vóxel.32
El formato de archivo Minc se desarrolló para proporcionar un formato de datos flexible para imágenes médicas.30
ECAT7 es un formato de archivo utilizado para imágenes PET.33
BKR formato utilizado en EEG.
BIDS la estructura para datos de imagen cerebral es un estándar para organizar, anotar, y describir los datos recogidos mediante pruebas de neuroimagen.34
Los metadatos constituyen la información que describe la imagen. En cualquier formato de archivo, siempre hay información asociada con la imagen más allá de los datos de píxeles. Esta información denominada metadatos se almacena normalmente al principio del archivo como encabezado y contiene al menos las dimensiones de la matriz de la imagen, la resolución espacial, la profundidad de píxeles y la interpretación fotométrica. Gracias a los metadatos, una aplicación de software puede reconocer y abrir correctamente una imagen en un formato de archivo compatible simplemente con un doble clic o arrastrando el icono de la imagen al icono de la aplicación. 30
En el caso de las imágenes médicas, los metadatos tienen un papel más amplio debido a la naturaleza de las imágenes en sí. Las imágenes que provienen de modalidades de diagnóstico suelen tener información sobre cómo se produjo la imagen. Por ejemplo, una imagen de resonancia magnética tendrá parámetros relacionados con la secuencia de pulsos utilizada, por ejemplo, información de tiempo, ángulo de giro, número de adquisiciones, etc. Una imagen de medicina nuclear como una imagen de PET tendrá información sobre el radiofármaco inyectado y el peso del paciente. 30
Los formatos de archivo de post procesamiento tienen una sección de metadatos más tersa que esencialmente describe los datos de píxeles. El diferente contenido de los metadatos es la principal diferencia entre las imágenes producidas por una modalidad de diagnóstico y las imágenes post procesadas. Los metadatos son una herramienta poderosa para anotar y explotar información relacionada con imágenes con fines clínicos y de investigación y para organizar y recuperar en archivos imágenes y datos asociados. 30
Especificaciones del formato BIDS
BIDS es un formato para estandarizar y describir los resultados de los experimentos de neuroimagen (Fig.2 izquierda) de una manera intuitiva de entender y fácil de usar con las herramientas de análisis existentes (Fig. 2 derecha).
Cualquier archivo de metadatos (por ejemplo, archivos que terminen en: .json, .bvec, _events.tsv, _physio.tsv.gz y _stim.tsv) se puede definir en uno de cuatro niveles (en orden jerárquico): adquisición de resonancia magnética, sesión, tema, o conjunto de datos. Los valores del nivel superior son heredados por todos los niveles inferiores a menos que sean anulados por un archivo en el nivel inferior. Por ejemplo, /task-nback_bold.json se puede especificar en el nivel del conjunto de datos para establecer el tiempo de repetición (TR) para todos los sujetos, sesiones y ejecuciones. Si una de las ejecuciones tiene un TR diferente al especificado en el archivo de nivel del conjunto de datos, se puede utilizar un archivo /sub-osubject_id>/sub-osubject_id>_task-nback_bold.json para especificar el TR para esa ejecución específica. (46
Para maximizar la adopción y la flexibilidad del estándar BIDS, solo se requiere un pequeño subconjunto de campos de metadatos y archivos (obligatorio). La decisión de qué campos y archivos de metadatos se requieren se basó en los metadatos mínimos necesarios para realizar análisis básicos estándar en cada tipo de datos. Para las exploraciones anatómicas, solo se requiere especificar el tipo (ponderado en T1, ponderado en T2, mapa T1, etc.). Para las exploraciones funcionales (fMRI), el investigador debe especificar un nombre de tarea (que podría ser 'descanso' en las llamadas exploraciones en estado de reposo), tiempo de repetición (en segundos) y tiempo y duración de todos los eventos (estímulos y / o respuestas, a menos que el sujeto no estuviera realizando ninguna tarea. 46
Para imágenes ponderadas por difusión, los metadatos requeridos se limitan a valores b (en forma de .bvalfiles) y tablas de gradiente de difusión (en forma de .bvecfiles). Los diferentes tipos de mapas de campo también incluyen un conjunto de campos requeridos correspondientes. De manera similar, cuando se incluyen registros fisiológicos (respiratorios o cardíacos) u otros registros continuos, el investigador debe especificar una hora de inicio (en relación con el comienzo de la adquisición de imágenes) y la frecuencia de muestreo. Cuando falta un archivo o campo de metadatos requerido, el Validador de BIDS 40 informará un error. 46
Además de los metadatos obligatorios, el estándar BIDS recomienda con fuerza la inclusión de otros metadatos que son cruciales para realizar algunos tipos adicionales de análisis. Estos incluyen, pero no se limitan a, tiempo de corte (necesario para la corrección de tiempo de corte), dirección de codificación de fase, espaciamiento de eco efectivo y tiempo de eco (requerido para realizar desarmado de campo). Cuando falta una pieza recomendada de metadatos, el Validador de BIDS informará una advertencia. 46
Conclusiones
Con el desarrollo de la investigación se identificaron y caracterizaron los equipos de adquisición de datos de neurociencias, así como su funcionamiento y tipos de datos que generan. Se profundizó sobre los tipos de formatos y las características principales de los metadatos correspondientes.
El análisis sobre la recopilación, organización, procesamiento y almacenamiento de los datos y metadatos de neurociencias para cada técnica de adquisición de datos (EEG, iEEG, MEG, PET), así como su vínculo a la estructura de datos de imágenes cerebrales (BIDS) permitió obtener una caracterización general de cómo gestionar y procesar la información contenida en los mismos.
Existe una tendencia al aumento de las investigaciones de neurociencias teniendo como eje fundamental el procesamiento del cúmulo de datos, por lo que se hace necesario el desarrollo de soluciones informáticas para su almacenamiento, organización y gestión.