Surface representation model of macromolecular structures

Navas-Conyedo, Edisel; Ramírez-Cayón, Leonardo A.; Gonzáles-Suárez, Amauris D.; Gulín-González, Jorge; Navas-Conyedo, Edisel; Ramírez-Cayón, Leonardo A.; Gonzáles-Suárez, Amauris D.; Gulín-González, Jorge

My SciELO

Custom services

Services on Demand

Article

Send this article by e-mail

Indicators

Cited by SciELO

Revista Cubana de Ciencias Informáticas

On-line version ISSN 2227-1899

Rev cuba cienc informat vol.15 no.4 supl.1 La Habana 2021 Epub Dec 01, 2021

Artículo originales

Modelo de representación de superficies de estructuras macromoleculares

Surface representation model of macromolecular structures

0000-0001-8315-6032Edisel Navas-Conyedo¹^*, 0000-0002-2866-2272Leonardo A. Ramírez-Cayón², 0000-0002-2866-2271Amauris D. Gonzáles-Suárez², 0000-0001-7912-2665Jorge Gulín-González¹

^¹Centro de Estudio de Matemática Computacional (CEMC). Grupo de Matemática y Física Computacionales, Facultad de Ciencias y Tecnologías Computacionales. Universidad de las Ciencias Informáticas, Carretera a San Antonio delos Ba ños, 2 1 Km, Torrens, La Lisa, La Habana, Cuba.

^²Facultad de Ciencias y Tecnologıas Computacionales. Universidad de las Ciencias Informaticas, Carretera a San Antonio delos Ba ños, 2 1 Km, Torrens, La Lisa, La Habana, Cuba.

RESUMEN

Algunas estructuras biológicas como macromoléculas, proteínas y plaquetas tienen cientos o miles de estructuras atómicas, donde las estructuras internas son irrelevantes a la hora de evaluar la interacción entre ellas. Al evaluar la interacción entre estructuras, la información presente en su superficie es suficiente, por esta razón, es importante contar con un modelo que abstraiga toda la estructura interna, manteniendo solo la presente en la superficie y evitando cálculos innecesarios. Proponemos un módulo de Python nombrado pysurmolmesh para la construcción de un modelo representativo de las superficies de estructuras macromoleculares a través de una malla de partículas interactuantes que reflejan sus propiedades mecánicas y químicas, evitando contener información sobre las estructuras macromoleculares internas.

Palabras-clave: Modelo de superficie; Macromoléculas; Python

ABSTRACT

Some biological structures as macromolecules, proteins, and platelets have hundreds to thousands of atomic structures, where internal structures are irrelevant when evaluating the interaction between them. When evaluating the interaction between structures, the information present on their surface is sufficient, for this reason, it is important to have a model that abstracts the entire internal structure, keeping only the one present on the surface and avoiding unnecessary computations. We propose a Python module named pysurmolmesh for the construction of a representative model of the surfaces of macromolecular structures through a mesh of inter- acting particles that reflect their mechanical and chemical properties, avoiding containing information on the internal macromolecular structures.

Key words: Surface model; Macromolecule; Python

Introducción

Para el estudio computacional de sistemas macromoleculares con métodos ab-initio como dinámica molecular (^{Boinepalli and Attard, 2003}) o similares, se necesita de la información que especifica las características morfológicas e interacciones del sistema de estudio. Usualmente, el usuario en el proceso de dise ño de la simulación debe proveer explícitamente toda la información de todos los componentes y las interacciones presentes en el sistema, donde en algunos casos existen comportamientos inalterables e irrelevantes para el estudio realizado (San, 2021). Tal es el caso de las interacciones entre sistemas macromoleculares, puesto que estas ocurren solamente entre las estructuras que conforman la superficie, quedando inmutable el resto de las estructuras internas. Esto posibilita la creación de un modelo abstracto que reduce el volumen de información correspondiente a las estructuras con conformaciones internas inmutables, reduciendo la información a un modelo de superficie.

En general, las proteínas tienen características cercanas a cuerpos semirrígidos, que pueden modelarse como una colección de partículas coloides unidas (^{Fuhrmans and Mu¨ller, 2013}; ^{Kreuziger et al., 2020}). Para que se tenga una idea cuantitativa, estructuras como la Trombina poseen 9278 átomos y de ellos solo 456 en la capa superficial (^{Chinnaraj et al., 2018}), por tanto, con un modelo de 456 partículas o menos se pueden representar las características químico-físicas de esta molécula durante su interacción con otros componentes. Desde el punto de vista físico, estas estructuras pueden considerarse materia condensada suave (soft condesed matter en Inglés), donde las propiedades elásticas del enmallado y los potenciales iónicos-químicos definen su com- portamiento, siendo relevante construir el modelo físico acorde a parámetros experimentales por interpolación por análisis posteriores Ab-initio (^{Bagchi et al., 2005}; ^{Grubmu¨ller et al., 1991}; ^{von Bu¨low et al., 2019}). De esta manera se preserva el efecto de forma y tamaño de la estructura, evitando la contribución de las estructuras internas, manteniendo la solo información necesaria para evaluar la interacción con otras estructuras durante la simulación. La herramienta de software para la generación del modelo de superficie es implementada como un módulo para Python (^{Foundation, 2020}), optimizado para su uso en el ambiente interactivo Jupyter (Varoquaux et al., 2021), el cual incluye además de las funciones necesarias para generar el modelo de superficie, otras útiles para su posterior representación visual 3D.

Métodos o Metodología Computacional

Una macromolécula estác ompuesta por un conjunto de Ná tomos de los cuáles se conoce su disposición espacial, además de cada átomo se conoce su tama ño efectivo, para lo cual se puede usar el radio iónico como referencia. Por tanto, de cada i−átomo de la estructura se conoce la tupla , siendo →Ri el vector de posición de cada átomo y di su radio iónico. Para la reconstrucción de la superficie exterior de la estructura es necesario comprender el concepto de función de distancia signada de un punto p en el espacio respecto a una esfera E con centro en la posición R→E y de radio dE , como:

Resulta evidente comprobar en la ecuación (1) que para los puntos interiores a la esfera spE < 0, para los exteriores spE > 0 y spE = 0 en los puntos sobre la superficie. Por tanto, la distancia de un punto p a la superficie externa de una estructura formada por los N átomos se puede calcular como

spN = mín (spi) (2)

, siendo spi la distancia del punto p al i−átomo de la estructura (^{Persson and Strang, 2004}; ^{Zhang et al., 2014}).

Para la generación del modelo de superficie externas primeramente se genera un conjunto de puntos equidistantes sobre una esfera que circunscribe a la estructura, centrada en →

Fig. 1 Distribución de puntos en una esfera unitaria para ρ ∈ {2, 4, 5}.

máx (d _i ). El número de puntos depende del número de latitudes ρ ≥ 2, generando puntos sobre la superficie esférica que equidistan en

con un número de puntos aproximado de m = 5 ρ2 − ρ + 2¹. Cada punto está conectado con sus vecinos más cercanos formando un un enmallado de Delaunay (^{Varoquaux et al., 2021}). En la Figura 1 se muestran la distribución de puntos generadas para el conjunto de valores ρ ∈ {2, 4, 5} correspondientes a {20, 78, 124} puntos respectivamente.

Cada punto j generado es movido hacia superficie de la estructura bajo la acción de una pseudo-fuerza correspondiente a un potencial elástico donde el índice k corresponde a los vecinos de la triangulación que conecta cada vértice, el proceso se realiza a través del método de gradiente descendiente(^{Lambert, 1991}; ^{Galassi et al., 2011}; ^{Press et al., 2007}). Este proceso garantiza que se mantenga la distancia media entre los puntos de la superficie generada a la vez que se sitúen sobre la superficie exterior con una densidad constante que atrapa las características geométricas fundamentales de la estructura y reduce el volumen de puntos a generar.

Para acelerar la evaluación de la distancia en la ecuación (2), se almacena la información de la posición de los N átomos de la estructura en una estructura de datos de árbol KD (KD Tree en idioma Inglés) (^{Varoquaux et al., 2021}), con lo que se asegura que la evaluación tenga un orden de complejidad algorítmica de O (log₂ (N)). En el enmallado de Delaunay 3D se genera un conjunto de tetraedros de los cuáles se eliminan las caras interiores, evaluando la función de distancia signada (2) sobre los incentros de los triángulos de cada cara, dejando solo la cara de menor valor absoluto de distancia.

El algoritmo para generar el modelo de superficie ha sido implementado como un módulo de Python optimiza- do para su uso desde interfaces interactivas como Jupyter, el cual se puede instalar utilizando la herramienta de gestión de paquetes de Python pip desde la URL https://github.com/Ertytux/pysurmolmesh. git a través de:

pip install -e https://github.com/Ertytux/pysurmolmesh.git

Para cargar una estructura macromolecular, desde un archivo en alguno de los formatos estándares para este tipo de estructura, se utiliza la función loadPDB que devuelve tres arreglos, el primero de ellos el listado de tipos de átomos, el segundo sus posiciones y por último el radio iónico de cada tipo como:

El parámetro rho es el ρ utilizado para generar el enmallado inicial relajado sobre la estructura, el cuál define la finura utilizada y se escoge buscando que el número de vértices sea menor o igual que el número de átomos exteriores de la estructura, a la vez que se tenga la información geométricas necesaria para construir un modelo

Fig. 2 Representación de la Trombina

reducido. Los parámetros de salida son: pst es el arreglo de posiciones de los vértices del enmallado, bl el arreglo de los pares de índices de las aristas, trigs el arreglo de la triada de vértices de los triángulos de las caras de las superficies exteriores y por último err el residuo relativo al valor s dependiente de ρ como medida del error de generación, ver ecuación (3).

RESULTADOS Y DISCUSIÓN

Para ilustrar la representación simplificada de estructuras, se utilizaron tres macromoléculas con geometrías diferentes: Trombina (^{Chinnaraj et al., 2018}), Amiliode-P y proteína C-Reactiva (^{Mikolajek et al., 2011}), estas estructuras tienen en común que poseen forma propelar, por lo que resulta compleja su representación adecuada, pues pose bordes agudos con ángulos de ataque progresivos, aspecto que es importante para muchos estudios donde la hidrodinámica es importante (^{Panyang et al., 2020}; ^{Basagaoglu et al., 2018}). Para cada una de ellas hicimos una representación simple de las estructuras atómicas, donde por simplicidad y para una representación visual adecuada mostramos las posiciones atómicas de los átomos de mayor tamaño. A continuación, generamos el correspondiente enmallado y luego mostramos conjuntamente el enmallado y las representaciones atómicas, el cual denominamos mixto.

La Trombina, Figura 2, tiene una estructura alargada con un centro ancho, semejante a una hélice, donde los puntos geométricos relevantes se encuentran en el centro y bordes de las propelas, este tipo de estructura es relevante pues los bordes deben identificarse y hay una estructura progresiva que es muy particular de las formas propelares. Esto es identificado por el algoritmo concentrando un mayor número de puntos en el centro y borde de la estructura.

Fig. 3 Representación del Amiliode-P

Fig. 4 Representación de la proteína C-Reactiva

Tanto el Amiliode-P, Figura 3, como la proteína C-Reactiva, Figura 4, poseen una estructura pentagonal, donde la diferencia más notable está en el grosor casi cilíndrico del Amiliode-P con una cavidad interna más peque ña. En ambos casos se logra una representación adecuada de las estructuras externas, no así de la cavidad, como en el Amiliode-P, donde los puntos del enmallado generado cerca de la cavidad interior no son suficientes, aún cuando la estructura general es aceptable.

Cuando el enmallado es generado, además de la información de los vértices, se genera la información de las conexiones entre ellos y de la lista de triadas de puntos que conforman las superficies de las caras. Esta información resulta útil para generar estructuras vesiculares coloidales que sustituyan a la macromolécula durante una simulación. Téngase en cuenta que en las interacciones entre estructuras macromoleculares esencialmente intervienen las superficies, la parte interna solo se tienen en cuenta cuando por motivos eléctricos (desplazamiento de cargas o efectos de dipolos eléctricos) intervienen en las interacciones, aunque este aspecto se puede atribuir directamente a los nodos situados en superficie de manera efectiva, de forma que se reproduzca aproximadamente el mismo patrón de interacción.

En general, la herramienta desarrollada genera correctamente el modelo de superficie de las estructuras cuando no hay cavidades internas dentro de la estructura a representar, esto constituye una limitante si se desea estudiar efectos o fenómenos de cavitación o absorción de estructuras más peque ñas dentro de la cavidad, lo cual se será corregido en versiones futuras del módulo.

CONCLUSIONES

Se desarrolló un módulo de Python para su uso interactivo desde Júpiter para creación de modelos de superficie y la representación geométrica de estructuras macromoleculares. El algoritmo utilizado para generar el modelo de superficie reproduce las características geométricas fundamentales de la macromolécula representada, salvo cuando hay presencia de cavidades, donde correcciones posteriores deben ser introducidas.

La información del enmallado generado puede asociarse a una estructura coloidal sustituyente para ser utilizado en simulaciones complejas, donde se evalúe solo la interacción entre las superficies de los componentes o en estudios de microfluídica con la interacción con un solvente.

Agradecimientos

Agradecemos al proyecto nacional e institucional de la Universidad de las Ciencias Informáticas: Estudio de los efectos hidrodinámicos en las interacciones de partículas virales en la sangre mediante técnicas de microfluídica computacional por el soporte de la presente investigación.

REFERENCIAS

Prosenjit Bagchi, Paul C. Johnson, and Aleksander S. Popel. Computational fluid dynamic simulation of aggregation of deformable cells in a shear flow. Journal of Biomechanical Engineering, 127(7):1070-1080, Aug 2005. ISSN 0148-0731. [ Links ]

Hakan Basagaoglu, Sauro Succi, Danielle Wyrick, and Justin Blount. Particle shape influences settling and sorting behavior in microfluidic domains. Scientific Reports, 8(1):8583, June 2018. ISSN 2045-2322. URL https://doi.org/10.1038/s41598-018-26786-7. [ Links ]

Sharada Boinepalli and Phil Attard. Grand canonical molecular dynamics. J. Chem. Phys., 119:12769-12775, 2003. [ Links ]

M. Chinnaraj, Z.Chen, L. A. Pelc, Z. Grese, D. Bystranowska, E.Di Cera, and N. Pozzi. Structure of proth- rombin in the closed form reveals new details on the mechanism of activation. SCI REP, 8(2945), 2018. doi: 10.1038/S41598-018-21304-1. [ Links ]

Python Software Foundation. Python 3.8.10. Electronic Manual, 2020. URL https://www.python. org. [ Links ]

Marc Fuhrmans and Marcus Mu¨ller. Mechanisms of vesicle spreading on surfaces: coarse-grained simula- tions. Langmuir, 29:4335-4349, 2013. doi: 10.1021/la400119e. URL https://dx.doi.org/10.1021/la400119e. [ Links ]

Mark Galassi, Jim Davies, James Theiler, Brian Gough, Gerard Jungman, Michael Booth, and Fabrice Rossi. Gnu Scientific Library: Reference Manual. Network Theory Ltd., July 2011. ISBN 0954161734. [ Links ]

H. Grubmu¨ller, H. Heller, A. Windemuth, and K. Schulten. Generalized verlet algorithm for efficient mole- cular dynamics simulations with long-range interactions. Molecular Simulation, 6(1-3):121-142, 1991. [ Links ]

Lisa Baumann Kreuziger, Agnes Lee, Adam Cuker David Garcia, Mary Cushman, Maria DeSancho, and Jean M. Connors. Covid-19 and vte/anticoagulation: Frequently asked questions, May 2020. URL https://www.hematology.org/covid-19/covid-19-and-vte-anticoagulation. [ Links ]

John Denholm Lambert. Numerical Methods for Ordinary Differential Systems. John Wiley and Sons, Chi- chester, 1991. ISBN 0-471-92990-5. [ Links ]

Halina Mikolajek, Simon E. Kolstoe, Valerie E. Pye, Palma Mangione, Mark B. Pepys, and Stephen P. Wood. Structural basis of ligand specificity in the human pentraxins, c-reactive protein and serum amyloid p com- ponent. Journal of Molecular Recognition, 24(2):371-377, 2011. doi: https://doi.org/10.1002/jmr.1090. URL https://www.onlinelibrary.wiley.com/doi/abs/10.1002/jmr.1090. [ Links ]

Xu Panyang, Zhou Qi, and Xu Jiancheng. Mechanism of thrombocytopenia in covid-19 patients. Annals of Hematology, 04 2020. doi: 10.1007/s00277-020-04019-0. [ Links ]

P.-O. Persson and G. Strang. A simple mesh generator in matlab. SIAM Review, 46(2):329-345, June 2004. URL http://persson.berkeley.edu/distmesh/persson04mesh.pdf. [ Links ]

W. H. Press, S. A. Teukolsky, W. T. Vetterling, and B. P. Flannery. Numerical recipes in C++. The art of scientific computing. Cambridge: University Press, -c2007, Third Edition., 2007. ISBN 0521880688. [ Links ]

LAMMPS Users Manual. Sandia National Laboratories, http://lammps.sandia.gov, Feb 2021. [ Links ]

Gae¨l Varoquaux, Emmanuelle Gouillart, Olaf Vahtras, Pierre de Buyl, and many others. Scipy Lecture Notes. 2021. URL https://www.scipy-lectures.org. [ Links ]

So¨ren von Bu¨low, Marc Siggel, Max Linke, and Gerhard Hummer. Dynamic cluster formation determines viscosity and diffusion in dense protein solutions. Proceedings of the National Academy of Sciences, 116 (20):9843-9852, 2019. ISSN 0027-8424. doi: 10.1073/pnas.1817564116. URL https://www.pnas.org/content/116/20/9843. [ Links ]

Na Zhang, Peng Zhang, Wei Kang, Danny Bluestein, and Yuefan Deng. Parameterizing the morse potential for coarse-grained modeling of blood plasma. Journal of Computational Physics, 257, Part A:726-736, 2014. ISSN 0021-9991. [ Links ]

Recibido: 30 de Junio de 2021; Aprobado: 01 de Octubre de 2021

^∗Autor para correspondencia: enavas@uci.cu

Los autores del presente trabajo no manifiestan conflicto de intereses respecto al contenido publicado

Conceptualización: Edisel Navas Conyedo

Curación de datos: Edisel Navas Conyedo y Jorge Gulín González

Análisis formal: Edisel Navas Conyedo, Leonardo A. Ramírez-Cayón y Amauris D. Gonzáles-Suárez

Adquisición de fondos: Edisel Navas Conyedo y Jorge Gulín González

Investigación: Leonardo A. Ramírez-Cayón y Amauris D. Gonzáles-Suárez

Metodología: Leonardo A. Ramírez-Cayón y Amauris D. Gonzáles-Suárez

Administración del proyecto: Edisel Navas Conyedo

Recursos:Jorge Gulín González

Software: Edisel Navas Conyedo, Leonardo A. Ramírez-Cayón y Amauris D. Gonzáles-Suárez

Supervisión: Jorge Gulín González

Validación: Jorge Gulín González

Visualización: Edisel Navas Conyedo

Redacción - borrador original:Edisel Navas Conyedo, Leonardo A. Ramírez-Cayón y Amauris D. Gonzáles- Suárez

Redacción - revisión y edición: Jorge Gulín González