Información

¿Cuántos genes coexpresados ​​se esperarían en un tejido?

¿Cuántos genes coexpresados ​​se esperarían en un tejido?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Estoy trabajando con microarrays de expresión génica de tejidos tumorales y quiero usar un programa para encontrar los grupos de genes coexpresados ​​a fin de saber si algunos genes en particular se coexpresan con otros genes y qué genes son esos.

Como debo hacer esto para muchos experimentos de microarrays y he leído que hay muchos genes que tienen expresión constante en un tejido, clasifiqué el gen por su variabilidad (coeficiente de variación) que tenían en los experimentos y mantuve la primera 3000 genes para buscar su co-expresión. Luego empleé un programa (un paquete de bioconductores) para encontrar la coexpresión.

Ahora, esperaba encontrar varios grupos de genes (sin una razón particular para esto) en el experimento que estaba usando como ejemplo, pero en lugar de eso, solo encuentro un grupo de genes coexpresados ​​de aproximadamente cien, y el otros genes no fueron coexpresados.

Mi pregunta es: ¿este resultado podría tener un sentido biológico, o estoy cometiendo un terrible error en algún lugar ?, gracias de antemano.


  • Consulte la hermosa publicación de Daniel Ramsköld et al. 2009, que contiene los números para la coexpresión generalmente anticipada.
  • El nivel específico de coexpresión, que se aplica a su escenario, dependerá de su tejido, sus umbrales y su definición de coexpresión.
  • Si busca un co-cambio de algunos genes en diferentes muestras (en lugar de coexpresión), la cantidad de genes que deberían cambiar dependerá de la biología subyacente (y así evitará una respuesta general sin considerar los detalles de su muestra) .

Hay ciertos grupos de genes muy bien definidos que cabría esperar que se coexpresaran, p. Ej. proteínas ribosomales, subunidades de proteosoma, componentes empalmados, subunidades de VHATPasa; y cada uno de estos grupos se coexpresa en diferentes circunstancias. Por lo tanto, me parece que sus diferentes tejidos tumorales (si esa es la situación) se encuentran en condiciones similares, por lo que no puede diferenciar estos grupos, o que hay algún problema con su análisis.


Identificación de redes de genes de coexpresión, genes reguladores y vías para la obesidad basadas en la secuenciación de ARN del tejido adiposo en un modelo porcino

La obesidad es una condición metabólica compleja en fuerte asociación con varias enfermedades, como la diabetes tipo 2, que tiene como resultado importantes implicaciones económicas y de salud pública. La obesidad es el resultado de factores ambientales y genéticos y sus interacciones, incluidas las interacciones genéticas en todo el genoma. La identificación de genes reguladores y coexpresados ​​en ARN extraído de tejidos relevantes que representan a individuos delgados y obesos proporciona un punto de entrada para la identificación de genes y vías de importancia para el desarrollo de la obesidad. El cerdo, un animal omnívoro, es un excelente modelo para la obesidad humana, que ofrece la posibilidad de estudiar en profundidad las regulaciones transcriptómicas a nivel de órganos de la obesidad, inviable en humanos. Nuestro objetivo fue revelar las redes de coexpresión del tejido adiposo, las vías y las regulaciones transcripcionales de la obesidad utilizando enfoques de biología de sistemas basados ​​en secuenciación de ARN en un modelo porcino.

Métodos

Seleccionamos 36 animales para la secuenciación de ARN de una población de cerdos F2 creada previamente que representan tres grupos extremos en función de sus riesgos genéticos predichos de obesidad. Aplicamos el análisis de red de coexpresión de genes ponderados (WGCNA) para detectar grupos de genes altamente coexpresados ​​(módulos). Además, los genes reguladores se detectaron utilizando algoritmos de Lemon-Tree.

Resultados

WGCNA reveló cinco módulos que estaban fuertemente correlacionados con al menos un fenotipo relacionado con la obesidad (correlaciones que van de -0,54 a 0,72, P & lt 0,001). La anotación funcional identificó vías que aclaran la asociación entre la obesidad y otras enfermedades, como la osteoporosis (diferenciación de osteoclastos, P = 1.4E -7) y complicaciones relacionadas con el sistema inmunológico (p. Ej. Citotoxidad mediada por células asesinas naturales, P = 3.8E -5 Vía de señalización del receptor de células B, P = 7,2E -5). Lemon-Tree identificó tres genes reguladores potenciales, utilizando puntajes confiables, para el módulo WGCNA que se asoció con diferenciación de osteoclastos: CCR1, MSR1 y SI1 (puntuaciones de probabilidad respectivamente 95,30, 62,28 y 34,58). Además, la detección de genes conectados diferencialmente identificó varios genes previamente identificados como asociados con la obesidad en humanos y roedores, p. CSF1R y MARC2.

Conclusiones

Hasta donde sabemos, este es el primer estudio que aplica enfoques de biología de sistemas utilizando datos de secuenciación de ARN de tejido adiposo porcino en un modelo porcino caracterizado genéticamente para la obesidad. Revelamos redes complejas, vías, genes candidatos y reguladores relacionados con la obesidad, lo que confirma la complejidad de la obesidad y su asociación con trastornos relacionados con el sistema inmunológico y la osteoporosis.


La agrupación de genes en procariotas se conocía desde hace mucho tiempo. Sus genes están agrupados en operones, los genes dentro de los operones comparten una unidad promotora común. En su mayoría, estos genes están relacionados funcionalmente. El genoma de los procariotas es relativamente muy simple y compacto. En eucariotas, el genoma es enorme y solo una pequeña cantidad son funcionalmente genes, además, los genes no están organizados en operones. Excepto nematodos y tripanosomas aunque sus operones son diferentes de los operones procariotas. En eucariotas, cada gen tiene su propio sitio de regulación de la transcripción. Por lo tanto, los genes no tienen que estar muy próximos para coexpresarse. Por lo tanto, durante mucho tiempo se asumió que los genes eucariotas se distribuían aleatoriamente en el genoma debido a la alta tasa de reordenamientos cromosómicos. Pero debido a que la secuencia completa de genomas estuvo disponible, fue posible localizar absolutamente un gen y medir su distancia a otros genes.

El primer genoma eucariota secuenciado fue el de Saccharomyces cerevisiae, o levadura en ciernes, en 1996. Medio año después, Velculescu et al. (1997) publicaron una investigación en la que habían integrado los datos de SAGE con el mapa del genoma ahora disponible. Durante un ciclo celular, diferentes genes están activos en una célula. Por lo tanto, utilizaron datos SAGE de tres momentos del ciclo celular (fase logarítmica, células detenidas en fase S y células detenidas en fase G2 / M). Debido a que en la levadura todos los genes tienen una unidad promotora propia, no se sospechaba que los genes se agruparan cerca unos de otros, pero lo hicieron. Los grupos estaban presentes en los 16 cromosomas de levadura. [2] Un año después, Cho et al. También informó (aunque con más detalle) que ciertos genes se encuentran cerca unos de otros en la levadura. [3]

Coexpresión Editar

Cho y col. fueron los primeros en determinar que los genes agrupados tienen los mismos niveles de expresión. Identificaron transcripciones que muestran una periodicidad dependiente del ciclo celular. De esos genes, el 25% se encontraba muy cerca de otros genes que se transcribían en el mismo ciclo celular. Cohen y col. (2000) también identificaron grupos de genes coexpresados.

Caron y col. (2001) hicieron un mapa del transcriptoma humano de 12 tejidos diferentes (células cancerosas) y concluyeron que los genes no se distribuyen al azar en los cromosomas. En cambio, los genes tienden a agruparse en grupos de 39 genes en estrecha proximidad. Los clusters no solo eran genéticamente densos. Identificaron 27 grupos de genes con niveles de expresión muy altos y los llamaron RIDGE. Un RIDGE común cuenta de 6 a 30 genes por ciento. Sin embargo, hubo grandes excepciones, del 40 al 50% de los RIDGE no eran tan densos en genes como en la levadura, estos RIDGE estaban ubicados en las regiones de los telómeros. [1]

Lercher y col. (2002) señalaron algunas debilidades en el enfoque de Caron. Se pueden generar fácilmente agrupaciones de genes muy próximos y altos niveles de transcripción mediante duplicados en tándem. Los genes pueden generar duplicados de sí mismos que se incorporan en su vecindario. Estos duplicados pueden convertirse en una parte funcional de la ruta de su gen padre o (debido a que ya no son favorecidos por la selección natural) obtener mutaciones deletéreas y convertirse en pseudogenes. Debido a que estos duplicados son falsos positivos en la búsqueda de grupos de genes, deben excluirse. Lercher excluyó los genes vecinos con una gran semejanza entre sí, y luego buscó con una ventana deslizante regiones con 15 genes vecinos. [4]

Estaba claro que existían regiones densas en genes. Hubo una correlación sorprendente entre la densidad de genes y un alto contenido de CG. De hecho, algunos grupos tenían altos niveles de expresión. Pero la mayoría de las regiones altamente expresadas consistían en genes de mantenimiento, genes que están altamente expresados ​​en todos los tejidos porque codifican mecanismos basales. Solo una minoría de los grupos contenían genes que estaban restringidos a tejidos específicos.

Versteeg y col. (2003) intentaron, con un mejor mapa del genoma humano y mejores taqs SAGE, determinar las características de los RIDGE más específicos. Los genes superpuestos se trataron como un solo gen y los genes sin intrones se rechazaron como pseudogenes. Determinaron que los RIDGE son muy densos en genes, tienen una alta expresión génica, intrones cortos, alta densidad de repetición SINE y baja densidad de repetición LINE. Los grupos que contienen genes con niveles de transcripción muy bajos tenían características opuestas a las de los RIDGE, por lo que esos grupos se denominaron anti-puentes. [5] Las repeticiones de LINE son ADN basura que contiene un sitio de escisión de endonucleasa (TTTTA). Su escasez de RIDGE puede explicarse por el hecho de que la selección natural favorece la escasez de repeticiones LINE en los ORF porque sus sitios de endonucleasas pueden causar mutaciones deletéreas en los genes. Aún no se comprende por qué las repeticiones SINE son abundantes.

Versteeg y col. También concluyó que, contrariamente al análisis de Lercher, los niveles de transcripción de muchos genes en los RIDGE (por ejemplo, un grupo en el cromosoma 9) pueden variar mucho entre diferentes tejidos. Lee y col. (2003) analizaron la tendencia de agrupamiento de genes entre diferentes especies. Ellos compararon Saccharomyces cerevisiae, Homo sapiens, Caenorhabditis elegans, Arabidopsis thaliana y Drosophila melanogaster, y encontraron un grado de agrupación, como fracción de genes en agrupaciones sueltas, de (37%), (50%), (74%), (52%) y (68%), respectivamente. Llegaron a la conclusión de que las vías de las que los genes son agrupaciones en muchas especies son raras. Encontraron siete vías agrupadas universalmente: glucólisis, biosíntesis de aminoacil-tRNA, ATP sintasa, ADN polimerasa, degradación del hexaclorociclohexano, metabolismo de cianoaminoácidos y fotosíntesis (síntesis de ATP en especies no vegetales). No es sorprendente que estas sean vías celulares básicas. [6]

Lee y col. utilizó grupos de animales muy diversos. Dentro de estos grupos se conserva la agrupación, por ejemplo, los motivos de agrupación de Homo sapiens y Mus musculus son más o menos iguales. [7]

Spellman y Rubin (2002) hicieron un mapa transcriptómico de Drosophila. De todos los genes analizados, el 20% se agruparon. Los grupos constaban de 10 a 30 genes en un tamaño de grupo de aproximadamente 100 kilobases. Los miembros de los grupos no estaban relacionados funcionalmente y la ubicación de los grupos no se correlacionaba con las estructuras de cromatina conocidas. [8]

Este estudio también mostró que dentro de los grupos, los niveles de expresión de un promedio de 15 genes eran muy similares en las muchas condiciones experimentales que se utilizaron. Estas similitudes eran tan sorprendentes que los autores razonaron que los genes de los grupos no están regulados individualmente por su promotor personal, sino que estaban implicados cambios en la estructura de la cromatina. Un patrón de corregulación similar fue publicado en el mismo año por Roy et al. (2002) en C. elegans. [9]

Muchos genes que están agrupados en grupos muestran los mismos perfiles de expresión en carcinomas de mama ductales invasivos humanos. Aproximadamente el 20% de los genes muestran una correlación con sus vecinos. Los grupos de genes coexpresados ​​se dividieron por regiones con menos correlación entre genes. Estos grupos podrían cubrir un brazo cromosómico completo.

Al contrario de los informes discutidos anteriormente, Johnidis et al. (2005) han descubierto que (al menos algunos) genes dentro de los grupos no están co-regulados. Aire es un factor de transcripción que tiene un efecto de regulación hacia arriba y hacia abajo en varios genes. Funciona en la selección negativa de timocitos, que responde a los propios epítopos del organismo, por parte de las células medulares. [10]

Los genes que estaban controlados por aire se agruparon. 53 de los genes más activados por aire tenían un vecino activado por aire dentro de 200 Kb o menos, y 32 de los genes más reprimidos por aire tenían un vecino reprimido por aire dentro de 200 Kb, esto es menos de lo esperado por el cambio. Hicieron el mismo cribado para el regulador transcripcional CIITA.

Estos reguladores de la transcripción no tuvieron el mismo efecto en todos los genes del mismo grupo. Los genes que estaban activados y reprimidos o no afectados a veces estaban presentes en el mismo grupo. En este caso, es imposible que los genes regulados por aire estuvieran agrupados porque todos estaban co-regulados.

Por lo tanto, no está muy claro si los dominios están co-regulados o no. Una forma muy eficaz de probar esto sería insertando genes sintéticos en RIDGE, anti-puentes y / o lugares aleatorios en el genoma y determinar su expresión. Esos niveles de expresión deben compararse entre sí. Gierman y col. (2007) fueron los primeros que probaron la corregulación utilizando este enfoque. Como construcción de inserción, utilizaron un gen de GFP fluorescente impulsado por el promotor de fosfoglicerato quinasa humana (PGK) expresado de manera ubicua. Integraron esta construcción en 90 posiciones diferentes en el genoma de células HEK293 humanas. Descubrieron que la expresión de la construcción en Ridges era de hecho más alta que la de las insertadas en antiridges (mientras que todas las construcciones tienen el mismo promotor). [11]

Investigaron si estas diferencias en las expresiones se debían a genes en la vecindad directa de las construcciones o al dominio en su conjunto. Descubrieron que las construcciones próximas a genes altamente expresados ​​se expresaban ligeramente más que otras. Pero cuando ampliaron el tamaño de la ventana a los 49 genes circundantes (nivel de dominio), vieron que las construcciones ubicadas en dominios con una expresión alta general tenían una expresión más de 2 veces mayor que las ubicadas en dominios con un nivel de expresión bajo.

También comprobaron si la construcción se expresaba a niveles similares a los de los genes vecinos y si esa estrecha coexpresión estaba presente únicamente dentro de los RIDGE. Descubrieron que las expresiones estaban altamente correlacionadas dentro de los RIDGE y casi ausentes cerca del final y fuera de los RIDGE.

Observaciones previas y la investigación de Gierman et al. demostró que la actividad de un dominio tiene un gran impacto en la expresión de los genes ubicados en él. Y los genes dentro de un RIDGE se coexpresan. Sin embargo, las construcciones utilizadas por Gierman et al. fueron regulados por un promotor activo a tiempo completo. Los genes de la investigación de Johnidis et al. dependían de la presencia del factor de transcripción aire. La extraña expresión de los genes regulados por el aire podría haber sido causada en parte por diferencias en la expresión y conformación del propio factor de transcripción del aire.

Relación funcional Editar

Antes de la era genómica se sabía que los genes agrupados tienden a estar relacionados funcionalmente. Abderrahim y col. (1994) habían demostrado que todos los genes del complejo principal de histocompatibilidad estaban agrupados en el cromosoma 6p21. Roy y col. (2002) mostró que en el nematodo C. elegans los genes que se expresan únicamente en el tejido muscular durante la etapa larvaria tienden a agruparse en pequeños grupos de 2 a 5 genes. Identificaron 13 grupos.

Yamashita y col. (2004) mostró que los genes relacionados con funciones específicas en los órganos tienden a agruparse. Seis dominios relacionados con el hígado contenían genes para el metabolismo de xenobióticos, lípidos y alcohol. Cinco dominios relacionados con el colon tenían genes de apoptosis, proliferación celular, transportador de iones y producción de mucina. Estos grupos eran muy pequeños y los niveles de expresión eran bajos. Los genes relacionados con el cerebro y la mama no se agruparon. [12]

Esto muestra que al menos algunos grupos constan de genes relacionados funcionalmente. Sin embargo, existen grandes excepciones. Spellman y Rubin han demostrado que hay grupos de genes coexpresados ​​que no están relacionados funcionalmente. Parece que los grupos aparecen de formas muy diferentes.

Reglamento Editar

Cohen y col. encontraron que de un par de genes coexpresados, solo un promotor tiene una secuencia de activación ascendente (UAS) asociada con ese patrón de expresión. Sugirieron que los UAS pueden activar genes que no están en adyacencia inmediata a ellos. Esta explicación podría explicar la coexpresión de pequeños grupos, pero muchos grupos contienen muchos genes para ser regulados por un solo UAS.

Los cambios de cromatina son una explicación plausible de la corregulación observada en los grupos. La cromatina está formada por la cadena de ADN y las histonas que están unidas al ADN. Las regiones donde la cromatina está muy compacta se denominan heterocromatina. La heterocromatina consiste muy a menudo en restos de genomas virales, transposones y otro ADN basura. Debido al empaquetamiento apretado, el ADN es casi inalcanzable para la maquinaria de transcripción, cubrir el ADN deletéreo con proteínas es la forma en que la célula puede protegerse. La cromatina, que consta de genes funcionales, es a menudo una estructura abierta donde el ADN es accesible. Sin embargo, no es necesario que la mayoría de los genes se expresen todo el tiempo.

El ADN con genes que no se necesitan se puede cubrir con histonas. Cuando un gen debe expresarse, proteínas especiales pueden alterar la sustancia química adherida a las histonas (modificaciones de histonas) que hacen que las histonas abran la estructura. Cuando se abre la cromatina de un gen, la cromatina de los genes adyacentes también lo es hasta que esta modificación se encuentra con un elemento límite. De esa manera, los genes se expresan al mismo tiempo. Entonces, los genes se agrupan en "centros de expresión". En comparación con este modelo, Gilbert et al. (2004) mostró que los RIDGE están presentes principalmente en estructuras de cromatina abiertas. [13] [14]

Sin embargo, Johnidis et al. (2005) han demostrado que los genes del mismo grupo pueden expresarse de manera muy diferente. Aún no está muy claro cómo funciona la regulación de genes eucariotas y los cambios de cromatina asociados, y no hay consenso al respecto. Para obtener una imagen clara sobre el mecanismo de los grupos de genes, primero es necesario aclarar el funcionamiento de la cromatina y la regulación de los genes. Además, la mayoría de los artículos que identificaron grupos de genes corregulados se centraron en los niveles de transcripción, mientras que pocos se centraron en los grupos regulados por los mismos factores de transcripción. Johnides y col. descubrió fenómenos extraños cuando lo hicieron.

Los primeros modelos que intentaron explicar la agrupación de genes se centraron, por supuesto, en los operones porque se descubrieron antes que las agrupaciones de genes eucariotas. En 1999, Lawrence propuso un modelo para los operones de origen. Esta modelo de operón egoísta sugiere que los genes individuales se agruparon mediante transferencia vertical y horizontal y se conservaron como una sola unidad porque era beneficioso para los genes, no per se para el organismo. Este modelo predice que los grupos de genes deben haberse conservado entre especies. Este no es el caso de muchos operones y grupos de genes que se observan en eucariotas. [15]

Según Eichler y Sankoff, los dos procesos medios en la evolución cromosómica eucariota son 1) reordenamientos de segmentos cromosómicos y 2) duplicación localizada de genes. La agrupación podría explicarse razonando que todos los genes de una agrupación se originan a partir de duplicados en tándem de un antepasado común. Si todos los genes coexpresados ​​en un grupo hubieran evolucionado a partir de un gen ancestral común, se habría esperado que estuvieran coexpresados ​​porque todos tienen promotores comparables. Sin embargo, la agrupación de genes es una pisada muy común en los genomas y no está claro cómo este modelo de duplicación podría explicar toda la agrupación. Además, muchos genes que están presentes en grupos no son homólogos.

¿Cómo se acercaron los genes evolutivos no relacionados en primer lugar? O hay una fuerza que acerca a los genes funcionalmente relacionados, o los genes se acercan por el cambio. Singer y col. propuso que los genes se acercaban por recombinación aleatoria de segmentos del genoma. Cuando los genes funcionalmente relacionados se acercaron entre sí, esta proximidad se conservó. Determinaron todos los posibles sitios de recombinación entre genes de humanos y ratones. Después de eso, compararon la agrupación del genoma del ratón y el humano y observaron si se había producido recombinación en los sitios potencialmente recombinantes. Resultó que la recombinación entre genes del mismo grupo era muy rara. Entonces, tan pronto como se forma un grupo funcional, la célula suprime la recombinación. En los cromosomas sexuales, la cantidad de grupos es muy baja tanto en humanos como en ratones. Los autores razonaron que esto se debía a la baja tasa de reordenamientos cromosómicos de los cromosomas sexuales.

Las regiones de cromatina abiertas son regiones activas. Es más probable que los genes se transfieran a estas regiones. Los genes del organelo y el genoma del virus se insertan con mayor frecuencia en estas regiones. De esta manera, los genes no homólogos se pueden presionar juntos en un pequeño dominio. [dieciséis]

Es posible que algunas regiones del genoma sean más adecuadas para genes importantes. Es importante para la célula que los genes responsables de las funciones basales estén protegidos de la recombinación. Se ha observado en levaduras y gusanos que los genes esenciales tienden a agruparse en regiones con una tasa de replicación pequeña. [17]

Es posible que los genes se hayan acercado mucho debido al cambio. Se han propuesto otros modelos pero ninguno de ellos puede explicar todos los fenómenos observados. Está claro que tan pronto como se forman los racimos, se conservan por selección natural. Sin embargo, todavía falta un modelo preciso de cómo se acercaron los genes.

La mayor parte de los grupos actuales deben haberse formado relativamente recientemente porque solo se conservan siete grupos de genes funcionalmente relacionados entre los filos. Algunas de estas diferencias pueden explicarse por el hecho de que la expresión génica está regulada de manera muy diferente por diferentes filos. Por ejemplo, en vertebrados y plantas se usa la metilación del ADN, mientras que está ausente en levaduras y moscas. [18]


¿Cuántos genes coexpresados ​​se esperarían en un tejido? - biología

En el ganado vacuno de ascendencia europea, el rasgo de ser sin cuernos o tener cuernos está determinado por un par de genes. Un gen de la pareja se hereda de la madre y el otro del padre. El gen sin cuernos (P) es dominante sobre el gen con cuernos (p). Si un animal tiene dos genes sin cuernos (PP), homocigotos, o un gen con cuernos y uno con cuernos (Pp), heterocigotos, será polled. Sin embargo, si es heterocigoto sin cuernos (Pp), puede transmitir el gen sin cuernos o con cuernos a su descendencia. La única situación en la que un animal tendrá cuernos es cuando posee dos genes con cuernos recesivos (pp), cuernos homocigotos. La Tabla 1 ilustra la expresión de polledness o cuernos y qué genes y rasgos se puede esperar que se transmitan a la descendencia de los diversos apareamientos.

Si un animal de cría europea, no de ascendencia cebú, tiene cuernos, puede determinar a partir de la observación visual que es homocigoto para el gen con cuernos recesivo. Sin embargo, si el animal tiene el cuello liso o escurrido, es imposible determinar a partir de la observación visual si es genéticamente homocigótico (PP) o heterocigoto (Pp). El toro sin cuernos homocigótico con dos genes sin cuernos sólo engendrará terneros sin cuernos. Solo a través de la descendencia producida se puede determinar el número de genes polled. La mejor prueba de un toro para vacas con cuernos es aparear el toro sin cuernos en cuestión con las vacas con cuernos. Un toro sin cuernos criado con vacas con cuernos que producen uno o más terneros con cuernos es un toro heterocigoto (un gen recesivo para los cuernos), independientemente de cuántos terneros sin cuernos se produzcan. La Tabla 2 da la probabilidad de que un toro sin cuernos sea homocigótico si no se producen terneros con cuernos a partir de apareamientos con vacas con cuernos.

Tabla 1. Expresión genética del sondeo o cuernos y herencia esperada de la descendencia
Padre Represa Pantorrillas
Polled homocigoto (PP) Polled homocigoto (PP) 100% homocigoto polled (PP)
Polled homocigoto (PP) Encuestados heterocigotos (Pp) 50% homocigotos encuestados (PP)
50% heterocigotos encuestados (Pp)
Polled homocigoto (PP) Homocigoto con cuernos (pp) 100% heterocigotos encuestados (Pp)
Encuestados heterocigotos (Pp) Homocigoto con cuernos (pp) 50% heterocigotos encuestados (Pp)
50% con cuernos homocigotos (pp)
Encuestados heterocigotos (Pp) Encuestados heterocigotos (Pp) 25% homocigotos encuestados (PP)
50% heterocigotos encuestados (Pp)
25% Homocigotos con cuernos (pp)

Tabla 2. Probabilidad de que un toro sin cuernos sea homocigótico si no se producen terneros con cuernos
No. de terneros sin cuernos de vacas cornudas Probabilidad de que Bull sea homocigótico encuestado
2 75.00%
3 87.50%
4 93.75%
5 96.88%
6 98.44%
7 99.22%
8 99.61%
10 99.90%
12 99.98%
14 99.99%

Hay genes adicionales que afectan el crecimiento en forma de cuerno, escamas, en la cabeza de un animal. Las escamas son cuernos desarrollados de manera incompleta que generalmente están sueltos y se mueven debajo de la piel, no adheridos al cráneo. Varían en tamaño desde pequeños crecimientos en forma de costra hasta ocasionalmente casi tan grandes como cuernos. Debido a que el gen de las escamas se transmite por separado, no tiene ningún efecto sobre la presencia o ausencia de cuernos. No todo el ganado con cuernos es portador del gen de escamas y no todo el ganado sin cuernos carece del gen de escamas.

El gen de las escamas se expresa de manera diferente al gen de la polledness / cuernos. La forma en que se expresa el gen de las escamas depende del sexo del animal. En los machos, el gen scur es dominante, lo que significa que si solo uno de los dos genes es para scurs, el toro se escabullirá. Por lo tanto, es fácil detectar el gen scur en el toro y eliminarlo de la manada. En las hembras, el gen de las escamas es recesivo, lo que significa que debe poseer ambos genes para las escamas para que la vaca sea escabrosa. Si la vaca posee sólo un gen de la escara, ella no tendrá la misma, pero tiene un 50 por ciento de posibilidades de transmitir el gen de la escara a su ternero. La vaca sin cabeza lisa puede tener el gen scur recesivo, lo que resulta en mucha más dificultad para identificar / eliminar el gen scur del rebaño. La Tabla 3 muestra los patrones de herencia escabrosos. La presencia del gen scur está indicada por Sc y la ausencia del gen scur por Sn. Estos patrones de genes son para animales sin cuernos, ya que el crecimiento del cuerno cubrirá cualquier condición escabrosa si existe.

Tabla 3. Patrones de herencia escasa
Composición genética de los animales Vacas Toros
ScScPP Escupido Polled Escupido Polled
ScSnPP Smooth Polled Escupido Polled
SnSnPP Smooth Polled Smooth Polled

Otro factor que complica la herencia de polledness / cuernos es que en el ganado con ascendencia cebú, como Brahman, Santa Gertrudis y otros hay un gen adicional que afecta la herencia de cuernos. La herencia de cuernos en el ganado tipo cebú es diferente a la observada en las razas británicas. El gen sin cuernos (P) y el gen scur (Sc) pueden estar presentes en el ganado estadounidense con ascendencia cebú. Sin embargo, otro gen, el gen del cuerno africano (Af) también afecta la herencia de los cuernos en estos animales. La ausencia de este gen se expresa mediante el símbolo (An).

Los genetistas están razonablemente seguros de que la forma en que se expresa el gen Af depende del sexo del animal, al igual que la forma en que se expresan las escamas. En los machos, el gen Af es dominante sobre el gen sin cuernos, An. Esto significa que un solo gen Af dará como resultado que un toro tenga cuernos, incluso si es heterocigoto u homocigoto sin cuernos. En las hembras, el gen Af es recesivo con respecto al gen anotado An. En hembras heterocigotas sin cuernos, dos de los genes Af deben estar presentes para que el animal tenga cuernos.

En los animales que poseen el gen Af además del gen sin cuernos (homocigotos o heterocigotos) se pueden esperar los patrones de herencia mostrados en la Tabla 4.

Al igual que las escamas, la presencia del gen del cuerno africano es fácil de detectar en los machos, ya que la presencia de un solo gen Af hace que el macho tenga cuernos. Por lo tanto, no es necesario realizar pruebas de progenie para el gen Af en machos. Si se desprende al toro, no posee el gen Af. Si tiene cuernos cuando su ascendencia genética muestra que debería ser encuestado, la razón puede ser que posee un gen Af. Los productores de ganado también deben tener en cuenta que un toro homocigótico probado producirá algunos terneros con cuernos si se cruza con vacas con cuernos o sin cuernos que portan el gen del cuerno africano.

Tabla 4. Patrones de herencia del gen del cuerno africano
Composición genética de los animales Vacas Toros
AfAfPP Con cuernos Con cuernos
AfAnPP Encuestados Con cuernos
AnAnPP Encuestados Encuestados

Como puede ver, en última instancia, hay tres pares de genes que pueden determinar si el ganado tiene tejido similar a un cuerno en la cabeza en forma de cuernos o escamas.


Los científicos debaten hasta dónde llegar en la edición de genes humanos

El premio Nobel David Baltimore de Caltech habla con los reporteros en la cumbre internacional de la Academia Nacional de Ciencias sobre edición de genes humanos, el martes en Washington, DC Cientos de científicos y especialistas en ética de todo el mundo debaten cómo lidiar con la tecnología que facilita la edición de código genético humano. Susan Walsh / AP ocultar leyenda

El premio Nobel David Baltimore de Caltech habla con los reporteros en la cumbre internacional de la Academia Nacional de Ciencias sobre edición de genes humanos, el martes en Washington, DC Cientos de científicos y especialistas en ética de todo el mundo debaten cómo lidiar con la tecnología que facilita la edición de código genético humano.

El calentamiento global no es el único problema irritante con el que luchó el mundo esta semana.

Mientras los delegados se reunían en París para discutir el cambio climático, la Cumbre Internacional sobre Edición Genética Humana se reunió en Washington, D.C., para debatir otro acertijo: ¿Hasta dónde deberían llegar los científicos al editar el ADN humano?

El enfoque principal era si se debería permitir a los científicos utilizar nuevas y poderosas técnicas de ingeniería genética para editar genes en óvulos, espermatozoides o embriones humanos, un paso extremadamente controvertido que plantea una serie de espinosas cuestiones éticas y de seguridad.

Al final de la reunión del jueves, los organizadores de la conferencia concluyeron que sería "irresponsable proceder" con cualquier intento de crear un embarazo o un bebé a partir de óvulos, espermatozoides o embriones humanos que hayan sido alterados, debido a preocupaciones éticas y de seguridad.

Pero la investigación "básica intensiva" es "claramente necesaria y debería proceder" para explorar la seguridad y los beneficios potenciales de editar ese tipo de ADN, dijo el comité en un comunicado.

"Esa declaración es nuestra respuesta a la pregunta de si debería haber una prohibición" de cualquier investigación adicional, dijo David Baltimore, un biólogo ganador del Premio Nobel que presidió el comité.

En particular, los organizadores no descartaron la posibilidad de que la edición de genes algún día pueda usarse para crear humanos, a medida que "el conocimiento científico avanza y las opiniones de la sociedad evolucionan".

Los organizadores pidieron la creación de un foro permanente para continuar evaluando el estado de la investigación y la preparación de la sociedad.

Cerca de 500 científicos, médicos, bioéticos, expertos legales, historiadores, defensores de pacientes y otros se reunieron para la cumbre, que fue patrocinada por la Academia Nacional de Ciencias de EE. UU., La Academia Nacional de Medicina de EE. UU., La Academia China de Ciencias y la Royal Society del Reino Unido. .

Un comité internacional organizado por las academias estadounidenses asistió a la cumbre como parte de su proceso de investigación para emitir recomendaciones sobre posibles pautas para la edición genética. Se esperan para el próximo año.

La reunión se convocó debido a las crecientes preocupaciones provocadas por el desarrollo de técnicas de edición de genes como CRISPR-Cas9. Estas técnicas permiten a los científicos realizar cambios muy precisos en el ADN con mucha más facilidad que nunca.

Los científicos creen que las nuevas técnicas producirán muchos beneficios, como encontrar nuevas formas de prevenir y tratar enfermedades, como el SIDA, el cáncer y el Alzheimer.

Pero la capacidad de editar el ADN con tanta facilidad también está generando muchos temores, especialmente sobre la posibilidad de cambiar el ADN humano desde el principio. Los científicos exploraron cómo la alteración de los espermatozoides, los óvulos y los embriones podría generar nuevos conocimientos importantes sobre la biología y el desarrollo humanos básicos, y ayudar a prevenir y tratar muchas enfermedades hereditarias, como la enfermedad de Huntington, la fibrosis quística y la enfermedad de Tay-Sachs.

Pero alterar la llamada línea germinal de esta manera se ha considerado durante mucho tiempo fuera de los límites. Eso es porque esos cambios pueden transmitirse a las generaciones futuras. Los errores podrían introducir inadvertidamente nuevas enfermedades en el acervo genético humano.

Otro temor es que dar este paso abriría la puerta a los bebés de diseño, creando niños que son más inteligentes, más altos, más inteligentes o que tienen otros rasgos supuestamente deseables.

Durante sus comentarios de apertura, Baltimore se refirió al libro de 1932 de Aldous Huxley Nuevo mundo valiente. "La advertencia implícita en su libro es una que deberíamos tomar en serio hoy mientras enfrentamos la perspectiva de nuevos y poderosos medios para controlar la naturaleza de la población humana", dijo Baltimore.

Otro orador, Daniel Kevles, historiador médico de la Universidad de Yale, recordó a la audiencia que la eugenesia alguna vez fue ampliamente aceptada en los Estados Unidos. "La eugenesia no fue exclusiva de los nazis, sucedió en todas partes", dijo Kevles.

Muchos científicos enfatizaron que no están ni cerca de tener la capacidad de diseñar genéticamente rasgos complejos. Pero un prominente genetista especuló que los intentos de mejorar la raza humana podrían comenzar con la investigación médica.

George Church de la Facultad de Medicina de Harvard escucha una discusión sobre la seguridad y la ética de la edición de genes humanos en una reunión cumbre el martes. Susan Walsh / AP ocultar leyenda

George Church de la Facultad de Medicina de Harvard escucha una discusión sobre la seguridad y la ética de la edición de genes humanos en una reunión cumbre el martes.

"Creo que la mejora entrará en la puerta en términos de tratamiento de enfermedades graves", dijo George Church de la Universidad de Harvard. La capacidad de mejorar la memoria podría comenzar con una investigación dirigida a tratar la enfermedad de Alzheimer, por ejemplo, dijo Church.

Parecía haber un acuerdo general en que las preocupaciones de seguridad hacen que sea demasiado pronto para intentar tener un bebé utilizando óvulos, embriones o esperma con ADN editado. Pero hay una división sobre lo que debería permitirse además de eso.

Algunos, como el bioético católico Hille Haker de la Universidad de Loyola en Chicago, pidieron una moratoria sobre cualquier experimento, al menos hasta que los científicos tengan más tiempo para entender cómo usar las nuevas técnicas de edición de genes y la sociedad tenga más tiempo para debatir los complejos temas. ellos levantan.

Otros temían que una moratoria obstaculizaría un campo prometedor en un momento importante. Argumentaron que deberían continuar los estudios básicos en el laboratorio.

"Todos tenemos un deber moral ineludible: continuar con la investigación científica hasta el punto en que podamos tomar una decisión racional", dijo John Harris, profesor de bioética en la Universidad de Manchester en Inglaterra. "Me parece que la consideración de una moratoria es el camino equivocado. La investigación es necesaria".

Pero Jennifer Doudna de la Universidad de California, Berkeley, pionera en el desarrollo de CRISPR-Cas9, repitió su posición de que la investigación que involucre la técnica debe proceder con cautela.

Uno de los momentos más emotivos ocurrió cuando Sarah Gray de la Asociación Estadounidense de Bancos de Tejidos se dirigió a un panel de científicos de la audiencia. Reprimiendo las lágrimas, Gray describió cómo sufrió su hijo antes de morir de un trastorno genético seis días después de su nacimiento. "Si tienes las habilidades y el conocimiento para arreglar estas enfermedades", dijo Gray, "entonces hazlo".


Resultados y discusión

Todos los individuos en este estudio eran severamente obesos (IMC & gt 35) y se sometieron a cirugía bariátrica. El fenotipado metabólico profundo dio como resultado una descripción general del estado metabólico de los individuos, mostrando que casi la mitad eran MHO (definido como no tener ni T2D ni NASH). Entre los individuos MUO, 18 personas padecían DT2 (7 hombres, 11 mujeres), 27 padecían NASH (8 hombres, 19 mujeres) y de ellos, 13 individuos tenían T2D y NASH (4 hombres, 9 mujeres). Las estadísticas descriptivas de los fenotipos metabólicos mostraron una diferencia significativa (P & lt 0.05) entre los individuos MHO y MUO para glucosa, hemoglobina glucosilada (HbA1c), FFA y aspartato transaminasa (ASAT) (Tabla 1). Esos fenotipos metabólicos no mostraron una diferencia significativa entre hombres y mujeres (P & gt0.05), aunque sí encontramos una diferencia significativa para el IMC, el índice cintura-cadera (índice WH), la insulina, el colesterol total y las lipoproteínas de baja densidad (LDL ) niveles (P & lt0.05). Se encontró una diferencia significativa en la edad: los individuos MHO eran más jóvenes que los individuos MUO, lo que está de acuerdo con un estudio que encontró una prevalencia decreciente de obesidad metabólica saludable con la edad [24].

La coexpresión entre tejidos se centra en genes individuales

Dobrin et al. [25] demostró que la investigación de la coexpresión entre tejidos puede conducir a la detección de genes que están relacionados con cambios específicos de tejido en enfermedades y que esto representa la comunicación entre tejidos. Por lo tanto, identificamos genes que están alterados en la coexpresión entre tejidos entre individuos MHO y MUO, ya que podrían identificar genes involucrados en la diafonía de los tejidos con respecto a las comorbilidades inducidas por la obesidad. Detectamos dos genes alterados entre la subred MHO y MUO: IL1B y IL-6. Ambos genes mostraron, la mayoría de ellos una coexpresión significativa entre tejidos más fuerte en la subred MUO que en la subred MHO.

Interleucina 1-β (IL1B) es una citoquina importante producida principalmente por macrófagos activados. IL1B mostraron una fuerte correlación entre el hígado y los tejidos adiposos en la subred MUO, con correlaciones más bajas entre los otros tejidos y en la subred MHO (Tabla 2). Como la obesidad conduce a un aumento de la activación de los macrófagos en el hígado y el tejido adiposo [26], los niveles de ARNm de IL1B aumentarán en consecuencia. Los estudios han demostrado la importancia de IL1B en el desarrollo de la resistencia a la insulina inducida por la obesidad [27, 28], y un papel central para IL1B Se ha sugerido en el bloqueo de la acción de la insulina en el tejido adiposo relacionado con la diafonía de macrófagos y adipocitos [29]. Además, la función de IL1B en el hígado-tejido adiposo se ha estudiado la diafonía en ratones [30]. Estudios recientes demostraron que no hubo diferencias en los niveles sistémicos de IL1B entre individuos con MHO y MUO [31, 32]. Aquí, no encontramos diferencias en los niveles de ARNm IL1B, pero las correlaciones entre tejidos más fuertes en la subred MUO indican un papel potencial para IL1B en enfermedades metabólicas inducidas por la obesidad.

Se encontró un patrón similar en los tejidos para la interleucina-6 (IL-6) con fuertes correlaciones entre hígado y tejido adiposo (Tabla 3). IL-6 es una citocina y una mioquina, lo que significa que también es secretada por el músculo esquelético durante la contracción [33]. Las muchas funciones de IL-6 incluyen funciones en las respuestas inmunológicas y el metabolismo de la glucosa [34, 35]. IL-6 se ha propuesto como predictor independiente de DT2 [36] y el mismo estudio también mostró una interacción significativa entre IL1B y IL-6. En contraste con IL1B, se mostraron niveles de ARNm de IL-6 significativamente disminuidos en MHO vs. Individuos MUO [32]. Sorprendentemente, nuestros datos no muestran diferencias significativas en los niveles de ARNm de IL-6 entre individuos MHO y MUO.

Análisis de redes entre tejidos con especial atención a IL1B y IL-6

Construimos dos grandes redes de coexpresión de genes utilizando genes relacionados con la insulina en cuatro tejidos, lo que resultó en una red para los individuos MHO y MUO. La agrupación dentro de esas redes, como resultado, puede conducir a agrupaciones específicas de tejido o agrupaciones con genes en todos los tejidos. La agrupación de los genes en la red MHO y MUO se visualiza utilizando un dendrograma de genes (Fig. S1). Nos centramos en las características de la red de los genes identificados (IL1B y IL-6) ya que son potencialmente importantes en el desarrollo de enfermedades. IL1B y IL-6, expresado en cada uno de los cuatro tejidos, no se agruparon a través de los tejidos o dentro de la subred MHO. Sin embargo, se agruparon en la red MUO, dentro de cada tejido. Seguimos investigando esos módulos y genes, centrándonos en las correlaciones alteradas entre las subredes MHO y MUO, para obtener más información sobre los mecanismos implicados en el desarrollo de la enfermedad. Confirmamos que esos módulos no dependían de la edad o el género, ya que los genes propios de los módulos no tenían una correlación significativa con la edad o el género. Si bien nos centramos en los patrones de coexpresión generales en los tejidos de individuos con MHO y MUO, se podría esperar que los patrones de coexpresión puedan diferir entre los pacientes que padecen NASH o T2D, sin embargo, debido al tamaño limitado de la muestra, no pudimos determinar casa en ellos.

El módulo Greenyellow en la red MUO, que contiene tanto el IL1B y IL-6 gen, agruparon los perfiles de expresión de 29 genes (MM & gt 0.6) de los cuales 27 provienen del hígado. Dos genes en este módulo (PKM y SLC6A5) proceden del SAT y del IVA, respectivamente. GSEA reveló la vía de señalización del receptor tipo NOD (NLR) ya que la vía KEGG más significativa (P = 0,002) y los términos GO se asociaron con la transducción de señales (por ejemplo, la regulación negativa de la transducción de señales, P = 3,55E-5) y la unión al receptor de citoquinas (P = 6,59E -4). Estos hallazgos concuerdan con el hecho de que cantidades excesivas de tejido adiposo dan como resultado una mayor liberación de citocinas, p. Ej. IL-6, IL1B, y CCL2, provocando inflamación a través, por ejemplo, de la vía de señalización NLR [37].

Los coeficientes de correlación de genes de Pearson en el módulo Greenyellow se visualizaron en Cytoscape para ambas subredes (Fig 2A). La visualización muestra que los genes en el módulo Greenyellow están fuertemente correlacionados entre sí en la subred MUO, mientras que los mismos genes están menos fuertemente correlacionados en la subred MHO. Como era de esperar, se detecta una fuerte coexpresión entre IL1B y IL-6, con un ligero aumento de la fuerza entre los individuos MHO y MUO (0,50 frente a 0,71, respectivamente). En este módulo, IL1B no muestra grandes alteraciones en la coexpresión con otros genes entre individuos MHO y MUO. Sin embargo, IL-6 muestra una correlación alterada con los genes supresores de citocinas SOCS2 (r = 0,01 vs. r = 0,74) y SOCS3 (r = 0,47 vs. r = 0,75), y además, la correlación entre SOCS2 y SOCS3 está ligeramente alterado (r = 0,44 vs. r = 0,69). Estudios anteriores han demostrado que la obesidad afecta la señalización de JAK-STAT3 como resultado de niveles elevados de IL-6, lo que lleva a una expresión elevada de, por ejemplo, SOCS3 en tejido adiposo blanco, hígado y músculo [38]. Al unirse a los sustratos del receptor de insulina, SOCS3 perjudica la acción de la insulina y aumenta SOCS3 los niveles están asociados con la resistencia a la insulina [39]. La importancia de la asociación entre SOCS3 y IL-6 se ha demostrado antes, ya que la ausencia de SOCS3 conduce a efectos alterados de IL-6 dando como resultado un fuerte efecto inhibidor sobre los macrófagos y las células dendríticas, que se asemeja a una respuesta inflamatoria [40]. También el PTPN1 El gen, que codifica PTP1B, se asocia con la resistencia a la insulina al regular negativamente la señalización de la insulina [41]. Debido a sus efectos tanto sobre la insulina como sobre la leptina, se ha sugerido como objetivo farmacológico para la obesidad y la diabetes [42]. Este gen mostró una coexpresión muy alterada con IL-6 en el módulo entre subredes MHO y MUO: no se encontró correlación entre PTP1B y IL-6 en la subred MHO, mientras que se correlacionaron moderadamente en la subred MUO (r = 0,53).

Visualización de los genes en el módulo (A) Greenyellow (de la subred MUO) en los individuos MHO y MUO, y (B) módulo Turquesa (de la subred MUO) en los individuos MHO y MUO. Los genes que provienen del hígado son de color amarillo, del músculo naranja, del azul VAT y del verde SAT. IL1B e IL-6 tienen un borde rojo. Los bordes se colorean según su correlación en una escala rojo-verde que representa una correlación negativa-positiva.

La detección de posibles variantes genéticas causales utilizando un enfoque de mapeo de eQTL llevó a la detección de un eQTL digno de mención en este módulo: el SLC6A5 gen, expresado en IVA. SLC6A5 muestra coeficientes de correlación generalmente bajos con otros genes en la subred MHO, pero varios genes fuertemente correlacionados en la subred MUO. Correlaciones con IL1B y IL-6 son solo moderados en MUO (0,28 y 0,41, respectivamente) y bajos en MHO (-0,13 y -0,05, respectivamente) subredes. Las correlaciones más fuertes de SLC6A5 dentro de la subred MUO se encuentran con ANXA1 (r = 0,66), CCL2 (r = 0,63), MARCAS (r = 0,61) y SOCS3 (r = 0,61) todos los cuales no están correlacionados en la subred MHO. SLC6A5 codifica el transportador neuronal de glicina 2 (GlyT2) y su acción implica las vías de la proteína quinasa C (PKC) [35]. Aunque SLC6A5 en sí no se ha asociado con la obesidad, sus propiedades reguladoras a través de las vías de la PKC podrían afectar el estado metabólico de las personas obesas. Por ejemplo, ANXA1 (asociado con la adiposidad [43]) es un mediador importante en el sistema neuroendocrino y los mecanismos dependientes de PKC son esenciales para su actividad [44]. Asimismo, lo comentado anteriormente SOCS3 se ha relacionado con la participación en las vías de la PKC [45]. Por lo tanto, sugerimos un posible papel causal para SLC6A5 en los procesos reguladores relacionados con las enfermedades metabólicas inducidas por la obesidad. Esto está respaldado por el hecho de que una mutación en este gen provoca, entre otras cosas, una disminución del peso corporal en ratones [46].

El módulo Turquesa en la subred MUO (Fig 2B) agrupaba los perfiles de expresión de 26 genes únicos (MM & gt 0.9), todos provenientes del músculo. Ambos IL1B y IL-6 se filtraron debido al estricto umbral en el MM, pero se incluyeron en la comparación de las fortalezas de correlación entre las subredes MHO y MUO. Las correlaciones entre ellos se alteraron entre la subred MHO y MUO (r = 0.25 vs r = 0,75, resp.). Uno de los genes de la obesidad bien conocido es la leptina (LEP), que codifica la leptina, que también se denomina "hormona de la saciedad". En el músculo esquelético, promueve la disipación de energía y previene la acumulación de ácidos grasos [47]. LEP muestra fuertes correlaciones positivas y negativas con todos los demás genes del módulo Turquesa (correlación absoluta & gt 0,8) en la subred MUO, mientras que es baja con muchos de los genes en la subred MHO (correlación absoluta & lt 0,4). La mayor correlación diferencial para LEP se encontró entre LEP y PTPRE (0.22 vs. 0.91 en MHO vs. MUO). PTPRE (Proteína tirosina fosfatasa, tipo receptor, E) regula negativamente la señalización de la insulina en el músculo esquelético y se ha sugerido que desempeña un papel como regulador de retroalimentación negativa de la señalización de la leptina a través de JAK2 [8]. Además, se encontraron fuertes alteraciones para la correlación entre LEP y IL1B (r = -0,15 vs. r = 0.81 en MHO vs. MUO). Se ha demostrado que IL1B es necesaria para la inducción de leptina durante la inflamación [12]. Nuestros datos sugieren que esta inducción no se está produciendo en individuos con MHO. Otro gen interesante es la adiponectina (ADIPOQ), que codifica la hormona adiponectina que aumenta la sensibilidad a la insulina del músculo esquelético y se ha sugerido como objetivo farmacológico para la obesidad y la diabetes tipo 2 [13]. La correlación entre ADIPOQ y IL1B difirieron en gran medida entre MHO y MUO (r = -0,19 vs r = 0,68 en MHO vs. MUO). En los adipocitos, pero no en el músculo esquelético, se ha demostrado que IL1B reduce la producción de adiponectina, lo que afecta negativamente a la sensibilidad a la insulina [24, 29]. No se detectaron eQTL en este módulo.

El módulo Black en la subred MUO (Fig 3A) agrupó los perfiles de expresión de 30 genes (MM & lt 0.60), todos provenientes de SAT, excepto dos que provenían de VAT: PRKAG2 (también co-expresado en SAT) y PIK3R1. La correlación entre IL1B y IL-6, y su correlación con genes supresores de citocinas, fue similar entre las subredes MHO y MUO en SAT. Los dos genes que se expresan en VAT, PRKAG2 y PIK3R1, muestran una coexpresión alterada con IL-6 y IL1B. La coexpresión de PIK3R1 con IL1B y IL-6 en la subred MHO es muy bajo (-0,16 y -0,20, respectivamente), pero fuertemente negativo en la subred MUO (ambos -0,67). PIK3R1 codifica parte de la enzima fosfatidilinositol 3-quinasa (PI3K), y la señalización de PI3K juega un papel importante en la señalización de la insulina. PIK3R1 participa en la mediación de la sensibilidad a la insulina y la respuesta inflamatoria en el tejido adiposo [31]. La coexpresión alterada entre los genes de la insulina y PIK3R1 indica un papel importante en el desarrollo de la enfermedad que también ha sido identificado por otros [48]. La correlación de PRKAG2 con IL1B y IL-6 es alrededor de cero en el MHO, pero moderadamente positivo en la subred MUO (0.53 y 0.54, respectivamente). PRKAG2 es parte de la vía de la proteína quinasa activada por AMP (AMPK), que es importante en la regulación de la energía, p. homeostasis de la glucosa y sensibilidad a la insulina [49]. Por sus propiedades, es un fármaco diana para el síndrome metabólico.

Visualización de los genes en el módulo (A) Black (de la subred MUO) en los individuos MHO y MUO, y (B) módulo Salmon (de la subred MUO) en los individuos MHO y MUO. Los genes que provienen del hígado son de color amarillo, del músculo naranja, del azul VAT y del verde SAT. IL1B e IL-6 tienen un borde rojo. Los bordes se colorean según su correlación en una escala rojo-verde que representa una correlación negativa-positiva.

En este módulo encontramos un eQTL: el receptor de IL-6 (IL-6R). Muchas de las correlaciones entre IL-6R y otros genes no se alteraron entre las subredes MHO y MUO. Sin embargo, la correlación con SOCS3 fue elevado (0,29 vs 0,67, respectivamente) y con PIK3R1 (en IVA) disminuyó (0.01 vs -0.58, respectivamente). Sorprendentemente, las correlaciones de IL-6 con esos genes inalterados, lo que implica un papel importante para el receptor de IL-6, también basado en la discusión previa de los resultados de la vía JAK-STAT, en el desarrollo de enfermedades inducidas por la obesidad. Se han detectado varios fenotipos alterados en mutaciones en el receptor de IL-6 en ratones, p. Ej. resistencia a la insulina y acción inflamatoria inflada [50]. Sin embargo, en una gran encuesta en humanos, sólo se pudo encontrar una correlación significativa con el IMC y la pérdida de peso en individuos con obesidad mórbida con los niveles de expresión de IL-6R en el hígado, y no en el tejido adiposo omental, adiposo subcutáneo y del estómago [51].

El módulo Salmon en la subred MUO (Fig. 3B) agrupó los perfiles de expresión de 33 genes (MM & lt 0,6). Todos estos genes procedían de VAT, excepto un gen (sintaxina 4, STX4) que provenía tanto del SAT como del IVA. En este módulo también estaban presentes varios genes de módulos discutidos anteriormente. La coexpresión de IL1B y IL-6 con SOCS2 y SOCS3 es similar a la coexpresión encontrada en SAT (módulo negro), lo que significa que su correlación solo se altera en el hígado. También la coexpresión entre IL1B y IL-6 está inalterado en SAT. La coexpresión entre STX4 en SAT y VAT es más fuerte en el MUO que en la subred MHO (0,28 vs 0,58, respectivamente). La coexpresión de STX4 en SAT se altera con IL1B, el antagonista del receptor de IL1B (IL1RN), IL6, y el receptor de IL-6 (IL6R). En los cuatro casos, la coexpresión es de moderada a fuertemente positiva en la subred MUO y baja coexpresión negativa en la subred MHO. Sin embargo, la coexpresión de STX4 en VAT con los cuatro genes que se expresaron en VAT es similar entre las subredes MHO y MUO, lo que sugiere un papel en el desarrollo de la enfermedad para STX4 solo en SAT.

En este módulo encontramos un eQTL: PTPRE, expresado en IVA. PTPRE es un regulador negativo de la señalización de la insulina en el músculo [47]. En un estudio con personas obesas, se demostró que PTPRE se expresó y metila de manera diferencial antes y después de la cirugía bariátrica, y ese fenotipo de NASH se correlacionó negativamente con la reconstrucción bariátrica [52]. Además de la detección de PTPRE como eQTL, el PTPRE gen está presente en los cuatro módulos que fueron investigados más a fondo debido a la presencia de IL1B y IL-6. Enfocándonos en la conversación entre tejidos de este gen, el cambio principal se encuentra entre la correlación en el hígado y el VAT (0,05 frente a 0,55 en MHO frente a MUO). En el módulo Salmón PTPRE muestra una coexpresión alterada con lo discutido anteriormente ISL1 gen (0,07 frente a -0,60 en MHO frente a MUO), que codifica la proteína potenciadora del gen de la insulina ISL-1. Muchas de las correlaciones de ISL1 con otros genes en este módulo están alterados, con fuertes correlaciones negativas en la subred MUO. Anteriormente, se ha demostrado que ISL1 se expresa en IVA y se correlaciona negativamente con el IMC y la grasa abdominal [34]. También mostraron que la expresión se redujo en ratones obesos pero se redujo en ratones sensibles a la insulina delgados. En el módulo Greenyellow, con genes mayoritariamente hepáticos, las alteraciones entre los individuos MHO y MUO se encuentran dentro de las correlaciones de la expresión de PTPRE en el hígado con p. ej. SLC6A5 (IVA), SLC6A13 (hígado) y PKM (SENTÉ). Es notable que el módulo se compone principalmente de genes coexpresados ​​en el hígado, pero que PTRPE muestra una coexpresión alterada con los dos genes que provienen de SAT y VAT, lo que sugiere una función importante para PTPRE como vínculo entre los tejidos en el desarrollo de enfermedades derivadas de la obesidad. Hasta la fecha, ningún estudio ha vinculado PTPRE con cualquiera de esos genes.

En resumen, hemos demostrado la integración de redes de coexpresión de genes a través de tejidos en individuos MHO y MUO para identificar genes y vías relacionadas con el desarrollo de enfermedades inducidas por la obesidad. Los resultados proporcionan información importante sobre la genómica de la capacidad de expansión del tejido adiposo, la lipotoxicidad y posibles comorbilidades como la diabetes tipo 2 y la EHNA. En un entorno de red de coexpresión, detectamos IL-6 y IL1B como genes clave para las diferencias de coexpresión de genes entre tejidos relacionadas con el estado metabólico. Investigando los módulos en los que IL-6 y IL1B se coexpresaron, detectamos muchos genes y vías coexpresados ​​alterados que podrían ser importantes en el desarrollo de la inflamación inducida por la obesidad y la comorbilidad. Aunque IL-6 y IL1B Los niveles de ARNm no se alteraron entre los individuos MHO y MUO en nuestro estudio, su coexpresión con otros genes indica un papel potencialmente importante en el desarrollo de alteraciones metabólicas inducidas por la obesidad. El enfoque elegido nos dio una idea de la coexpresión entre genes en un entorno de red, pero no pudo dar información sobre las direcciones en la red. Sin embargo, se eligió un enfoque de mapeo de eQTL para detectar genes que afectan los niveles de ARNm y, por lo tanto, afectan el estado de salud. Esto llevó a la identificación de varios genes (PTPRE, IL-6R, y SLC6A5) que podría tener un papel importante en las vías relacionadas con la insulina de las personas obesas. Se necesita la validación funcional de esos genes para identificar su papel potencial en el desarrollo de comorbilidades inducidas por la obesidad.


Introducción

La especificidad de tejido, en la que las células realizan diferentes funciones a pesar de poseer ADN idéntico, se logra parcialmente a través de mecanismos de regulación génica dependientes del tejido, incluida la modificación epigenética y la regulación transcripcional y postranscripcional [1-3]. Estos complejos programas de control producen diferentes programas de expresión génica en los tejidos, y la mayoría de los genes muestran una expresión diferencial estadísticamente significativa [4, 5]. Estas diferencias pueden tener consecuencias significativas: es especialmente probable que los genes específicos de tejido sean dianas de fármacos [6] y los factores de transcripción específicos de tejido estén especialmente implicados en enfermedades complejas [2, 7, 8].Comprender estas diferencias también es esencial para comprender los genes pleiotrópicos y para interpretar estudios en los que los datos genómicos solo pueden recopilarse para un tejido accesible o proxy (como el uso de sangre en el estudio de trastornos psiquiátricos [9-11]).

Los mecanismos de control específicos de tejido pueden ser capturados por redes de coexpresión, en las que dos genes están conectados si sus niveles de expresión están correlacionados en un conjunto de individuos. En tal escenario, las diferencias genéticas o ambientales entre individuos sirven como pequeñas perturbaciones a la red reguladora subyacente, lo que resulta en una correlación entre los niveles de expresión de los genes que son consistentes con las relaciones regulatorias. Las redes de coexpresión proporcionan información sobre la actividad celular, ya que los genes que se coexpresan a menudo comparten funciones comunes [12], y estas redes se han utilizado ampliamente para estudiar enfermedades [13-15].

El conjunto de datos del consorcio Genotype-Tissue Expression (GTEx) [16] brinda la oportunidad de estudiar estas redes de coexpresión para un número sin precedentes de tejidos humanos simultáneamente. Sin embargo, muchos de los tejidos perfilados tienen menos de una docena de muestras, muy pocas para inferir con precisión las decenas de millones de parámetros que definirían una coexpresión o red reguladora. Una solución sería combinar todas las muestras disponibles y aprender una única red de consenso para todos los tejidos, pero esto no ofrecería información sobre la especificidad del tejido. Por otro lado, inferir cada red de forma independiente ignora los puntos en común de los tejidos: las redes de tejidos comparten muchos más enlaces de los que cabría esperar por casualidad, y aprender enlaces a través de múltiples tejidos es menos ruidoso que aprender enlaces usando un solo tejido, incluso cuando se usa el mismo número de muestras totales [12].

Aquí, utilizamos un algoritmo novedoso, GNAT (Gene Network Analysis Tool), para construir simultáneamente redes de coexpresión para 35 tejidos humanos distintos. Usando una jerarquía que codifica la similitud de tejido, nuestro enfoque aprende una red para cada tejido, lo que alienta a los tejidos cercanos en la jerarquía a tener redes similares. Se ha demostrado que el aprendizaje por transferencia jerárquica mejora la potencia y la precisión en trabajos anteriores [5, 6, 17, 18]. Proponemos un modelo jerárquico novedoso junto con un método de optimización de parámetros diseñado para datos a gran escala, y lo aplicamos a los datos GTEx. Mostramos que nuestro método infiere redes con mayor probabilidad de validación cruzada que las redes aprendidas en cada tejido de forma independiente o una sola red aprendida en todos los tejidos. Nuestro método es aplicable a cualquier conjunto de datos en el que las relaciones de muestra se pueden describir mediante una jerarquía, por ejemplo, múltiples líneas de células cancerosas o especies en un árbol filogenético. El código completo de nuestro método está disponible como S1 Data.

Analizamos las redes resultantes para realizar varias observaciones novedosas sobre los principios de especificidad de tejido. Proponemos múltiples métricas para identificar genes que son importantes para definir la identidad de los tejidos, y demostramos que tales genes son genes desproporcionadamente esenciales. Mostramos que los factores de transcripción específicos de tejido, que son ejes centrales de nuestras redes, se vinculan a genes con funciones específicas de tejido, que a su vez muestran niveles de expresión más altos. Identificamos 1.789 módulos de genes que están enriquecidos para las funciones de Ontología de genes y mostramos que los módulos enriquecidos que se regulan positivamente dentro de un tejido son a menudo fundamentales para la función del tejido. También mostramos que los módulos que se encuentran en los tejidos son especialmente propensos a enriquecerse para las funciones de la ontología genética, y que estas funciones tienden a ser las que son esenciales para todos los tejidos. Los resultados presentados aquí, incluidas todas las redes y módulos de genes, pueden consultarse de forma interactiva a través de nuestra herramienta web [19]. Los genes y módulos identificados proporcionan una base para futuras investigaciones.


Referencias

Hajer GR, van Haeften TW, Visseren FL: Disfunción del tejido adiposo en obesidad, diabetes y enfermedades vasculares. Eur Heart J. 2008, 29: 2959-2971. 10.1093 / eurheartj / ehn387.

Nijhuis J, Rensen SS, Slaats Y, van Dielen FM, Buurman WA, Greve JW: activación de neutrófilos en obesidad mórbida, activación crónica de inflamación aguda. Obesidad (Silver Spring). 2009, 17: 2014-2018. 10.1038 / oby.2009.113.

Tam CS, Clement K, Baur LA, Tordjman J: Obesidad e inflamación de bajo grado: una perspectiva pediátrica. Obes Rev.2010, 11: 118-126. 10.1111 / j.1467-789X.2009.00674.x.

Hotamisligil GS, Shargill NS, Spiegelman BM: Expresión adiposa del factor de necrosis tumoral alfa: papel directo en la resistencia a la insulina relacionada con la obesidad. Ciencias. 1993, 259: 87-91. 10.1126 / science.7678183.

Curat CA, Miranville A, Sengenes C, Diehl M, Tonus C, Busse R, Bouloumie A: De monocitos sanguíneos a macrófagos residentes en tejido adiposo: inducción de diapédesis por adipocitos maduros humanos. Diabetes. 2004, 53: 1285-1292. 10.2337 / diabetes.53.5.1285.

Harman-Boehm I, Bluher M, Redel H, Sion-Vardy N, Ovadia S, Avinoach E, Shai I, Kloting N, Stumvoll M, Bashan N, Rudich A: Infiltración de macrófagos en la grasa omental versus la grasa subcutánea en diferentes poblaciones: efecto de la adiposidad regional y las comorbilidades de la obesidad. J Clin Endocrinol Metab. 2007, 92: 2240-2247. 10.1210 / jc.2006-1811.

Weisberg SP, McCann D, Desai M, Rosenbaum M, Leibel RL, Ferrante AW: La obesidad está asociada con la acumulación de macrófagos en el tejido adiposo. J Clin Invest. 2003, 112: 1796-1808.

Xu H, Barnes GT, Yang Q, Tan G, Yang D, Chou CJ, Sole J, Nichols A, Ross JS, Tartaglia LA, Chen H: La inflamación crónica de la grasa juega un papel crucial en el desarrollo de la resistencia a la insulina relacionada con la obesidad . J Clin Invest. 2003, 112: 1821-1830.

Bluher M: La distinción entre individuos obesos metabólicamente "sanos" y "no sanos". Curr Opin Lipidol. 2010, 21: 38-43. 10.1097 / MOL.0b013e3283346ccc.

Despres JP, Allard C, Tremblay A, Talbot J, Bouchard C: evidencia de un componente regional de la grasa corporal en la asociación con los lípidos séricos en hombres y mujeres. Metabolismo. 1985, 34: 967-973. 10.1016 / 0026-0495 (85) 90147-7.

Capel F, Klimcakova E, Viguerie N, Roussel B, Vitkova M, Kovacikova M, Polak J, Kovacova Z, Galitzky J, Maoret JJ, et al: Macrófagos y adipocitos en la obesidad humana: expresión génica del tejido adiposo y sensibilidad a la insulina durante la restricción calórica y estabilización de peso. Diabetes. 2009, 58: 1558-1567. 10.2337 / db09-0033.

Henegar C, Tordjman J, Achard V, Lacasa D, Cremer I, Guerre-Millo M, Poitou C, Basdevant A, Stich V, Viguerie N, et al: La firma transcriptómica del tejido adiposo destaca la relevancia patológica de la matriz extracelular en la obesidad humana. Genome Biol. 2008, 9: R14-10.1186 / gb-2008-9-1-r14.

Nair S, Lee YH, Rousseau E, Cam M, Tataranni PA, Baier LJ, Bogardus C, Permana PA: Mayor expresión de genes relacionados con la inflamación en preadipocitos cultivados / células vasculares estromales de obesos en comparación con indios Pima no obesos. Diabetologia. 2005, 48: 1784-1788. 10.1007 / s00125-005-1868-2.

Goldfine AB, Shoelson SE, Aguirre V: Expansión y contracción: tratamiento de la diabetes con cirugía bariátrica. Nat Med. 2009, 15: 616-617. 10.1038 / nm0609-616.

van Dielen FM, Buurman WA, Hadfoune M, Nijhuis J, Greve JW: factor inhibidor de macrófagos, inhibidor del activador del plasminógeno-1, otras proteínas de fase aguda y mediadores inflamatorios se normalizan como resultado de la pérdida de peso en sujetos con obesidad mórbida tratados con cirugía restrictiva gástrica . J Clin Endocrinol Metab. 2004, 89: 4062-4068. 10.1210 / jc.2003-032125.

Brunt EM, Janney CG, Di Bisceglie AM, Neuschwander-Tetri BA, Bacon BR: Esteatohepatitis no alcohólica: una propuesta para la clasificación y estadificación de las lesiones histológicas. Soy J Gastroenterol. 1999, 94: 2467-2474. 10.1111 / j.1572-0241.1999.01377.x.

Eisen MB, Spellman PT, Brown PO, Botstein D: análisis de conglomerados y visualización de patrones de expresión en todo el genoma. Proc Natl Acad Sci USA. 1998, 95: 14863-14868. 10.1073 / pnas.95.25.14863.

Thomas PD, Campbell MJ, Kejariwal A, Mi H, Karlak B, Daverman R, Diemer K, Muruganujan A, Narechania A: PANTHER: una biblioteca de familias y subfamilias de proteínas indexadas por función. Genome Res. 2003, 13: 2129-2141. 10.1101 / gr.772403.

Thomas PD, Kejariwal A, Guo N, Mi H, Campbell MJ, Muruganujan A, Lazareva-Ulitsky B: Aplicaciones para datos de evolución de la función de secuencia de proteínas: análisis de expresión de ARNm / proteína y herramientas de puntuación de SNP de codificación. Ácidos nucleicos Res. 2006, 34: W645-650. 10.1093 / nar / gkl229.

Kanehisa M, Goto S: KEGG: enciclopedia kyoto de genes y genomas. Ácidos nucleicos Res. 2000, 28: 27-30. 10.1093 / nar / 28.1.27.

Miron M, Woody OZ, Marcil A, Murie C, Sladek R, Nadon R: una metodología para la validación global de experimentos de microarrays. BMC Bioinformática. 2006, 7: 333-10.1186 / 1471-2105-7-333.

Wrobel G, Kokocinski F, Lichter P: AutoPrime: selección de cebadores para secuencias expresadas. Biología del genoma. 2004, 5: p11-p19. 10.1186 / gb-2004-5-5-p11.

Durden DL, Kim HM, Calore B, Liu Y: Las señales del receptor Fc gamma RI a través de la activación de hck y MAP quinasa. J Immunol. 1995, 154: 4039-4047.

Wang AV, Scholl PR, Geha RS: Asociación física y funcional del receptor de inmunoglobulina G de alta afinidad (Fc gamma RI) con las quinasas Hck y Lyn. J Exp Med. 1994, 180: 1165-1170. 10.1084 / jem.180.3.1165.

Durden DL, Liu YB: Proteína-tirosina quinasa p72syk en la señalización del receptor Fc gamma RI. Sangre. 1994, 84: 2102-2108.

Kiener PA, Rankin BM, Burkhardt AL, Schieven GL, Gilliland LK, Rowley RB, Bolen JB, Ledbetter JA: La reticulación del receptor I de Fc gamma (Fc gamma RI) y el receptor II (Fc gamma RII) en células monocíticas activa un vía de transducción de señales común a ambos receptores Fc que implica la estimulación de la proteína tirosina quinasa p72 Syk. J Biol Chem. 1993, 268: 24442-24448.

Charles JF, Humphrey MB, Zhao X, Quarles E, Nakamura MC, Aderem A, Seaman WE, Smith KD: La respuesta inmune innata a Salmonella enterica serovar Typhimurium por macrófagos depende de TREM2-DAP12. Infect Immun. 2008, 76: 2439-2447. 10.1128 / IAI.00115-08.

Colonna M: TREM en el sistema inmunológico y más allá. Nat Rev Immunol. 2003, 3: 445-453. 10.1038 / nri1106.

Kenny EF, O'Neill LA: Adaptadores de señalización utilizados por receptores tipo Toll: una actualización. Cytokine. 2008, 43: 342-349. 10.1016 / j.cyto.2008.07.010.

Derosa G, D'Angelo A, Tinelli C, Devangelio E, Consoli A, Miccoli R, Penno G, Del Prato S, Paniga S, Cicero AF: Evaluación de los niveles de metaloproteinasas 2 y 9 y sus inhibidores en diabéticos y sujetos sanos. Diabetes Metab. 2007, 33: 129-134. 10.1016 / j.diabet.2006.11.008.

Hongo S, Watanabe T, Arita S, Kanome T, Kageyama H, Shioda S, Miyazaki A: la leptina modula la expresión de ACAT1 y el flujo de colesterol de los macrófagos humanos. Soy J Physiol Endocrinol Metab. 2009, 297: E474-482. 10.1152 / ajpendo.90369.2008.

Ikonen E: Compartimentación y tráfico de colesterol celular. Nat Rev Mol Cell Biol. 2008, 9: 125-138. 10.1038 / nrm2336.

Kolz M, Baumert J, Muller M, Khuseyinova N, Klopp N, Thorand B, Meisinger C, Herder C, Koenig W, Illig T: la asociación entre las variaciones en el gen TLR4 y la diabetes tipo 2 incidente se modifica por la proporción de colesterol total al colesterol HDL. BMC Med Genet. 2008, 9: 9-10.1186 / 1471-2350-9-9.

Pagler TA, Neuhofer A, Laggner H, Strobl W, Stangl H: la salida de colesterol a través de la resecreción de HDL se produce cuando el transporte de colesterol fuera del lisosoma está alterado. J Lipid Res. 2007, 48: 2141-2150. 10.1194 / jlr.M700056-JLR200.

Rader DJ, Pure E: Lipoproteínas, función de macrófagos y aterosclerosis: ¿más allá de la célula espumosa ?. Cell Metab. 2005, 1: 223-230. 10.1016 / j.cmet.2005.03.005.

Shi H, Kokoeva MV, Inouye K, Tzameli I, Yin H, Flier JS: TLR4 vincula la inmunidad innata y la resistencia a la insulina inducida por ácidos grasos. J Clin Invest. 2006, 116: 3015-3025. 10.1172 / JCI28898.

Tayebjee MH, Tan KT, MacFadyen RJ, Lip GY: niveles circulantes anormales de metaloproteasa 9 y su inhibidor tisular 1 en la enfermedad arterial periférica comprobada mediante angiografía: relación con la gravedad de la enfermedad. J Intern Med. 2005, 257: 110-116. 10.1111 / j.1365-2796.2004.01431.x.

Wang X, Jin W, Rader DJ: La regulación al alza de la lipasa endotelial de macrófagos por los receptores tipo toll 4 y 3 modula la producción de interleucina-10 y -12 de macrófagos. Circ Res. 2007, 100: 1008-1015. 10.1161 / 01.RES.0000263011.34709.c5.

Westerterp M, Berbee JF, Pires NM, van Mierlo GJ, Kleemann R, Romijn JA, Havekes LM, Rensen PC: La apolipoproteína C-I está implicada de manera crucial en el desarrollo de la aterosclerosis inducida por lipopolisacáridos en ratones knockout para la apolipoproteína E. Circulación. 2007, 116: 2173-2181. 10.1161 / CIRCULATIONAHA.107.693382.

Yvan-Charvet L, Wang N, Tall AR: Papel de los transportadores HDL, ABCA1 y ABCG1 en la salida de colesterol y las respuestas inmunitarias. Arterioscler Thromb Vasc Biol. 2010, 30: 139-143. 10.1161 / ATVBAHA.108.179283.

Tchkonia T, Lenburg M, Thomou T, Giorgadze N, Frampton G, Pirtskhalava T, Cartwright A, Cartwright M, Flanagan J, Karagiannides I, et al: Identificación de progenitores de células grasas humanas específicas de depósito a través de distintos perfiles de expresión y patrones de genes de desarrollo . Soy J Physiol Endocrinol Metab. 2007, 292: E298-307. 10.1152 / ajpendo.00202.2006.

Vohl MC, Sladek R, Robitaille J, Gurd S, Marceau P, Richard D, Hudson TJ, Tchernof A: un estudio de genes expresados ​​diferencialmente en tejido adiposo subcutáneo y visceral en hombres. Obes Res. 2004, 12: 1217-1222. 10.1038 / oby.2004.153.

Historial de prepublicación

Se puede acceder al historial de prepublicación de este documento aquí: http://www.biomedcentral.com/1755-8794/3/34/prepub


Fondo

La cremallera de leucina básica (bZIP) representa una superfamilia de genes que codifica factores de transcripción. Esta familia de genes está ampliamente distribuida en eucariotas. Las proteínas bZIP, que se definen por el dominio bZIP conservado [1, 2], desempeñan un papel importante en la regulación de varios procesos biológicos, como el crecimiento y desarrollo de las plantas y las respuestas al estrés salino.

Las proteínas del factor de transcripción codificadas por la familia de genes bZIP contienen un dominio bZIP altamente conservado. La estructura se compone de 60 a 80 aminoácidos, incluida una región de unión de ADN básica y una cremallera de leucina adyacente [2]. La región de unión contiene señales de localización nuclear y un N-X7-Motivo R / K con intervalos precisos constantes para contactar con el ADN diana [3]. La región de la cremallera de leucina se compone de repeticiones en heptada de leucina u otros aminoácidos hidrófobos grandes, y el número de repeticiones en diferentes genes puede variar mucho [3, 4]. La leucina se encuentra en la séptima posición de aminoácidos de la secuencia de heptapéptidos y puede ser reemplazada por isoleucina, valina, fenilalanina o metionina [3]. Las proteínas bZIP suelen funcionar formando dímeros a través de la cremallera de leucina [4]. Los factores de transcripción de bZIP de plantas tienen una preferencia de unión por las secuencias centrales de ACGT, como A-box (TACGTA), C-box (GACGTC) y G-box (CACGTG). Además, también se unen a otros motivos de secuencia de ADN [3, 4]. Los flancos externos del elemento central regulan la especificidad de las interacciones proteína-ADN [3]. Estudios anteriores han indicado que las duplicaciones segmentarias del genoma y los eventos de duplicación del genoma completo pueden explicar la expansión de la familia de genes bZIP [2, 5]. Con respecto a la clasificación, los investigadores inicialmente dividieron a los miembros de la familia del gen bZIP en 10 grupos en Arabidopsis, basándose en dominios comunes [3]. Luego, los genes bZIP de Arabidopsis se actualizaron y se dividieron en 13 grupos (A-M) [4].

La familia de genes bZIP juega un papel importante en los procesos biológicos, como el crecimiento y desarrollo, la maduración de las flores y las respuestas al estrés en las plantas. El Arabidopsis bZIP11 El gen impacta el desarrollo de la raíz al vincular señales de baja energía con el control del crecimiento primario de la raíz mediado por auxinas [6]. HY5 codifica una proteína bZIP, que participa en la regulación de la raíz de Arabidopsis y el desarrollo del hipocótilo [7]. Sobreexpresión de ZmbZIP4 en el maíz conduce a un aumento en el número de raíces laterales, raíces primarias más largas y un sistema de raíces mejorado [8]. Las proteínas bZIP también regulan las respuestas de las plantas al estrés abiótico, como el estrés salino. Sobreexpresión de SlAREB El gen del tomate puede mejorar la tolerancia de las plantas a la deficiencia de agua y el estrés salino [9]. Se observaron resultados similares para el GhABF2 gen en Arabidopsis y algodón [10], así como para GmbZIP2 en soja transgénica [11].

Los estudios sobre la familia de genes bZIP en el álamo se han centrado únicamente en sus funciones en el desarrollo de las raíces y la resistencia a la sequía. Por ejemplo, álamo PtabZIP1L se expresa principalmente en las raíces y puede mediar en el desarrollo de las raíces laterales y la resistencia a la sequía mediante la regulación de diversas vías metabólicas [12]. Álamo bZIP53 es inducible en la expresión génica por estrés salino y regula negativamente el desarrollo de raíces adventicias [13]. El chopo AREB1 puede regular las respuestas a la sequía y la tolerancia de Populus trichocarpa al afectar la acetilación de histonas [14]. El análisis y la caracterización exhaustivos de la familia de genes bZIP del álamo y el cribado de genes expresados ​​diferencialmente en tejidos (DEG) y genes de respuesta al estrés salino mediante la secuenciación del transcriptoma pueden proporcionar una referencia importante para las investigaciones de la función genética y el mejoramiento por ingeniería genética. Además, el uso de métodos bioinformáticos para revelar los procesos biológicos en los que pueden participar los genes ayudará a analizar el mecanismo regulador de los genes. En el presente estudio, realizamos una investigación sistemática sobre los genes bZIP en álamo, incluida la identificación de miembros de la familia de genes, análisis de secuencias de proteínas y relaciones filogenéticas, distribución cromosómica de los genes, duplicaciones genómicas en tándem y duplicaciones segmentarias y análisis de colinealidad entre especies. Además, sobre la base de los datos de perfiles de transcriptomas, también exploramos patrones de expresión diferencial de los genes bZIP en diferentes tejidos y sus respuestas al estrés salino. Finalmente, realizamos análisis de redes y coexpresión de genes en los genes clave, seguidos de análisis de enriquecimiento de conjuntos de genes. Nuestro enfoque de biología de sistemas ha arrojado luz sobre redes de genes diferenciales o rutas biológicas asociadas con diversos procesos biológicos.


Materiales y métodos

Selección de conjuntos de sondas y datos de expresión de genes P450

Una colección de todos los citocromos P450 de A. thaliana (271 genes en abril de 2005) y los identificadores de locus AGI (Arabidopsis Genome Initiative) correspondientes (Atxgxxxxx) se recuperaron de la 'base de datos PlaCe Arabidopsis P450' (Tabla 2). Para 21 genes P450 anotados en PlaCe, no se asoció ningún locus AGI. Aquellos incluidos 18 pseudogenes anotados. Dos pares de genes P450 se asociaron con el mismo locus AGI (CYP71A27P y CYP71A28: At4g20240 CYP71A23 y CYP71A24: At3g48290), dejando un total de 248 loci AGI. Estos se utilizaron para identificar los conjuntos de sondas correspondientes en el microarray Affymetrix ATH1 utilizando la herramienta de selección de sondas "Genevestigator" [10]. 21 genes no estaban representados en la matriz.Los 227 genes restantes estaban representados por un total de 229 conjuntos de sondas, con 26 genes representados por más de un conjunto de sondas y 32 conjuntos de sondas que representan más de un gen. Utilizando la herramienta de selección de sondas 'Genevestigator' identificamos todos los genes reconocidos por estos conjuntos de sondas, y si más de un conjunto de sondas estaba presente para un gen determinado, seleccionamos un único conjunto de sondas específico (si está disponible) para ese gen. Esto resultó en 216 conjuntos de sondas seleccionados de estos 191 que reconocen un solo gen P450, 21 reconocen dos genes, 3 conjuntos de sondas pueden hibridar con tres genes y uno reconoce cuatro genes para un total de los 227 P450 representados y tres genes que no son P450 ( genes flanqueantes que también son reconocidos por el conjunto de sondas). Los conjuntos de sondas utilizados y los genes reconocidos por estos conjuntos de sondas se pueden encontrar en la página de inicio de 'CYPedia'.

Luego recuperamos los datos de expresión normalizados para estos conjuntos de sondas de la herramienta 'Genevestigator Digital Northern' [10]. Los datos se descargaron en mayo de 2005 (conjunto de datos 1), que cubren 1.823 experimentos de microarrays, y en abril de 2006 (conjunto de datos 2, una actualización que incluye el conjunto de datos 1) que cubren 2.202 microarrays. Para cada conjunto de sondas, el fondo se definió como la intensidad de señal promedio de todas las sondas llamadas "ausentes" por el software Affymetrix, y todas las sondas ausentes se establecieron en este valor de fondo. Si se disponía de matrices de réplicas, se determinaba la intensidad media de todas las réplicas. Cada experimento se colocó en una de las siguientes cuatro categorías: i) muestras de órganos y tejidos de plantas de tipo silvestre, ii) tratamiento de estrés de plantas de tipo silvestre, iii) hormonas, nutrientes (privación) y otros tratamientos de plantas de tipo silvestre, y iv) plantas mutantes en comparación con muestras de tipo silvestre tratadas por igual (si corresponde). Las intensidades de señal de las muestras de órganos y tejidos se compararon con las intensidades de fondo, generando así log2-relaciones sobre el fondo. Las intensidades de ambos grupos de tratamiento se compararon con las intensidades de señal de las muestras de control correspondientes generando log2-relaciones que comparan el tratamiento con el control, y las intensidades de las muestras mutantes se compararon con las intensidades de las muestras de tipo salvaje igualmente tratadas generando log2-relaciones para mutantes en comparación con el tipo salvaje. Cada conjunto de datos se dividió en 30 grupos de expresión utilizando agrupaciones de K-medias y los mapas de calor combinados de todos los grupos se pueden encontrar en la página de inicio de 'CYPedia' siguiendo el enlace 'ver matrices'. Para la visualización de las matrices de expresión se utilizó la herramienta 'HeatMapper' en el 'Bio-Array Resource (BAR)' [9] y los mapas de calor resultantes se incorporaron en formatos de hojas de cálculo de uso común (Adobe PDF, Microsoft Excel y OpenOffice Calc).

Selección de genes metabólicos

Se generó una lista de genes relacionados con cualquier aspecto del metabolismo de las plantas (base de datos de vías) recuperando todos A. thaliana genes, que se anotaron en las siguientes bases de datos: i) 'KEGG Orthology (KO) - Arabidopsis thaliana' (KEGG) [59], ii) las 'Vías metabólicas' en 'The Arabidopsis Information Resource' (AraCyc) [60] iii ) la 'Base de datos de genes de lípidos de Arabidopsis' (AcylLipid) [61], iv) la 'Base de datos de conocimientos sobre vías bioquímicas' (BioPathAt) [34], v) una selección de publicaciones dedicadas a la anotación de vías metabólicas secundarias (Litpath) [30 –33, 35, 62]. La información de todas las bases de datos se combinó en una matriz de datos y se seleccionaron conjuntos de sondas de Affymetrix para el conjunto de genes únicos como se describió anteriormente, lo que dio como resultado 4.129 conjuntos de sondas únicas. Para este conjunto de genes, se agregaron anotaciones que se derivaron del 'Catálogo funcional' en el 'Centro de información de Munich para secuencias de proteínas (MIPS-FunCat) [36] y términos' GeneOntology 'seleccionados manualmente de TAIR [63] (es decir, tener la evidencia codifica IDA [inferida de un ensayo directo], IMP [inferida de un fenotipo mutante] y / o TAS [declaración del autor rastreable].

A cada gen se le asignó una puntuación de anotación de ruta con: diez puntos para genes caracterizados bioquímicamente (es decir, anotación como 'funcional' en 'AcylLipid' o 'BioPath', o identificados en revisiones de la literatura) nueve puntos para genes con función bioquímica inmediata descritos como IDA en TAIR-GO, ocho puntos para genes anotados como 'funcionales (?)' O 'inferidos de fenotipo mutante' en 'AcylLipid', 'BioPath', o literatura siete puntos para genes con código de evidencia IMP en TAIR-GO seis puntos para genes con un fenotipo mutante descrito, pero con una función molecular poco clara cinco puntos para genes con alta similitud (WU-BLAST e & lt 10-50) a un gen vegetal caracterizado cuatro puntos para genes con altas similitudes con otro gen vegetal, pero función de ese gen no validado tres puntos para genes con similitud (WU-BLAST 10-10 e & lt 10-50) a un gen vegetal caracterizado dos puntos para genes con similitudes bajas (WU-BLAST e & gt 10-10) a un gen vegetal caracterizado un punto para miembros de grandes familias de genes con similitudes bajas (WU-BLAST e & gt 10 -10) con un gen vegetal caracterizado.

Análisis de coexpresión y mapeo de vías

Los datos de expresión de Affymetrix para los 4,129 conjuntos de sondas seleccionados se recuperaron y procesaron como se describe anteriormente para los P450 y se fusionaron las matrices de expresión. El análisis de coexpresión se realizó como se describió anteriormente [9]. En resumen, los vectores de expresión se centraron en la media y se calcularon los coeficientes de correlación de Pearson (valores r) entre el vector de expresión de cada P450 y los de los 4.129 genes en el "estanque" para cada conjunto de datos. Las manipulaciones posteriores se realizaron utilizando el entorno R [64]. Para cada P450 y conjunto de datos, se recuperaron genes coexpresados ​​con r & gt 0,5 y se extrajeron las vías bioquímicas correspondientes de la base de datos de vías (ver más arriba). Para cada vía, se contó el número de genes coexpresados ​​y se calculó la suma de las puntuaciones de anotación (ver más arriba). La vía se retuvo solo cuando al menos un gen en la lista tenía más de seis puntos de anotación. Se comparó el número y la puntuación de genes coexpresados ​​en una vía determinada con el número total y la puntuación de todos los genes de esa vía. Sobre la base de un análisis de distribución hipergeométrica con cola, solo se conservaron las rutas sobrerrepresentadas en el grupo de genes coexpresados ​​(p [hiper] & lt 0,005). Posteriormente, se identificaron las vías identificadas en los cuatro conjuntos de datos y se sumaron el número y las puntuaciones de genes encontrados en cada conjunto de datos. Las tablas resultantes se ordenaron según los puntajes y se importaron a una plantilla de OpenOffice Calc (OpenOffice.org) y se agregaron y guardaron miniaturas de los mapas de calor de expresión reales, generados con la herramienta 'Heatmapper plus' en la 'BAR' [9], y se guardaron en formato html. Los resultados de cada P450 se pueden encontrar en la página web 'Pathway Map' para cada P450. Los datos de expresión y los datos de información de la vía para genes coexpresados ​​(r & gt 0,5 para un máximo de 50 genes) se fusionaron y clasificaron según el valor r. Las tablas de expresión se codificaron por colores utilizando la herramienta 'Heatmapper plus' en la 'BAR' y se guardaron como páginas web estáticas vinculadas a los mapas de ruta correspondientes.

Comparación de plataformas de matrices

Los datos de expresión de P450 generados usando un microarreglo manchado que cubre productos de PCR específicos de genes se recuperaron de la página web "Genómica funcional de Arabidopsis P450s" (Tabla 1). Usando esta plataforma de doble canal (CYP-array), se generaron intensidades de señal en raíces de plántulas de 1 semana (y otros cuatro órganos) en comparación con una muestra de 'ARN universal'. Este "ARN universal" consiste en una mezcla de ARN derivados de raíces y brotes de plántulas y hojas, tallos y flores de plantas maduras [2]. Para generar un 'control universal' similar a partir de microarrays públicos de ATH1, seleccionamos 14 muestras de brotes de plántulas, 9 muestras de hojas de plantas maduras, 17 muestras de raíces de plántulas, 19 muestras de flores enteras y 10 muestras de tallos de los datos de órganos procesados conjunto (ver arriba). Luego calculamos el logaritmo medio2 Las intensidades sobre el fondo forman todas las muestras y las compararon con la intensidad media de las muestras de raíces y, por lo tanto, crearon relaciones raíz / 'control universal' similares a las de la matriz CYP. Para este último, las intensidades no detectables se establecieron artificialmente en una proporción de 0.05 en comparación con el control universal y las proporciones fueron log2-transformado. Los datos de expresión de los genes representados en ambas plataformas se centraron en la media de los experimentos. Sobre la base de un modelo de regresión lineal que compara los dos conjuntos de datos, se calculó un valor de R 2.


Ver el vídeo: SHF 3 y 4 Tejido conectivo I (Agosto 2022).