Información

¿Por qué analizar el transcriptoma en lugar del proteoma?

¿Por qué analizar el transcriptoma en lugar del proteoma?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

El análisis del transcriptoma (RNA-Seq, microarrays, qPCR, etc.) es probablemente la tecnología más utilizada para evaluar la expresión génica y los procesos celulares dinámicos. Luego, los resultados se extrapolan (análisis funcionales, GO, etc.) para inferir consecuencias celulares biológicas. Los ARN son en realidad solo el intermediario. La presencia de un ARNm no significa necesariamente que se convertirá en una proteína. Podría ser degradado por microARN, etc. antes de la traducción. Finalmente, es la proteína la que realmente es causal de un cambio biológico.

Entonces, mi pregunta es por qué no ir directamente a las proteínas. ¿Por qué no simplemente extraer las proteínas y secuenciarlas, cuantificarlas, analizarlas y sacar conclusiones? ¿Cuáles son los argumentos convincentes para estudiar el transcriptoma y comprender los procesos biológicos?


P: ¿Por qué no simplemente extraer las proteínas ...

R: No es solo una cuestión de extrayendo las proteínas, necesitarías separar ellos y luego aislar cada uno de ellos. Actualmente no existe una forma práctica de hacer esto para, digamos, 10,000 proteínas, que en cualquier caso pueden tener múltiples formas. La belleza del método RNAseq es que no no requieren separación física o aislamiento de transcripciones.

Un enfoque que probablemente sea más útil es identificar y cuantificar las proteínas en el lugar, pero todavía falta un poco para tener la amplitud y la sensibilidad necesarias.

P: ... secuenciarlos ...

R: La secuenciación de proteínas es lenta y difícil. No se puede aplicar a escala masiva, a diferencia de la secuenciación de copias de ADN de transcripciones de ARN. Otros métodos de identificación basados ​​en el comportamiento físico (migración o posición de elución) son más prometedores y la dirección que probablemente se seguirá.

P: ... cuantifíquelos ...

R: Incluso eso es difícil cuando, por ejemplo, estás eluyendo proteínas de geles. En contraste, la metodología RNAseq solo cuenta las transcripciones. (Pero la dirección probable en la que esto irá es la cuantificación por altura de pico, sin separación o aislamiento, como con la metabolómica, o por la intensidad de alguna señal de la proteína inmovilizada en el gel, tinción de algo más sofisticado).

Entonces, en general, realiza análisis de proteínas en proteínas individuales particulares que le interesan, mientras que puede hacer análisis de RNAseq en todas las transcripciones en una muestra biológica y luego ir a pescar (entre los resultados, y luego en el lago si ese es su cosa).


¿Por qué no simplemente extraer las proteínas y secuenciarlas, cuantificarlas, analizarlas y sacar conclusiones?

Porque la proteómica es De Verdad duro. Para proporcionar un ejemplo, no existe un equivalente proteico de la PCR. Eso significa que no hay una forma sencilla de seleccionar y amplificar una proteína en particular a partir de una mezcla compleja. La invención de la PCR fue fundamental para los rápidos avances de la genómica durante los últimos 40 años.

La espectrometría de masas es la herramienta principal para la proteómica de alto rendimiento y los análisis de espectrometría de masas son todavía muy difíciles de ejecutar, e incluso más difíciles de interpretar.


Si bien tiene razón en que 'el resultado final' es siempre proteína y que el análisis funcional a nivel de ARNm puede ignorar cosas del control de traducción, existen buenas razones para analizar el transcriptoma:

1) Como dijiste, pueden pasar muchas cosas con el ARNm: puede degradarse, traducirse o también reprimirse durante un tiempo hasta que se vuelva a activar. La mayoría de estos procesos de control tienen un efecto bastante fuerte en la 'producción final de proteínas', pero son mucho más fáciles de estudiar a nivel de ARNm / transcriptoma (ya que ahí es donde ocurren).

2) Analizar el transcriptoma a nivel de todo el genoma es técnicamente relativamente fácil: la tecnología de secuenciación está bastante avanzada en este momento y hay muchos protocolos diferentes establecidos para observar no solo los niveles de expresión de los ARNm individuales, sino también otras cosas como la estabilidad, el procesamiento (es decir, el empalme o poliadenilación) y también traducción de ARNm. Todo esto también se puede hacer con un aporte de material relativamente bajo.
El análisis de proteínas, por otro lado, requiere el uso de espectrometría de masas que no es necesariamente tan potente o sensible como la secuenciación.


¿Cuáles son los argumentos convincentes para estudiar el transcriptoma y comprender los procesos biológicos?

Existen argumentos convincentes para estudiar el transcriptoma, pero dependen de la pregunta de investigación. La investigación que se centra en la activación de factores de transcripción debe utilizar datos del transcriptoma, al igual que la investigación sobre los eventos de procesamiento del ARN (empalme, procesamiento previo al ARNm, estabilidad). También desea datos de transcripción al estudiar las transcripciones de ARN que no codifican proteínas.

No creo que haya argumentos biológicos convincentes para estudiar el transcriptoma cuando se quiere saber sobre la expresión de genes que codifican proteínas en tejidos o células. Debe centrarse en las proteínas, ya que son el paso final en la expresión de genes que codifican proteínas. La correspondencia entre los niveles de transcripciones que codifican proteínas y su proteína puede ser excelente, pero también puede ser muy pobre. Los datos de la transcripción no pueden segregar estos grupos. En estimaciones globales, los niveles de transcripción solo explican alrededor de la mitad de la variación en los niveles de proteínas. Creo que ese nivel de inexactitud es inaceptable cuando existe una alternativa viable.

¿Por qué no simplemente extraer las proteínas y cuantificarlas?

Existen limitaciones físicas e históricas para la cuantificación global de proteínas. He recopilado un par de limitaciones que considero más importantes. La espectrometría de masas (MS) es el método de elección actual para la cuantificación de proteínas de alto rendimiento. Los métodos como la secuenciación de Edman o la detección inmunológica tienen un rendimiento mucho menor.

Existen limitaciones físicas que actualmente impiden que la EM realice mediciones globales cuantitativas utilizando proteínas intactas. Eso es muy lamentable. Las mediciones globales se realizan actualmente cuantificando péptidos de proteínas digeridas utilizando un sistema de cromatografía líquida para alimentar la EM con péptidos (LC-MS). Los péptidos se identifican y luego se asignan a una proteína o grupo de proteínas. Los resultados finales son confiables y la mayoría se resolverá en identificaciones de proteínas individuales. Algunos péptidos solo se resolverán para identificar un grupo de proteínas. Esta es una limitación menor en la mayoría de los casos.

La realización de mediciones globales de cantidades de proteínas solo ha sido posible en la última década, mientras que las mediciones globales solo se han convertido en una rutina con la llegada de la LC de rendimiento ultraalto emparejada con los espectrómetros de masas más nuevos. Muchos investigadores académicos tendrán acceso a esta tecnología a través de su instalación de espectrometría de masas local, pero la mayoría no se dará cuenta. Esta novedad es en gran parte la razón por la que es menos común.

Resumen

Creo que la cuantificación de proteínas por LC-MS se utilizará en lugar de datos de transcripción con más frecuencia durante los próximos años. Esto se debe a la capacidad de los instrumentos LC-MS actuales de proporcionar mejores respuestas en sistemas biológicos que requieren información a nivel de proteínas. Los revisores empezarán a exigirlo. Creo que en la próxima década la LC-MS de alto rendimiento podría volverse lo suficientemente barata como para reemplazar incluso las técnicas inmunológicas de menor rendimiento, como la inmunotransferencia y la inmunofluorescencia.


Hay un aspecto que no se ha detallado: un transcriptoma es mucho más económico que un proteoma. Analizar una sola proteína en LC-MS / MS puede costar tanto como un transcriptoma. Y si pertenece a esos pequeños grupos con fondos insuficientes que trabajan con organismos no modelo que son realmente interesantes pero no realmente útiles para curar el cáncer, entonces no tiene otra opción.


Proteoma

Importancia del proteoma

¿Qué podemos aprender del proteoma? Dado que la mayoría de las funciones enzimáticas celulares, interruptores reguladores, transductores de señales y componentes estructurales están compuestos de proteínas, la caracterización de las proteínas expresadas por una célula puede proporcionar pistas importantes sobre la función, organización y capacidad de respuesta inherentes a una célula. Además, al definir la variación entre diferentes células y entre células expuestas a diferentes estímulos, podemos comprender:

adaptación celular a señales ambientales

Mecanismos de diferenciación celular y desarrollo del organismo.

aspectos celulares de los procesos patológicos

respuestas celulares al envejecimiento

diferencia entre individuos dentro de una especie, es decir, la base molecular de nuestra individualidad en fisiología, susceptibilidad a enfermedades y respuesta a la terapéutica y exposiciones ambientales.

Actualmente existe un gran entusiasmo por el potencial de medir los niveles de expresión génica de cada gen de un organismo. Secuencias de genoma extensas o completas han hecho posible perfilar los niveles de transcripciones de ARNm de todos los genes simultáneamente mediante hibridación de microarrays de ADN. Por lo tanto, ¿es incluso necesario estudiar la expresión de proteínas ahora que la expresión de genes se mide tan fácilmente a nivel de ARNm? La mayoría de los científicos creen que la respuesta es sí, porque los dos enfoques son realmente diferentes cuantitativa y cualitativamente. En primer lugar, la mayoría de los microarrays de ADN normalmente no distinguen entre transcripciones variantes (producidas por empalme alternativo, uso de sitios de inicio de transcripción alternativos o sitios de poliadenilación, o edición de ARN). En segundo lugar, es posible que la abundancia de proteínas no se pueda predecir con precisión mediante el nivel de ARNm, ya que se desconoce la tasa de traducción y degradación de proteínas para cada ARNm. En tercer lugar, las modificaciones postraduccionales y las escisiones proteolíticas son críticas para la función de una proteína, pero no pueden detectarse ni predecirse mediante el nivel de ARNm. Por último, las proteínas suelen trabajar en complejos y la localización de las proteínas está regulada por la célula, pero ninguna de estas propiedades se aborda al examinar los niveles de ARNm.

Tanto la importancia como la complejidad de estudiar el proteoma son evidentes en su magnitud. El proteoma es muchas veces más grande que el genoma, dado el amplio grado de modificaciones y procesamiento postraduccionales que experimentan casi todas las proteínas. Existen muchos ejemplos en los que un solo gen (compuesto por muchos exones) puede generar cientos y posiblemente miles de moléculas de proteínas diferentes mediante empalmes alternativos y modificaciones postraduccionales. Por lo tanto, el análisis de todo el proteoma presenta un desafío más abrumador que los proyectos de secuenciación del genoma.


Fondo

La mayoría de las bacterias viven en entornos que no mantienen un crecimiento continuo. Más bien, las poblaciones naturales suelen ser estacionarias con respecto al crecimiento, ya que los factores necesarios para el crecimiento suelen ser limitantes (por ejemplo, nutrientes, oxígeno) o se han acumulado factores que inhiben el crecimiento (por ejemplo, productos de desecho) (revisado en [1]). Sin embargo, la fase estacionaria no es necesariamente el estado final. El crecimiento bacteriano se reanuda tan pronto como las condiciones ambientales vuelven a ser favorables. Presumiblemente, las poblaciones de la fase estacionaria están optimizadas para hacer frente a cualquiera de dos posibilidades. Por un lado, deben soportar las desafiantes condiciones ambientales que impiden el crecimiento. Por otro lado, deberían ser capaces de reanudar rápidamente el crecimiento en caso de cambios ambientales que favorezcan el crecimiento. Un objetivo de este estudio fue aprender cómo las bacterias afrontan esta situación. Los datos transcriptómicos y proteómicos sobre una población bacteriana a medida que atraviesa los diversos estados de crecimiento pueden proporcionar algunas pistas. Se han utilizado enfoques transcriptómicos para estudiar los cambios entre las fases de crecimiento [2, 3]. Un enfoque combinado transcriptómico y proteómico tiene la ventaja de proporcionar conocimientos más profundos sobre los cambios moleculares que subyacen a la adaptación del crecimiento bacteriano [4, 5, 6, 7]. En general, esperábamos que el flujo de información de ADN a ARN se correlacionara con la conversión de ARN a proteína, es decir, se predice que los cambios en el transcriptoma conducirán a los cambios correspondientes en el proteoma y el metaboloma. Sin embargo, está surgiendo evidencia de un amplio espectro de organismos de que la abundancia de ARN generalmente no se correlaciona bien con la abundancia de proteínas [8]. Otro objetivo de este estudio fue ver si este es realmente el caso.

En un estudio anterior, analizamos los datos del transcriptoma de nuestro organismo modelo, Rhodobacter sphaeroides, en la fase exponencial y después de varios tiempos de incubación en la fase estacionaria [9]. R. sphaeroides es una alfaproteobacteria fototrófica facultativa, que se encuentra principalmente en hábitats de agua dulce. Estos entornos están sujetos a cambios frecuentes, y esto se refleja en la flexibilidad de R. sphaeroides para seleccionar entre una serie de vías metabólicas para optimizar el crecimiento y minimizar el estrés. Por ejemplo, R. sphaeroides utiliza la respiración aeróbica para la producción de ATP en presencia de niveles suficientes de oxígeno. Si la tensión del oxígeno disminuye, las bacterias comienzan a formar complejos fotosintéticos. Si hay luz disponible, se realiza la fotosíntesis anoxigénica [10]. Dado que la presencia simultánea de luz, oxígeno y bacterioclorofila conduce a estrés fotooxidativo por la generación del oxígeno singlete dañino, las bacterias intentan evitar esta situación reprimiendo la expresión génica de la fotosíntesis en presencia de luz y oxígeno [11, 12]. Además, montan una respuesta para proteger contra el consiguiente estrés fotooxidativo [13, 14]. La respuesta de R. sphaeroides a varios estreses como el estrés oxidativo (peróxido de hidrógeno), el estrés fotooxidativo (oxígeno singlete) y la limitación del hierro se ha estudiado intensamente [14, 15, 16, 17, 18, 19]. Este gran cuerpo de conocimientos sobre el R. sphaeroides La respuesta a diversos estreses nos brinda la oportunidad de comparar el transcriptoma de esta bacteria en diversas respuestas al estrés con el transcriptoma en diferentes fases de crecimiento. En particular, estamos interesados ​​en factores reguladores comunes y patrones de expresión.

El éxito de este enfoque se ejemplificó en un estudio anterior sobre R. sphaeroides que se centró en los cambios transcriptómicos durante la salida de la fase estacionaria después del acceso a nutrientes frescos (en adelante, excrecencia). Nuestros datos revelaron que los factores sigma alternativos RpoHI y RpoHII son actores importantes en el crecimiento posterior a una fase estacionaria extendida. RpoHI y RpoHII también son necesarios para la respuesta a una variedad de tensiones, que incluyen calor, oxígeno singlete, peróxido de hidrógeno, superóxido y CdCl.2 [20]. Sorprendentemente, hubo una superposición significativa entre el transcriptoma de crecimiento y el de la respuesta al estrés fotooxidativo [9], lo que sugiere que la respuesta bacteriana al cambio repentino en las condiciones que inician el crecimiento es similar a la respuesta al estrés fotooxidativo.

Este estudio presenta un análisis comparativo completo de los cambios en el transcriptoma y lo compara con el proteoma en las diferentes fases de crecimiento. No solo incluimos datos transcriptómicos y proteómicos durante la transición a la fase estacionaria, sino también el proteoma en la fase estacionaria profunda. Los datos del transcriptoma se basan en un análisis de microarrays previamente publicado [9], y los datos del proteoma se basan en espectrometría de masas cuantitativa.


Proteómica: conceptos básicos, tecnología y aplicaciones

Las transcripciones de genes que un individuo puede producir a lo largo de su vida, denominadas transcriptoma (por analogía con el término genoma), se refieren al conjunto haploide de cromosomas que llevan todos los genes funcionales.

De manera similar, todas las proteínas producidas por un organismo ahora se agrupan bajo la sombra de la proteómica. La proteómica implica el estudio sistemático de proteínas con el fin de proporcionar una visión integral de la estructura, función y papel en la regulación de un sistema biológico.

Estos incluyen la interacción proteína-proteína, la modificación de proteínas, la función de las proteínas y sus estudios de localización. El objetivo de la proteómica no es solo identificar todas las proteínas de una célula, sino también crear un mapa tridimensional completo de la célula que indique dónde se encuentran las proteínas. Junto con los avances en bioinformática, este enfoque para describir de manera integral los sistemas biológicos sin duda tendrá un impacto importante en nuestra comprensión del fenotipo de las células tanto normales como enfermas.

El proteoma (término acuñado por Mark Wilkins en 1995) de una célula dada es el número total de proteínas en un instante dado y es altamente dinámico en respuesta a señales internas y externas. Las proteínas pueden modificarse mediante modificaciones postraduccionales, sufrir translocaciones dentro de la célula o sintetizarse o degradarse.

Por tanto, el examen de las proteínas de una célula en un momento determinado refleja el entorno proteico inmediato en el que se estudia. Un proteoma celular es la colección de proteínas que se encuentran en un tipo de célula particular bajo la influencia de un conjunto particular de condiciones ambientales como la exposición a la estimulación hormonal. Un conjunto completo de proteínas de todos los diversos proteomas celulares formará un proteoma completo del organismo.

Un hallazgo interesante del Proyecto Genoma Humano es que hay muchas más proteínas en el proteoma humano (

400.000 proteínas) que los genes que codifican proteínas en el genoma humano (

22.000 genes). Se cree que el gran aumento en la diversidad de proteínas se debe al corte y empalme alternativo y la modificación postraduccional de proteínas. Esto indica que la diversidad de proteínas no se puede caracterizar completamente mediante el análisis de expresión génica solo. La proteómica, por tanto, es una herramienta útil para caracterizar células y tejidos de interés.

Los primeros estudios de proteínas que pueden denominarse proteómica comenzaron con la introducción de la electroforesis en gel bidimensional de proteínas de E. coli (O & # 8217 Ferrall, 1975) seguida de estudios de proteínas de ratón y cobaya (Ksole, 1975). Aunque la electroforesis bidimensional (2-DE) fue un gran paso adelante y muchas proteínas pudieron separarse y visualizarse mediante esta técnica, no fue suficiente para la identificación de proteínas mediante ninguna tecnología de secuenciación de proteínas sensibles.

Después de ciertos esfuerzos, la primera tecnología importante para la identificación de proteínas fue la secuenciación de proteínas por degradación de Edman (Edman, 1949). Esta tecnología se utilizó para la identificación de proteínas de geles 2-D para crear la primera base de datos 2D (Celis et al. 1987). Otro desarrollo más importante en la identificación de proteínas fue la tecnología de espectrometría de masas (MS) (Andersen et al. 2000). La secuenciación de proteínas mediante la tecnología MS se ha incrementado debido a su sensibilidad de análisis, tolera complejos de proteínas y es susceptible de operaciones de alto rendimiento.

Aunque se han realizado varios avances en la identificación de proteínas (mediante MS o secuenciación de Edman) sin tener la base de datos de secuenciación de ADN a gran escala de secuencias expresadas y ADN genómico, las proteínas no se pudieron caracterizar porque se pueden generar diferentes isoformas de proteínas a partir de un solo gen a través de varios. modificaciones (Fig. 18.1). Y la mayoría de las secuencias de ADN y proteínas se han acumulado en un corto período de tiempo.

En 1995, se realizó por primera vez la secuenciación del genoma de un organismo en Haemophilus influenzae (Fleischmann et al. 1995). Hasta la fecha, se ha completado la secuenciación de varios otros genomas eucariotas, a saber. Arabidopsis thaliana (Tabata, 2000), Sachcharomyces cerevisiae (Goffeau, 1996), Caenorhabditis elegans (Abbott, 1998), Oryza (Matsumoto, 2001) y humano (Venter, 2001).

Para el perfil de expresión de proteínas, un procedimiento común es el análisis de ARNm mediante diferentes métodos, incluido el análisis en serie de la expresión génica (SAGE) (Velculescu et al. 1995) y la tecnología de microarrays de ADN (Shalon, 1996). Sin embargo, el nivel de transcripción de un gen da solo una idea aproximada del nivel real de expresión de ese gen.

Se puede producir un ARNm en abundancia, pero al mismo tiempo se degrada rápidamente o se traduce de manera ineficaz manteniendo la cantidad mínima de proteína. Las proteínas que se han formado también se someten a modificaciones postraduccionales. Diferentes modificaciones postraduccionales o proteólisis y compartimentación regulan las funciones de las proteínas en la célula (fig. 18.1).

Se predijo que el número medio de proteínas formadas por gen sería una o dos en las bacterias, tres en las levaduras y tres o más en los seres humanos (Wilkins et al. 1996). En respuesta a las respuestas extracelulares, varias proteínas experimentan modificaciones postraduccionales. La fosforilación de proteínas es un mecanismo de señalización importante y la desregulación de la proteína quinasa y la fosfatasa puede resultar en oncogénesis (Hunter, 1995).

A través del análisis de proteomas, los cambios en las modificaciones de muchas proteínas expresadas por una célula pueden analizarse después de la traducción. Otra característica importante de una proteína es su localización en la célula. Se sabe que la mala localización de las proteínas tiene un efecto adverso sobre la función celular (fibrosis quística) (Drumm y Collins, 1993). El crecimiento celular, la muerte celular programada y la decisión de continuar a través del ciclo celular están todos regulados por la transducción de señales a través de complejos de proteínas (Pippin et al. 1993). La interacción de proteínas se puede detectar mediante el uso de un sistema de dos híbridos de levadura (Rain et al. 2001).

Para comprender un proteoma, se deben realizar tres tipos distintos de análisis:

(1) La proteómica de expresión de proteínas es el estudio cuantitativo de la expresión de proteínas de todo el proteoma o sub-proteoma de dos muestras que difieren en alguna variable. La identificación de nuevas proteínas en la transducción de señales y las proteínas específicas de la enfermedad son el resultado principal de este enfoque.

(2) La proteómica estructural intenta identificar todas las proteínas dentro de un complejo u orgánulo, determinar su localización y caracterizar todas las interacciones proteína-proteína. El objetivo principal de estos estudios es trazar un mapa de la estructura de los complejos proteicos o de las proteínas orgánulos celulares (Blackstock y Weir, 1999).

(3) La proteómica funcional permite el estudio de un grupo seleccionado de proteínas responsables de las vías de señalización, enfermedades e interacciones proteína-proteína. Esto puede ser posible aislando los sub-proteomas específicos mediante cromatografía de afinidad para un análisis adicional (Fig. 18.2):

Tecnología de proteómica:

La medición del nivel de la transcripción de un gen no proporciona necesariamente una imagen clara de los productos proteicos formados. Por lo tanto, para la medición de la expresión génica real, deben analizarse las proteínas. Antes de la identificación y medición de la actividad, todas las proteínas de un proteoma en cualquier instante deben separarse entre sí.

Un experimento típico de proteómica (por ejemplo, perfil de expresión de proteínas) se puede dividir en las siguientes categorías:

(i) Separación y aislamiento de proteínas

(ii) La adquisición de información estructural de proteínas para la identificación y caracterización de proteínas.

(i) Separación y aislamiento de proteínas:

Un componente esencial de la proteómica es la electroforesis de proteínas, la forma más eficaz de resolver una mezcla compleja de proteínas. Hay dos tipos de electroforesis disponibles como electroforesis unidimensional y bidimensional. En la electroforesis en gel unidimensional (1-DE), las proteínas se resuelven sobre la base de sus masas moleculares. Las proteínas son lo suficientemente estables durante 1-DE debido a su solubilidad en dodicil sulfato de sodio (SDS). Las proteínas con masa molecular de 10-300 kDa se pueden separar fácilmente a través de 1-DE.

Pero con mezclas de proteínas complejas, los resultados con 1-DE son limitados, por lo que para mezclas de proteínas más complejas como el lisado celular crudo, la mejor herramienta de separación disponible es la electroforesis en gel bidimensional (2-DE) (O & # 8217 Ferrall, 1975). Aquí, las proteínas se separan según sus cargas netas en la primera dimensión y según sus masas moleculares en la segunda dimensión.

Como un solo gel de 2-DE puede resolver miles de proteínas, sigue siendo una herramienta poderosa para la catalogación de proteínas. La electroforesis bidimensional tiene la capacidad de resolver proteínas que han sufrido algunas modificaciones postraduccionales, así como la expresión de proteínas de dos muestras cualesquiera pueden compararse cuantitativa y cualitativamente. Recientemente se han introducido gradientes de pH en 2-DE que mejoraron enormemente la reproducibilidad de esta técnica (Bjellqvist et al. 1993).

Sin embargo, quedan pocos problemas por resolver con 2-DE. A pesar de los esfuerzos para automatizar el análisis de proteínas mediante 2-DE, sigue siendo un proceso que requiere mucho tiempo y trabajo. Otra limitación importante de 2-DE es la incapacidad para detectar proteínas de bajo número de copias cuando se analiza un lisado celular total (Link et al. 1997 Shevchenko et al. 1996) así como también la ineficacia para acelerar el proceso de digestión en gel.

Por lo tanto, se han buscado alternativas para evitar la electroforesis en gel de proteínas. Un enfoque es la digestión proteolítica de la mezcla de proteínas para convertirlas en péptidos y luego purificar los péptidos antes de someterlos a análisis por espectrometría de masas (MS). La purificación de péptidos se ha simplificado mediante cromatografía líquida (Link et al. 1999 McCormack et al. 1997), electroforesis capilar (Figeys et al. 1999 Tong et al. 1999) y cromatografía de fase inversa (Opiteck et al. 1997).

Recientemente, Juan et al. (2005) han desarrollado un nuevo enfoque para acelerar el proceso de identificación de proteínas utilizando tecnología & # 8216microwave & # 8217. Las proteínas extraídas de los geles se someten a digestión con tripsina mediante irradiación de microondas, que produce rápidamente fragmentos de péptidos. Estos fragmentos podrían analizarse mediante MALDI (desorción / ionización láser asistida por matriz). A pesar de la gran cantidad de investigaciones posteriores sobre ciertas alternativas al 2-DE, esta es la técnica más utilizada para los estudios de proteomas.

(ii) Adquisición de estructuras proteicas: identificación de proteínas:

Uno de los primeros métodos utilizados para la identificación de proteínas fue la micro secuenciación por la química de Edman para obtener secuencias de aminoácidos N-terminales. Esta técnica fue introducida por Edman en 1949. En la secuenciación de Edman, se secuencia el N-terminal de una proteína para determinar su verdadero sitio de inicio. La secuenciación de Edman es un método de secuenciación más aplicable para la identificación de proteínas separadas por electroforesis en gel de poliacrilamida-SDS.

Este método se ha utilizado ampliamente en los primeros años de la proteómica, pero en los últimos tiempos han surgido ciertas limitaciones. Una de las principales limitaciones es la modificación N-terminal de proteínas. Si alguna proteína está bloqueada en el N-terminal antes de la secuenciación, entonces es muy difícil identificar la proteína.

Para superar este problema, se ha empleado recientemente un nuevo enfoque de secuenciación de péptidos mixtos (Damer et al. 1998). En este enfoque, una proteína se convierte en péptidos mediante escisión con bromuro de cianógeno (CNBr) o escatol seguido de la secuenciación de péptidos de Edman.

El avance más significativo en proteómica ha sido la identificación espectrométrica de masas de proteínas separadas en gel. Debido a sus altos niveles de sensibilidad, identificación de proteínas en complejos / mezclas de proteínas y alto rendimiento, esta técnica ha demostrado ser mucho mejor que la ES.

En espectrometría de masas, las proteínas se digieren en péptidos en el propio gel mediante una proteasa adecuada, como la tripsina, porque las proteínas, como tales, son difíciles de eluir de los geles. Además, el peso molecular de las proteínas no suele ser adecuado para la identificación de bases de datos. Por el contrario, los péptidos se pueden eluir fácilmente de los geles y el emparejamiento de incluso un pequeño conjunto de péptidos con la base de datos es bastante suficiente para identificar una proteína.

Hay dos enfoques principales para la identificación de proteínas por espectrometría de masas:

(i) & # 8220 La ionización por electropulverización & # 8221 (ESI) implica la fragmentación de péptidos individuales seguida de ionización directa a través de electropulverización en un espectrómetro de masas en tándem. En ESI, una muestra líquida fluye desde un tubo microcapilar al orificio del espectrómetro de masas, donde una diferencia de potencial entre el capilar y la entrada al espectrómetro de masas da como resultado la generación de una fina niebla de gotitas cargadas (Fenn et al. 1989 Hunt y col. 1981).

Tiene la capacidad de resolver péptidos en una mezcla, aislar una especie a la vez y disociarla en fragmentos que contienen amino o carboxi-terminales designados & # 8216b & # 8217 e "y", respectivamente.

(ii) En el enfoque de & # 8220 Mapeo de masas de péptidos & # 8221 (Henzel et al. 1993) se adquiere el espectro de masas de la mezcla de péptidos eluidos, lo que da como resultado una huella dactilar de masa de péptidos de la proteína que se está estudiando. El espectro de masas se obtiene mediante un & # 8216 método espectrométrico de masas-desorción / ionización láser asistida por matriz & # 8217 (MALDI) relativamente simple.

En este enfoque, se analiza la mezcla de péptidos trípticos porque la tripsina escinde proteínas en el aminoácido arginina y lisina. Como los péptidos trípticos pueden predecirse teóricamente para cualquier proteína, las masas de péptidos predichas pueden compararse con las obtenidas experimentalmente mediante análisis MALDI. Si el número suficiente de péptidos coincide con la secuencia de proteínas existente en la base de datos, la precisión para la identificación de proteínas es alta.

Después de las escisiones por proteasa de las proteínas, también se analizan mediante análisis de masas. El análisis de masas sigue la conversión de proteínas o péptidos en iones moleculares. Estos iones se separaron en un espectrómetro de masas en función de su relación masa / carga (m / z). Está determinado por el tiempo que tardan los iones en llegar al detector. Por lo tanto, el instrumento se denomina instrumento de tiempo de vuelo (TOF).

La relación que permite determinar la relación m / z es E = 1/2 (m / z) v 2. En esta ecuación. E es la energía impartida a los iones cargados como resultado del voltaje que aplica el instrumento y V es la velocidad de los iones en la trayectoria de vuelo. A medida que se introducen iones peptídicos en la cámara de colisión, interactúan con el gas de colisión y se fragmentan a lo largo de la estructura del péptido (fig. 18.4).

Debido a que todos los iones están expuestos al mismo campo eléctrico, todos los iones cargados de manera similar tendrán energías similares. Por lo tanto, según la ecuación anterior, los iones que tienen una masa mayor deben tener velocidades más bajas y, por lo tanto, requerirán tiempos más largos para llegar al detector. Los diferentes pasos involucrados en la espectrometría de masas se describen en un diagrama de flujo en la figura 18.3.

(iii) Utilización de la base de datos:

Inicialmente, la secuenciación de algunas proteínas o péptidos seguida de la presentación de secuencias juntas creó un ensamblaje de proteínas llamado base de datos de proteínas. La digestión proteolítica de muchas proteínas también se predice teóricamente y se deposita en la base de datos. Por lo tanto, en la actualidad, se ha acumulado tanta información que podemos buscar una homología entre una nueva secuencia de péptidos y las secuencias existentes en la base de datos para identificar la proteína.

El objetivo principal de la búsqueda en bases de datos es identificar una gran cantidad de proteínas de forma rápida y precisa. Toda la información acumulada a través de la secuenciación de Edman o la espectrometría de masas se utiliza para identificar las proteínas. En la búsqueda de bases de datos de huellas dactilares de masas de péptidos, la masa de un péptido desconocido después de la digestión proteolítica se compara con la masa permitida de péptido de la digestión teórica de proteínas en la base de datos. En la búsqueda de bases de datos de secuencias de aminoácidos, se identifica la secuencia de aminoácidos de un péptido y se puede utilizar para buscar bases de datos para encontrar la proteína de la que se deriva.

Por tanto, la colección de bases de datos de secuencias de proteínas está diseñada para representar una lista parcial del genoma de un organismo, es decir, los genes y todas las proteínas que codifican. Las familias de proteínas generalmente se clasifican de acuerdo con su historia evolutiva inferida de la homología de secuencia.

These databases are excellent tools for gene discovery, comparative genomics and molecular evolution. The purpose of database similarity searching is the sensitive detection of sequence homologues, regardless of the species relationship in order to infer similarity of function from similarity of sequence.

Recently, Chromatography-based proteomics is used to measure the concentration of low molecular weight peptides in complex mixtures such as plasma or sera. These technologies use time-of-flight (TOF) spectroscopy with matrix-assisted or surface- enhanced laser desorption/ionization to produce a spectrum of mass-to-charge (m/z) ratios that can be analysed in order to identify unique signatures from its chromatography pattern.

Applications of Proteomics:

1. Post-Translational Modifications:

Proteomics studies involve certain unique features as the ability to analyze post- translational modifications of proteins. These modifications can be phosphorylation, glycosylation and sulphation as well as some other modifications involved in the maintenance of the structure of a protein.

These modifications are very important for the activity, solubility and localization of proteins in the cell. Determination of protein modification is much more difficult rather than the identification of proteins. As for identification purpose, only few peptides are required for protease cleavages followed by database alignment of a known sequence of a peptide. But for determination of modification in a protein, much more material is needed as all the peptides do not have the expected molecular mass need to be analyzed further.

For example, during protein phosphorylation events, phosphopeptides are 80 Da heavier than their unmodified counterparts. Therefore, it gives, rise to a specific fragment (PO 3- mass 79) bind to metal resins, get recognized by specific antibodies and later phosphate group can be removed by phosphatases (Clauser et al. 1999 Colledge and Scott, 1999). So protein of interest (post-translationally modified protein) can be detected by Western blotting with the help of antibodies or 32 P-labelling that recognize only the active state of molecules. Later, these spots can be identified by mass spectrometry.

2. Protein-Protein Interactions:

The major attribution of proteomics towards the development of protein interactions map of a cell is of immense value to understand the biology of a cell. The knowledge about the time of expression of a particular protein, its level of expression, and, finally, its interaction with another protein to form an intermediate for the performance of a specific biological function is currently available.

These intermediates can be exploited for therapeutic purposes also. An attractive way to study the protein-protein interactions is to purify the entire multi-protein complex by affinity based methods using GST-fusion proteins, antibodies, peptides etc.

The yeast two-hybrid system has emerged as a powerful tool to study protein-protein interactions (Haynes and Yates, 2000). According to Pandey and Mann (2000) it is a genetic method based on the modular structure of transcription factors in the close proximity of DNA binding domain to the activation domain induces increased transcription of a set of genes.

The yeast hybrid system uses ORFs fused to the DNA binding or activation domain of GAL4 such that increased transcription of a reporter gene results when the proteins encoded by two ORFs interact in the nucleus of the yeast cell. One of the main consequences of this is that once a positive interaction is detected, simply sequencing the relevant clones identifies the ORF. For this reason it is a generic method that is simple and amenable to high throughput screening of protein-protein interactions.

Phage display is a method where bacteriophage particles are made to express either a peptide or protein of interest fused to a capsid or coat protein. It can be used to screen for peptide epitopes, peptide ligands, enzyme substrate or single chain antibody fragments.

Another important method to detect protein-protein interactions involves the use of fluorescence resonance energy transfer (FRET) between fluorescent tags on interacting proteins. FRET is a non-radioactive process whereby energy from an excited donor fluorophore is transferred to an acceptor fluorophore. After excitation of the first fluorophore, FRET is detected either by emission from the second fluorophore using appropriate filters or by alteration of the fluorescence lifetime of the donor.

A proteomics strategy of increasing importance involves the localization of proteins in cells as a necessary first step towards understanding protein function in complex cellular networks. The discovery of GFP (green fluorescent protein) and the development of its spectral variants has opened the door to analysis of proteins in living cells by use of the light microscope.

Large-scale approaches of localizing GFP-tagged proteins in cells have been performed in the genetically amenable yeast S. pombe (Ding et al. 2000) and in Drosophila (Morin et al. 2001). To localize proteins in mammalian cells, a strategy was developed that enables the systematic GFP tagging of ORFs from novel full-length cDNAs that are identified in genome projects.

3. Protein Expression Profiling:

The largest application of proteomics continues to be protein expression profiling. The expression levels of a protein sample could be measured by 2-DE or other novel technique such as isotope coded affinity tag (ICAT). Using these approaches the varying levels of expression of two different protein samples can also be analyzed.

This application of proteomics would be helpful in identifying the signaling mechanisms as well as disease specific proteins. With the help of 2-DE several proteins have been identified that are responsible for heart diseases and cancer (Celis et al. 1999). Proteomics helps in identifying the cancer cells from the non-cancerous cells due to the presence of differentially expressed proteins.

The technique of Isotope Coded Affinity Tag has developed new horizons in the field of proteomics. This involves the labeling of two different proteins from two different sources with two chemically identical reagents that differ in their masses due to isotope composition (Gygi et al. 1999). The biggest advantage of this technique is the elimination of protein quantitation by 2-DE. Therefore, high amount of protein sample can be used to enrich low abundance proteins.

Different methods have been used to probe genomic sets of proteins for biochemical activity. One method is called a biochemical genomics approach, which uses parallel biochemical analysis of a proteome comprised of pools of purified proteins in order to identify proteins and the corresponding ORFs responsible for a biochemical activity.

The second approach for analyzing genomic sets of proteins is the use of functional protein microarrays, in which individually purified proteins are separately spotted on a surface such as a glass slide and then analyzed for activity. This approach has huge potential for rapid high-throughput analysis of proteomes and other large collections of proteins, and promises to transform the field of biochemical analysis.

4. Molecular Medicine:

With the help of the information available through clinical proteomics, several drugs have been designed. This aims to discover the proteins with medical relevance to identify a potential target for pharmaceutical development, a marker(s) for disease diagnosis or staging, and risk assessment—both for medical and environmental studies. Proteomic technologies will play an important role in drug discovery, diagnostics and molecular medicine because of the link between genes, proteins and disease.

As researchers study defective proteins that cause particular diseases, their findings will help develop new drugs that either alter the shape of a defective protein or mimic a missing one. Already, many of the best-selling drugs today either act by targeting proteins or are proteins themselves. Advances in proteomics may help scientists eventually create medications that are “personalized” for different individuals to be more effective and have fewer side effects. Current research is looking at protein families linked to disease including cancer, diabetes and heart disease.


A paradigm-shifting book from an acclaimed Harvard Medical School scientist and one of Tiempo’s most influential people.

It’s a seemingly undeniable truth that aging is inevitable. But what if everything we’ve been taught to believe about aging is wrong? What if we could choose our lifespan?

In this groundbreaking book, Dr. David Sinclair, leading world authority on genetics and longevity, reveals a bold new theory for why we age. As he writes: “Aging is a disease, and that disease is treatable.”

This eye-opening and provocative work takes us to the frontlines of research that is pushing the boundaries on our perceived scientific limitations, revealing incredible breakthroughs—many from Dr. David Sinclair’s own lab at Harvard—that demonstrate how we can slow down, or even reverse, aging. The key is activating newly discovered vitality genes, the descendants of an ancient genetic survival circuit that is both the cause of aging and the key to reversing it. Recent experiments in genetic reprogramming suggest that in the near future we may not just be able to sentir younger, but actually volverse younger.


Resultados

Cytological analysis of anthers from R2P2 and R2P2CMS

As with our previous cytological analysis of the anthers of OguCMS cabbage [22], the abnormal pollen development of the OguCMS cabbage line was mainly due to the proliferation and expansion of the tapetum at the anther development stage 9–12 according to Sanders et al [28]. and tapetum PCD from stage 5 to the tetrad stage. To further investigate the tapetum development in anthers of OguCMS cabbage, we performed light and transmission electron microscopy. Paraffin sections (Fig 1) revealed enlarged abnormal tapetum at the tetrad stage of the OguCMS line resulting in delayed deposition of sporopollenin. Compared to R2P2 (Fig 1C and 1D), light microscopy of the tetrads (anther development stage:7–8) and the uninucleate stage (anther development stage:9–10) revealed a fat abnormal tapetum in R2P2CMS (Fig 1E and 1F). Furthermore, the hypertrophic abnormal tapetum at the tetrad stage was observed in R2P2CMS (Fig 1H) using transmission electron (TE) microscopy.

Correlation between samples

Correlation analysis of gene expression level among samples was used to verify experimental reliability and sampling accuracy. The correlation value between the two replicates was calculated based on FPKM, and should be ≥0.92 as per the Encode plan. Correlation between R2P2CMS-1 and R2P2CMS-2 was 0.9479 and 0.9341 between R2P2-1 and R2P2-2 (Table 1). High correlation suggests the replicate samples have high reliability and repeatability, ensuring subsequent analysis reflects real differences in gene expression between R2P2CMS and R2P2.

Differentially expressed genes in R2P2CMS and R2P2 by RNA-seq analysis

RNA-seq analysis generated 13,037,109 to 13,066,594 SE50-clean reads, which were assembled into 36,890 unigenes. A total of 1323 genes (307 up- and 1016 down-regulated genes) with probability ≥0.8 &│log2Ratio(R2P2CMS/R2P20029│≥1 were differentially regulated in R2P2CMS. DEGs were mainly assigned (GO analysis) into three groups: (1) response to stimulus including light intensity and reactive oxygen species (2) cell wall organization or biogenesis (3) pollen development. There were 22 DEGs assigned to pollen development, pollen wall assembly and pollen exine formation, and all were down-regulated in R2P2CMS as showed in Table 2.

Validation of RNA-seq-based DEGs by qRT-PCR

There were 23 DEGs selected for validation using qRT-PCR. Correlation analysis was performed to evaluate the two platforms. The RNA-seq data (log2 (R2P2CMS/R2P2)) and qRT-PCR data (log2(2 -ΔΔCt )) for each DEG (S1 Table) was positively correlated at 0.8438 (Fig 2, correlation is significant at the 0.01 level).

Factors related to tapetum programmed cell death (PCD)

Cytological analysis showed that proliferation and expansion of the tapetum appeared at the anther developmental stage 9–12. Furthermore, most of the microspores were compressed by abnormal hypertrophic tapetum cells in R2P2CMS. Two DEGs were identified (Bol017269, log2Ratio: -12.4592 Bol008912:-9.2109) encoding GA-regulated family protein[29,30], MYB101 (Bol013459:-7.9363)[31–33] involved in GA mediated signaling pathway- triggered PCD, TDF1/MYB 35 (Bol042967:-6.6075)[34], PLP4 (Bol028944:-6.7823)[35] and AMS genes (Bol042692:-2.6678 Bol004758:-3.0183)[36,37], and all these genes were significantly down-regulated in R2P2CMS (S2 Table). Four DEGs were identified as belonging to the cysteine proteinase superfamily[38,39] (Bol041049:-14.5119, Bol015354:-2.0250, Bol041861:-7.6149, Bol023341:-11.0642) and were rarely expressed in R2P2CMS. Niveles de expresión de MYB101 (Bol013459), GA-regulated family protein (Bol008912) and cysteine proteinase (Bol041049) were verified by qRT-PCR with a value of log2(2 -PCR -4.6459, -6.9604, -11.6789.

Essential biosynthesis pathways and key related genes in exine development

From our pathway enrichment results, sporopollenin biosynthesis such as fatty acid elongation (S3 Table), biosynthesis of unsaturated fatty acid (S4 Table), phenylpropanoid biosynthesis pathway (S5 Table), flavonoid biosynthesis (S6 Table), carotenoid biosynthesis (S7 Table), pathway of cutin, suberine and wax biosynthesis (S8 Table) and protein processing in ER (S9 Table) were among the top 20 significantly enriched pathways (pathways with Q-value ≤ 0.05).

All 8 DEGs identified as being involved in fatty acid elongation and 8 DEGs identified as being involved in biosynthesis of unsaturated fatty acid were down-regulated in R2P2CMS. Most of the genes involved in fatty acid elongation were KCS (3-ketoacyl-CoA synthase) genes.

All 24 DEGs (except Bol017968) involved in the phenylpropanoid biosynthesis pathway and 20 DEGs involved in flavonoid biosynthesis were down-regulated in R2P2CMS. Key genes participated both in flavonoid biosynthesis and phenylpropanoid biosynthesis or metabolic process by KEGG annotation included DRL1 (Bol016365: -1.6646), LAP5 (Bol013698: -2.3969 Bol034656: -3.1199), LAP6 (Bol025267: -1.8631), CYP78A7 (Bol043713: -5.2576) and CYP98A8 (Bol039941: -7.1587). Other key phenylpropanoid biosynthesis genes included ACOS5 (Bol029711: -2.3937) and PAL1 (Bol037689: -1.5571 Bol025522: -2.1679) which were also identified as participating in gametophyte development annotated by GO. Other key DEGs involved in the flavonoid biosynthesis included CYP703A2 (Bol018458: -4.5243 Bol040704: -1.6142), and CHS (Bol043396: -2.2360 Bol034259:-1.3776). Niveles de expresión de DRL1 (Bol016365), LAP5 (Bol034656), CYP98A8 (Bol039941), ACOS5 (Bol029711) and CYP703A2 (Bol018458) were verified by qRT-PCR with log2(2 -ΔΔCt ) values of -2.5752, -3.9456, -7.5928, -1.8604, -6.1178, -11.6789, respectively.

All 15 DEGs involved in carotenoid biosynthesis were down-regulated in the CMS line except 3 genes. Key genes were analyzed including GELPs (GDSL-like Lipases, Bol026926:-11.0867 Bol023605:-10.7184 Bol002897:-10.6968 Bol002899:-9.1983 Bol029971:-2.4724 and Bol026928:-10.9374), EXL4 (extracellular lipase 4, Bol039273:-14.7554 and Bol037608:-14.7206), CYP97A3 (Bol005984:-1.6580) and ATA27 (Glycosyl hydrolase superfamily protein, Bol039271:-10.9311). Among them, low expression was observed in the two EXL4, six GELPs (except gene Bol029971) and ATA27 in R2P2CMS, yet expression was high in R2P2. Log2(2 -ΔΔCt ) values of qRT-PCR analysis of two GELPs genes (Bol023605 and Bol002899) were -10.9400 and -10.7869, respectively.

Twelve DEGs identified as being involved in cutin, suberine and wax biosynthesis were down-regulated in R2P2CMS and key related genes were analyzed. Dos ms2/jojoba FAR2 genes (Bol010336:-1.6689 Bol007277:-1.6803) were annotated in pollen wall assembly using GO analysis. In R2P2CMS, three CYP86C (Bol032609: -6.4276 Bol004019: -7.1397 Bol029152:-12.8476) and four HXXXD-type acyl-transferase family proteins (Bol033609: -7.6484 Bol033614:-13.5615 Bol033616:-14.2310 Bol033612:-10.4104) were inhibited, yet highly expressed in R2P2. Furthermore, key genes CYP704B1 (Bol023932:-1.8321) and GMC oxidoreductase (Bol029117: -4.0004 Bol045261:-2.7731) are identified.

There were 71 DEGs identified as involved in protein processing in ER and most of the up-regulated genes in the CMS line were heat shock proteins (HSPs) involved in response to stress. HSPs in the ER are thought to prevent tapetum differentiation.

Secretion and translocation of sporopollenin precursors

Secretion and translocation of sporopollenin precursors to the microspores should be inhibited in the CMS lines. ABC (ATP binding cassette) transporters and LTPs (lipid transfer proteins) have been shown to play essential roles in secretion of sporopollenin precursors from tapetal cells and in delivery of these precursors. Here, two of the four identified ABC-2 type transporter family proteins (Bol042334: -5.7642 Bol013065: -4.9162) and three, LTP12 (Bol004980: -11.8782 Bol010612: -17.1135 Bol014756: -10.9286) (S2 Table), showed very low expression in R2P2CMS compared to R2P2. For Bol013065, log2Ratio by RNA-seq was -4.9162 and log2(2 -ΔΔCt ) by qRT-PCR was -5.6584, which is consistent.

In addition to producing precursors for sporopollenin development, tapetum also synthesizes and secretes callose synthase (CALS), also termed β-1,3-glucanase, to degrade the callose wall surrounding the microspores after the tetrad stage. Furthermore, it is thought that the callose wall may play an important role in pollen development as a glucose source or as a stress factor forming tectum of the sexine [40]. Here, the expression level of the DEG CALS5 (Bol019328) was extremely low in R2P2CMS, and a log2Ratio by RNA-seq of -6.1683 and log2(2 -ΔΔCt ) by qRT-PCR of -4.0327. A series of tapetum specific genes expressed at the tetrad stage are listed in Table 3. Tapetum specific proteins with unknown function, anther 20, lysine histidine transporter 2, thaumatin-like protein 3 and pectin lyase-like superfamily proteins, were all down-regulated in R2P2CMS. Expression levels of ATLP-3 (Bol039345), TAP35/TAP44 (Bol011923) and ATA20 (Bol011894) were verified with the log2(2 -ΔΔCt ) of -3.3718, -3.97709 and -14.6351.

Proteomic differences in R2P2CMS and R2P2 by ITRAQ analysis

Quantification repeat analysis.

Here, CV was used to evaluate reproducibility. CV is defined as the ratio of the standard deviation (SD) to the mean. The lower the CV, the better the reproducibility. The mean CV for this experiment was 0.079 (Fig 3), indicating our data was reliable for further study.

X-axis is the deviation between the protein ratio of the replicate samples. Y-axis is the percentage that a protein at a certain angle comprise quantified protein amount.

In total, 274,364 spectrum were generated 22,634 peptides and 7,147 unique proteins were identified with the cutoff: MascotPercolator Q-value ≤ 0.01. While, 833 proteins were differentially expressed including 538 up- and 295 down-regulated in R2P2CMS compared to R2P2, with a significant threshold of fold change ≥ 1.2 or ≤1/1.2 (0.8333333) and Q-value ≤ 0.05.

Among the 833 DEPs, 553 (66.39%) were classified into KEGG pathways, 6 of which were characterized as enrichment pathways with p-value < 0.05. These included ribosome (63, 11.39%), spliceome (36, 6.51%), mRNA surveillance pathway (30, 5.42%), other types of O-glycan biosynthesis(2, 0.36%), glycosphingolipid biosynthesis - ganglio series(4, 0.72%) and other glycan degradation (10, 1.81%) as shown in Table 4, which showed that substantial proteins change and glycan degradation in R2P2CMS compared to R2P2. Sporopollenin biosynthesis related pathways among KEGG analysis of DEPs include protein processing in ER (19, 3.44%), carotenoid biosynthesis (10, 1.81%), phenylpropanoid biosynthesis (17, 3.07%), flavonoid biosynthesis (7, 1.27%), biosynthesis of unsaturated fatty acids(4, 0.72%), cutin, suberine and wax biosynthesis (3, 0.54%), pathways and related DEPs were listed in S10 Table. And DEPs like cysteine proteins(Bol041861 Bol037199) and ABC transporters(Bol013065) were all up-regulated in R2P2. Lipid-transfer protein(Bol033811) was down-regulated in R2P2CMS. Key DEPs involved in pathway of protein processing in ER, except for Bol013102, all the HSPs (Bol039505, Bol036095, Bol032900, Bol039198, Bol010195) were up-regulated in the CMS line, which was consistent with the results of transcriptome. In carotenoid biosynthesis pathway, 5 GDSL-like Lipases(Bol026926, Bol035147, Bol026928, Bol035145, Bol002897) and 2 DEPs EXL4 (Bol037608, Bol039273)were all up-regulated in CMS line. Key DEPs CYP98A8 Bol039941) in phenylpropanoid biosynthesis was up-regulated in R2P2CMS, other key DEPs like DRL1, LAP5, LAP6, ACOS5, and PAL1 found in DEGs were not identified. In flavonoid biosynthesis, key DEPs participated include CYP98A8(Bol039941,+), CHS (Bol043396,-) CYP82F1 (Bol033613, -).

Correlation analysis of DEGs and DEPs

Correlation analysis of DEGs and DEPs was performed between R2P2CMS and R2P2. DEGs and DEPs were divided into four groups according to expression in R2P2CMS compared to R2P2: Group 1, 22 DEGs and DEPs (13 down-regulated and 9 up-regulated) with the same expression Group 2, 70 DEGs and DEPs with opposite expression Group 3, 741 DEPs whose corresponding genes were not differentially expressed Group 4, 1232 DEGs whose corresponding proteins were not differentially expressed. DEGs and DEPs are displayed in the Venn diagram (Fig 4).

KEGG pathways analysis of all the correlated DEGs/DEPs

KEGG pathway analysis of all 92 DEGs/DEPs are shown in Fig 5. Among them, pathways identified include: phenylalanine metabolism (Bol005311, Bol013614), isoflavonoid biosynthesis (Bol041944), fatty acid biosynthesis (Bol008037), ABC transporters (Bol013065), cutin, suberine and wax biosynthesis (Bol032609, Bol004019) and protein processing in ER (HSPS: Bol013102, Bol039505, Bol039198). Except for Bol013102, the expression pattern of other two HSPs in was the same. Key CHS(Bol043396) in flavonoid biosynthesis pathway in both analysis was all down-regulated, while CYP98A8 Bol039941) had the opposite expression pattern. Only one cysteine protein Bol041861 was correlate, but the expression pattern was opposite. 2 DEPs EXL4 (Bol037608, Bol039273) and 3 GDSL-like Lipases Bol026926, Bol002897 and Bol026928 with opposite expression pattern were all correlated in carotenoid biosynthesis pathway. In phenylpropanoid biosynthesis other key genes like DRL1, LAP5, LAP6, ACOS5, and PAL1 found in DEGs were all not identified, only DEPs CYP98A8 Bol039941) up-regulated in R2P2CMS was correlate and it’s expression pattern was opposite. ABC transporters (Bol013065) in both analysis was opposite. In biosynthesis of unsaturated fatty acids, only one NAD(P)-binding Rossmann-fold superfamily protein Bol008037 was correlated with opposite expression pattern. The glycan degradation pathway was identified in both transcriptome and proteome analysis including GELPs (Bol002897 and Bol026928), BGAL (beta-galactosidase, Bol035797 and Bol000448) and EXL6 (extracellular lipase 6, Bol039272) and were expressed at a very low level in R2P2CMS. GELPs (Bol002897 and Bol026928) are also involved in the carotenoid biosynthesis pathway, and EXL6 may play an essential role in pollen development in B. rapa and Arabidopsis [41]. Among DEGs and DEPs with the same trend pattern, EF hand calcium-binding protein family(Bol026249, -3.8032 Bol015339, -3.8569), embryo-specific protein 3 (ATS3, Bol020675, AT5G62210–3.5356) which was participated in reproduction developmental process by GO annotation, late embryogenesis abundant domain-containing protein(Bol042711, AT2G03740–16.9392) which was verified to be accumulated late in embryogenesis of cotton[42], lipid-transfer protein(Bol033811, -11.5318), CHS Bol043396, -2.2360) may be important for resulting in the sterility in R2P2CMS.

X-axis represents the numbers of DEGs or DEPs.


Transcriptome Analysis of Adrenocortical Cells in Health and Disease

The transcriptome is the complete set of transcripts in a specific type of cell or tissue. Generally, the goal of transcriptome analysis is to identify genes differentially expressed among different conditions, leading to a new understanding of the genes or pathways associated with the conditions. Transcriptome analysis requires an appropriate statistical method with a multiple comparison test to interpret global changes in the expression of thousands of genes. This chapter reviews and describes recent progress in transcriptome analysis of adrenocortical cells. Strategies for determining transcriptomes and data mining to interpret analysis are discussed. Representative studies are introduced, including a mouse model for human lipoid adrenal hyperplasia that proposes, as a new pathophysiological hallmark, a reciprocal interaction between adrenocortical cells and infiltrated macrophages. Analysis of global transcript profiling will be an essential tool for future research on the nature of adrenocortical cells.


Why analyse transcriptome instead of proteome? - biología

Proteomics is the large-scale study of proteins, particularly their structures and functions. The proteome is the entire complement of proteins, including the modifications made to a particular set of proteins, produced by an organism or system. This will vary with time and distinct requirements, or stresses, that a cell or organism undergoes.

While proteomics generally refers to the large-scale experimental analysis of proteins, it is often specifically used for protein purification and mass spectrometry. After genomics and transcriptomics, proteomics is considered the next step in the study of biological systems. It is much more complicated than genomics mostly because while an organism’s genome is more or less constant, the proteome differs from cell to cell and from time to time. This is because distinct genes are expressed in distinct cell types. This means that even the basic set of proteins which are produced in a cell needs to be determined. In the past, this was done by mRNA analysis, but this was found not to correlate with protein content. It is now known that mRNA is not always translated into protein. The amount of protein produced for a given amount of mRNA depends on the gene it is transcribed from and the current physiological state of the cell.

Proteomics confirms the presence of the protein and provides a direct measure of the quantity present. Not only does the translation from mRNA cause differences, but many proteins are also subjected to a wide variety of chemical modifications after translation which are critical to the protein’s function such as phosphorylation, ubiquitination, methylation, acetylation, glycosylation, oxidation, and nitrosylation. Some proteins undergo ALL of these modifications, often in time-dependent combinations, aptly illustrating the potential complexity one has to deal with when studying protein structure and function.

Proteomics typically gives us a better understanding of an organism than genomics. First, the level of transcription of a gene gives only a rough estimate of its level of expression into a protein. An mRNA produced in abundance may be degraded rapidly or translated inefficiently, resulting in a small amount of protein. Second, as mentioned above many proteins experience post-translational modifications that profoundly affect their activities. For example, some proteins are not active until they become phosphorylated. Third, many transcripts give rise to more than one protein through alternative splicing or alternative post-translational modifications. Fourth, many proteins form complexes with other proteins or RNA molecules. They only function in the presence of these other molecules. Finally, protein degradation rate plays an important role in protein content.

One way in which a particular protein can be studied is to develop an antibody which is specific to that modification. For example, there are antibodies that only recognize certain proteins when they are tyrosine-phosphorylated, known as phospho-specific antibodies. There are also antibodies specific to other modifications. These can be used to determine the set of proteins that have undergone the modification of interest. For more quantitative determinations of protein amounts, techniques such as ELISAs can be used.

Most proteins function in collaboration with other proteins. One goal of proteomics is to identify which proteins interact. This is especially useful in determining potential partners in cell signaling cascades. Several methods are available to probe protein–protein interactions. The traditional method is yeast two-hybrid analysis. New methods include protein microarrays, immunoaffinity, and chromatography followed by mass spectrometry, dual polarisation interferometry, Microscale Thermophoresis, and experimental methods such as phage display and computational methods.

Robotic preparation of MALDI mass spectrometry samples: Matrix-assisted laser desorption/ionization (MALDI) is a soft ionization technique used in mass spectrometry. It allows for the analysis of biomolecules and large organic molecules which tend to be fragile and fragment when ionized by more conventional ionization methods.

One of the most promising developments to come from the study of human genes and proteins has been the identification of potential new drugs for the treatment of disease. This relies on genome and proteome information to identify proteins associated with a disease, which computer software can then use as targets for new drugs. For example, if a certain protein is implicated in a disease, its 3-D structure provides the information to design drugs to interfere with the action of the protein. A molecule that fits the active site of an enzyme, but cannot be released by the enzyme, will inactivate the enzyme. Understanding the proteome, the structure and function of each protein and the complexities of protein–protein interactions will be critical for developing the most effective diagnostic techniques and disease treatments in the future. Moreover, an interesting use of proteomics is using specific protein biomarkers to diagnose disease. A number of techniques allow testing for proteins produced during a particular disease, which helps to diagnose the disease quickly.


Conclusión

In summary, there is clearly enormous potential in the integration and use of (multi)omics data for a better understanding of the molecular mechanisms, processes and pathways discriminating health and disease.

The success of this new model of science will depend on the gradual shift from a reductionist to a global approach, sustained by a lively and proactive flow of data across and between different fields of expertise, and funding programmes promoting and supporting this endeavour [ 153]. It is reassuring that governments are starting to acknowledge the importance of translating this comprehensive biomedical knowledge to the bedside and thus fostering the implementation of plans supporting the logistics and regulatory actions for such transformation to take place.

Together, this will eventually aid the development of measures for disease prevention, early diagnosis, disease monitoring and treatment, thus making precision medicine a forthcoming possibility.

We present an overview on the basics and exponential growth of genomics, transcriptomics and proteinomics.

We summarize the principal bioinformatics and biostatistics tools for omics analysis.

Genetics, functional biology, bioinformatics and biostatistics established specific jargons, impacting communication and data interpretation. We particularly aim at targeting a broad range of scientific professionals (including students) seeking knowledge outside their field of expertise.

We provide a critical view of strengths and weaknesses of these omic approaches.


Información del autor

Afiliaciones

Department of Pharmaceutical Sciences, University of Toronto, Toronto, ON, Canada

Mahmoud Labib & Shana O. Kelley

Department of Chemistry, University of Toronto, Toronto, ON, Canada

Institute for Biomaterials and Biomedical Engineering, University of Toronto, Toronto, ON, Canada

Department of Biochemistry, University of Toronto, Toronto, ON, Canada

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

Contribuciones

Los autores contribuyeron igualmente a todos los aspectos del artículo.

Autor correspondiente


Ver el vídeo: Proteoma:D (Junio 2022).


Comentarios:

  1. Caddawyc

    Pido disculpas, pero en mi opinión estás equivocado. Ingrese lo discutiremos. Escríbeme en PM.

  2. Hsmilton

    ¿No escribes a pedido?

  3. Jerric

    Gente, ¿qué noticias del frente?



Escribe un mensaje