α-hélice | 310 hélice | π-helix | |
---|---|---|---|
Residues per turn | 3.6 | 3.0 | 4.4 |
Tradução por resíduo | 1.5 Å (0.15 nm) | 2.0 Å (0.20 nm) | 1.1 Å (0.11 nm) |
Radius de hélice | 2.3 Å (0,23 nm) | 1,9 Å (0,19 nm) | 2,8 Å (0,28 nm) |
Pitch | 5,4 Å (0,54 nm) | 6,0 Å (0,60 nm) | 4,8 Å (0.48 nm) |
Diagrama interactivo de ligações de hidrogénio em estrutura secundária de proteínas. Desenho animado acima, átomos abaixo com azoto em azul, oxigénio em vermelho (PDB: 1AXC)
As estruturas secundárias mais comuns são hélices alfa e folhas beta. Outras hélices, tais como a hélice 310 e a hélice π, são calculadas para ter padrões de ligação de hidrogénio energeticamente favoráveis, mas raramente são observadas em proteínas naturais, excepto nas extremidades da hélice α devido à embalagem desfavorável da espinha dorsal no centro da hélice. Outras estruturas alargadas tais como a hélice de poliprolina e a folha alfa são raras em proteínas de estado nativo, mas são muitas vezes hipotéticas como importantes intermediários de dobragem de proteínas. Voltas apertadas e loops soltos e flexíveis ligam os elementos da estrutura secundária mais “regulares”. A bobina aleatória não é uma verdadeira estrutura secundária, mas é a classe de conformações que indicam uma ausência de estrutura secundária regular.
Aminoácidos variam na sua capacidade de formar os vários elementos da estrutura secundária. A prolina e a glicina são por vezes conhecidas como “quebradores de hélice” porque perturbam a regularidade da conformação da espinha dorsal helicoidal α; no entanto, ambas têm capacidades conformacionais invulgares e são normalmente encontradas por turnos. Os aminoácidos que preferem adoptar conformações helicoidais em proteínas incluem metionina, alanina, leucina, glutamato e lisina (“MALEK” em códigos de 1 letra de aminoácidos); em contraste, os grandes resíduos aromáticos (triptofano, tirosina e fenilalanina) e os aminoácidos ramificados Cβ (isoleucina, valina, e treonina) preferem adoptar conformações de cordão β. No entanto, estas preferências não são suficientemente fortes para produzir um método fiável de previsão de estrutura secundária apenas a partir da sequência.
Vibrações colectivas de baixa frequência são consideradas sensíveis à rigidez local dentro das proteínas, revelando que as estruturas beta são genericamente mais rígidas do que as proteínas alfa ou desordenadas. As medições de dispersão de neutrões ligaram directamente a característica espectral a ~1 THz aos movimentos colectivos da estrutura secundária da proteína beta-barril GFP.
Padrões de ligação ao hidrogénio em estruturas secundárias podem ser significativamente distorcidos, o que torna difícil a determinação automática da estrutura secundária. Existem vários métodos para definir formalmente a estrutura secundária da proteína (por exemplo, DSSP, DEFINE, STRIDE, ScrewFit, SST).
Classificação DSSPEdit
O Dicionário de Estrutura Secundária de Proteínas, abreviadamente DSSP, é normalmente utilizado para descrever a estrutura secundária de proteínas com códigos de letra única. A estrutura secundária é atribuída com base em padrões de ligação de hidrogénio como os inicialmente propostos por Pauling et al. em 1951 (antes de qualquer estrutura proteica alguma vez ter sido determinada experimentalmente). Existem oito tipos de estrutura secundária que a DSSP define:
- G = hélice de 3 voltas (310 hélices). Comprimento mínimo 3 resíduos.
- H = hélice de 4 voltas (α hélice). Comprimento mínimo 4 resíduos.
- I = hélice de 5 voltas (π hélice). Comprimento mínimo de 5 resíduos.
- T = curva ligada ao hidrogénio (3, 4 ou 5 voltas)
- E = fio estendido em paralelo e/ou anti-paralelo β-conformação da folha. Comprimento mínimo 2 resíduos.
- B = resíduo em ponte isolada β (par único β- folha formação de ligação de hidrogénio)
- S = curva (a única atribuição não baseada em ligação de hidrogénio).
- C = bobina (resíduos que não estão em nenhuma das conformações acima referidas).
‘Bobina’ é frequentemente codificada como ‘ ‘ (espaço), C (bobina) ou ‘-‘ (traço). As conformações das hélices (G, H e I) e das folhas são todas necessárias para ter um comprimento razoável. Isto significa que 2 resíduos adjacentes na estrutura primária devem formar o mesmo padrão de ligação de hidrogénio. Se a hélice ou o padrão de ligação da folha de hidrogénio for demasiado curto, são designados como T ou B, respectivamente. Existem outras categorias de atribuição de estrutura secundária de proteínas (curvas acentuadas, laços Omega, etc.), mas são menos frequentemente utilizadas.
A estrutura secundária é definida pela ligação de hidrogénio, pelo que a definição exacta de uma ligação de hidrogénio é crítica. A definição padrão de ligação de hidrogénio para estrutura secundária é a de DSSP, que é um modelo puramente electrostático. Atribui cargas de ±q1 ≈ 0,42e ao carbono carbonilo e oxigénio, respectivamente, e cargas de ±q2 ≈ 0,20e ao amido hidrogénio e azoto, respectivamente. A energia electrostática é
E = q 1 q 2 ( 1 r O N + 1 r C H – 1 r O H – 1 r C N ) ⋅ 332 kcal/mol . Estilo E=q_{1}q_{2}{2}esquerda(1}{r_{\frac {1}{r_{\mathrm {ON} + +frac 1{{r_mathrm {CH}} …frac 1…r_mathrm… …]……. Certo)cdot 332{\i1}text{ kcal/mol}.{\i}
De acordo com DSSP, uma ligação de hidrogénio existe se e apenas se E for inferior a -0,5 kcal/mol (-2,1 kJ/mol). Embora a fórmula DSSP seja uma aproximação relativamente grosseira da energia física da ligação de hidrogénio, é geralmente aceite como uma ferramenta para definir a estrutura secundária.
classificação SSTEdit
SST é um método Bayesiano para atribuir estrutura secundária a dados de coordenadas proteicas usando o critério de informação Shannon de inferência de Comprimento Mínimo de Mensagem (MML). O SST trata qualquer atribuição de estrutura secundária como uma hipótese potencial que tenta explicar (comprimir) dados de coordenadas proteicas dadas. A ideia central é que a melhor atribuição de estrutura secundária é aquela que pode explicar (comprimir) as coordenadas de uma dada coordenada proteica da forma mais económica, ligando assim a inferência da estrutura secundária à compressão de dados sem perdas. SST delineia com precisão qualquer cadeia proteica em regiões associadas com os seguintes tipos de atribuição:
- E = (Extensão) de uma folha plissada em β
- G = Hélice 310 à direita
- H = Hélice α-helix
- g = Hélice 310 à esquerda
- h = Hélice esquerdamão α-helix
- i = Esquerda π-helix
- 3 = 310 giros
- 4 = giros
- 5 = giros
- 5 = giros
- T = Giros não especificados
- C = Bobina
- – = Resíduo não atribuído
li>I = Hélice π-helix