Orientador: Prof. Dr. Flávio Augusto Vicente Seixas Coorientador: Prof.ª Dr.ª Maria Aparecida Fernandez Coorientador: Prof. Dr. Quirino Alves de Lima Neto Dissertação (mestrado em Ciências Biológicas)--Universidade Estadual de Maringá, 2017 Resumo: A proteína KIN foi identificada em 1989 em células de rato a partir da reação cruzada de anticorpos policlonais monoespecíficos, dirigidos contra a proteína RecA de Escherichia coli. O gene KIN codifica uma proteína nuclear de 45 kDa que possui a capacidade de se ligar a ácidos nucleicos. Entre os eucariotos, o gene KIN é conservado filogeneticamente, o que indica atividade funcional em processos biológicos indispensáveis. Em murinos, a proteína KIN está associada à cromatina formando focos de replicação por todo o nucleoplasma, similar àqueles observados com outras proteínas envolvidas no reparo do DNA, na replicação e no splicing de RNA. KIN é ubiquamente expressa em mamíferos e mostra alta expressão em células humanas de músculo esquelético, coração, testículo e células com altas taxas de proliferação, como tumores. Estes dados apontando que KIN tenha um papel na replicação. Adicionalmente, vem sendo associada as funções de fator de transcrição em bactérias e leveduras; reprogramação da expressão gênica global na adaptação de plantas à disponibilidade limitada de cobre, pela interação com SPL7; e em murinos mostrou-se que KIN é importante para um eficiente reparo e resolução das quebras de fita dupla, ocasionadas por radiação ionizante e pela troca de isotipo de imunoglobulinas pelos linfócitos B. Em neurônios existe a evidência de um papel alternativo para a KIN ao invés da replicação, já que esses não se dividem mais depois de maduros. A proteína KIN é composta estruturalmente por motivos particulares: um dedo de zinco, um domínio de hélice alada (Winged Helix Domain), um domínio homólogo a proteína recA de E. coli e um motivo KOW. No entanto, a completa estrutura tridimensional da proteína KIN humana ainda não foi resolvida por métodos experimentais e nem por modelagem in silico, devido à falta de moldes estruturais para a maioria da sequência, indicando uma estrutura ímpar para essa proteína. Diante destas características, nosso grupo se propôs a realizar a análise filogenética e a caracterização biofísica da proteína KIN, utilizando técnicas de bioinformática e espectroscopia de Dicroísmo Circular (CD). A determinação dos parâmetros biofísicos da HSAKIN como Entalpia de desnaturação (?Hm) e Temperatura de melting (Tm) ainda não foi efetuada, assim, o objetivo deste trabalho foi o de realizar ensaios de expressão, análise filogenética e análise biofísica desta proteína de modo a determinar parâmetros termodinâmicos que possam contribuir para a elucidação de suas funções celulares. A análise computacional de parâmetros biofísicos e estruturais foi realizada a partir da sequência traduzida da proteína HSAKIN(His)6x, utilizando programas e servidores on-line, os quais, também foram utilizados para os alinhamentos de múltiplas sequências. Foi prevista uma massa de 48.032,65 Da, ponto isoelétrico teórico de 9,07 e um NLS Bipartido (NLS+) para a proteína HSAKIN(His)6x. Com base nos alinhamentos pôde-se verificar que HSAKIN é bastante conservada entre os animais utilizados, passando de 90% de identidade. Quando se analisou a identidade entre os domínios das proteínas homólogas à HSAKIN separadamente, notou-se um maior grau de identidade para os domínios dedo de zinco e hélice alada, sugerindo que podem ser responsáveis pelo processo mais fundamental à função desta proteína, a ligação à cromatina, ao qual já foi visto que esses dois domínios podem se associar, bem como a interação proteína-proteína. O motivo NLS+ encontrado apresentou maior identidade para a maioria dos eucariotos superiores em relação ao anteriormente descrito na literatura. Bactérias Escherichia coli BL21 (DE3) transformadas com o plasmídeo pET23a-d(+)HSAKIN(His)6x, contendo a sequência codificante da proteína HSAKIN(His)6x, foram induzidas com IPTG para promover a superprodução da proteína de interesse. Posteriormente, as proteínas foram purificadas com cromatografia de afinidade e tiveram seus tampões trocados em coluna de exclusão molecular. Depois de purificadas e concentradas, as amostras foram submetidas a análise por dicroísmo circular. A determinação da porcentagem dos elementos de estrutura secundária da proteína purificada foi realizada para três pHs (6,4; 7,4 e 8,4), por meio da deconvolução do espectro de CD a 20 °C. Em pH fisiológico a proteína HSAKIN(His)6x possui mais da metade de sua composição de elementos não estruturados, voltas-ß e random coils, seguido de folhas-ß (30%) e em menor porcentagem de a-hélices (17%). Esses resultados sugerem, com base que regiões não enoveladas podem se inter-relacionar com uma coleção de parceiros na organização de complexas redes de interação proteína-proteína, assim, essas regiões não estruturadas de KIN poderiam auxiliar na formação de complexas redes de interação proteína-proteína, promovendo a formação de complexos proteicos de alto peso molecular que agem nos processos aos quais HSAKIN foi relacionada. Esses dados podem ser extrapolados para as homólogas analisadas que apresentam altos valores de identidade de sequência. Os resultados de desnaturação térmica para os pHs 6,4 e 7,4 no comprimento de onda 222 nm, mostraram os parâmetros biofísicos ?Hm e Tm relativamente baixos em comparação aos encontrados na literatura. Esses valores substancialmente baixos, provavelmente se devem a esta proteína não possuir nenhuma ponte dissulfeto intra-cadeia, mesmo contando com 7 cisteínas em sua sequência. Possivelmente, a não ocorrência de ligações pode ser devido a diversos impedimentos estéricos impostos pela estrutura enovelada da proteína Abstract: KIN protein was identified in 1989 in mouse cells by means cross-reaction of monospecific polyclonal antibodies directed against the RecA protein from Escherichia coli. The KIN gene encodes a 45 kDa nuclear protein which has nucleic acid binding capacity. Among eukaryotes, KIN gene is conserved phylogenetically, which indicates functional activity in indispensable biological processes. In murine, KIN protein is associated with chromatin forming replication foci throughout the nucleoplasm, similar to those observed with other proteins involved in replication, in DNA repair and RNA splicing. KIN is ubiquitously expressed in mammals and shows high expression in human cells of skeletal muscle, heart, testis and cells with high proliferation rates, such as tumors. These data point out that KIN has a role in replication. In addition, it has been associated to other functions like transcription factor in bacteria and yeasts; reprogramming of global gene expression in plant adaptation to limited copper availability by interaction with SPL7; and in murines it has been shown that KIN is important for efficient repair and resolution of double-stranded breaks caused by ionizing radiation and for the immunoglobulins isotype exchange by B-lymphocytes. In neurons, there is evidence of an alternative role for KIN rather than replication, since they do not divide more after mature. KIN protein is structurally composed for particular motifs: a zinc finger, a winged helix domain, a domain homologous to the recA protein from E. coli and a KOW motif. However, the complete three-dimensional structure of human KIN protein has not yet been resolved by experimental methods or by in silico modeling, due to the lack of structural templates for most of the sequence, indicating a unique structure for this protein. In view of these characteristics, our group proposed to carry out the phylogenetic analysis and biophysical characterization of human KIN protein, using bioinformatics techniques and Circular Dichroism spectroscopy (CD). The determination of the biophysical parameters of HSAKIN as denaturation enthalpy (?Hm) and melting temperature (Tm) has not been performed, so the aim of this work was to perform expression, phylogenetic and biophysical analysis of this protein in order to determine thermodynamic parameters that may contribute to the elucidation of their cellular functions. The computational analysis of biophysical and structural parameters was performed from the HSAKIN(His)6x protein sequence, using on-line programs and servers, which were also used for multiple sequence alignments. It was predicted a molecular weight of 48,032.65 Da, theoretical isoelectric point of 9.07 and a bipartite NLS (NLS+) for the HSAKIN(His)6x protein. Based on the alignments it could be verified that HSAKIN is highly conserved among the tested animals, passing from 90% of identity. When the identity among HSAKIN homologous protein domains was analyzed separately, a higher degree of identity was noted for the zinc finger and winged helix domain, suggesting that they may be responsible for the most fundamental process to the function of this protein, the binding to chromatin, to which it has already been seen that these two domains can be associated, as well as the interaction protein-protein. The NLS+ motif found showed higher identity for most eukaryotes compared to that previously described in the literature. Bacteria Escherichia coli BL21 (DE3) transformed with the plasmid pET23a-d (+) HSAKIN(His)6x, containing the HSAKIN(His)6x protein coding sequence, were induced with IPTG to promote overproduction of the protein of interest. Subsequently, the proteins were purified with affinity chromatography and had their buffers exchanged into a molecular exclusion column. After being purified and concentrated, the samples were analyzed by circular dichroism. The percentage determination of the secondary structure elements of the purified protein was performed for three pHs (6,4; 7,4 e 8,4), by deconvolution of the CD spectrum at 20 °C. In physiologic pH HSAKIN(His)6x has more than half of its composition of non-structured elements, ß-turns and random coils, followed by ß- sheets (30%) and a lower percentage of a-helices (17%). These results suggest, based on that non-envelope regions can interrelate with a collection of partners in the organization of complex protein-protein interaction networks, thus, these nonstructured KIN regions could aid in the formation of complex protein-protein, promoting the formation of high molecular weight protein complexes that act on the processes to which HSAKIN has been related. These data can be extrapolated to the analyzed counterparts having high sequence identity values. The thermal denaturation results for pHs 6.4 and 7.4 at the wavelength 222 nm showed relatively low biophysical parameters ?Hm and Tm compared to the literature. These substantially low values are possibly due to this protein having no intra-chain disulfide bridge, even with 7 cysteines in its sequence. Possibly, the nonoccurrence of bonds may be due to several steric hindrances imposed by the fold structure [7] 50 f. : il. (algumas color.).