A família gênica masp (proteína de superfície associada a mucina), identificada durante a anotação do genoma do Trypanosoma cruzi, é a segunda maior família mutligênica neste parasito, consistindo de aproximadamente 1400 membros. Membros da família MASP contêm domínios N- e C-terminais conservados que codificam para um peptídeo sinal e um sítio de adição de âncora de GPI, respectivamente. A região central é variável em comprimento e em sequência de aminoácidos, e contém um grande repertório de motivos repetitivos, os quais sugerem que MASP esteja envolvida em interações parasito-hospedeiro. Uma vez que nenhum membro da família MASP foi caracterizado até o momento, decidiu-se estudar as estruturas secundária e terciária de diferentes MASPs. Para este objetivo, optou-se por clonar e expressar em Escherichia coli a região central das sequências de quatro membros MASP. Para isso, algumas características das proteínas alvo foram consideradas, tais como curto comprimento da sequência de aminoácidos, em torno de 170 resíduos, baixo conteúdo de sítios potenciais de glicosilação e baixo grau de desordem estrutural. Uma vez que regiões de baixa complexidade normalmente correspondem a segmentos desenovelados ou estruturas extendidas, foi utilizado o servidor PONDR VL-XT para predizer regiões desordenadas nos quatro membros MASP. Proteínas nativamente desenoveladas têm sido descritas por possuírem elevada taxa de resíduos carregados e baixa taxa de resíduos hidrofóbicos. Gráficos de carga líquida média versus taxa de hidrofobicidade foram obtidos para as regiões centrais das quatro MASPs. Estas análises revelaram a presença das quatro regiões centrais no espaço designado para proteínas nativamente desenoveladas. As sequências foram amplificadas por PCR, clonadas nos sistemas de clonagem TOPO e/ou pGEM-T e submetidas ao sequenciamento de DNA. Posteriormente, os produtos de PCR foram transferidos para dois vetores de expressão derivados do vetor pET-28a (Novagen), que foram modificados no Centro de Biologia Molecular e Estrutural (CeBiME, Campinas / SP). Em ambos os vetores, o sítio de reconhecimento por trombina foi substituído pelo sítio de reconhecimento da protease TEV (tobacco etch vírus). As quatro proteínas MASP em fusão a cauda de histidina N-terminal foram expressas na forma solúvel, enquanto que aquelas fusionadas a GST N-terminal foram expressas como corpos de inclusão insolúveis, exceto a recombinante MASP1:GST. A purificação da MASP 3 fusionada a cauda de histidina foi realizada por cromatografia de afinidade. Após a clivagem da etiqueta por TEV, a proteína foi purificada por cromatografia de troca iônica. O estudo da estrutura tridimensional de proteínas MASP permitirá uma compreensão mais detalhada destas moléculas, tal como a localização de seus epítopos e seu enovelamento, o que pode contribuir para a identificação de sua função biológica no T. cruzi. The Trypanosoma cruzi masp (mucin associated surface protein) gene family was identified during the annotation of the genome as the second largest gene family in this human pathogen, consisting of approximately 1400 members. MASP members contain N- and C- terminal conserved domains that encode a putative signal peptide and a GPI-anchor addition site, respectively. The central region is variable both in length and in amino acid sequence and contains a large repertoire of repetitive motifs, which suggests MASP may be involved in parasite-host cell interaction. Since no member of the MASP family has been characterized to date, we have decided to study the secondary and tertiary structures of distinct MASPs. For this purpose, we have decided to clone and express in E. coli the central region sequences of four MASP members. For this, some features of the target proteins were considered such as short amino acid sequence length, around 170 residues, low content of potential glycosylation sites and low intrinsic disorder degree. Knowing that sequence regions with low complexity nearly always correspond to nonfolding segments or extended structures, we have used the web server PONDR VL-XT to predict disordered regions in MASPs. Natively unfolded proteins have been described to possess a high ratio of charged residues and a low ratio of hydrophobic residues. The mean net charge versus mean hydrophobicity ratio was ploted for the four MASPs central region. This analysis showed that the four central regions falls in the phase space of natively unfolded proteins. After that, the sequences were PCR amplified and cloned into TOPO and/or pGEM-T cloning systems and submitted to DNA sequencing. Subsequently, the PCR products were transferred to two expression vectors derived from pET-28a vector (Novagen), which were modified in the Center of Molecular and Structural Biology (CeBiME, Campinas/SP). In both vectors, the thrombin recognition site was replaced by a TEV (tobacco etch virus) protease recognition site. The four N-terminal fusion His-tag MASP proteins were expressed in the soluble forms, whereas the N-terminal GST fusion MASPs were expressed as insoluble inclusion bodies, except the recombinant GST:MASP1. Purification of the Histidine-tagged MASP3 was carried out by affinity chromatography. After His-tag cleavage by TEV, the protein was purified by ion exchange chromatography. The study of the three-dimensional structure of MASP proteins will enable a more detailed understanding of these molecules, such as the location of their epitopes and its fold, which may contribute to the identification of its biological function on T. cruzi.