Tese de doutoramento em Biologia (Biologia de Sistemas), apresentada à Faculdade de Ciências da Universidade de Lisboa, 2020. Tese orientada por: Doutora Luísa Romão (orientadora) e Doutora Mafalda Bourbon (co-orientadora). Upstream open reading frames (uORFs) are cis-acting elements located within the 5’ leader sequence (or 5’ untranslated region; 5’UTR) of transcripts that can regulate translation of the correspondent main open reading frame (mORF). During basal conditions, uORFs are typically considered to be repressors of downstream translation, as they can impede the ribosomes to access the mORF or even induce mRNA degradation by the nonsense-mediated mRNA decay (NMD) pathway. However, during stress conditions, phosphorylation of the eukaryotic initiation factor 2α (eIF2α) allows the expression of several stress-responsive proteins through uORF-mediated mechanisms, while global mRNA translation is inhibited. During endoplasmic reticulum (ER) stress, for instance, the accumulation of unfolded proteins leads to activation of the ER-resident PKR-like ER kinase (PERK) that phosphorylates eIF2α as part of the stress-protective mechanisms of the unfolded protein response (UPR) and the integrated stress response (ISR). This results in the selective uORF-mediated translation of downstream effectors, like the activating transcription factor 4 (ATF4), the CCAAT-enhancer-binding protein homologous protein (CHOP) and the growth arrest and DNA damage-inducible protein 34 (GADD34), which drive stress resolution or, in the case of a prolonged stress, cell death. The dual role of PERK in regulating cell fate has been reported to be involved in the outcome of several human diseases, including diabetes, neurodegenerative disorders and cancer. Moreover, mutations in the EIF2AK3 gene that encodes PERK have been implicated in the development of the rare genetic disease, Wolcott-Rallison Syndrome (WRS). Interestingly, data from ribosome-profiling (Ribo-seq) studies suggested the existence of uORFs within PERK 5’UTR, which could be involved in the regulation of PERK expression. In this work, we aimed to study the translational regulatory role of five AUG- and three non-AUG-uORFs identified in the PERK 5’UTR and assess its impact in cell homeostasis and human disease. While uORF2 and the non-AUG-uORFs 5, 6 and 7 do not seem to have a significant regulatory role, uORF1, uORF3, uORF4 and uORF8 together present a strong repressive effect over mORF translation in basal conditions, possibly by providing a barrier to the scanning ribosomes and precluding translation reinitiation at the mORF, without affecting the PERK mRNA levels. Curiously, we found that when we induce PERK overexpression, it leads to the spontaneous activation of a portion of PERK in the absence of any stress stimulus, possibly highlighting the biological relevance of its uORF-mediated translational regulation in maintaining its physiological basal levels. Conversely, during stress conditions, increased bypass of uORF1 results in a modest degree of translational de-repression, which may help to counterbalance the increased rate of PERK protein turnover observed in these conditions. We also found that alteration of the PERK uORFs by mutations found in WRS patients modify PERK expression, providing a possible link with the disease phenotype. Finally, we tested the impact of PERK unbalanced expression in the viability of HCT116 cells but, at least in our experimental conditions, no differences were found. Altogether, we provide a new example of a transcript containing uORFs that fine-tune mORF translation. Moreover, we highlight the importance of including 5’UTRs, like the one of PERK, in the screening of stress-related mutations and the necessity of functional studies to assess their relevance in the pathogenesis of human diseases. This may provide vital information for the development of new therapeutic strategies. A expressão génica em eucariotas é um processo complexo que compreende vários passos altamente regulados. Em particular, a tradução do RNA mensageiro (mRNA) representa um passo chave da expressão génica, cuja regulação permite à célula rapidamente alterar a síntese de proteínas de uma forma espácio-temporal em resposta a diferentes estímulos. O processo de tradução divide-se em quatro etapas: iniciação, alongamento, terminação e reciclagem de ribossomas. A etapa de iniciação representa o passo limitante e, como tal, é o mais regulado. De entre os múltiplos fatores regulatórios que podem atuar nesta etapa, encontram-se as pequenas grelhas de leitura a montante (do inglês, upstream open reading frames, uORFs), que correspondem a pequenas regiões potencialmente traduzidas definidas por um codão de iniciação na região 5’ não traduzida (do inglês, 5’ untranslated region, 5’UTR) dos mRNAs, em fase com um codão de terminação a montante ou sobreposto com a grelha de leitura principal (do inglês, main open reading frame, mORF) que codifica a proteína. As uORFs são tipicamente consideradas repressoras da tradução em condições fisiológicas normais, uma vez que funcionam como “barreiras” aos ribossomas que, ao traduzirem-nas, podem não chegar a traduzir a mORF. Outra característica regulatória importante das uORFs é a possibilidade de induzirem a degradação do mRNA pelo processo de decaimento do RNA mensageiro mediado por mutações sem sentido (do inglês, nonsense-mediated mRNA decay, NMD), uma vez que os seus codões de terminação podem ser reconhecidos como prematuros aquando da terminação da tradução. Contudo, em condições de stress as uORFs são muitas vezes responsáveis por permitir a tradução da mORF. Isto acontece porque nestas condições ocorre a fosforilação do fator eucariótico de iniciação da tradução 2α (do inglês, eukaryotic initiation factor 2α, eIF2α), o que favorece o não reconhecimento de codões de iniciação de algumas uORFs normalmente com contextos Kozak fracos (do inglês, leaky scanning ou ribossome bypass), ou a ocorrência de reiniciação da tradução na mORF após tradução da uORF. A proteína cinase tipo PKR residente no retículo endoplasmático (do inglês, PKR-like ER kinase, PERK) é uma das responsáveis por fosforilar o eIF2α em condições de stress. Estruturalmente, a PERK é uma proteína transmembranar do ER que possui três domínios: (i) um domínio lumenal regulatório; (ii) um domínio transmembranar; e (iii) um domínio catalítico citoplasmático. Em condições de homeostasia, a PERK encontra-se num estado monomérico inativo. No entanto, quando ocorre stress do ER, a acumulação de proteínas mal enoveladas promove a oligomerização de domínios lumenais de PERK que aproximam os domínios citoplasmáticos de forma a promover a sua auto fosforilação e consequente ativação. Uma vez ativada, a PERK fosforila o eIF2α de forma a inibir globalmente a tradução do mRNA como mecanismo de proteção, enquanto favorece a tradução mediada por uORFs de proteínas responsáveis por aumentar a capacidade processadora do ER como parte dos mecanismos da resposta a proteínas mal enoveladas (do inglês, unfolded protein response, UPR) e da resposta integrada ao stress (do inglês, integrated stress response, ISR). Algumas destas proteínas são a ATF4 (do inglês, activating transcritpion factor 4), a CHOP (do inglês, CCAAT-enhancer-binding protein homologous protein) e a GADD34 (do inglês, growth arrest and DNA damageinducible protein 34) que, no caso de um estímulo prolongado ou intenso, podem também desencadear vias pró-apoptóticas. O papel da PERK na regulação da homeostasia da célula e da sua sobrevivência foi implicado em várias doenças, como a diabetes mellitus, as doenças neurodegenerativas e o cancro. Além disso, mutações no gene que codifica a PERK (o gene EIF2AK3) foram associadas ao desenvolvimento da doença rara, síndrome de Wolcott-Rallison (do inglês, WolcottRallison syndrome, WRS), caracterizada por diabetes mellitus neonatal permanente e displasia epifisária múltipla. Isto sugere que a expressão e a atividade da PERK são essenciais para o normal funcionamento da célula, devendo ser corretamente reguladas. Curiosamente, dados de perfil ribossomal (do inglês, ribosome profiling) mostram a existência de vários eventos de iniciação de tradução na 5’UTR do mRNA da PERK, até mesmo em codões de iniciação não canónicos, o que sugere a existência de uORFs com potencial regulatório. Tendo em conta a inexistência de estudos sobre as uORFs do mRNA da PERK, o objetivo do presente trabalho foi estudar o papel regulatório de cinco uORFs iniciadas por AUG e três uORFs iniciadas por codões não canónicos identificadas no transcrito da PERK, bem como avaliar a sua relevância para a homeostasia da célula e a saúde humana. Para o efeito, a sequência de DNA complementar da 5’UTR do mRNA da PERK foi clonada a montante da ORF da luciferase do pirilampo para obter um plasmídeo que permite quantificar, através de ensaios de luminometria, o efeito das uORFs na tradução da mORF. Por mutagénese dirigida foram obtidas várias construções que permitiram estudar o efeito individual ou combinado dessas uORFs e explorar o seu mecanismo de regulação da tradução. De acordo com os nossos resultados, as uORFs da PERK inibem fortemente a tradução da mORF, tendo-se registado uma redução de 92% e de 89% na atividade relativa da luciferase promovida pela 5’UTR da PERK na linha celular de cancro colorretal, HCT116, e na linha celular embrionária de rim, HEK293, respetivamente. Este efeito repressor é mediado principalmente pela uORF1 iniciada por um codão AUG com contexto Kozak forte, e é maximizado pelas uORFs 3, 4 e 8, também iniciadas por AUG mas com contextos intermédios. As restantes uORFs da PERK, a uORF2 iniciada por AUG, e as uORFs iniciadas por codões não canónicos, as uORFs 5, 6 e 7, parecem não contribuir significativamente para este processo regulatório, provavelmente por serem iniciadas por codões de iniciação com contextos Kozak fracos que favorecem o leaky scanning. Tendo em conta o tamanho das uORFs, é possível que o efeito repressor das uORFs 1, 3 e 4 seja devido ao impedimento de reiniciação da tradução na mORF após a sua tradução. Já a uORF8, que é mais pequena e poderia permitir reiniciação, poderá dever o seu papel inibitório ao facto de ter o codão de terminação sobreposto ao codão de iniciação da PERK. Em concordância com um papel regulatório ao nível da tradução, estas uORFs não parecem induzir a degradação do mRNA da PERK por NMD. Tendo em conta que verificámos que a PERK é uma proteína estável em condições normais e que, quando em excesso, pode ser espontaneamente ativada e promover inadvertidamente a inibição da tradução global, sugerimos que o efeito repressor das suas uORFs contribui para manter a expressão da PERK apenas a um nível basal. Em oposição, verificámos que em células tratadas com o indutor de stress do ER, tapsigargina, a degradação da PERK é favorecida. Curiosamente, a fosforilação do eIF2α que ocorre nestas condições permite algum leaky scanning da uORF1, resultando numa ligeira de-repressão ao nível da tradução da mORF, que poderá, desta forma, ajudar a contrabalançar a perda de PERK. Tendo em conta o papel notório das uORFs na regulação dos níveis da PERK e a relação desta cinase com o desenvolvimento de WRS, estudámos o efeito de mutações identificadas em doentes com WRS, que eliminam ou alteram as uORFs, na regulação da expressão da PERK. Os nossos resultados mostram que algumas destas mutações podem alterar a taxa de produção de PERK, o que poderá explicar o fenótipo da doença, necessitando, no entanto, de confirmação experimental adicional. Finalmente estudámos o impacto que a expressão excessiva ou deficiente de PERK poderia ter na viabilidade de células HCT116, não tendo verificado qualquer alteração significativa, para além da ativação espontânea de uma porção da PERK quando sobre expressa. No entanto, existem outros estudos usando linhas celulares e condições experimentais diferentes nos quais a produção desequilibrada de PERK afeta a viabilidade ou o normal funcionamento da célula, sugerindo que o contexto biológico pode influenciar as consequências da desregulação da PERK. Em suma, neste estudo é apresentado um novo exemplo de um transcrito cuja tradução da mORF é regulada por uORFs. Adicionalmente, é destacada a importância de se incluírem as 5’UTRs dos genes, como o da PERK, no rastreio de mutações que possam estar associadas ao desenvolvimento de doenças genéticas, bem como o estudo detalhado das suas consequências biológicas. Este tipo de informações é imprescindível para o desenvolvimento de novas terapias ou para a aplicação adequada das já existentes. Rafael Queirós Fernandes foi bolseiro de doutoramento no âmbito do Programa doutoral BioSys em Sistemas Biológicos, Genómica Funcional & Integrativa (FCT/PD/00065/2012) da Faculdade de Ciências da Universidade de Lisboa. Este projeto foi financiado pela Fundação para a Ciência e a Tecnologia do Ministério da Ciência, Tecnologia e Ensino Superior com a bolsa de doutoramento PD/BD/114392/2016. N/A