Most previous linguistic investigations of the web have focused on special linguistic features associated with Internet language (e.g., the use of emoticons, abbreviations, contractions, and acronyms) and the “new” Internet registers that are especially salient to observers (e.g., blogs, Internet forums, instant messages, tweets). Multi-Dimensional (MD) analysis has also been used to analyze Internet registers, focusing on core grammatical features (e.g., nouns, verbs, prepositional phrases). MD research differs theoretically and methodologically from most other research approaches in linguistics in that it is built on the notion of linguistic co-occurrence, with the claim that register differences are best described in terms of sets of co-occurring linguistic features that have a functional underpinning. At the same time, though, most previous MD studies are similar to other previous research in their focus on new Internet registers, such as blogs, Facebook/ Twitter posts, and email messages. These are the registers that we immediately think of in association with the Internet, and thus it makes sense that they should be the focus of most previous research. However, that emphasis means that we know surprisingly little at present about the full range of registers found on the web and the patterns of linguistic variation among those registers. This is the goal of the present study. Rather than beginning with a focus on new registers that are assumed to be interesting, we analyze a representative sample of the entire searchable web. End-users coded the situational and communicative characteristics of each document in our corpus, leading to a much wider range of register categories than that used in any previous linguistic study: eight general categories; several hybrid register categories; and twenty-seven specific register categories. This approach thus leads to a much more inclusive and diverse sample of web registers than that found in any previous study of English Internet language. The goal of the present study is to document the patterns of linguistic variation among those registers. Using MD analysis, we explore the dimensions of linguistic variation on the searchable web, and the similarities and differences among web registers with respect to those dimensions.Translation by Patrícia Pereira Bértoli, Simone Vieira Resende and Flávia Azeredo-Cerqueira. Grande parte das pesquisas linguísticas sobre a internet tem como base o estudo de características linguísticas específicas que ocorrem na linguagem da internet (por exemplo, o uso de emoticons, abreviaturas, contrações e acrônimos) e também os “novos” registros da internet, aqueles mais evidentes, como por exemplo, blogs, fóruns da Internet, mensagens instantâneas e tweets. A análise multidimensional (AMD) já foi utilizada para investigar registros da internet, principalmente na análise de características gramaticais fundamentais, como por exemplo, substantivos, verbos e preposições. Uma pesquisa de cunho multidimensional difere de forma teórica e metodológica da maioria das abordagens de pesquisa no campo da linguística na medida em que ela se constrói a partir da noção de coocorrência linguística, que defende a ideia de que as diferenças entre registros podem ser descritas de forma mais adequada quando consideramos os conjuntos de características linguísticas que possuem base funcional. Contudo, a maioria dos estudos multidimensionais já realizados anteriormente são semelhantes a outras pesquisas sobre os novos registros da internet, como por exemplo, blogs, posts do Facebook/Twitter e mensagens de e-mail. Estes são os registros que quase sempre associamos com a internet, e por isso faz sentido que eles sejam o foco da maioria das pesquisas já realizadas. No entanto, isso só mostra como sabemos pouco sobre a complexidade dos registros encontrados na web e os padrões de variação linguística entre eles. Este é o objetivo do presente estudo. Em vez de começar com o foco nos novos registros que são considerados interessantes por natureza, analisamos uma amostra representativa de toda a web. Os usuários finais codificaram as características situacionais e comunicativas de cada documento do corpus, levando a uma gama muito mais ampla de categorias de registro do que as utilizadas em qualquer outro estudo feito anteriormente: oito categorias gerais; várias categorias de registros híbridos; e vinte e sete categorias de registros específicos. Esta abordagem é capaz de gerar uma amostra muito mais inclusiva e diversificada de registros da web do que qualquer outro estudo já realizado em língua inglesa. O objetivo deste estudo é documentar os padrões de variação linguística que subjazem esses registros. Por meio da AMD, revelamos as dimensões da variação linguística da web e as semelhanças e diferenças entre os registros que compõem essas dimensões.---Tradução de Patrícia Pereira Bértoli, Simone Vieira Resende e Flávia Azeredo-Cerqueira.