Bem-vindos à MULTPLATCOL!
O que é MULTPLATCOL?
É uma Plataforma Multilíngue De Dicionários De Colocações e baseada em corpus. É um projeto financiado pela Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP), Processo ner 2020/01783-2.
Até o momento, a MULTPLATCOL é composto por dicionários em cinco idiomas: português, inglês, espanhol, francês e chinês, formando diferentes pares de línguas. Em breve, mais idiomas serão adicionados e mais pares de línguas serão formados.
USUÁRIOS MULTPLATCOL
A plataforma pretende ser customizada para diferentes públicos-alvo de acordo com as suas necessidades. Ela é especialmente projetada para alunos de línguas estrangeiras, professores de línguas estrangeiras, aprendizes e tradutores profissionais, desenvolvedores de materiais didáticos, lexicógrafos e pesquisadores, ou qualquer outro público-alvo que possa estar interessado em aprender colocações mais profundamente.
Como surgiu o Projeto MULTPLATCOL?
O projeto MULTPLATCOL é resultado de pesquisas realizadas pela Professora Doutora Adriane Orenha-Ottaiano, da Universidade Paulista “Júlio de Mesquita Filho” (UNESP), há mais de 12 anos.
Quais são os principais objetivos da MULTPLATCOL?
Tem como objetivo promover o aprendizado e a tradução de colocações de forma mais eficaz, para que o usuário dos dicionários possa desenvolver sua proficiência nos idiomas acima mencionados e, assim, utilizar o idioma de forma mais natural e eficaz.
Como se trata da primeira Plataforma Multilíngue de Dicionários de Colocações nas línguas acima mencionadas, especialmente com foco nos diversos tipos de colocações, esperamos alcançar o objetivo e o desafio de atender às necessidades colocacionais dos usuários do dicionário, para que possam alcançar proficiência e fluência na língua.
Estrutura e Design da MULTPLATCOL
MULTPLATCOL visa atender às necessidades dos usuários no que se refere à codificação da língua e, dessa maneira, são considerados dicionários de produção. Além de ajudar os usuários a produzir textos mais autênticos, a MULTPLATCOL também tem o objetivo de desenvolver a competência colocacional dos usuários, que está intrinsecamente ligada à fluência. Quanto mais amplo o repertório de colocações, maior fluência um aluno pode alcançar.
Além disso, pretende-se que a plataforma tenha um layout de fácil utilização, que ofereça a possibilidade de ser customizada. Como os alunos de línguas estrangeiras ou usuários de dicionários em geral encontram desafios ao usar colocações em sua língua nativa, a MULTPLATCOL também foi projetada para exibir dicionários monolíngues. Assim, funcionará como um dicionário monolíngue, bilíngue ou multilíngue (inglês, português, francês, espanhol e chinês), tendo também em conta que as colocações são ativadas automaticamente para cada língua abrangida pela plataforma.
O que são Colocações?
A literatura sobre colocações mostra que existem duas abordagens mais distintas para operacionalizar a identificação e definição de colocações, e em nosso projeto de pesquisa definiremos colocações guiadas por ambas.
Sob uma abordagem estatisticamente orientada, vemos as colocações como combinações frequentes de palavras cuja co-ocorrência dentro de uma certa distância uma da outra é estatisticamente maior do que o esperado em comparação com quaisquer outras palavras combinadas aleatoriamente em um idioma específico (Barfield; Gyllstad, 2009; Nesselhauf, 2005; Sinclair 1966, 1991; etc.). No entanto, como Teubert (2004: 188) mencionou, ser estatisticamente significativo não é suficiente para identificar uma combinação de palavras como uma colocação: ‘Eles também têm que ser semanticamente relevantes. Eles têm que ter um significado próprio, um significado que não é óbvio pelo significado das partes de que são compostos.
Por esse motivo, é importante descrever as colocações sob uma abordagem fraseológica e, portanto, definimos colocações como combinações difusas, recorrentes e convencionalizadas que consistem em uma base e um colocado (Haussmann 1979, 1989), que são lexicalmente e/ou sintaticamente fixados até certo ponto (Pazos-Bertrán, Orenha Ottaiano & Xiong, no prelo). Podem ser ditos parcialmente compositivos porque sua base mantém seu significado, porém, o colocado pode assumir um significado especial apenas em combinação (quando apenas combinado) com a base (Alonso-Ramos, 1994; Corpas 1996; Haussmann, 1989; Heylen & Maxwell, 1994; Orenha-Ottaiano, 2020; Pamies, 2019; Penadés Martínez, 2017; Torner & Bernal, 2017).
As colocações podem ter um alcance colocacional (mais ou menos) restrito e isso significa que quanto mais geral é uma palavra (a base), mais sentidos ela possui e maior número de colocações atrai para cada sentido (à um amplo alcance colocacional). Por outro lado, quanto mais específica é uma palavra, menos sentidos ela tem e menos colocações ela atrai (à uma faixa colocacional estreita).
São as combinações específicas de uma língua e de uma cultura e, como tal, a colocabilidade dos seus elementos pode variar significativamente de uma língua para outra, constituindo-se, assim, da sua própria rede de colocações.
Por exemplo, em português brasileiro, se eu, falante nativo, digo: Em sã, automaticamente, o outro falante nativo irá completar: consciência, formando, assim, a expressão em sã consciência. Se esse não for o seu caso, a MULTPLATCOL o ajudará a encontrar os itens lexicais mais adequados e frequentes que co-ocorrem com a palavra que você está procurando!
Para melhor ilustrar, cito parte de um texto de Gregório Duvivier, publicado no Jornal A Folha de São Paulo, em 2015, lembrado por um aluno do curso de Letras, Leandro, quando discutíamos a respeito das colocações em sala de aula:
“A palavra caudaloso, por exemplo, tem união estável com a palavra rio - você dificilmente verá caudaloso andando por aí acompanhada de outra pessoa. O mesmo vale para frondosa, que está sempre com a árvore. Perdidamente, coitado, é um advérbio que só adverbia o adjetivo apaixonado. Nada é ledo a não ser o engano, assim como nada é crasso a não ser o erro.”
Qual é o papel das colocações na aprendizagem de línguas estrangeiras?
No processo de falar, os falantes nativos não apenas juntam palavras separadas, mas também usam “blocos pré-fabricados”, como se fossem uma só palavra. Assim, o que parece espontâneo é, na verdade, uma fala estereotipada fixa e repetitiva, e se o falante não tiver um vasto repertório dessas unidades fixas estereotipadas (colocações, por exemplo) à sua disposição, sua fala pode não soar natural. Assim, quanto mais amplo o repertório de colocações, melhor o aprendiz será capaz de se comunicar ou escrever em uma língua estrangeira. Então, essa é a importância e a razão pela qual compilamos uma plataforma como a MULTPLATCOL!
Qual o papel das colocações na tradução?
No que diz respeito à tradução de colocações, o tradutor deve conhecer com mais profundidade e precisão a rede colocacional de cada língua, para que possa produzir textos mais idiomáticos e fluentes na língua-alvo. Mais uma vez, chamamos a atenção para a relevância do MULTPLATCOL!
Metodologia MULTPLATCOL
A metodologia do MULTPLATCOL se baseia na combinação de métodos automáticos para extrair candidatos a colocações (Garcia et al., 2019a), com cuidadosa pós-edição realizada por lexicógrafos. Abordagens automáticas por meio de ferramentas de Processamento de Linguagem Natural para anotar grandes corpora com lemas, PoS-tags e relações de dependência nos cinco idiomas (inglês, francês, português, espanhol e Chinês). Usando esses dados, aplicamos medidas estatísticas (Evert et al., 2017; Garcia et al., 2019b) e estratégias de semântica distribucional para selecionar os candidatos (Garcia et al., 2019c) e recuperar exemplos baseados em corpus (Kilgarriff et al., 2008).
A taxonomia das colocações do MULTPLATCOL
Para ajudar o público-alvo a usar as colocações de forma mais precisa e produtiva, os dicionários tratarão de todos os tipos de colocações. Abrange várias estruturas sintáticas de colocações que se enquadram na seguinte taxonomia:
- Verbais
- Substantivas
- Adjetivas
- Adverbiais
Para entender melhor, observe as estruturas de cada tipo de colocação e seus exemplos logo abaixo:
Figura 1: Taxonomia das colocações e exemplos (Orenha-Ottaiano, no prelo)
AGRADECIMENTOS
À Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP), processo nº 2018/22943-8, pela Bolsa de Pós-Doutorado concedida, a qual nos possibilitou finalizar a compilação da MULTPLATCOL.
À toda a Equipe GBD e MULTPLATCOL, que ajudaram tornar possível sua criação!