Use este identificador para citar ou linkar para este item: http://repositorio.ufes.br/handle/10/4114
Título: Interpretação automatizada de textos : processamento de anáforas
Autor(es): Freitas, Sérgio Antônio Andrade de
Orientador: Menezes, Crediné Silva de
Coorientador: Lopes, José Gabriel Pereira
Data do documento: 11-Abr-2005
Editor: Universidade Federal do Espírito Santo
Resumo: Esta tese apresenta uma solução para a interpretação de anáforas nominais definidas.Considere o seguinte texto: (1) a. Mariana comprou um carro novo. b. O motor veio danificado. A frase (1a) apresenta duas entidades: Mariana e um carro novo. Já a frase (1.2b) tem apenas uma entidade o motor. No processo de interpretação, humano ou computacional, a utilização do artigo de nido o é um indicativo de que a entidade já havia sido introduzida no discurso, i.e. apresenta um caráter anafórico. Resolver uma anáfora é, a priori, identi car a quem ou a que se refere esta anáfora. Mas no caso acima é mais do que isto: sem dúvida o motor existe no texto por causa da existência de um carro, porém a interpretação do motor deve ir além disto e identi car como este motor está ligado com aquele carro. Isto é uma anáfora nominal de nida. A interpretação das anáforas nominais de nidas ou de qualquer fenômeno anafórico pode ser generalizada como um processo que atribui valores aos itens da seguinte equação: R(A, T ) (2) onde: A denota a entidade introduzida pela interpretação fora de contexto de um pronome, de uma elipse ou de um sintagma nominal de nido, T denota o seu antecedente e R é a relação existente entre A e T . O processo de resolução da equação, que é propriamente o processo de resolução de anáforas, consiste em descobrir T e R dado A. Nesta tese é proposta uma metodologia computacional que interpreta as anáforas nominais de nidas cuja relação R é uma dentre: parte de, membro de, subcategorizado por e coreferência. A obtenção das relações é feita por um conjunto de regras pragmáticas [Freitas, Lopes e Menezes 2004, Filho e Freitas 2003] (cap. 3). Caso seja constatado que A não seja anafórica então ela é acomodada no contexto. A metodologia computacional é construída sobre um ambiente de programação em lógica [Damásio, Nejdl e Pereira 1994] que permite raciocinar abdutivamente [Kakas, Kowalski e Toni 1992] sobre a representação semântica do texto [Kamp e Reyle 1993]. A partir da interpretação das entidades é construída a estrutura nominal do discurso [Lopes e Freitas 1994] (cap. 4), a qual permite: (1) fazer o acompanhamento das entidades mais salientes em cada frase [Freitas e Lopes 1994], (2) limitar o universo de escolha de possíveis antecedentes[Freitas e Lopes 1996] e (3) prover um resumo das entidades do discurso. O resultado é uma metodologia que permite, de forma integrada, resolver anáforas e elipses, sendo que a estrutura nominal do discurso pode ser usada na busca de informações.
This thesis presents a solution to the interpretation of de nite descriptions in Portuguese. For example, consider the following text: (1) a. Mariana bought a new car. b. The engine was damaged. The sentence (1a) introduces two entities: Mariana and a car which is new. The sentence (1b) introduces only one entity the engine. In a human or computer interpretation process, the use of the de nite article the preceeding a noun indicates that the introduced entity was already present at the discourse, i.e., it is an anaphoric entity. The resolution of an anaphora is a reference problem, but in the example (1) there is another problem: although the car is the entity that gives context to the engine, we can not say that the engine is the car (as for a pronominal anaphora). It also must be determined how the engine is related to the car. This is a de nite description problem. The interpretation of any kind of anaphora can be represented by the following equation: R(A, T ) (2) where A denotes an entity introduced by the context interpretation of a pronoun, an ellipsis or a de nite noun phrase, T denotes its antecedent and R is the relation between A and T . The equation's resolution process is summarized as: given A nd T and R. This thesis proposes a methodology to the de nite description interpretation that the relation R is of: part of, member of, subcategorized by and corefers. These relations are obtained by a set of pragmatic rules [Freitas, Lopes e Menezes 2004, Filho e Freitas 2003], which are here de ned (chapter 3). Also if A is not anaphoric then it is acommodated in the discourse context. The computational methodology is implemented in a logic programming system [Damásio, Nejdl e Pereira 1994] that permits an abductive reasoning [Kakas, Kowalski e Toni 1992] at the semantic representation of the discourse [Kamp e Reyle 1993]. The interpretation of the entities is the basis to the Discourse Nominal Structure [Lopes e Freitas 1994] (chapter 4), which allows: (1) to track the most salient entities at each sentence [Freitas e Lopes 1994], (2) to limit the number of possible antecedents [Freitas e Lopes 1996] and (3) to give a discourse entities summary. The result is an integrated metodology to solve anaphors and ellipses. Finally, the Nominal Structure of the Discourse can help the search/index of digital documents.
URI: http://repositorio.ufes.br/handle/10/4114
Aparece nas coleções:PPGEE - Teses de doutorado

Arquivos associados a este item:
Arquivo TamanhoFormato 
tese_2376_TeseDoutoradoSergioAntonioAndradedeFreitas.pdf996.88 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.