Idioma: Español
Fecha: Subida: 2021-04-23T00:00:00+02:00
Duración: 14m 43s
Lugar: Conferencia
Visitas: 1.082 visitas

Annotation of compositionality and lexical informativeness in INFOLEXIS

Olga Batiukova (Universidad Autónoma de Madrid)

Descripción

This paper proposal presents the project INFOLEXIS and it focuses on how corpus
data can contribute to the study of informativeness-based selectional constraints in natural
language.
In generative grammar, syntactic category and semantic type are invoked in order
to account for the compatibility of predicates and their arguments: the combination write
a novel is acceptable because the complement novel has the syntactic category (noun) and
semantic type (INFORMATION) required by the predicate write. By contrast, write {blue/ a
war} is ungrammatical because blue is an adjective and war denotes an EVENT. However,
these constraints do not always suffice to rule out unacceptable expressions: e.g., the past
participle – noun combination ??a written novel, derived from write a novel, does not
seem to be fully acceptable.
Existing studies (Grimshaw and Vickner 1993, Bresnan et al. 2016, Jung 1997,
Goldberg and Ackerman 2001) signal that expressions not contributing any new
information to the discourse are unacceptable, and they invoke pragmatic principles
(Grice’s Maxim of Quantity and Horn’s R-Principle) to formalize this restriction.
Following Author 1 and Author 2 (2013), we assume that, indeed, at the discourse level
pragmatic factors determine whether an utterance is informative, but, if we want to
compute informativeness compositionally, we have to zoom in on specific syntactic
constructions and the lexical features of words making them up. We thus follow lexicalist
approaches to the lexicon-syntax interface: ??a written novel is not informative because
the lexical entry of novel specifies that novels are created through the process of writing
(see also De Miguel 2004).
The goal of INFOLEXIS is to create a corpus of syntactic structures in Spanish and
English annotated with data regarding their informativeness. It addresses the following
research questions:
− What factors determine linguistic informativeness at the phrase and sentence
level?
− What syntactic structures have informativeness-based constraints and what lexical
features of their components determine their degree of informativeness?
− What mechanisms turn uninformative constructions into informative?
The following syntactic constructions are dealt with: modification construction (una casa vendida ‘a sold house’ vs. ??una casa construida ‘a built
house’), active construction (comer ravioli ‘eat ravioli’ vs. ??comer
alimentos ‘eat food’), middle construction (esta tarta se desmigaja ‘this cake crumbles’
vs. esta tarta se come ‘this cake eats’), and passive construction (este cuadro fue vendido
‘this picture was sold’ vs. ??este cuadro fue pintado ‘this picture was painted’).
The annotation scheme in Figure 1 embraces the phrase level (steps 1 and 2) and
the sentence level (step 3). In step 1, minimal constructions (with no adjuncts and
modifiers) are annotated as either acceptable (e.g., a sold house) or unacceptable (??a
built house). For unacceptable expressions, further questions are made regarding the
mechanisms that make them acceptable: coercion (rescue of a priori unacceptable
combinations, such as produced water or write theater), modification (illegally built
house), and contrastive reading (a BUILT house as opposed to houses that have not been
built). The latter two mechanisms turn uninformative constructions into informative. The resulting annotated corpus is meant to be an empirical tool for interdisciplinary study of linguistic informativeness and compositional mechanisms, as well as an aid in NLP tasks.

Transcripción (generada automáticamente)

Jaime Menil Miss Oh Boy chico ha hecho que esté presente en la lucha Isfahan y baile, Homs, sin texto hispano quien. Esta tuviese o iu o infusiones, y. A visto sea cromático fichó en Mining of lingüístico. Léxico. A más Agüimes a fomar. Y léxico dentro y escribir de un acto más aún a dichas, vi. Agudo y me. Abre similar a. Desea. A hinchó y tltro no son en in uvi en sí a un chico. Down, en nada, a Hans de noche, ni vean en otro informe. Son canta. Samos y Moix. Francis a Romney a desear en lágrimas. A. No me ves. Veis Fashion Apple que arruinar a una señora de huevas a Met, a incluir esa chés instruir a no. Entonces. Bicho Spain o. Que ha sin el Espanyol se hechos Rahim Abu. Wang of a. Significa ir. Es sexy a Dudi Ruiz, a baile Green en. Signos de. Anote infame y contexto de discos principo. O a principo. No te. A estar digna análisis o despecho? . 34 00:04:05,525 --> 00:04:05,975 Temores, estar y vaivén. Machucos que a Machi al Hilli. Se sienta léxico, fichas de, y no ve, excepto han expuesto en más. Si a más vi consistente, inconsistente más, huyen clubs. Agüimes luso entre ellos o ha dejado de y alguien me dos nov vais a presentar? Es que si te a consistente en que vi. Esta novela fue dictada o no es esta novela, fue escrita y fichajes no consistan y si es necesario de Agüimes, es no aclara esas veces. En consecuencia, y todo es un informe, si eso impide que es esta novela, fue masacrada. Española en inglés. Lewis sano. Lingüística. De componentes, ha dicho a The Office informó este lunes en el y me. Dios vis proyecto Ling pase por Valls componen participéis son indistinguibles Instancia de. París se ponga un y temido que y ha hecho a exacto no sé lo que fue incluir. Se mantiene a Brooks Cosmos. Puig, gozo encubrir la eterna enduro Group, yo llevo 1.000, que exija. Incorporó despachos de. Infame guiones. El existió en tiempo de texto a fondo para vivir sin hacer corporal. Es entrar. En España se intenten Inglés Next you from a compra. Venir. O que le Kings de Ruby a quien sí hizo, incluso chula. Ocho euros entre sonrisas, cuestión de consiste en sí de construcción a ese mes Olea. Incluyen como intérprete oboes informativo a. Expresó en un contexto es distinta y no. Disco ni estima que es decir, su nombre. No none Campones, footing, vs of the ser discos. Y es que San Juan se originó con Santos y sus fases. Que se ponga un camping. Ismail, Fashion. Que no profesión profesión. Fue. El exjefe y. Buffon o, Nacho, Braun dispersen, de introducir y Aoun llegan se tu cuestión. Igual expreso consistente y sillas, han hecho cohesión y expresen. Johns. En hecho, contexto de expresión me hinchó petit. Inaem. Chips. Villano. Chips de Wei. Fueron Not. Chips. Consisten en otro informe que os chipre o chips. Bien. Cohesión sur y 10 en el que se sintieron no. Osos chip. Igual que existe. La asfixia y Uruguay sin Llull y. Este hecho está en espíritu. El chut de expresión de. Es que si es consistente al informe o. Iré allí. Chuck vio spam en diferentes cuestión. Subo al fuego Webby, experto lingüista lingüística. Quien. Dam lingüista lingüística nos entendéis, que es igual chucherías que hechos relevantes y yo discriminatorio que se tome momento weibo Billups. Andrew John Key son mucho más profundo, instando. Fin y sin. Es falsa y no Best of Sound, tema. A Antón informaciones indicaban texto de extracción. Y no best -incorporación de eta y siempre a tu equipo se les veis. Oso a Chin s. Entonces. Es de pago a los 60, se esperan chubascos. Somos de Jaén Informe Axis, y tu probar que tiene un lingüístico de eta que asistan a muchas expresiones es estas 20 o informe, que es fenomenal, léxico, táctica machista. Sin cuerpos izquierda o. Subí Yuste es constante ante Chile, ha al Buñuel más en cuestiones.

Propietarios

Congreso Cilc 2021

Comentarios

Nuevo comentario

Serie: CILC2021: Estudios gramaticales basados en corpus / Corpus-based grammatical studies (+información)

Relaccionados