Laboratoire de linguistique formelle
Présentation
à travers l'analyse formelle des unités traditionnelles du langage (le mot, la phrase, l'énoncé ou le discours) et l'analyse d'un ensemble de langues très diversifié, les chercheurs du Laboratoire de Linguistique Formelle explorent le système cognitif du langage dans son entier. Animé d'un esprit ouvert et collaboratif, le Laboratoire de Linguistique Formelle est membre du Labex EFL Empirical Foundations of Linguistics (2011-2021), et participe à de nombreuses collaborations nationales et internationales.
La spécificité du Laboratoire de Linguistique Formelle est la combinaison de deux diversités complémentaires : diversité des approches théoriques et diversité des langues étudiées.
L'unité des chercheurs du Laboratoire repose sur un ensemble de convictions partagées :
La linguistique se construit par une interaction constante entre description, analyse, formalisation et théorie ;
Il est possible d'analyser les données linguistiques de façon relativement indépendante des modèles théoriques ;
L'analyse se nourrit de la comparaison approfondie des langues.
Statut académique et histoire
Le Laboratoire de Linguistique Formelle est une unité mixte de recherche (UMR 7110) sous la double tutelle du CNRS et du ministère de l'éducation et de la Recherche. Elle est rattachée à l'Université Paris Diderot. Dirigée par Anne Abeillé depuis septembre 2011, elle compte 14 chercheurs CNRS, 3 ITA CNRS, 18 enseignants-chercheurs et 41 doctorants.
Fondé en 1972 par Antoine Culioli (initialement comme équipe de recherche associée, puis comme unité de recherche associée), le Laboratoire de Linguistique Formelle a été dirigé par Jean-Claude Milner (1990-1999), Jean Lowenstamm (1999-2005) et Alain Kihm (2005-2011).
La spécificité du Laboratoire de Linguistique Formelle est la combinaison de deux diversités complémentaires : diversité des approches théoriques et diversité des langues étudiées.
Thèmes de recherche
Grammaire du mot
Les travaux regroupés dans cet axe portent sur tous les aspects de la structure et de l'interprétation des objets lexicaux : morphophonologie et morphosyntaxe, morphologie flexionnelle et constructionnelle, sémantique lexicale. Le travail s'appuie sur divers projets de recherche en cours (LabEx EFL, Marie Curie Tameal avec l’Australie, Hubert Curien P7-Coimbra), de mise en réseau (ESF Networds), ou éditoriaux (GGHF, revue BAALL) et implique un large réseau de collaborateurs externes (28 institutions dans 12 pays).
Grammaire de la phrase
Les travaux regroupés dans cet axe portent sur l'étude de l'objet phrase sous ses aspects prosodiques, syntaxiques et sémantiques. Le travail s'appuie sur divers projets de recherche (LabEx EFL, Fédération TUL, French Tobi, ANR Asfalda…) ou de collaboration (PICS avec la Roumanie), et implique un large réseau de collaborateurs externes (12 institutions dans 7 pays) en particulier avec l’Australie et le Brésil. Certains projets de cet axe sont décrits dans la rubrique Langues romanes (Grande Grammaire du français, Essential Grammar of Romanian, enrichissement du Corpus arboré du français…).
Grammaire de l'énoncé et du discours
Les travaux regroupés dans cet axe portent sur l'interprétation des unités linguistiques en contexte, aussi bien du point de vue des paramètres discursifs structuraux (par ex. relations de discours) que de paramètres nonstructuraux (contexte énonciatif, structure informationnelle, connaissances partagées, question en discussion, etc.) L'interface sémantique/pragmatique, et toutes les interfaces entre sémantique/pragmatique et lexique, morphologie, et syntaxe, sont des lieux naturels d'exploration pour de tels phénomènes contextuels. Si le sujet n'est pas nouveau pour le laboratoire, il est renouvelé par une plus grande place donnée à la diversité des langues d'une part et aux approches expérimentales d'autre part.
Les travaux s’appuient sur plusieurs projets en cours : LabEx EFL (axes 2, 3 et 7), Marie-Curie TAMEAL, Projet Détermination et identification des événements (Fédération TUL FR 2559), notamment, ainsi que sur des collaborations internationales nourries, impliquant pas moins de 19 institutions extérieures (dont 16 situées à l’étranger).
Axes transverses
Langues afroasiatiques
Le laboratoire est dans une position doublement privilégiée pour l'étude des langues afroasiatiques. D'une part, il réunit des compétences sur les langues des cinq familles du phylum (berbère, couchitique, égyptien, sémitique, tchadique). D'autre part, il joue un rôle moteur dans l'édition de la revue internationale BAALL, seule reuve de linguistique formelle consacrée au domaine afro-asiatique.
Langues d'Asie orientale
Les travaux réunis dans ce domaine transversal portent sur les langues de la zone Asie orientale, et plus particulièrement sur le chinois (mandarin, cantonais, minnan de Taiwan), le khmer, les langues austronésiennes de Taiwan, le vietnamien, le coréen et le japonais. Ils couvrent les champs des trois domaines principaux: mot, phrase, énoncé et discours, et s’appuient sur des collaborations variées (Academia Sinica, Hanoi, Pekin National U., Hongkong Polytechnic U…)
Créolisation et acquisition des langues
Ce nouvel axe transversal réunit des spécialistes des langues créoles et de l’acquisition des langues. L’étude de ces deux domaines au sein de LLF a été renforcée par des recrutements de créolistes et de psycholinguistes, et par l’obtention du GDR-i Structure, émergence et évolution des pidgins et des créoles (Seepicla), dirigé par O. Bonami, pour 2012-2015. Tout en poursuivant des travaux en acquisition de L1 et L2, d’une part, des travaux de description grammaticale des créoles d’autre part, une des hypothèses que nous souhaitons tester est que la genèse des créoles, ainsi que certaines de leurs propriétés, reflète un processus d’acquisition L2 non supervisé.
Langues romanes
L'étude des langues romanes constitue depuis l'origine un des points forts du LLF. Les travaux qui s'initient ou se poursuivent relèvent des trois domaines principaux (mot, phrase, énoncé et discours) et sont surtout orientés sur une perspective synchronique. La constitution de ressources valorisables (grands corpus, grammaires de référence) constitue une part importante des travaux. Ils s’appuient sur des projets collaboratifs (LabEx EFL) et sur des réseaux internationaux (PICS avec la Roumanie, Hubert Curien avec Coimbra, Capes-Cofecub avec Florianopolis, French Tobi avec Cambridge et UAB Barcelone). Toutes les langues romanes sont étudiées au sein du laboratoire.
[halshs-01480080] Some issues in the morphological analysis of nominal plurals in Persian
Date: 1 Mar 2017 - 09:54
Desc: Under the framework of Whole Word Morphology (WWM) developed by Ford and Singh (Ford et al. 1997), this paper proposes a synchronic description of nominal plural morphology in Persian (limited to Tehran’s spoken variety). Some problematic issues in the existing analyses are: 1) It is common to divide the plural morphology into Persian and Arabic. This etymological division, based on the illegitimate hypothesis that all speakers have access to words’ etymology, has no place in a synchronic analysis. 2) A proper explanation of double plurals, ranging from speech errors: maqâlâthâ, nazarâthâ..., to commonly used forms: omurât, omurhâ, rosumât, rosumhâ..., is lacking. 3) -jât has been extended both in formal and informal registers and is no longer limited to vowel-ending nouns, i.e. šarbatjât, roqanjât, boronzjât used as technical terms, as well as alkoljât, esemesjât, mozaxrafjât, sândevičjât used in a familiar register, especially by youngsters. 4) Pairs of words such as čarand/čarandiyât, qazal/qazaliyât, jafang/jafangiyât, hajv/hajviyât challenge the analyses of -iyât as a phonological variant of -ât. 5) Finally, given that a variety of plural forms is available to speakers, and the fact that these forms are not always interchangeable, the question of how the choice of plural marking is determined is raised.
[hal-01070019] Extending the coverage of a MWE database for Persian CPs exploiting valency alternations
Date: 31 Mar 2022 - 16:41
Desc: [...]
[halshs-01220381] How much is determined by Syntax? An empirical Approach to the Position of the Direct Object in Persian
Date: 23 Dic 2015 - 12:28
Desc: Several theoretical studies (e.g. Browning & Karimi 1994; Karimi 2003; Ghomeshi 1997; Ganjavi 2007) claim that rā-marked (definite and/or specific) direct objects (DOs) occupy a higher position than their non-rā-marked (indefinite non-specific) counterparts. One of the main arguments to support this claim is the unmarked relative order between the direct and the indirect object (IO), which is broadly assumed to be IO−DO[-rā]−V and DO[+rā]−IO−V (e.g. Mahootian 1997; Rasekhmahand 2004; Roberts 2009). In this paper, we provide empirical evidence against such a dichotomous view. We have conducted a corpus-based study (Faghiri & Samvelian, 2014) and experimental follow up studies (Faghiri et al., 2014; Faghiri, forthcoming) to investigate ordering preferences between the DO and the IO in the preverbal domain. In addition to the realization of the DO, we have taken into account other potentially influential factors such as relative length, givenness, collocationality and lexical bias, via mixed-effect regression modeling, in line with key empirical studies on word order variations (e.g. Wasow 2002). The data reveal that while rā-marked DOs show a strong preference to appear before the IO, among different non-rā-marked DOs, i.e. bare nouns ketāb, bare noun with modifiers ketāb-e akkāsi and indefinite/numeral NPs ye ketāb(-i), only bare nouns show a strong preference for adjacency to the verb. Interestingly, indefinite (non-rā-marked) DOs show a clear preference for the inverse, grouping thus with rā-marked DOs. Moreover, extra syntactic factors such as relative length also play a significant role on these ordering preferences. Accordingly, we argue that the ordering preferences observed for different types of DOs is best reflected by a continuum based on the degree of conceptual and/or discourse accessibility. Consequently, any structural account of the latter would lead to wrong predictions. We furthermore examine other arguments provided to support a dual-position account and present some counterexamples that question their validity. Thus, in line with Samvelian (2001), we refute a dual syntactic position account of the DO.
[halshs-01480110] Heaviness and Constituent ordering : a Corpus-based study in Persian
Date: 1 Mar 2017 - 10:20
Desc: This paper presents a corpus-based study of the relative order between the direct object (DO) and the indirect object (IO) in the preverbal domain in Persian, a SOV language. The relative weight is one of the main factors stipulated in explaining constituent order preferences, namely several studies have pointed out the tendency to postpone heavy constituents (heavy NP shift). This weight effect is either accounted for in terms of parsing (Hawkins, 1994) or in terms of planning and production (Wasow 1997, Arnold et al. 2000, Stallings et al.1998, among others), planning or comprehending long and/or complex constituents requires more memory or resource than short and simple ones. Since this explanation lies on general principles of cognition, it has been sometimes assumed that “short-before-long” is universal. However, building on extensive data from typologically different languages, Hawkins have highlighted an asymmetry between VO and OV languages. The latter display the mirror image preference, i.e. “long-before-short”. Empirical corpus-based and experimental studies on Japanese, a consistent head-final language, have indeed confirmed this generalization (Yamashita & Chang, 2001). Our study shows a similar effect in Persian; however, relative length plays a secondary role, since the position of the DO mainly depends on its degree of determination.
[halshs-00751082] Inflectional periphrasis in Persian
Date: 21 Nov 2012 - 15:58
Desc: Modern Persian conjugation makes use of five periphrastic constructions. We contrast the properties of these five constructions and argue that they call for different analyses. We propose contrasting analyses relying on the combination of an HPSG approach to feature geometry and syntactic combination, and an approach to paradigm organization and morphological exponence based on Paradigm Function Morphology. This combination of analytic tools allows us to treat the whole array of periphrastic constructions as lexical in origin--no phrasal construction or multi-word lexical entry of any kind is required.
Autres contacts
U.F.R. Linguistique (UFRL)
Bâtiment Olympe de Gouges - case courrier 7031
8 rue Albert Einstein
75013 PARIS