Estabilitat idiolectal de l’espanyol a través de quatre gèneres de comunicació: aportacions a l’anàlisi de l’autoria forense
Resum
L’anàlisi d’autoria forense es basa en que cada parlant té la seva pròpia versió d’una llengua o idiolecte els trets lingüístics del qual són recurrents de manera relativament estable (Coulthard et al., 2011). En lingüística, hi ha una gran disparitat entre el coneixement del concepte de l’idiolecte i el seu estudi amb dades empíriques (Barlow, 2013). En aquesta investigació multigenèrica (cross-genre, en anglès) vam cobrir part d’aquestes llacunes, amb dades de corpus escrits i orals de l’espanyol mexicà. A través d’una anàlisi de n-grames de paraules, vam identificar quatre àrees d’estabilitat idiolectal en espanyol: llenguatge avaluatiu i expressions de quantitat, de modalitat deòntica i de modalitat epistèmica. Els nostres resultats mostres que les construccions gramaticals són útils en l’anàlisi de l’autoria, considerant el context forense, amb anàlisis motivades lingüísticament combinades amb eines quantitatives. Així mateix, vam proporcionar una anàlisi lingüística fonamentada en la teoria de la gramàtica de construccions basada en l’ús, cosa que dona compte adequadament de l’ús recurrent i particular de les construccions idiolectals.
Paraules clau
Cites
Anthony, Laurence. (2017). AntConc (Version 3.5.0) [Computer Software]. Waseda University.
Baayen, Harald, Van Halteren, Hans, Neijt, Anneke, y Tweedie, Fiona. (2002). An experiment in authorship attribution. Proceedings of JADT 2002: 6es Journées internationales d’Analyse statistique des Données Textuelles, 69-75.
Barlow, Michael. (2013). Individual differences and usage-based grammar. International Journal of Corpus Linguistics, 18(4), 443-478. https://dx.doi.org/10.1075/ijcl.18.4.01bar
Bell, Allan. (1984). Language style as audience design. Language in society, 13(2), 145-204.
Blas Arroyo, José Luis. (2017). ¿Identidades lingüísticas invariables? Trayectorias idiolectales ante la variación y el cambio lingüí stico en el español clásico. Revista Internacional de Lingüística Iberoamericana, 30, 117-144.
Bloch, Bernard. (1948). A set of postulates for phonemic analysis. Language, 24(1), 3-46.
Bucholtz, Mary, y Hall, Kira. (2010). Locating identity in language. En Carmen Llamas y Dominic Watt (eds.), Language and identities (pp. 18-28). Edinburgh University Press.
Bybee, Joan, y Eddington, David. (2006). A Usage-Based Approach to Spanish Verbs of ‘Becoming.’ Language, 82(2), 323-355.
Bybee, Joan, Perkins, Revere, y Pagliuca, William. (1994). The evolution of grammar: Tense, aspect and modality in the languages of the world. The University of Chicago Press.
Cicres, Jordi, y Queralt, Sheila. (2019). An n-gram based approach to the automatic classification of schoolchildren’s writing. Vigo International Journal of Applied Linguistics, 16, 53-80.
Coulthard, Malcolm, Grant, Tim, y Kredens, Krzysztof. (2011). Forensic linguistics. En Ruth Wodak, Barbara Johnstone y Paul E. Kerswill (eds.), The SAGE Handbook of Sociolinguistics (pp. 531-544). SAGE Publishing. https://sk.sagepub.com/reference/hdbk_sociolinguistics/n36.xml
De Houwer, Annick. (2005). Bilingual development in the early years. En Encyclopedia of Language & Linguistics (2a ed.). Elsevier.
Drummond, Rob, y Schleef, Erik. (2016). Identity in variationist sociolinguistics. En The Routledge handbook of language and identity (pp. 50-65). Routledge.
Eckert, Penelope. (2000). Linguistic variation as social practice. Blackwell.
Eguren, Luis, y Sánchez, Cristina. (2007). Grammar and history of Spanish cierto. En Georg A. Kaiser y Manuel Leonetti (eds.), Proceedings of the Workshop “Definiteness, Specificity and Animacy in Ibero-Romance Languages”. Arbeitspapier, 122. Fachbereich Sprachwissenschaft, Universität Konstanz, 1-22.
Gibbons, John, y Turell, Maria Teresa (eds.). (2008). Dimensions of Forensic Linguistics. John Benjamins.
Giles, Howard, y Powesland, Peter. (1975). Speech style and social evaluation. Academic Press. https://dx.doi.org/10.1017/S0047404500005820
Goldberg, Adele. (2003). Constructions: A new theoretical approach to language. Trends in cognitive sciences, 7(5), 219-224. https://doi.org/10.1016/S1364 6613(03)00080-9
Goldstein-Stewart, Jade, Winder, Ransom, y Sabin, Roberta. (2009). Person identification from text and speech genre samples. “Proceedings of the 12th Conference of the European Chapter of the Association for Computational Linguistics”, 336-344.
Grant, Tim. (2010). Text messaging forensics Txt 4n6: Idiolect free authorship analysis?En Malcolm Coulthard y Alison Johnson (eds.), The Routledge handbook of forensic linguistics (pp. 536-550). Routledge. https://doi.org/10.4324/9780203855607.cU33
Grant, Tim. (2022). The Idea of Progress in Forensic Authorship Analysis (Elements in Forensic Linguistics). Cambridge University Press.
Hopper, Paul. (1987). Emergent Grammar. Berkeley Linguistics Society, 13, pp. 139-157.
Iglesias, Olivier. (2016). “Se le quedó mirando”: la atracción de clíticos en un corpus de idiolectos (s. xix-xxi). En Johannes Kabatek (ed.), Lingüística de corpus y lingüística histórica iberorrománica (pp. 424-448). De Gruyter. https://doi.org/10.1515/9783110462357-019
Johnson, Alison, y Wright, David. (2017). Identifying idiolect in forensic authorship attribution: an n-gram textbite approach. Language and Law = Linguagem e Direito, 1(1), 37-69.
Juola, Patrick. (2008). Authorship Attribution. Now Publishing. http://dx.doi.org/10.1561/1500000005
Kiesling, Scott F. (2013). Constructing identity. En J. K. Chambers y Natalie Schilling (eds.), The handbook of language variation and change (2a ed., pp. 448-467). John Wiley and Sons.
Kredens, Krzysztof. (2002). Towards a corpus-based methodology of forensic authorship attribution: a comparative study of two idiolects. En Barbara Lewandowska-Tomaszczyk (Ed.), PALC’01: Practical Applications in Language Corpora (pp. 405-437). Peter Lang.
Labov, William. (1972). Language in the inner city: Studies in the Black English vernacular. University of Pennsylvania Press. https://doi.org/10.1177/089124167600400410
Labov, William. (1984). Field methods of the project on linguistic change and variation. En John Baugh y Joel Sherzer (eds.), Language in Use: Readings in Sociolinguistics (pp. 28-53). Prentice Hall.
Langacker, Ronald. (1987). Foundations of cognitive grammar. Volume I: Theoretical prerequisites. Stanford University Press.
Litvinova, Tatiana, Seredin, Pavel, Litvinova, Olga, Dankova, Tatiana, y Zagorovskaya, Olga. (2018). On the stability of some idiolectal features. En Alexey Karpov, Oliver Jokisch y Rodmonga Potapova (eds.), Speech and Computer. SPECOM 2018. Lecture Notes in Computer Science (vol. 11096). Springer, Cham. https://doi.org/10.1007/978-3-319-99579-3_35
Litvinova, Tatiana, Litvinova, Olga, y Seredin, Pavel. (2018, 13-16 de noviembre). Assessing the level of stability of idiolectal features across modes, topics and time of text production [Ponencia]. 23rd Conference of Open Innovations Association (FRUCT), Boloña, Italia, pp. 223-230.
Milroy, James. (1992). Linguistic Variation and Change. Blackwell.
Mojedano Batel, Andrea, Soler Bonafont, Amparo, y Kredens, Krzysztof. (En prensa). Epistemic modality constructions as stable idiolectal features: A cross-genre study of Spanish. International Journal for the Semiotics of Law.
Moore, Emma. (2011). Variation and identity. En Warren Maguire y April McMahon (eds.), Analysing variation in English (pp. 219-236). Cambridge University Press.
Mufwene, Salikoko. (2010). SLA and the emergence of creoles. Studies in Second Language Acquisition, 32(3), 359-400. https://doi.org/10.1017/S027226311000001X
Nuyts, Jan. (2005). The modal confusion: On terminology and the concepts behind it. En Alex Klinge y Henrik Müller (eds.), Modality: Studies in form and function (pp. 5-38). Equinox.
Nuyts, Jan. (2016). Analyses of the Modal Meanings. En Jan Nuyts y Johan van der Auwera (eds.), The Oxford Handbook of Modality and Mood (pp. 31-49). Oxford University Press.
Ochs, Elinor. (1992). Indexing gender. En Alessandro Duranti y Charles Goodwin (eds.), Rethinking context: language as an interactive phenomenon (pp. 335-358). Cambridge University Press.
Overdorf, Rebekah, y Greenstadt, Rachel. (2016). Blogs, twitter feeds, and reddit comments: Cross-domain authorship attribution. Proceedings on Privacy Enhancing Technologies, 3, 155-171. https://doi.org/10.1515/popets-2016-0021
Queralt, Sheila. (2014). Acerca de la prueba lingüística en atribución de autoría hoy. Revista de Llengua i Dret, 62, 35-48.
Queralt, Sheila, y Giménez García, Roser. (2018). La imitación como contraargumento en peritajes de atribución de autoría: estudio de un caso. Estudios de Lingüística Aplicada, 36(68), 131-164.
Rauniomaa, Mirka. (2003). Stance accretion. Estudio presentado en el Language, Interaction, and Social Organization Research Focus Group. University of California, Santa Barbara (febrero de 2003).
Rickford, John, y McNair-Knox, Faye. (1994). Addressee-and topic-influenced style shift: A quantitative sociolinguistic study. En Douglas Biber y Edward Finnegan (eds.), Perspectives on Register: Situating Register Variation within Sociolinguistics (pp. 235-276). Oxford University Press.
Romano, Manuela, y Porto Requejo, María Dolores. (2013). Emotion, attention and idiolectal variation in radio narratives. Revista Española de Lingüística Aplicada, (volumen monográfico), 143-164.
Solan, Lawrence, y Tiersma, Peter. (2004). Author identification in American courts. Applied linguistics, 25(4), 448-465. https://doi.org/10.1093/applin/25.4.448
Soler Bonafont, María Amparo. (2022). Esto es lo que creo... El dominio de la opinión en el español hablado a través de los usos construccionales de creo. Círculo de Lingüística Aplicada a la Comunicación, 91, 219-231. http://dx.doi.org/10.5209/CLAC.77196
Spassova, Maria. (2009). El potencial discriminatorio de las secuencias de categorías gramaticales en la atribución forense de autoría de textos en español. [Tesis doctoral]. Universitat Pompeu Fabra.
Spassova, Maria S., López, Fernanda, Queralt, Sheila, Gavaldà, Núria, Cicres, Jordi, García Barrero, David, y Marquina, Montse. (2014). Idiolectometria forense: estat de la qüestió. En Núria Gavaldà Ferré, Montserrat Forcadell Guinjoan y Raquel Casesnoves-Ferrer (eds.), Ens queda la paraula: estudis de lingüística aplicada en honor a M. Teresa Turell. Sèrie monografies, 3. Documenta Universitaria.
Stamatatos, Efstathios. (2013). On the robustness of authorship attribution based on character n-gram features. Journal of Law and Policy, 21(2), 421-439.
Stamatatos, Efstathios. (2017). Authorship attribution using text distortion. “Proceedings of the 15th Conference of the European Chapter of the Association for Computational Linguistics”, vol. 1, Long Papers, 1138-1149. https://doi.org/10.18653/v1/E17-1107
Swales, John. (1990). Genre Analysis: English in Academic and Research Settings. Cambridge University Press.
Thompson, Geoff, y Hunston, Susan. (2000). Evaluation: an introduction. En Susan Hunston y Geoff Thompson (eds.), Evaluation in text: authorial stance and the construction of discourse (pp. 1-27). Oxford University Press.
Turell, Maria Teresa. (2011). La tasca del lingüista detectiu en casos de detecció de plagi i determinació d’autoria de textos escrits. Llengua, Societat i Comunicació, 9, 69-85.
Turell, Maria Teresa, y Gavaldà, Núria. (2013). Towards an index of idiolectal similitude (or distance) in forensic authorship analysis. Journal of Law and Policy, 21(2), 495-514.
Troya Déniz, Magnolia. (2015). Quizá(s) y tal vez en novelistas de España y América. Philologica Canariensia, 21, 109-132. https://doi.org/10.20420/PhilCan.2015.0036
Van der Auwera, Johan. (1996). Modality: the three-layered scalar square. Journal of Semantics, 13(3), 181-195.
Wright, David. (2014). Stylistics versus Statistics: A corpus linguistic approach to combining techniques in forensic authorship analysis using Enron emails [Tesis doctoral]. University of Leeds.
Wright, David. (2017). Using word n-grams to identify authors and idiolects: A corpus approach to a forensic linguistic problem. International Journal of Corpus Linguistics, 22(2), 212-241. https://doi.org/10.1075/ijcl.22.2.03wri
DOI: http://dx.doi.org/10.58992/rld.i79.2023.3951