Congresos y Jornadas Didáctica de las Lenguas y las Literaturas - 2 | Page 687
Turismo. Con este fin seleccionamos herramientas de búsqueda de
textos y de análisis de los mismos.
En un primer momento de la investigación conformamos un
corpus de textos científico-académicos149 y procedimos a su análisis
a fin de determinar las características particulares del léxico utilizado en este género textual. Para el análisis de los resúmenes de los
artículos seleccionados, se utilizó el Corpus of Contemporary American English (COCA) creado por Mark Davies (2008), profesor de
Lingüística en la Universidad de Brigham Young, Estados Unidos.
Este corpus fue utilizado con el fin de determinar la presencia de vocabulario general, académico y técnico, colocaciones, repetición de
palabras y también para establecer la densidad terminológica del
texto. Como su autor lo define, COCA es el mayor corpus de monitoreo150, de acceso libre, con 450 millones de palabras, utilizadas en
diferentes medios entre los años 1990 y 2012 y etiquetadas de acuerdo a categoría morfosintáctica y fuente. Su exhaustividad, equilibrio en la selección de géneros y presencia de textos actuales, entre
otras características, le otorgan una gran fiabilidad. (Davies, 2010)
Además de la interfaz del corpus, el sitio web de COCA ofrece
otras herramientas para el análisis del léxico, como por ejemplo
Word and Phrase que permite obtener información sobre las palabras individuales del texto ingresado (opción Word) y sobre las frases que constituyen colocaciones típicas (opción Phrase). La función
Word proporciona una lista de todas las palabras en el texto ingre149
Extraídos de la revista especializada Tourism Management, alojada en la página web de la editorial Elsevier
150
Se entiende por “corpus de monitoreo” un corpus que nos permite observar
los cambios [en el idioma] a través del tiempo.
Investigación y Práctica en Didáctica de las Lenguas
673