Nuestra
universidad acogió el VI Congreso Internacional de Lingüística de Corpus
(CILC2014) los días 22, 23 y 24 de mayo. Los organizadores, en nombre de la
Asociación Española de Lingüística de Corpus (AELINCO) se esmeraron muchísimo para
que todos los ponentes se sintieran a gusto. El comité organizador estuvo
compuesto por: Francisco Alonso Almeida, Heather Adams, Patricia Arnaiz Castro,
Laura Cruz García, Victoria Galván, Isabel González Cruz, Víctor González Cruz,
Maria del Pilar González de la Rosa, Sandra Marrero Morales, Margarita Mele
Marrero, Maureen Mulligan, Jéssica Pérez Luzardo, Ivalla Ortega Barrera, Elena
Quintana Toledo, María Jesús Vera Cazorla, Margarita Sánchez Cuervo, Ángeles
Sánchez Hernández, Ricardo Santana Rodríguez y Amelia Torres Ramírez.
Algunas organizadoras: Pilar, Laura e Ivalla |
¿Qué
es lingüística de corpus? La lingüística de
corpus es un área de la lingüística
que se ocupa de la recopilación y análisis de corpus
lingüísticos, es decir, de conjuntos de datos lingüísticos
recolectados con criterio para ser objeto de investigación lingüística (estudia
la lengua a través de estas muestras). Originalmente se elaboraban a mano; en la actualidad, los corpus se recopilan de manera
automática.
Unos
días antes del comienzo del congreso nos reunimos todos los voluntarios para preparar
las bolsas que cada ponente recibiría al registrarse al llegar al congreso: una
carpeta que contenía un mapa de la ciudad, programas sociales e
instrucciones generales para el evento. Los 28 voluntarios se dividieron en dos
grupos, el que iba a estar presente por las mañanas y el de la tarde. Me tocó
estar por la tarde, lo que agradecí porque de esa manera podía entrar por las
mañanas a escuchar las conferencias que más me llamaban la atención.
El
miércoles 21, por la tarde, comenzaron los talleres pre-conferencia: Basics of corpus linguistics y History of English and corpus linguistics. Ambos
talleres los impartieron Begoña Crespo García, de la Universidade da Coruña e Isabel de la Cruz Cabanillas de la Universidad de Alcalá.
En
el primer taller se abordaron los aspectos fundamentales del corpus de
lingüística como ¿Qué es un corpus? ¿Cuáles son los criterios para compilar un
corpus? ¿Para qué sirve un corpus? Después de una breve descripción de un corpus y las herramientas necesarias para su tratamiento, los participantes
estábamos listos para comenzar a trabajar en la Lingüística de Corpus.
El
segundo taller se centró en la influencia de la Lingüística de Corpus sobre el
campo de la historia de la lengua inglesa. Se presentaron Corpora representativos para cada período de la historia de l inglés,
se mostraron las aplicaciones que tienen en este área en particular y también los
avances en el estudio histórico del inglés.
La
mañana del 23, al comenzar el congreso, fue increíble. A las ocho ya se había formado una fila
de ponentes que venían a registrarse. Tuvimos que
trabajar duro para que todos pudieran entrar a las nueve de la mañana a la
ceremonia de inauguración. Más tarde me colé en la plenaria inaugural en la que
el Dr. Istvan Kecskes nos deleitó con Is the “idiom principle”
blocked in bilingual language production? A corpus study on formulaic language
use.
No
paraban de llegar ponentes y las mesas de la entrada siempre estaban llenas. El
trabajo en las mesas consistía en ir buscando los nombres que nos indicaban los
recién llegados en la lista de ponentes, entregar certificados, facturas y
libros de resúmenes (book of abstracts), guardar las presentaciones de cada
orador en el ordenador, atender cualquier pregunta y entregar una
identificación a cada uno. Otros estaban en las salas o aulas durante las
conferencias y vigilaban que no faltara de nada, que todo estuviera perfecto
mientras que otros trabajaron como mensajeros. Ayudamos en todo lo que pudimos,
pero también disfrutamos de bastantes conferencias interesantísimas. Aquí podéis ver la página del congreso con su
programa y los ponentes que han pasado por nuestra universidad.
![]() |
Karin Aijmer y Francisco Alonso Almeida |
Pero
no todo han sido conferencias, no. En las pausas para el café tuvimos el
privilegio de conocer más de cerca a los ponentes de universidades como Algeria, Turquía, Alemania, Grecia, Rusia, Inglaterra, Saudi Arabia, Estados
Unidos, Kuwait, México, Polonia, Portugal, Francia, Brasil, Bélgica, Finlandia,
Indonesia, Kazakhstan, Suecia, Ucrania, Italia, Taiwan, Rumanía, Libia,
Nigeria, Canadá, Chile, Japón, Macao, Eslovenia, Noruega, Hong Kong, Zimbabwe,
Iran, Qatar, Lituania, Armenia, Serbia, Checoslovaquia y Montenegro.
Cena de gala |
Otra ocasión para conversar con los ponentes la tuvimos en la cena de gala, en la que disfrutamos todos de un menú increíble y de aún mejor compañía.
Estoy
muy contenta de haber participado en una experiencia tan edificante. Muchas gracias a
los que lo hicieron posible.
¡Os deseo unas bonitas vacaciones!
Algunas palabras claves:
Corpus: conjunto
de datos, textos u otros materiales sobre determinada materia que pueden servir
de base para una investigación o trabajo
Corpus lingüístico: es un conjunto, habitualmente muy amplio, de ejemplos reales (pueden ser
textos, lo más común o muestras orales) de uso de una lengua.
Construcción de un corpus: el proceso de diseño, la recogida de los textos,
la codificación, el montaje y el almacenamiento de los metadatos, el marcado de
los textos en los que sea necesario y, posiblemente, la adición de anotación
lingüística
Lingüística computacional: es un campo multidisciplinar de la lingüística y de la informática que
utiliza la informática para estudiar y tratar el lenguaje humano. En esta
disciplina participan lingüistas, informáticos especializados en inteligencia
artificial, psicólogos congnoscitivos y expertos en lógica entre otros.
¿Qué estudia la lingüística computacional?
- Corpus lingüístico asistido por ordenador
- Diseño de analizadores sintácticos para lenguajes naturales (parser en inglés).
- Diseño de etiquetadores o lematizadores, tales como el POS-tagger.
- Definición de lógicas especializadas que sirvan como fuente para el Procesamiento de Lenguas Naturales.
- Estudio de la posible relación entre lenguajes formales y naturales.
- Traducción automática.
Etiquetado: En lingüística computacional, el etiquetado gramatical, conocido también
por “part-of-speech tagging, POS-tagging o POST, es el proceso de asignar o
etiquetar a cada una de las palabras de un texto su categoría gramatical. El
etiquetado tiene lugar mediante el empleo de algoritmos que realizan el
etiquetado mediante etiquetas descriptivas predefinidas
Lematización: es un proceso lingüístico que consiste en hallar el lema correspondiente
(dada una forma flexionada, es decir, en plural, en femenino, conjugada, etc.).
El lema de una palabra es la palabra que nos encontraríamos como entrada en un
diccionario tradicional. La lematización se puede realizar automáticamente
mediante programas de análisis morfológico.
Procesamiento de lenguajes
naturales (PLN, o NLP – Natural Language Processing):
es una subdisciplina de la inteligencia artificial y la rama ingeniera de la
lingüística computacional. Se ocupa de la formulación e investigación de
mecanismos eficaces computacionalmente para la comunicación entre personas o
entre personas y máquinas por medio de lenguajes naturales.
Para
saber más:
Algunos voluntarios |
No hay comentarios :
Publicar un comentario