El diseño del blog es creación de Noelia Mendoza Medina

Sígueme en About me Sígueme en Wordpress Sígueme en Proz Sígueme en Twitter Sígueme en Linkedin Sígueme en Facebook

miércoles, 28 de mayo de 2014

3 días en el VI Congreso Internacional de Lingüística de Corpus


Nuestra universidad acogió el VI Congreso Internacional de Lingüística de Corpus (CILC2014) los días 22, 23 y 24 de mayo. Los organizadores, en nombre de la Asociación Española de Lingüística de Corpus (AELINCO) se esmeraron muchísimo para que todos los ponentes se sintieran a gusto. El comité organizador estuvo compuesto por: Francisco Alonso Almeida, Heather Adams, Patricia Arnaiz Castro, Laura Cruz García, Victoria Galván, Isabel González Cruz, Víctor González Cruz, Maria del Pilar González de la Rosa, Sandra Marrero Morales, Margarita Mele Marrero, Maureen Mulligan, Jéssica Pérez Luzardo, Ivalla Ortega Barrera, Elena Quintana Toledo, María Jesús Vera Cazorla, Margarita Sánchez Cuervo, Ángeles Sánchez Hernández, Ricardo Santana Rodríguez y Amelia Torres Ramírez.

Algunas organizadoras: Pilar, Laura e Ivalla


¿Qué es lingüística de corpus? La lingüística de corpus es un área de la lingüística que se ocupa de la recopilación y análisis de corpus lingüísticos, es decir, de conjuntos de datos lingüísticos recolectados con criterio para ser objeto de investigación lingüística (estudia la lengua a través de estas muestras). Originalmente se elaboraban a mano; en la actualidad, los corpus se recopilan de manera automática.




Unos días antes del comienzo del congreso nos reunimos todos los voluntarios para preparar las bolsas que cada ponente recibiría al registrarse al llegar al congreso: una carpeta que contenía un mapa de la ciudad, programas sociales e instrucciones generales para el evento. Los 28 voluntarios se dividieron en dos grupos, el que iba a estar presente por las mañanas y el de la tarde. Me tocó estar por la tarde, lo que agradecí porque de esa manera podía entrar por las mañanas a escuchar las conferencias que más me llamaban la atención.

El miércoles 21, por la tarde, comenzaron los talleres pre-conferencia: Basics of corpus linguistics y History of English and corpus linguistics. Ambos talleres los impartieron Begoña Crespo García, de la Universidade da Coruña e Isabel de la Cruz Cabanillas  de la Universidad de Alcalá.

En el primer taller se abordaron los aspectos fundamentales del corpus de lingüística como ¿Qué es un corpus? ¿Cuáles son los criterios para compilar un corpus? ¿Para qué sirve un corpus? Después de una breve descripción de un corpus y las herramientas necesarias para su tratamiento, los participantes estábamos listos para comenzar a trabajar en la Lingüística de Corpus.

El segundo taller se centró en la influencia de la Lingüística de Corpus sobre el campo de la historia de la lengua inglesa. Se presentaron Corpora representativos para cada período de la historia de l inglés, se mostraron las aplicaciones que tienen en este área en particular y también los avances en el estudio histórico del inglés.

La mañana del 23, al comenzar el congreso, fue increíble. A las ocho ya se había formado una fila de ponentes que venían a registrarse. Tuvimos que trabajar duro para que todos pudieran entrar a las nueve de la mañana a la ceremonia de inauguración. Más tarde me colé en la plenaria inaugural en la que el Dr. Istvan Kecskes nos deleitó con Is the “idiom principle” blocked in bilingual language production? A corpus study on formulaic language use.

No paraban de llegar ponentes y las mesas de la entrada siempre estaban llenas. El trabajo en las mesas consistía en ir buscando los nombres que nos indicaban los recién llegados en la lista de ponentes, entregar certificados, facturas y libros de resúmenes (book of abstracts), guardar las presentaciones de cada orador en el ordenador, atender cualquier pregunta y entregar una identificación a cada uno. Otros estaban en las salas o aulas durante las conferencias y vigilaban que no faltara de nada, que todo estuviera perfecto mientras que otros trabajaron como mensajeros. Ayudamos en todo lo que pudimos, pero también disfrutamos de bastantes conferencias interesantísimas. Aquí podéis ver la página del congreso con su programa y los ponentes que han pasado por nuestra universidad.

Karin Aijmer y Francisco Alonso Almeida





Pero no todo han sido conferencias, no. En las pausas para el café tuvimos el privilegio de conocer más de cerca a los ponentes de universidades como Algeria, Turquía, Alemania, Grecia, Rusia, Inglaterra, Saudi Arabia, Estados Unidos, Kuwait, México, Polonia, Portugal, Francia, Brasil, Bélgica, Finlandia, Indonesia, Kazakhstan, Suecia, Ucrania, Italia, Taiwan, Rumanía, Libia, Nigeria, Canadá, Chile, Japón, Macao, Eslovenia, Noruega, Hong Kong, Zimbabwe, Iran, Qatar, Lituania, Armenia, Serbia, Checoslovaquia y Montenegro.





Cena de gala




Otra ocasión para conversar con los ponentes la tuvimos en la cena de gala, en la que disfrutamos todos de un menú increíble y de aún mejor compañía.

Estoy muy contenta de haber participado en una experiencia tan edificante. Muchas gracias a los que lo hicieron posible.

¡Os deseo unas bonitas vacaciones!




Algunas palabras claves:
Corpus: conjunto de datos, textos u otros materiales sobre determinada materia que pueden servir de base para una investigación o trabajo

Corpus lingüístico: es un conjunto, habitualmente muy amplio, de ejemplos reales (pueden ser textos, lo más común o muestras orales) de uso de una lengua.

Construcción de un corpus: el proceso de diseño, la recogida de los textos, la codificación, el montaje y el almacenamiento de los metadatos, el marcado de los textos en los que sea necesario y, posiblemente, la adición de anotación lingüística

Lingüística computacional: es un campo multidisciplinar de la lingüística y de la informática que utiliza la informática para estudiar y tratar el lenguaje humano. En esta disciplina participan lingüistas, informáticos especializados en inteligencia artificial, psicólogos congnoscitivos y expertos en lógica entre otros.
¿Qué estudia la lingüística computacional?
  • Corpus lingüístico asistido por ordenador
  • Diseño de analizadores sintácticos para lenguajes naturales (parser en inglés).
  • Diseño de etiquetadores o lematizadores, tales como el POS-tagger.
  • Definición de lógicas especializadas que sirvan como fuente para el Procesamiento de Lenguas Naturales.
  • Estudio de la posible relación entre lenguajes formales y naturales.
  • Traducción automática. 

Etiquetado: En lingüística computacional, el etiquetado gramatical, conocido también por “part-of-speech tagging, POS-tagging o POST, es el proceso de asignar o etiquetar a cada una de las palabras de un texto su categoría gramatical. El etiquetado tiene lugar mediante el empleo de algoritmos que realizan el etiquetado mediante etiquetas descriptivas predefinidas

Lematización: es un proceso lingüístico que consiste en hallar el lema correspondiente (dada una forma flexionada, es decir, en plural, en femenino, conjugada, etc.). El lema de una palabra es la palabra que nos encontraríamos como entrada en un diccionario tradicional. La lematización se puede realizar automáticamente mediante programas de análisis morfológico.

Procesamiento de lenguajes naturales (PLN, o NLP – Natural Language Processing): es una subdisciplina de la inteligencia artificial y la rama ingeniera de la lingüística computacional. Se ocupa de la formulación e investigación de mecanismos eficaces computacionalmente para la comunicación entre personas o entre personas y máquinas por medio de lenguajes naturales.

 
Poster session, main hall

Para saber más: 


Algunos voluntarios

No hay comentarios :

Publicar un comentario en la entrada