Resumen
El póster describe la extracción de relaciones semánticas en la lengua natural basada en datos sintácticos y morfológicos que vamos a recoger del lenguaje infantil.
Esta información mejora la traducción del lenguaje oral, en este caso del alemán, en el lenguaje por señas.
La motivación para este trabajo es la hipótesis de que las relaciones semánticas del idioma original son más relevantes que los del idioma terminal. Así la sintaxis para el arreglo de palabras y frases en un idioma terminal para expresar la información equivalente es más difícil para pasarla. La sintaxis de lenguajes por señas se diferencia bastante de la sintaxis de oraciones de lengua natural.
A menudo se asume que hay menos, o que no hay, reglas de gramática para lenguajes por señas. Cada usuario de lenguaje por señas sigue sus propias reglas de gramática. Cuando se observa los primeros pasos para expresar deseos y sentimientos, reconocemos que el empleo de reglas de sintaxis es muy similar al lenguaje por señas. A la edad de siete años, un niño controla 15 relaciones básicas y principales (Szagun, 1980). Aislamos estas relaciones y sus realizaciones típicas sintacto-semánticas.
Luego se diseña un sistema centrado en las capacidades gramaticales de gente de siete años. Un clasificador extrae las relaciones semánticas y los componentes semánticos, como el sujeto, el objeto..., basado en rasgos como el tipo de verbo de parte-de-discurso (Rudolph y F¨orsterling, 1997), el género, el caso, tiempo, número, el modo y marcos de verbo (Schulte, 2003).
Para cada relación definimos una de estas opciones:
1. Existe una plantilla explícita para el idioma terminal
2. Existe una regla de insertar un o más elementos en otra plantilla. En cuanto conocemos relaciones contenidas, comenzamos a identificar componentes contenidos.
Los componentes son las partes atómicas de oraciones reorganizadas. Durante un primer análisis de las oraciones de discurso infantil reconocimos es suficiente buscar el sujeto, el verbo, el tiempo, la posición, la interjección, la palabra de pregunta, negativa y partículas de repetición. Otras partes son bastante raras, entonces etiquetamos estos como objetos. Para reconocer a componentes usamos algunas técnicas conocidas e instrumentos.