Extracting Parallel Sentences from Nonparallel Corpora Using Parallel Hierarchical Attention Network
CONTENIDO PARA USUARIOS REGISTRADOS
Inicia sesión para disfrutar este recurso. Si aún no estás afiliado a BibloRed, haz clic en el botón.
Acceder- Autor
- Año de publicación 2020
- Idioma Inglés
- Publicado por Revista VirtualPRO,
- Descripción
- La recopilación de oraciones paralelas a partir de datos no paralelos es un problema de investigación del procesamiento del lenguaje natural que viene de lejos. En particular, las oraciones paralelas de entrenamiento son muy importantes para la calidad de los sistemas de traducción automática. Aunque muchos de los métodos existentes han mostrado resultados alentadores, no pueden aprender varios pesos de alineación en las oraciones paralelas. Para abordar este problema, proponemos una novedosa red neuronal de atención jerárquica paralela que codifica las oraciones monolingües frente a las bilingües y construye un clasificador para extraer las oraciones paralelas. En particular, nuestra estructura del mecanismo de atención puede aprender diferentes pesos de alineación de las palabras en las oraciones paralelas. Los resultados experimentales muestran que nuestro modelo puede obtener un rendimiento de vanguardia en el conjunto de datos inglés-francés, inglés-alemán e inglés-chino de la tarea compartida BUCC 2017 sobre la extracción de oraciones paralelas.
-
Citación recomendada (normas APA)
- Hindawi, "Extracting Parallel Sentences from Nonparallel Corpora Using Parallel Hierarchical Attention Network", -:Revista VirtualPRO,, 2020. Consultado en línea en la Biblioteca Digital de Bogotá (https://www.bibliotecadigitaldebogota.gov.co/resources/3436760/), el día 2024-05-18.