Objetos Digitales
Compresión automática de frases: ¿cómo decir algo en menos palabras y aun así decirlo bien? || VI Coloquio de Linguística Computacional. Ciclo de conferencias
@title_alternative br@
Torres Moreno, Juan Manuel || Molina, Alejandro
Repositorio, Facultad de Filosofía y Letras
@collection_name_full1qqq@
Conferencia
FFyL:RU-UNAM:

Datos curatoriales

Nombre de la colección

Repositorio Universitario Digital (FFyL)

Responsables de la colección

Pablo Miranda Quevedo

Colección asociada

@collection_name_full@

Responsables de la colección asociada

@collection_responsible@

Dependencia

Secretaría Académica, Facultad de Filosofía y Letras (FFyL)

Institución

Universidad Nacional Autónoma de México (UNAM)

Identificador

http://hdl.handle.net/10391/4102

Cita

@identifier_citation@

URI

FFyL:RU-UNAM:58641

Número gubernamental

@identifier_govdoc@

ISBN

@identifier_isbn@

ISSN

@identifier_issn@

SICI

@identifier_sici@

ISMN

@identifier_ismn@

Identificador Sword Slug Header

@identifier_slug@

Otro identificador

@identifier_other@

Créditos
@ws:credits@

Autoría

Autor

Torres Moreno, Juan Manuel || Molina, Alejandro

Coautores

@contributor_author@

Contribuidores

@contributor@

Editor

Facultad de Filosofía y Letras. Instituto de Ingeniería. Universidad Nacional Autónoma de México

Editor asociado

@contributor_editor@

Supervisor

@contributor_advisor@

Ilustrador

@contributor_illustrator@

Otro

@contributor_other@


Descripción del contenido

Descripción

Conferencia /// Compresión automática: ¿cómo decir algo en menos palabras y aun así decirlo bien?. Juan Manuel Torres Moreno. Alejandro Molina. Université d"Avignon. 20 de agosto de 2013 //// VI Coloquio de Linguística Computacional. Facultad de Filosofía y Letras. Instituto de Ingeniería. Universidad Nacional Autónoma de México. //// Descarga: Pulse botón derecho del ratón sobre el archivo de audio "mp3" que elija y seleccione "Guardar Destino Como..." || Presentaremos un nuevo enfoque para la generación automática de resúmenes de documentos (RAD). El RAD ha sido tratado durante medio siglo, permanece aún como un desafió porque nadie ha podido aun crear automáticamente resúmenes comparables, en calidad, con aquellos producidos por los humanos. En este contexto, las investigaciones en RAD se dividen en dos categorías: el resumen por extracción y el resumen por abstracción. En el primer caso, las frases son ordenadas de acuerdo con una ponderación, aquellas con más alto puntaje constituyen el extracto final. Ahora bien, les frases seleccionadas contienen a menudo informaciones secundarias, y un análisis más fino puede ser necesario. Proponemos un método de compresión automática de frases basado en la eliminación de fragmentos al interior de la frase. A partir de un corpus anotado manualmente, hemos creado un modelo lineal para predecir la posible supresión de esos fragmentos. El método toma en cuenta tres principios: la pertinencia del contenido o informatividad (¿qué decir?); la gramaticalidad (¿cómo decirlo correctamente?), y la longitud o tasa de compresión (¿cómo decirlo en pocas palabras?). Para medir la informatividad hemos utilizado una técnica inspirada en la física estadística: la energía textual. En cuanto a la gramaticalidad, proponemos un modelo de lenguaje probabilista. El método propuesto es capaz de generar resúmenes correctos en español, pero en general es independiente del idioma. Los resultados han engendrado diversos aspectos teóricos interesantes de cara al RAD usando compresión de frases. Por supuesto, debido al alto grado de subjetividad de la tarea, no existe una compresión óptima única sino varias compresiones correctas posibles. Para evaluar los resultados, hemos utilizado, además de las técnicas clásicas disponibles, un enfoque basado en el test de Turing: un juez humano se vio confrontado a decidir si un resumen fue producido por otro ser humano o por nuestro algoritmo. Nuestros resultados muestran que el juez es incapaz de decidir correctamente sobre este problema. //// Juan Manuel Torres (juan-manuel.torres@univ-avignon.fr). Es doctor en Informática Cognitiva. También tiene post-doctorado y HDR en Procesamiento de Lenguaje Natural. Su centro de trabajo es la Université d’Avignon (Francia). Se enfoca en el procesamiento de lenguaje natural y aprendizaje automático. Tiene una veintena de artículos publicados en revistas, cerca de 80 artículos en congresos nacionales e internacionales. Es el jefe del Grupo de Procesamiento de Lenguaje Natural (TALNE) en el Laboratoire Informatique d’Avignon (Francia).

Resumen

@description_abstract@

Origen

@description_provenance@

Patrocinador

@description_sponsorship@

Participantes@description_statementofresponsibility@
Tabla de contenido

@description_tableofcontents@

URI de la descripción

@description_uri@

Versión

@description_version@

Tema

Aplicaciones tecnológicas || Tecnologías del Habla || Linguística Computacional || Siglo XXI || Conferencia en audio || Economizar lenguaje || Compresión automática || Tecnología || Análisis de lenguaje || Semántica computacional || Precisión

Clasificación

@subject_classification@

Clasificación Decimall Dewey

@subject_ddc@

Clasificación Biblioteca del congreso

@subject_lcc@

Temas Biblioteca del Congreso

@subject_lcsh@

Medical Subject Headings

@subject_mesh@

Temas en otros estándares

@subject_other@

Cobertura

@coverage@

Cobertura espacial

@coverage_spatial@

Cobertura temporal

@coverage_temporal@

Idioma

es

Idioma ISO

@language_iso@

Idioma RFC 3066

@language_rfc3066@

Descripción del objeto

Fecha

2013 || 2014-04-28T23:45:54Z || 2014-04-28T23:45:54Z || 2013

Fecha de adquisición

@date_accessioned@

Fecha de disponibilidad

@date_available@

Fecha de creación

@date_created@

Fecha de publicación

@date_issued@

Fecha de recepción

@date_submitted@

Fecha de actualización

@date_updated@

Fuente

@source@

URI de la fuente

http://ru.ffyl.unam.mx:8080/jspui/bitstream/10391/4102/8/VI_CoLiCo_Juan_M_Torres_2013.pdf.txt || http://ru.ffyl.unam.mx:8080/jspui/bitstream/10391/4102/3/VI_CoLiCo_FOTOS_Mesa8_2013.pdf || http://ru.ffyl.unam.mx:8080/jspui/bitstream/10391/4102/2/VI_CoLiCo_Juan_M_Torres_2013.mp3 || http://ru.ffyl.unam.mx:8080/jspui/bitstream/10391/4102/1/VI_CoLiCo_Juan_M_Torres_2013.pdf


Formato

@format@

Formato extendido

@format_extent@

Medio físico

@format_medium@

Identificador MIME

@format_mimetype@

Relaciones

Relaciones

@relation@

Tiene las siguientes partes

@relation_haspart@

Es parte de

@relation_ispartof@

Es parte de la serie

@relation_ispartofseries@

Tiene una versión

@relation_hasversion@

Es una versión de

@relation_isversionof@

Reemplaza a

@relation_replaces@

Es reemplazado por

@relation_isreplacedby@

Es un formato de

@relation_isformatof@

Basado en

@relation_isbasedon@

Requiere

@relation_requires@

Aparece en

@relation_isreferencedby@

URI de la relación

@relation_uri@

Derechos

Derechos

@rights@

Propietario de los derechos

@rights_holder@

URI de los derechos

@rights_uri@

Fecha de derechos

@date_copyright@

Información general

Cómo citar esta página

Secretaría Académica, Facultad de Filosofía y Letras (FFyL), %%Compresión automática de frases: ¿cómo decir algo en menos palabras y aun así decirlo bien? || VI Coloquio de Linguística Computacional. Ciclo de conferencias%%, objeto digital: Repositorio Universitario Digital (FFyL). En %%Portal de datos abiertos UNAM%% (en línea), México, Universidad Nacional Autónoma de México. Disponible en: http://datosabiertos.unam.mx/FFyL:RU-UNAM:58641 Fecha de actualización: 2014-10-23 18:31:20.0 Fecha de consulta:

Políticas de uso de los datos

@publication_policy@

Contacto de la colección

Para consultar el repositorio de la Facultad de Filosofía y Letras, visite el siguiente enlace: http://ru.ffyl.unam.mx Para mayores informes, comunicarse con: ​Pablo Miranda. Correo: repositorio #para# filos.unam.mx



* Descripción:



Correo electrónico: