La extracción abierta de información para el español || VI Coloquio de Linguística Computacional. Ciclo de conferencias

@title_alternative br@

Zhila, Alisa || Gelbukh, Alexander

Repositorio, Facultad de Filosofía y Letras

@collection_name_full1qqq@

Conferencia

FFyL:RU-UNAM:

Datos curatoriales

Nombre de la colección

Repositorio Universitario Digital (FFyL)

Responsables de la colección

Pablo Miranda Quevedo

Colección asociada

@collection_name_full@

Responsables de la colección asociada

@collection_responsible@

Dependencia

Secretaría Académica, Facultad de Filosofía y Letras (FFyL)

Institución

Universidad Nacional Autónoma de México (UNAM)

Identificador

http://hdl.handle.net/10391/4078

Cita

@identifier_citation@

URI

FFyL:RU-UNAM:58617

Número gubernamental

@identifier_govdoc@

ISBN

@identifier_isbn@

ISSN

@identifier_issn@

SICI

@identifier_sici@

ISMN

@identifier_ismn@

Identificador Sword Slug Header

@identifier_slug@

Otro identificador

@identifier_other@

Créditos

@ws:credits@

Autoría

Autor

Zhila, Alisa || Gelbukh, Alexander

Coautores

@contributor_author@

Contribuidores

@contributor@

Editor

Facultad de Filosofía y Letras. Instituto de Ingeniería. Universidad Nacional Autónoma de México

Editor asociado

@contributor_editor@

Supervisor

@contributor_advisor@

Ilustrador

@contributor_illustrator@

Otro

@contributor_other@

Descripción del contenido

Descripción

Conferencia /// La extracción abierta de información para el español. Alisa Zhila. Alexander Gelbukh. Instituto Politécnico Nacional. 19 de agosto de 2013 //// VI Coloquio de Linguística Computacional. Facultad de Filosofía y Letras. Instituto de Ingeniería. Universidad Nacional Autónoma de México. //// Descarga: Pulse botón derecho del ratón sobre el archivo de audio "mp3" que elija y seleccione "Guardar Destino Como..." || La extracción abierta de información (Open Information Extraction en inglés) es la tarea de extraer afirmaciones del texto, sin especificación previa de la relación o dominio y sin vocabulario pre-especificado o un corpus de entrenamiento etiquetado manualmente. Previamente se había demostrado que los sistemas basados en las categorías gramaticales (Parts-of-Speech en inglés) son competitivos con los sistemas basados en el análisis sintáctico y funcionan más rápido para los corpus grandes como la Web. Sin embargo, la implementación de este tipo de sistemas requiere información específica del idioma. Hasta ahora, todo el trabajo se ha hecho para el inglés. En este trabajo presentamos un algoritmo de la extracción abierta de información para el español, basado en el etiquetamiento de categorías gramaticales (POS-tagging en inglés). Describimos la implementación del algoritmo en el sistema ExtrHech para el español. Comparamos los resultados del funcionamiento del sistema con los de los sistemas para el inglés, incluyendo una comparación sobre un conjunto de datos paralelo para inglés y español, y demostramos que el rendimiento de nuestro sistema ExtrHech es comparable con los sistemas del estado-del-arte y que el sistema es más robusto al ruido. Adicionalmente damos un análisis comparativo de los errores en las extracciones para los dos idiomas. //// Alisa Zhila ( alisa.zhila@gmail.com ). Cuenta con licenciatura y maestría en Física y Matemáticas Aplicadas por el Instituto de Física y Tecnología de Moscú. Actualmente está en el proceso del doctorado en Ciencias Computacionales del Instituto Politécnico Nacional. Tiene también un diplomado en traducción profesional. Trabaja en el Centro de Investigación en Computación del IPN en el área de procesamiento de lenguaje natural y extracción de información, entre otras. Ha publicado los artículos "Medida de similitudes semánticas entre pares de palabras" y "Estimación de la calidad de textos en la web", y ha participado en múltiples congresos. Es ganadora del premio "Microsoft Research 2012"

Resumen

@description_abstract@

Origen

@description_provenance@

Patrocinador

@description_sponsorship@

Participantes@description_statementofresponsibility@

Tabla de contenido

@description_tableofcontents@

URI de la descripción

@description_uri@

Versión

@description_version@

Tema

Aplicaciones tecnológicas || Tecnologías del Habla || Linguística Computacional || Siglo XXI || Conferencia en audio || Gramática computacional || Español

Clasificación

@subject_classification@

Clasificación Decimall Dewey

@subject_ddc@

Clasificación Biblioteca del congreso

@subject_lcc@

Temas Biblioteca del Congreso

@subject_lcsh@

Medical Subject Headings

@subject_mesh@

Temas en otros estándares

@subject_other@

Cobertura

@coverage@

Cobertura espacial

@coverage_spatial@

Cobertura temporal

@coverage_temporal@

Idioma

es

Idioma ISO

@language_iso@

Idioma RFC 3066

@language_rfc3066@

Descripción del objeto

Fecha

2013 || 2014-04-28T17:21:09Z || 2014-04-28T17:21:09Z || 2013

Fecha de adquisición

@date_accessioned@

Fecha de disponibilidad

@date_available@

Fecha de creación

@date_created@

Fecha de publicación

@date_issued@

Fecha de recepción

@date_submitted@

Fecha de actualización

@date_updated@

Fuente

@source@

URI de la fuente

http://ru.ffyl.unam.mx:8080/jspui/bitstream/10391/4078/8/CartelColicoSelifo_2013.jpg || http://ru.ffyl.unam.mx:8080/jspui/bitstream/10391/4078/7/VI_CoLiCo_FOTOS_Mesa1_2013.pdf || http://ru.ffyl.unam.mx:8080/jspui/bitstream/10391/4078/2/VI_CoLiCo_A_Zhila_A_Gelbukh_I_Mesa_2013.pdf || http://ru.ffyl.unam.mx:8080/jspui/bitstream/10391/4078/1/VI_CoLiCo_A_Zhila_A_Gelbukh_I_Mesa_2013.mp3

Formato

@format@

Formato extendido

@format_extent@

Medio físico

@format_medium@

Identificador MIME

@format_mimetype@

Relaciones

@relation@

Tiene las siguientes partes

@relation_haspart@

Es parte de

@relation_ispartof@

Es parte de la serie

@relation_ispartofseries@

Tiene una versión

@relation_hasversion@

Es una versión de

@relation_isversionof@

Reemplaza a

@relation_replaces@

Es reemplazado por

@relation_isreplacedby@

Es un formato de

@relation_isformatof@

Basado en

@relation_isbasedon@

Requiere

@relation_requires@

Aparece en

@relation_isreferencedby@

URI de la relación

@relation_uri@

Derechos

@rights@

Propietario de los derechos

@rights_holder@

URI de los derechos

@rights_uri@

Fecha de derechos

@date_copyright@

Información general

Cómo citar esta página

Secretaría Académica, Facultad de Filosofía y Letras (FFyL), %%La extracción abierta de información para el español || VI Coloquio de Linguística Computacional. Ciclo de conferencias%%, objeto digital: Repositorio Universitario Digital (FFyL). En %%Portal de datos abiertos UNAM%% (en línea), México, Universidad Nacional Autónoma de México. Disponible en: http://datosabiertos.unam.mx/FFyL:RU-UNAM:58617 Fecha de actualización: 2014-10-23 18:31:20.0 Fecha de consulta:

Políticas de uso de los datos

@publication_policy@

Contacto de la colección

Para consultar el repositorio de la Facultad de Filosofía y Letras, visite el siguiente enlace: http://ru.ffyl.unam.mx Para mayores informes, comunicarse con: Pablo Miranda. Correo: repositorio #para# filos.unam.mx