Análisis de contenido de texto basado en procesamiento de lenguaje natural con BERT

González, Jairo; Angulo, Jesús; Andrés, Meza

Análisis de contenido de texto basado en procesamiento de lenguaje natural con BERT

Este artículo se centra en tratar de aliviar los problemas relacionados con el análisis de contenido. Discutiremos el uso de diferentes modelos de clasificación en el aprendizaje automático. Adoptamos este enfoque para resolver algunos problemas relacionados con el análisis cualitativo, como la fiab...

Descripción completa

Detalles Bibliográficos
Autores:	González, Jairo, Angulo, Jesús, Andrés, Meza
Tipo de recurso:	artículo
Fecha de publicación:	2022
País:	Colombia
Institución:	Universidad del Norte
Repositorio:	Repositorio Uninorte
Idioma:	inglés
OAI Identifier:	oai:manglar.uninorte.edu.co:10584/11216
Acceso en línea:	http://hdl.handle.net/10584/11216
Access Level:	acceso abierto
Palabra clave:	clasificación de texto PLN BERT text classification NLP

Descripción
Sumario:	Este artículo se centra en tratar de aliviar los problemas relacionados con el análisis de contenido. Discutiremos el uso de diferentes modelos de clasificación en el aprendizaje automático. Adoptamos este enfoque para resolver algunos problemas relacionados con el análisis cualitativo, como la fiabilidad en el tiempo y la disminución de la mano de obra cualificada. Lo hacemos para automatizar un proceso que suele requerir cantidades considerables de tiempo y recursos, como humanos capacitados y largos plazos de entrega. Exploramos el uso de diferentes técnicas como Random Forest y K-Nearest Neighbor, también probamos diferentes métodos de bolsa de palabras para codificar el texto. También evaluamos un prototipo de la solución propuesta con Representaciones de Codificación Bidireccional de Transformadores (BERT) bajo un conjunto de datos para la detección de noticias falsas debido a las limitaciones de alcance, sin embargo, es aplicable a otro corpus y otro contexto de texto. Finalmente, con los servicios de AWS implementaremos un sistema para la creación de una API que pueda ser utilizada por el usuario común e implementada en sus sistemas de clasificación.

Análisis de contenido de texto basado en procesamiento de lenguaje natural con BERT

Similares en LA Referencia