Bienvenido, soy Miguel y en esta ocasión les traigo este nuevo tutorial.
Labelur le permite clasificar texto multidominio a través de la API REST
. Labelur
utiliza una moderna técnica de aprendizaje zero-shot
para la clasificación de texto multidominio sin necesidad de entrenar un modelo personalizado.
Índice
¿Qué es Labelur?
Labelur es un servicio en línea que realiza clasificación de texto multidominio. ¡Es fácil comenzar! Simplemente use cualquier lenguaje de programación de su elección, como Python
, Java
, Node
o PHP
(¿quién todavía usa PHP?)
Para enviar una solicitud POST
al servidor API de Labelur
con sus datos de texto. Labelur
responderá con la etiqueta del texto dado.
En qué se diferencia Labelur
de otras clasificaciones de texto
La mayoría de los servicios de clasificación de texto solo funcionan con datos específicos del dominio, como el análisis de opiniones, la clasificación de documentos legales o la clasificación de texto general para un tema genérico.
Si desea hacer un clasificador para un dominio específico, como bienes raíces, necesita tener datos de entrenamiento y crear un clasificador.
Tradicionalmente, si no tiene datos para entrenar un modelo personalizado, no puede producir un buen clasificador de texto.
¡Clasifiquemos un texto!
Daré una demostración usando Python, pero una vez más, puedes usar cualquier idioma que elijas. Primero, cree una cuenta y obtenga su clave API
.
Usaré la biblioteca de solicitudes de Python para enviar una solicitud POST
al servidor de Labelur
. La biblioteca JSON
se usará para jsonificar
nuestra carga útil de texto, y Matplot
se usará para graficar el resultado final.
import requests import json import matplotlib.pyplot as plt endpoint = "https://api.labelur.com/text_classify" data = {'text':"Understanding mail-in voting in the US", 'labels':["sports","politics","election"] } data = json.dumps(data) headers = { "Authorization": "Bearer f6pgvjaAwWRDcmNOphy_RnnYGY1z7FF33bV2sGzYP8E", "Content-Type":"application/json" } data_from_server = requests.post(endpoint, data=data, headers=headers).json() names = data_from_server['labels'] values = data_from_server['scores'] plt.figure(figsize=(8, 5)) plt.bar(names, values) plt.suptitle('Zero Shot Learning') plt.show()
Aquí, debemos seguir el esquema de carga útil. La carga útil debe tener texto y etiquetas como llaves. Valores para el etiquetas consistirá en una lista de cadenas, y el valor de la texto también será una cadena.
Al elegir posibles clases de etiquetas, debemos elegir una palabra que describa la clase tanto como sea posible.
Por ejemplo, en el texto «entender la votación por correo en los EE. UU.», Las etiquetas que proporcionamos eran "deportes"
, "política"
y "elecciones"
.
A continuación se muestra el resultado devuelto por Labelur
.
Solo nos tomó 3
minutos crear una cuenta y comenzar a clasificar texto usando Labelur
. Si no tiene datos para entrenar su propio modelo o no quiere lidiar con la molestia de implementar modelos ML
, Labelur
podría ser una gran solución para usted.
Gracias por leer este tutorial.
Añadir comentario