Plataforma de API Bincheng: Integración con Modelos de Lenguaje Avanzados y Detección de Contenido

La plataforma Bincheng API ofrece acceso a modelos de lenguaje de vanguardia, incluyendo gpt-4o-mini y gpt-4o-2024-08-06, con capacidades multimodales. Este servicio se integra con la detección de seguridad de contenido de Tencent Cloud para garantizar interacciones seguras y responsables.

El servicio API de Bincheng proporciona una solución robusta para desarrolladores que buscan integrar capacidades avanzadas de procesamiento de lenguaje natural en sus aplicaciones. El equipo de Bincheng se compromete a mantener la estabilidad del servicio y a resolver activamente cualquier problema, con un tiempo de respuesta garantizado de una hora para consultas.

Acceso a la API

La API es accesible a través de las siguientes URL de solicitud:

https://bx-api.online/api/v2/Gptliu/search
https://bx-api.online/v1/chat/completions

Los métodos de solicitud compatibles son POST, y los datos deben enviarse en formato JSON.

Solicitudes de Streaming (SSE) vs. No Streaming

La plataforma soporta tanto solicitudes de streaming (SSE) como no streaming. Las solicitudes de streaming ofrecen una experiencia de usuario mejorada con respuestas más rápidas y una salida gradual de texto.

Formato de Solicitud (Ejemplo SSE streaming):


{
       "messages" : [{"role":"user","content":"¿Quién eres?"}],
       "model": "gpt-4o-mini",
       "stream":true
}

Encabezados de Solicitud:


{
    "Content-Type": "application/json",
    "Authorization": "Bearer TU_TOKEN_AQUI"
}

Obtención de Tokens: Los tokens se pueden obtener visitando la plataforma Bincheng API, navegando a "Bincheng GPT" y luego a "API Key" en la esquina superior derecha. Los nuevos usuarios reciben una asignación gratuita de 10,000 caracteres, y se pueden adquirir más mediante recargas.

Promoción Especial: Ingrese el código "Bincheng Culture" en el centro de canje para recibir 35,000 caracteres adicionales.

La diferencia principal entre las solicitudes de streaming y no streaming radica en la entrega de la respuesta: las solicitudes de streaming devuelven la información de forma incremental, lo que resulta en una mayor velocidad de respuesta percibida. Las solicitudes no streaming esperan a que la respuesta completa sea generada antes de enviarla.

Formato de Respuesta

Las respuestas se devuelven en formato JSON.

Respuesta de Solicitud No Streaming:


{
    "id": "chatcmpl-77dQj73rIl0GJyTpAH4QlcSnhOFKp",
    "object": "chat.completion",
    "created": 1682054221,
    "model": "gpt-40-mini",
    "usage": {
        "prompt_tokens": 13,
        "completion_tokens": 30,
        "total_tokens": 43
    },
    "choices": [
        {
            "message": {
                "role": "assistant",
                "content": "Soy un modelo de lenguaje de inteligencia artificial capaz de responder y comunicarme basándome en la entrada del usuario."
            },
            "finish_reason": "stop",
            "index": 0
        }
    ]
}

Respuesta de Solicitud Streaming (Ejemplo):


data: {"id":"chatcmpl-783jPdq1a1ZG6KQc9pq98FDRSqNmp","object":"chat.completion.chunk","created":1682155323,"model":"gpt-3.5-turbo-0301","choices":[{"delta":{"role":"assistant"},"index":0,"finish_reason":null}]}
data: {"id":"chatcmpl-783jPdq1a1ZG6KQc9pq98FDRSqNmp","object":"chat.completion.chunk","created":1682155323,"model":"gpt-3.5-turbo-0301","choices":[{"delta":{"content":"Soy"},"index":0,"finish_reason":null}]}
data: {"id":"chatcmpl-783jPdq1a1ZG6KQc9pq98FDRSqNmp","object":"chat.completion.chunk","created":1682155323,"model":"gpt-3.5-turbo-0301","choices":[{"delta":{"content":" un"},"index":0,"finish_reason":null}]}
...
data: [DONE]

Funcionalidad de Diálogo Continuo

Para mantener el contexto en conversaciones, las interacciones previas (preguntas y respuestas) deben incluirse en la solicitud. Utilice el prefijo "Q:" para las preguntas y "A:" para las respuestas, separadas por el marcador de fin de texto <|endoftext|>.

Ejemplo de Implementación de Diálogo Continuo:


let conversationHistory = '';
const previousInteractions = [
    { question: "Hola!", answer: "Hola, ¿en qué puedo ayudarte?" },
    { question: "¿Cómo está el clima hoy?", answer: "El clima hoy es soleado." }
];

previousInteractions.forEach(interaction => {
    conversationHistory += ` Q: ${interaction.question} A: ${interaction.answer} <|endoftext|> `;
});

const newQuestion = "Gracias, ¿y mañana?";
conversationHistory += `Q: ${newQuestion} A: `;

// conversationHistory ahora contiene: " Q: Hola! A: Hola, ¿en qué puedo ayudarte? <|endoftext|>  Q: ¿Cómo está el clima hoy? A: El clima hoy es soleado. <|endoftext|> Q: Gracias, ¿y mañana? A: "

Al incluir el historial de conversaciones de esta manera, las respuestas generadas mantendrán el contexto de interacciones anteriores.

Etiquetas: GPT-4o API multimodal Tencent Cloud SSE

Publicado el 7-2 23:54

Friki Work