TeleChars AI API
⚙️ Configuración
Max Context Tokens: 4096
Max Generation Tokens: 4096
📦 Modelos cargados:
- qwen2.5-3b-instruct: ✅
- qwen2.5-coder-3b-instruct: ✅
- hermes-3-llama-3.2-3b: ✅
- phi-3.5-mini-instruct: ✅
Total modelos: 4/4
🔗 Endpoints disponibles:
GET /generate/<mensaje>[?params]
Devuelve solo el texto generado. Parámetros opcionales:
• system= (instrucciones del sistema)
• temperature= (0.0-2.0)
• top_p= (0.0-1.0)
• top_k= (0-100)
• model= (nombre del modelo)
• max_tokens= (máximo tokens a generar, default: 4096)
• repetition_penalty= (penalización de repetición)
• presence_penalty= (penalización de presencia)
• frequency_penalty= (penalización de frecuencia)
POST /v1/chat/completions
Compatible con OpenAI API
GET /health
Estado del servicio
GET /models
Lista todos los modelos disponibles