Groq
Ultra-fast AI inference with custom LPU hardware
Descripción General
Groq provides the fastest AI inference available using their custom Language Processing Unit (LPU) hardware. Run models like Llama and Mixtral at hundreds of tokens per second.
Características
Cómo Empezar
Sign up at console.groq.com for a free API key. Use the OpenAI-compatible endpoint with base_url='https://api.groq.com/openai/v1'.
Precios
Free tier / Pay per token
Ver detalles de preciosPreguntas Frecuentes
How fast is Groq?
Groq delivers 500+ tokens/second for Llama 3 — roughly 10x faster than typical GPU-based inference.
Lee artículos sobre IA y diseño
Mantente al día con las últimas tendencias y consejos en diseño e inteligencia artificial
Aprende habilidades de IA
Descubre habilidades prácticas para usar herramientas de IA de manera efectiva