¿Te preguntas por dónde empezar a usar modelos de lenguaje pequeños? Encuentra los mejores casos de uso donde los modelos de lenguaje pequeños serían mejores que los modelos de lenguaje grandes.¿Te preguntas por dónde empezar a usar modelos de lenguaje pequeños? Encuentra los mejores casos de uso donde los modelos de lenguaje pequeños serían mejores que los modelos de lenguaje grandes.

Cuándo usar modelos de lenguaje pequeños en lugar de modelos de lenguaje grandes

2025/12/15 02:21

Los modelos de lenguaje grandes (LLMs) continúan caminando en la cuerda floja entre la eficiencia y la confianza. Los usuarios los consideran efectivos, pero dudan de su precisión.

También pueden ser excesivos para algunos casos de uso. Por ejemplo, usar LLMs puede no ser la mejor opción para todas las tareas internas de RRHH, dados sus altos costos computacionales.

En todos estos conflictos, un nuevo tipo de modelo está ganando terreno: los modelos de lenguaje pequeños (SLMs). Estos son modelos más simples entrenados en conjuntos de datos más pequeños para realizar una función muy específica. Cumple con todos los requisitos de alta eficiencia, mayor confianza y bajo costo.

Algunos estudios recientes también afirman que los modelos de lenguaje pequeños son el futuro de la IA Agéntica. En este artículo, he enumerado casos de uso donde un SLM sería más eficiente que un LLM.

Principales casos de uso de SLM en diferentes funciones empresariales

Si te preguntas por dónde empezar con tu viaje SLM, he recopilado los mejores casos de uso de SLM en funciones empresariales comunes a continuación. 

Servicio al cliente

Los modelos LLM pueden ser útiles para el servicio al cliente, pero con importantes advertencias. Estos modelos están preentrenados en un vasto conjunto de datos, a menudo extraídos de internet. Parte de este conocimiento puede o no ser aplicable a tu servicio al cliente, especialmente cuando las políticas de la empresa son específicas. Te arriesgas a tener chatbots de cara al cliente que alucinen. Por ejemplo, un chatbot de servicio al cliente en el sitio web de Air Canada prometió un reembolso por duelo a un cliente contra una política que nunca existió.

Los SLMs tienen más sentido para chatbots de clientes y portales de quejas. Estos portales a menudo tratan con problemas/consultas altamente repetitivos y tienen un repositorio limitado de políticas de la empresa a las que referirse. El modelo puede entrenarse fácilmente con datos de tickets de clientes anteriores y políticas de la empresa. Eso es suficiente para que el modelo responda a los clientes.

Por supuesto, el SLM no puede manejar todo, y donde el bot no puede responder a la consulta, siempre puedes involucrar a un humano. Si es un chatbot, puedes proporcionar un número de soporte para que el cliente llame. Si es una plataforma de gestión de tickets, el ticket puede resolverse automáticamente si es un problema conocido para el SLM, o asignarse a un ejecutivo de soporte al cliente. Al menos, puedes estar seguro de que la automatización no está prometiendo algo a un cliente que no es posible.

​Ventas/Marketing 

Los LLMs definitivamente sobresalen en algunos casos de uso en ventas y marketing, especialmente en la creación de contenido. Los datos de entrenamiento más grandes ayudan a manejar diferentes temas. Pero usar LLMs para tareas más específicas como la calificación/nutrición de leads y el alcance personalizado puede no ser la mejor opción. Sus respuestas generalizadas no darán una buena impresión a tus clientes potenciales.

El SLM te ayuda a crear mensajes de alcance más personalizados. Puede entrenarse en tu conjunto de datos propietario para calificar leads. Puedes redactar algunos mensajes de alcance que te hayan funcionado en el pasado y usar modelos SLM para generar más mensajes de alcance basados en ellos. Los SLMs te ayudan a alejarte de los mensajes de alcance genéricos de IA.

Finanzas 

Los LLMs pueden usarse para análisis general del mercado. Pero se queda atrás en tareas de alto riesgo como la detección de fraude y el monitoreo de cumplimiento. Las tasas de fraude están aumentando tanto en cuentas de consumidores como de empresas. A pesar de que las empresas construyen sistemas de detección de fraude, los estafadores siguen encontrando nuevas formas de evitarlos. El modelo necesita un reentrenamiento continuo. Aquí es donde el SLM brilla y el LLM queda en segundo plano.

Se necesita más tiempo y recursos para reentrenar un LLM en comparación con un SLM. El SLM puede actualizarse continuamente con los datos de fraude más recientes para hacer el sistema más robusto.

Lo mismo ocurre con los datos de cumplimiento. Los LLMs pueden incluso tener información de cumplimiento desactualizada, lo que resulta en omisiones. Un SLM entrenado en un conjunto de datos pequeño es fácil de revisar y refinar para garantizar que solo las regulaciones más recientes estén disponibles en la base de conocimientos.

Recursos Humanos 

Los LLMs son excelentes para redactar descripciones generales de trabajo, comunicación con empleados o contenido de capacitación. Las tareas con altos riesgos de cumplimiento (ejemplo: crear documentos de políticas, acuerdos de empleo y documentos de inmigración) son donde las cosas se complican.

Los países o incluso los estados siguen actualizando sus leyes laborales. Por ejemplo, el gobierno australiano aumentó la licencia parental a 24 semanas en 2025, y se extenderá por otras dos semanas a partir de 2026. Nueva York aumenta el salario mínimo por hora para los trabajadores temporales recientemente. Japón comenzó a promover el equilibrio entre la vida laboral y personal y acuerdos de trabajo flexibles para nuevos padres.

Usar LLMs significa verificar continuamente que la base de conocimientos en el backend sea precisa y esté actualizada. Dejar fuera cualquier archivo de política antiguo por error en la base de datos resultaría en alucinaciones.  

Los modelos de lenguaje pequeños significan mucho más control sobre la base de conocimientos y más garantía de cumplimiento. Por ejemplo, Deel AI es un modelo de lenguaje pequeño curado por sus expertos en cumplimiento. Estos expertos actualizan continuamente la base de conocimientos para que obtengas las respuestas más actualizadas y precisas.

Operaciones comerciales

Una nueva encuesta de adopción de IA de G2 muestra que casi el 75% de las empresas utilizan múltiples funciones de IA en las operaciones comerciales diarias. La IA está impulsando la eficiencia operativa y mejorando la productividad. Tanto SLM como LLM tienen un papel que desempeñar en esto.

Los LLMs brillan en tareas estratégicas como gestión de riesgos, previsión de demanda, revisión de proveedores y más. Su amplia base de conocimientos le ayuda a considerar todos los ángulos antes de hacer una sugerencia. Por otro lado, el SLM funciona mejor para trabajos repetitivos. Piensa en la gestión de facturas, seguimiento de envíos, optimización de rutas, verificación de antecedentes o mantenimiento predictivo. Las tareas pueden ejecutarse con un conjunto limitado de reglas y datos pasados de la empresa.

Las empresas se benefician del uso de SLM en tareas rutinarias y repetitivas. Por ejemplo, Checkr, una plataforma de verificación de antecedentes de empleados, cambió de LLM a SLM para automatizar las verificaciones de antecedentes y vio mejor precisión, tiempos de respuesta más rápidos y una reducción de costos de 5X.

SLM vs LLM: ¿Quién gana la batalla?

En la comparación de SLM y LLM, la respuesta no es elegir entre SLM y LLM. El mejor enfoque es usarlos juntos como un modelo híbrido. Tanto SLM como LLM tienen sus propias fortalezas y debilidades. SLM hace un buen trabajo en tareas con alcances bien definidos y conjuntos de datos limitados. Pero para tareas que exigen razonamiento, LLM es una opción mucho mejor.

Tomemos la gestión de la cadena de suministro como ejemplo. Un enfoque híbrido es mejor para la gestión de la cadena de suministro donde:

  • LLM asume tareas estratégicas como análisis de riesgos, previsión de demanda y más
  • SLM automatiza tareas operativas de alto volumen y repetitivas, como gestión de rutas, procesamiento de facturas, etc.

Usar tanto SLM como LLM juntos crea un modelo completo para manejar todos los aspectos de la cadena de suministro. ​

Principales modelos SLM listos para entrenamiento personalizado

Una cosa buena sobre comenzar con tu implementación de SLM es que hay modelos disponibles para ajuste fino. Puedes elegir uno de estos según tu caso de uso:

  1. Meta Llama 3.1 (8B parámetros): Un modelo de alta eficiencia que destaca por casos de uso que requieren soporte multilingüe
  2. Microsoft Phi-3 (3.8B parámetros): Un modelo pequeño perfecto cuando tienes una tarea súper específica que requiere un fuerte razonamiento.
  3. Google Gemma 2 (2B parámetros): Un modelo ligero con capacidades multimodales, que te ayuda a manejar tanto texto como imágenes.

Usar SLMs nunca fue tan fácil

Con más modelos SLM siendo lanzados, ni siquiera tienes que crear ningún modelo desde cero. Solo elige un modelo existente que se adapte a tu caso de uso, construye una base de conocimientos de información para él, y estás listo para comenzar.  

\n

Aviso legal: Los artículos republicados en este sitio provienen de plataformas públicas y se ofrecen únicamente con fines informativos. No reflejan necesariamente la opinión de MEXC. Todos los derechos pertenecen a los autores originales. Si consideras que algún contenido infringe derechos de terceros, comunícate a la dirección service@support.mexc.com para solicitar su eliminación. MEXC no garantiza la exactitud, la integridad ni la actualidad del contenido y no se responsabiliza por acciones tomadas en función de la información proporcionada. El contenido no constituye asesoría financiera, legal ni profesional, ni debe interpretarse como recomendación o respaldo por parte de MEXC.