AI de código abierto ataca con Meta’s Llama 4

-

spot_img

En los últimos años, el mundo de la IA ha cambiado de una cultura de colaboración abierta a una dominada por sistemas patentados estrechamente guardados. Openai, una compañía literalmente fundada con “Abierta” en su nombre, se pivó a mantener en secreto sus modelos más poderosos después de 2019. Competidores como Anthrope y Google construyeron una IA de vanguardia de manera similar detrás de las paredes de API, accesibles solo en sus términos. Este enfoque cerrado estaba justificado en parte por la seguridad y los intereses comerciales, pero dejó a muchos en la comunidad lamentando la pérdida del espíritu de código abierto temprano.

Ahora, ese espíritu está montando un regreso. Meta modelos LLAMA 4 recientemente lanzados Signal un intento audaz de revivir la IA de código abierto en los niveles más altos, e incluso los jugadores tradicionalmente guardados están tomando nota. El CEO de OpenAi, Sam Altman, admitió recientemente que la compañía estaba “en el lado equivocado de la historia” con respecto a los modelos abiertos y planes anunciados Para una variante GPT-4 de “peso abierto y poderoso”. En resumen, la IA de código abierto es notable, y el significado y el valor de “abierto” están evolucionando.

(Fuente: Meta)

Llama 4: Meta’s Open Challenger a GPT-4O, Claude y Gemini

Meta dio a conocer la Llama 4 como otro desafío directo para los nuevos modelos de los pesos pesados ​​de la IA, posicionándolo como una alternativa de peso abierto. Llama 4 viene en dos sabores disponibles hoy: Llama 4 Scout and Llama 4 Maverick, con especificaciones técnicas alucinadas. Ambos son Mezcla de expertos (MOE) Los modelos que activan solo una fracción de sus parámetros por consulta, lo que permite un tamaño total masivo sin aplastar los costos de tiempo de ejecución. Scout y Maverick cada uno maneje los 17 mil millones de parámetros “activos” (la parte que funciona en cualquier entrada dada), pero gracias a MOE, Scout extiende a los de 16 expertos (parámetros 109B en total) y Maverick en 128 expertos (400b en total). El resultado: los modelos LLAMA 4 ofrecen un rendimiento formidable, y lo hagan con ventajas únicas que incluso faltan algunos modelos cerrados.

Por ejemplo, Llama 4 Scout cuenta con una ventana de contexto de 10 millones de tokens líder en la industria, órdenes de magnitud más allá de la mayoría de los rivales. Esto significa que puede ingerir y razonar sobre documentos verdaderamente masivos o bases de código de una vez. A pesar de su escala, Scout es lo suficientemente eficiente como para ejecutarse en una sola GPU H100 cuando es muy cuantificada, insinuando que los desarrolladores no necesitarán una supercomputadora para experimentar con ella.

Mientras tanto, Llama 4 Maverick está sintonizado para la máxima destreza. Las primeras pruebas muestran que la coincidencia mortuosa de los modelos cerrados en las tareas de razonamiento, codificación y visión. De hecho, Meta ya está burlando de un hermano aún más grande, Llama 4 Behemoth, todavía en entrenamiento, que internamente “Superenta a GPT-4.5, Claude 3.7 Sonnet y Gemini 2.0 Pro en varios puntos de referencia STEM”. El mensaje es claro: los modelos abiertos ya no son de segundo nivel; Llama 4 está disparando para el estado de última generación.

Igualmente importante, Meta ha puesto a Llama 4 inmediatamente disponible para descargar y usar. Los desarrolladores pueden tomar Scout y Maverick del sitio oficial o Cara abrazada Según la licencia comunitaria de Llama 4. Eso significa que cualquier persona, desde un hacker de garaje hasta una empresa Fortune 500, puede meterse debajo del capó, ajustar el modelo a sus necesidades y implementarlo en su propio hardware o nube. Este es un marcado contraste con las ofertas propietarias como el GPT-4O de OpenAi o Claude 3.7 de Anthrope, que se sirven a través de API pagas sin acceso a los pesos subyacentes.

Leer  Jpeg ai difumina la línea entre real y sintético

Meta enfatiza que la apertura de Llama 4 se trata de empoderar a los usuarios: “Estamos compartiendo los primeros modelos en el rebaño de Llama 4, lo que permitirá a las personas construir experiencias multimodales más personalizadas”. En otras palabras, Llama 4 es un juego de herramientas destinado a estar en manos de desarrolladores e investigadores de todo el mundo. Al liberar modelos que pueden rivalizar con los gustos de GPT-4 y Claude in Habilidad, Meta está reviviendo la noción de que la IA de primer nivel no tiene que vivir detrás de un muro de pago.

(Fuente: Meta)

¿El idealismo auténtico o el juego estratégico?

Meta Pitchs Llama 4 en términos grandiosos, casi altruistas. “Nuestro modelo AI de código abierto, Llama, se ha descargado más de mil millones de veces”, CEO Mark Zuckerberg anunciado recientementeagregando que “Los modelos de IA de abastecimiento abierto es esencial para garantizar que las personas de todas partes tengan acceso a los beneficios de la IA”. Este encuadre pinta a Meta como el portador de antorchas de la IA democratizada, una compañía dispuesta a compartir sus modelos de judías corona para el bien mayor. Y, de hecho, la popularidad de la familia Llama respalda esto: los modelos han sido descargados a una escala asombrosa (saltando de 650 millones a mil millones de descargas totales en solo unos meses), y ya están utilizados en producción por compañías como Spotify, AT&T y Doordash.

Meta con orgullo señala que los desarrolladores aprecian la “transparencia, personalización y seguridad” de tener modelos abiertos que pueden ejecutar ellos mismos, lo que “Ayuda a alcanzar nuevos niveles de creatividad e innovación” en comparación con las API de la caja negra. En principio, esto suena como el antiguo espíritu de software de código abierto (piense en Linux o Apache) que se aplica a la IA, una victoria inequívoca para la comunidad.

Sin embargo, no se puede ignorar el cálculo estratégico detrás de esta apertura. Meta no es una organización benéfica, y la “fuente abierta” en este contexto viene con advertencias. En particular, LLAMA 4 se libera bajo una licencia comunitaria especial, no una licencia permisiva estándar, por lo que si bien los pesos del modelo son gratuitos, existen restricciones (por ejemplo, ciertos casos de uso de alta recepción pueden requerir permiso, y la licencia es “propiedad” en el sentido de que está elaborado por Meta). Este no es el Iniciativa de código abierto (OSI) Definición aprobada de código abierto, que ha llevado a algunos críticos a argumentar que las empresas están mal utilizando el término.

En la práctica, el enfoque de Meta a menudo se describe como una IA “de peso abierto” o “disponible”: el código y los pesos están a la vista, pero Meta todavía mantiene cierto control y no revela todo (datos de entrenamiento, por ejemplo). Que no disminuye la utilidad para los usuarios, pero muestra que Meta es estratégicamente Abierto: manteniendo suficientes riendas para protegerse (y tal vez su ventaja competitiva). Muchas empresas están abofeteando las etiquetas de “código abierto” en los modelos de IA mientras retienen los detalles clave, subvirtiendo el verdadero espíritu de apertura.

Leer  Dos horas de conversación sobre IA pueden crear un gemelo digital casi perfecto de cualquier persona

¿Por qué se abriría meta? El panorama competitivo ofrece pistas. Liberar modelos potentes de forma gratuita puede construir rápidamente una amplia base de usuarios de desarrolladores y empresas, Mistral que tienesuna startup francesa, hizo exactamente esto con sus primeros modelos abiertos para ganar credibilidad como un laboratorio de primer nivel.

Al sembrar el mercado con Llama, Meta asegura que su tecnología se vuelve fundamental en el ecosistema de IA, que puede pagar dividendos a largo plazo. Es una estrategia clásica de abrazamiento y extensión: si todos usan su modelo “abierto”, establece indirectamente los estándares y tal vez incluso dirige a las personas hacia sus plataformas (por ejemplo, Meta’s AI Assistant Products Apalancar Llama. También hay un elemento de relaciones públicas y posicionamiento. Meta llega a jugar el papel de los modelos innovadores benevolentes, especialmente en contraste con contrasta Atrazai, que se ha enfrentado a sus críticas a la crítica. Subraya cuán efectivo ha sido el movimiento de Meta.

Después de que el innovador modelo abierto chino Deepseek-R1 surgió en enero y saltó a los modelos anteriores, Altman indicó que OpenAi no quería quedarse en el “lado equivocado de la historia”. Ahora OpenAi promete un modelo abierto con fuertes habilidades de razonamiento en el futuro, Marcando un cambio de actitud. Es difícil no ver la influencia de Meta en ese cambio. La postura de código abierto de Meta es auténtica y Estratégico: realmente amplía el acceso a la IA, pero también es un gambito inteligente para flanquear a los rivales y dar forma al futuro del mercado en los términos de Meta.

Implicaciones para desarrolladores, empresas y el futuro de AI

Para los desarrolladores, el resurgimiento de modelos abiertos como Llama 4 es un soplo de aire fresco. En lugar de estar encerrados en el ecosistema y las tarifas de un solo proveedor, ahora tienen la opción de ejecutar una poderosa IA en su propia infraestructura o personalizarla libremente.

Esta es una gran bendición para las empresas en industrias delicadas (piense en las finanzas, la salud o el gobierno, que desconfían de alimentar datos confidenciales en la caja negra de otra persona. Con Llama 4, un banco u hospital podría desplegar un modelo de idioma de última generación detrás de su propio firewall, ajustándolo en datos privados, sin compartir una token con una entidad externa. También hay una ventaja de costo. Si bien las tarifas de API basadas en el uso para los principales modelos pueden dispararse, un modelo abierto no tiene peaje de uso: solo paga por la potencia informática para ejecutarlo. Las empresas que aumentan las cargas de trabajo de IA pesadas pueden ahorrar significativamente al optar por una solución abierta que pueden escalar internamente.

No es sorprendente que estemos viendo más interés en modelos abiertos de las empresas; Muchos han comenzado a darse cuenta de que el control y la seguridad de la IA de código abierto se alinean mejor con sus necesidades que los servicios cerrados de talla única.

Leer  Fijación de la comprensión limitada de los modelos de difusión de los espejos y reflexiones

Los desarrolladores también obtienen beneficios en innovación. Con el acceso al modelo interno, pueden ajustar y mejorar la IA para los dominios de nicho (ley, biotecnología, idiomas regionales: lo que sea) de manera que una API cerrada pueda nunca atender. La explosión de proyectos impulsados ​​por la comunidad en torno a modelos de LLAMA anteriores, desde chatbots ajustados en el conocimiento médico hasta aplicaciones de teléfonos inteligentes aficionados que ejecutan versiones en miniatura, demostró cómo los modelos abiertos pueden democratizar la experimentación.

Sin embargo, el Renaissance del modelo abierto también plantea preguntas difíciles. ¿Se produce realmente la “democratización” si solo aquellos con recursos informáticos significativos pueden ejecutar un modelo de 400b-paraméter? Si bien Llama 4 Scout y Maverick bajan la barra de hardware en comparación con los modelos monolíticos, todavía son de peso pesado, un punto que no se pierde en algunos desarrolladores cuyas PC no pueden manejarlas sin ayuda en la nube.

La esperanza es que las técnicas como la compresión del modelo, la destilación o las variantes expertas más pequeñas goteen el poder de Llama 4 a tamaños más accesibles. Otra preocupación es el mal uso. Operai y otros largos argumentaron que liberar modelos poderosos abiertamente podría permitir actores maliciosos (para generar desinformación, código de malware, etc.).

Esas preocupaciones permanecen: un Claude o GPT de código abierto podría usarse mal sin los filtros de seguridad que las empresas hacen cumplir con sus API. Por otro lado, los proponentes argumentan que la apertura permite comunidad para identificar y solucionar problemas, haciendo que los modelos sean más robustos y transparentes con el tiempo que cualquier sistema secreto. Hay evidencia de que las comunidades de modelos abiertos se toman en serio la seguridad, desarrollan sus propias barandillas y comparten las mejores prácticas, pero es una tensión continua.

Lo que está cada vez más claro es que nos dirigimos hacia un paisaje híbrido de IA donde los modelos abiertos y cerrados coexisten, cada uno influyendo en el otro. Los proveedores cerrados como OpenAi, Anthrope y Google todavía tienen una ventaja en un rendimiento absoluto, por ahora. De hecho, a fines de 2024, sugirió la investigación Los modelos abiertos siguieron aproximadamente un año detrás de los mejores modelos cerrados en capacidad. Pero esa brecha se está cerrando rápidamente.

En el mercado actual, “AI de código abierto” ya no solo significa proyectos de pasatiempo o modelos más antiguos, ahora está en el corazón de la estrategia de IA para gigantes tecnológicos y nuevas empresas por igual. El lanzamiento de Meta’s Llama 4 es un recordatorio potente del valor en evolución de la apertura. Es a la vez una posición filosófica para democratizar la tecnología y un movimiento táctico en una batalla de la industria de alto riesgo. Para los desarrolladores y las empresas, abre nuevas puertas a la innovación y la autonomía, incluso cuando complica las decisiones con las nuevas compensaciones. Y para el ecosistema más amplio, aumenta la esperanza de que los beneficios de la IA no se bloqueen en manos de algunas corporaciones, si El espíritu de código abierto puede mantenerse firme.

spot_img

LEAVE A REPLY

Please enter your comment!
Please enter your name here

spot_img

Recomendar noticias

Los más populares