![](https://www.aibusinessasia.com/wp-content/uploads/2024/11/alibaba.png)
A pesar de las prohibiciones de chips de EE. UU., el ecosistema de IA de China ha superado las expectativas, especialmente atrayendo la atención internacional de los desarrolladores, ya que la serie Qwen de código abierto de Alibaba ha sido ampliamente adoptada y discutida en la comunidad.
China ha creado un ecosistema de IA completamente separado por varias razones: 1) para disminuir la dependencia de Occidente y 2) las restricciones de censura del Gran Cortafuegos; pero eso no quiere decir que la innovación esté sofocada.
En este momento, hay un conjunto extremadamente dinámico de actores en China en todo el ecosistema de IA, y hoy profundizaremos en el papel que desempeña Alibaba en este espacio.
Compañía | Capa de infraestructura | Capa de modelo | Capa de aplicación |
Alibaba | Alibaba Cloud ofrece una sólida infraestructura en la nube con soporte para modelos de código abierto y amplios servicios de inteligencia artificial. | Qwen-72B y Qwen-1.8B son LLM avanzados desarrollados por Alibaba Cloud, con capacidades de procesamiento multimodal. | Dingtalk, plataforma de chat empresarial Alimama, conjunto de herramientas de optimización de anuncios impulsada por IA para pymes que venden en Tmall y Taobao. |
Tencent | Tencent mejora sus capacidades de IA a través de su red inteligente de alto rendimiento, optimizando el uso de la GPU para la capacitación LLM. | Hunyuan es el LLM interno de Tencent orientado a aplicaciones empresariales, con un enfoque en la eficiencia y la rentabilidad. | Los servicios de inteligencia artificial de Tencent incluyen feeds de noticias personalizados y soluciones de chatbot en todas sus aplicaciones existentes. |
Huawei | Huawei Cloud ofrece una infraestructura de alto rendimiento diseñada para aplicaciones de IA, centrándose en la autosuficiencia tecnológica. | Pangu 3.0 consta de modelos fundamentales, específicos de la industria y de cada escenario, diseñados para diversas aplicaciones en todos los sectores. | Los LLM de Huawei se utilizan en diversas industrias, como las finanzas y la atención médica, para mejorar los esfuerzos de transformación digital. |
ByteDanza | ByteDance aprovecha su infraestructura en la nube para respaldar la implementación de sus LLM, enfatizando la rentabilidad en los servicios de IA. | Doubao es una familia de LLM lanzada por ByteDance, diseñada para diversas aplicaciones con estrategias de precios agresivas. | Aplicaciones como Doubao Chatbot y otras herramientas de inteligencia artificial generativa tienen como objetivo mejorar la interacción del usuario y la generación de contenido. |
Baidu | Baidu Cloud proporciona una infraestructura integral para el entrenamiento y la implementación de modelos de IA, centrándose en los avances tecnológicos en IA. | Ernie es el LLM insignia de Baidu que ha experimentado mejoras significativas en la eficiencia de la capacitación y el rendimiento de la aplicación a lo largo del tiempo. | Las aplicaciones de Baidu utilizan Ernie para mejorar las capacidades de búsqueda, agentes conversacionales y otras soluciones impulsadas por IA. |
Joe Tsai habla sobre la estrategia de inteligencia artificial de Alibaba, centrándose en respaldar la infraestructura de inteligencia artificial aprovechando su negocio en la nube existente.
Manual de estrategias de inteligencia artificial de Alibaba
Alibaba invierte en inteligencia artificial de cinco maneras principales con una estrategia doble.
Estrategia de pila tecnológica de extremo a extremo:
- Creación de un LLM propio: Qwen y oferta de sus LLM a desarrolladores de IA
- Servicio de computación en la nube
- Diseño de chips pensados para procesar aplicaciones de IA.
Estrategia de ecosistema:
- Implementación de IA en sus aplicaciones existentes orientadas al consumidor
- Financiación de empresas de IA en todo el ecosistema
Alibaba es, sin duda, la empresa tecnológica china más conocida a nivel internacional, con un negocio líder en la nube y su propia tecnología LLM. Aunque en China, Baidu y Huawei tienen cada uno sus propios modelos y servicios en la nube, la estrategia centrada en los datos de Baidu siempre se ha centrado más en su tecnología de conducción autónoma y Huawei siempre se ha centrado más en la computación y el hardware, mientras que su LLM se considera más un complemento "agradable de tener" para los clientes empresariales.
Por el contrario, Alibaba ha dicho repetidamente que su objetivo es “hacer que la IA sea accesible para todos”. En la Conferencia Apsara de 2024, El director ejecutivo de Alibaba, Eddie Wu, enfatizó que la compañía está comprometida a apoyar el ecosistema de código abierto, desde chips, servidores y redes hasta almacenamiento y centros de datos.
LLM propietario: Tongyi Qianwen (Qwen)
A la vanguardia de las ofertas de inteligencia artificial de Alibaba se encuentra Tongyi Qianwen, un gran modelo de lenguaje similar a un "superchatbot". Este modelo avanzado es capaz de comprender y generar texto, lo que lo hace adecuado para una amplia gama de aplicaciones, incluida la generación de artículos, respuestas conversacionales y atención al cliente.
La serie Qwen tiene una escala increíble, un rendimiento que supera todos los parámetros, funciones multimodales y un compromiso con la accesibilidad para una amplia gama de usuarios. Alibaba ha puesto esta tecnología a disposición del público, lo que permite que otras empresas la utilicen de forma gratuita para mejorar sus capacidades de servicio al cliente.
“Es el LLM chino más competitivo en comparación con otros como GPT4/4.o en términos de rendimiento general”, afirmó. Leo Jiang, fundador de GroundAI y ex director digital de Huawei.
Agregó que lo que hace especial a Qwen son sus dos formatos: “su servicio LLM basado en API ofrece un tiempo de comercialización más rápido y rentabilidad, mientras que su versión de código abierto brinda más control y privacidad a sus clientes”.
Alibaba lanzó su gran herramienta de desarrollo de lenguaje Tongyi Qianwen en 2023, a la que a menudo se hace referencia como Qwen y que ahora se encuentra en su iteración 2.5. Los modelos Qwen, incluidos Qwen-72B y Qwen-1.8B, se destacan por sus diversos tamaños de parámetros (que van desde 1.8 mil millones a 72 mil millones de parámetros) y sus capacidades multimodales, que les permiten procesar no solo texto, sino también datos de audio y visuales.
Esta flexibilidad se ve reforzada por su entrenamiento en más de 3 billones de tokens, lo que les permite superar a muchos otros modelos de código abierto en diversos puntos de referencia, incluidas la precisión de múltiples tareas y las capacidades de generación de código.
Qwen se ha posicionado como un asistente de IA integral, con cinco casos de uso de aplicación clave:
1) Transcripción y resúmenes de reuniones en tiempo real
2) procesar contenidos extensos y proporcionar resúmenes que requieren una comprensión complicada
3) Creación de presentaciones de PowerPoint con IA
4) traducción simultánea en tiempo real
5) chat de video con un agente de IA que puede ayudar a resolver problemas.
Fuente: Alibaba
La singularidad de Qwen radica en su impresionante tecnología y su fuerte compromiso con los principios de código abierto, ya que Alibaba pone a disposición varias versiones de sus modelos en plataformas como Hugging Face y ModelScope. Algunas personas se han preguntado por qué la empresa decidió abrir su modelo a otros, ya que ha estado invirtiendo capital en IA y ahora simplemente está dando su premio de forma gratuita. Sin embargo, la empresa se ha mostrado firme en su deseo de hacerlo accesible a todos, ya que enfatizó que este enfoque fomenta un entorno colaborativo donde los desarrolladores pueden experimentar e innovar juntos. La monetización puede llegar más adelante y Alibaba seguramente encontrará formas de hacerlo, pero hasta ahora, se ha convertido en un actor clave en la democratización del acceso a tecnologías avanzadas de IA para todos.
Alibaba ha estado entrenando sus modelos de IA de código abierto en gran medida con datos disponibles públicamente en todas sus aplicaciones, como su aplicación de comercio electrónico Taobao, una enorme ventaja competitiva dado que los usuarios activos mensuales superan los 930 millones. Al abrir sus modelos propietarios, ha suscitado un debate sobre si los modelos de IA de código abierto, que suelen ser más transparentes y rentables, en realidad también son más propensos a sufrir abusos.
En particular, las empresas con menos de 100 millones de usuarios activos mensuales pueden utilizar estos modelos de forma gratuita, lo que promueve una adopción más amplia en todas las industrias. Al apoyar el crecimiento de la comunidad de código abierto, Alibaba ha apuntado a empoderar a los usuarios para que aprovechen de manera efectiva las capacidades de IA y, al mismo tiempo, reduzcan la dependencia de tecnologías patentadas.
Jeff Ding de ChinaAI tradujo el artículo de AItechtalk que circuló ampliamente Por qué Qwen es el modelo grande de código abierto más popular del mundo en este momento, que escribió que “según los datos de Hugging Face, la serie/línea de sangre de modelos Qwen ha alcanzado más de 50.000. Es decir, los desarrolladores de todo el mundo han entrenado más de 50.000 modelos derivados basados en la base de la serie Qwen, solo superada por la serie Llama de aproximadamente 70.000. Estos datos son el indicador más convincente para juzgar la influencia a nivel de ecosistema de un modelo”.
Sorprendentemente, los modelos Qwen han despertado un interés significativo en todos los sectores, incluidos el de la automoción, los videojuegos y la investigación científica el año pasado. Los modelos se han descargado más de 40 millones de veces desde su presentación. Además, el modelo liviano Qwen-1.8B está diseñado para su implementación en dispositivos periféricos como teléfonos inteligentes, lo que lo convierte en una opción atractiva para aplicaciones que requieren menos recursos computacionales.
La actualización integral más reciente de Qwen2.5 implica una escala de parámetros más grande, una comprensión más potente de fotos y videos, un modelo de lenguaje de audio a gran escala y modelos de código abierto continuos. No solo se ha mejorado drásticamente, sino que también se ha reducido el costo de las capacidades de inferencia sólidas para respaldar tareas complejas tanto para Qwen-Plus como para Qwen-Turbo.
De cara al futuro, el director ejecutivo Eddie Wu señaló que, si bien el desarrollo de la IA ha avanzado rápidamente, la AGI (inteligencia artificial general) aún se encuentra en sus primeras etapas. Enfatizó la importancia de la colaboración y destacó que el costo de inferencia de API para Tongyi Qianwen se redujo en 97% año tras año, un factor clave que contribuye a su creciente popularidad. De hecho, esto lo verifica Leo, el ex ejecutivo de Huawei, quien señaló que los modelos Qwen ofrecen mayor precisión y veracidad en comparación con la mayoría de los otros modelos con sede en China. Se puede personalizar para casos de uso empresariales que priorizan la precisión de los resultados y apuntan a minimizar las alucinaciones del modelo. además, La mayor ventaja de Qwen en este momento es que ofrece a los desarrolladores una alternativa potente y rentable.
¿Cómo utilizar mejor Qwen?
Qwen se destaca como un modelo de lenguaje grande (LLM) competitivo y comercialmente viable. Su adopción generalizada en la comunidad de código abierto garantiza una validación y un soporte más amplios, mientras que su implementación está respaldada por la infraestructura de clase mundial de Alibaba Cloud. Estos factores hacen de Qwen una opción sólida para las empresas. A continuación, se presentan los cuatro pasos clave para guiar su implementación empresarial de Qwen.
- Definir objetivos de negocio y casos de uso:Concéntrese en casos de uso de alto impacto, como automatizar la atención al cliente, mejorar el análisis de datos o mejorar la generación de contenido.
- Preparación de datos y configuración de la infraestructura:Evaluar y preparar los datos necesarios para entrenar y ajustar el modelo Qwen. Esto incluye limpiar, estructurar y garantizar la disponibilidad de los conjuntos de datos relevantes, ya que entre el 60 y el 70 % del costo total generalmente se encuentra en esta capa.
- Proyecto piloto y evaluación iterativa: Comience con un proyecto piloto a pequeña escala, compare los resultados con los KPI predefinidos y repita rápidamente para lograr mejoras.
- Ampliación e integración: Integre completamente Qwen en sus flujos de trabajo existentes para aprovechar todo su potencial, al tiempo que establece una estructura de gobernanza para monitorear y optimizar su rendimiento.
Nube de Alibaba
La IA y el negocio de la nube son como la mano izquierda y la mano derecha, dijo Joe Tsai.Na podcast en el que hablamos con el gestor de fondos de cobertura noruego Nicolai TangenComo se mencionó anteriormente, cualquiera puede usar LLM de Alibaba a través de API o ir directamente a su modelo de código abierto. Sin embargo, quienes deseen implementar Qwen necesitarán poder de computación en la nube y Alibaba Cloud está ahí para brindarlo.
De hecho, actualmente, el 80% de las empresas tecnológicas de China y la mitad de las grandes empresas modelo del país operan en Alibaba Cloud. Esta escala es sencillamente incomparable. Joe reiteró que, con su servicio en la nube como el mayor proveedor en APAC, Alibaba tiene una enorme ventaja a la hora de recopilar datos y realizar pruebas para su Tongyi Qianwen. El ciclo positivo permite que las dos empresas, en todas las capas de IA, se retroalimenten continuamente.
Además, la empresa ha creado la mayor comunidad de código abierto llamada Alcance del modelo que alberga muchos otros modelos de código abierto en el mercado y cuando los desarrolladores utilizan esos modelos de código abierto, también necesitarán potencia informática, que se ha convertido en el principal impulsor de los ingresos de la nube de Alibaba.
Al proporcionar la infraestructura en la nube a las empresas emergentes, el gigante tecnológico espera cubrir sus apuestas al permitirles acceder de primera mano a la mejor aplicación orientada al consumidor. Proporcionar la infraestructura en la nube permitiría a la empresa acceder a un conjunto diverso de datos en todos los dominios y casos de uso que podría aprovechar para perfeccionar sus propios modelos si se le otorga el permiso. También significaría que la adquisición de talento y la exposición a las innovaciones en el campo serán más accesibles.
Aplicaciones de inteligencia artificial de Alibaba
Veamos ahora el aspecto de las aplicaciones. Alibaba ha integrado ampliamente la IA en sus propias operaciones, utilizándola para recomendaciones de productos en su plataforma de comercio electrónico, servicio de atención al cliente inteligente, segmentación de publicidad potenciada por IA y soluciones impulsadas por IA en servicios en la nube. Además, está buscando formas de utilizar mejor la IA para mejorar la eficiencia logística y otros casos de uso también. Hoy, echemos un vistazo a algunos de los casos de uso más maduros.
El servicio en línea de inteligencia artificial (AI OS) es una plataforma desarrollada por el equipo de ingeniería de búsqueda de la empresa. AI OS integra búsqueda personalizada, recomendaciones y publicidad, y admite varios escenarios comerciales en las plataformas de Alibaba, principalmente enfocándose en aplicaciones de mercado como Taobao. La tecnología originalmente enfocada en las capacidades de búsqueda de Taobao se ha expandido para incluir tecnologías de aprendizaje profundo y varios motores de búsqueda y recomendación.
Dingtalk es un software de chat empresarial, similar a Slack. En Dingtalk, todos los productos están habilitados con IA con un agente de IA integrado para uso empresarial y personal que se lanzó a principios de 2024. El agente de IA es un robot virtual que puede examinar análisis de datos y está equipado con capacidades de memoria, planificación y ejecución.
El formato para interactuar con el agente es a través de un chatbot similar a ChatGPT. Los casos de uso sugeridos por la compañía incluyen el uso del robot como vendedor, personal de TI, administrativo de RR.HH., financiero o de compras y puede ayudar a las empresas a automatizar muchas de las tareas tediosas y repetitivas dentro del proceso de gestión.
Mientras tanto, Alimama es una plataforma que ayuda a las marcas con la optimización de anuncios en las aplicaciones de mercado de comercio electrónico de Alibaba: Tmall/Taobao. Alimama es una unidad de negocios relativamente desconocida de Alibaba, pero en realidad se fundó muy temprano en 2007. Es una plataforma de marketing digital para empresas que venden en las plataformas Taobao o Tmall. La LMA multimedia potenciada por IA se lanzó en abril de este año y ahora se ha aplicado por completo a las aplicaciones 2B. Las herramientas incluyen agentes de ventas de IA capaces de manejar consultas de clientes y realizar tareas básicas de diseño de anuncios para mejorar la eficiencia y la calidad. Además, Alimama ofrece análisis de ventas para presupuestos y precios, herramientas de gestión de inventario para aumentar el ROI y servicios rentables de generación de texto a imagen o video para anuncios. La empresa afirma haber prestado servicios a más de 1 millón de comerciantes en la plataforma y haber reducido significativamente los costos de producción de publicidad.
Invertir para aprovechar todas las posibilidades (oportunidades)
Alibaba ha adquirido e invertido activamente en varias empresas de inteligencia artificial prometedoras en todos los niveles, en particular en aquellas especializadas en el desarrollo de chips de inteligencia artificial y en desarrolladores de LLM. Estas medidas estratégicas tienen como objetivo ampliar las oportunidades de Alibaba en el panorama de la inteligencia artificial en rápida evolución.
Y solo en 2024, Alibaba ha liderado importantes rondas de financiación para múltiples empresas de IA, incluida una inversión de 1.000 millones de dólares en Moonshot AI, que ha visto su valoración dispararse a aproximadamente 2.500 millones de dólares; una ronda de financiación de 691 millones de dólares para Baichuan, que elevó su valoración a alrededor de 2.800 millones de dólares; y un compromiso de más de 600 millones de dólares con MiniMax, que son tres de los cuatro llamados "tigres".
En la actualidad, las cuatro empresas emergentes de IA más valiosas de China han sido apodadas "Los cuatro (pequeños) tigres de la IA", y todas ellas se han fundado en los últimos tres a cinco años y ya han logrado un éxito monumental. Moonshot se valorará en 1.430 millones de dólares, Minimax valorado en 1.420 millones de dólares, Zhipu La IA recauda casi 1.000.000 de T/T y Se dice que Baichuan está valorado en cerca de $2 mil millones.
Las patatas fritas de Alibaba: T-Head
Por último, y a menudo pasado por alto, están los esfuerzos de Alibaba en el desarrollo de hardware. Noticia de último momento: Huawei no es la única gran empresa tecnológica china que desarrolla hardware con chips.
La empresa de chips de Alibaba, Cabeza en T, está logrando avances significativos en el desarrollo de la arquitectura RISC-V como parte del impulso más amplio de China por la autosuficiencia en semiconductores en medio de las restricciones comerciales en curso de Estados Unidos. T-Head se ha centrado en la creación de chips de alto rendimiento que puedan admitir diversas aplicaciones, incluida la inteligencia artificial (IA), el análisis de big data y las transacciones en línea.
Uno de los productos destacados de T-Head es el Zhenyue 510, un chip controlador diseñado para unidades de estado sólido (SSD) empresariales. Lanzado en la conferencia de computación en la nube Apsara de Alibaba, este chip promete mejorar el rendimiento en los centros de datos de Alibaba Cloud al proporcionar una reducción de latencia de 30% para las operaciones de entrada y salida en comparación con las soluciones existentes. Esta innovación es fundamental, ya que permite a Alibaba optimizar sus servicios en la nube y mejorar la eficiencia en el manejo de tareas de procesamiento de datos a gran escala.
Mientras China continúa enfrentando restricciones a la tecnología estadounidense, el enfoque de T-Head en RISC-V representa un movimiento estratégico hacia una posible mayor independencia en el diseño y fabricación de chips.
Lo que sí sabemos es que Alibaba ha adoptado un enfoque holístico para su estrategia de IA. Abarca una pila de tecnología integral y se ha posicionado como un actor clave en el ecosistema, que son todos pilares fundamentales para impulsar aún más los modelos Qwen de manera significativa. Los modelos Qwen, que se basan en una escalabilidad a nivel de infraestructura, hasta el nivel de chip, están diseñados para admitir diversas aplicaciones en el extenso ecosistema de comercio electrónico, aplicaciones e inversión de Alibaba. Este enfoque estratégico no solo mejora las capacidades de los modelos, sino que también garantiza su relevancia y eficacia en varios casos de uso impulsados por la empresa que priorizan la precisión y minimizan las alucinaciones de los modelos. Se ha posicionado con éxito como uno de los actores más importantes, si no EL MÁS IMPORTANTE, en el ecosistema de IA de China.
##
Fuentes: entrevistas, informes de la industria, opiniones de expertos, anuncios de la empresa, material de relaciones con inversores, transcripciones de la Conferencia Aspara y Alizila.
Campo de golf
- Nube de Alibaba Enlace oficial a Qwen
- Instrucciones de Qwen2.5-LLM, última actualización en septiembre de 2024
- Github Qwen2.5: una serie de modelos de lenguaje de gran tamaño que admiten una variedad de escalas de parámetros (de 0,5 B a 72 B), con capacidades mejoradas en la generación de texto largo, seguimiento de instrucciones y comprensión de datos estructurados, y admite 29 idiomas. Sus aplicaciones son adecuadas para la generación de código, la generación de texto y el procesamiento de datos complejos. Qwen2.5 ofrece funciones como cuantificación, inferencia e implementación local, que son compatibles con varios marcos computacionales, como Hugging Face, ModelScope y vLLM, entre otros.
- Github Qwen-VL: es un modelo de lenguaje visual a gran escala que admite entradas de texto e imágenes y tiene capacidades de conversación multilingüe, especialmente en el reconocimiento de texto e imágenes en chino e inglés. El modelo admite el procesamiento de imágenes de alta resolución y el reconocimiento de grano fino, superando a la mayoría de los modelos de código abierto.
- Github Qwen-Audio: es capaz de procesar diversas entradas de audio (como voz humana, sonidos naturales, música, etc.) y generar salidas de texto. Este modelo es adecuado para tareas como reconocimiento de audio, descripción de audio, clasificación de escenas y reconocimiento de emociones.
- Github Qwen2.5-Matemáticas:Admite la solución de problemas matemáticos tanto en chino como en inglés e integra Cadena de Pensamiento (CoT) y Razonamiento Integrado de Herramientas (TIR).
- Github Codificador Qwen2.5:el último modelo de programación de código abierto que admite una ventana de contexto de 128K y cubre 92 lenguajes de programación.
Biografía del autor
Grace escribe sobre IA x Energía, IA x Geopolítica, IA x bigtech en Substack en AI Proem.
También escribe a menudo comentarios para Fortuna, El diplomático, y otras publicaciones internacionales sobre inteligencia artificial, tecnología y gobernanza corporativa. En su vida anterior como periodista, Grace ha informado para CNBC sobre tecnología y negocios en Asia desde Singapur, y su trabajo también ha sido publicado en SCMP, S&P Global Market Intelligence, Yahoo Finance y USA Today.
Las 5 mejores lecturas de Grace:
- La carrera armamentista de la IA está lejos de terminar: los chips son solo la mitad del juego y la infraestructura es la otra parte.
- Por qué los centros de datos no pueden funcionar con energías renovables por completo (todavía)
- Ganancias de las grandes tecnológicas: todos a bordo para la IA
- Baidu, Alibaba y Tencent: duelo de inteligencia artificial
- Un mundo nuclear completamente (nuevo)
Próximo gran análisis en profundidad: Huawei vs. Nvidia y Google
Suscríbete para recibir actualizaciones de las últimas publicaciones del blog
Deja tu comentario: