Los desarrolladores chinos de inteligencia artificial han encontrado una manera de utilizar los chips estadounidenses más avanzados sin traerlos a China.
Están trabajando con agentes para acceder a potencia computacional en el extranjero, a veces disfrazando su identidad utilizando técnicas del mundo de las criptomonedas.
La táctica surge en respuesta a los controles de exportación de Estados Unidos que han impedido que empresas chinas importen directamente los codiciados chips de inteligencia artificial (IA) desarrollados por Nvidia, con sede en Estados Unidos. Aunque aún es posible que los usuarios chinos lleven físicamente los chips de Nvidia a China recurriendo a una red de vendedores del mercado gris, el proceso es engorroso y no puede satisfacer todas las necesidades de los grandes usuarios.
Un emprendedor que ayuda a las empresas chinas a superar los obstáculos es Derek Aw, un ex minero de bitcoins. Convenció a inversionistas en Dubai y Estados Unidos para que financiaran la compra de servidores de inteligencia artificial que albergaban los potentes chips H100 de Nvidia
En junio, la empresa de Aw instaló más de 300 servidores con los chips en un centro de datos en Brisbane, Australia. Tres semanas después, los servidores comenzaron a procesar algoritmos de inteligencia artificial para una empresa en Beijing.
"Hay demanda. Hay ganancias. Naturalmente, alguien proporcionará el suministro", dijo Aw.
Rentar potencia computacional lejana no es nada nuevo, y muchas empresas globales desplazan datos por todo el mundo utilizando servicios de empresas estadounidenses como Google Cloud, Microsoft Azure y Amazon Web Services. Sin embargo, esas empresas, al igual que los bancos, tienen políticas de "Conoce a tu Cliente" que pueden dificultar que algunos clientes chinos obtengan la potencia computacional más avanzada.
Los compradores y vendedores de potencia computacional y los intermediarios que los conectan no están infringiendo ninguna ley, según abogados familiarizados con las sanciones estadounidenses. Washington tiene como blanco las exportaciones de chips, equipos y tecnología avanzados, pero las empresas de la nube dicen que las reglas de exportación no restringen el acceso de las empresas chinas o sus filiales extranjeras a los servicios de la nube estadounidenses que utilizan chips Nvidia.
En enero, el Departamento del Comercio propuso una regla que busca evitar que entidades extranjeras maliciosas utilicen los servicios de computación en la nube de EU para actividades que incluyen el entrenamiento de grandes modelos de IA. Las empresas de la nube estadounidenses argumentan que la regla no evitará el abuso y, en cambio, podría socavar la confianza de los clientes y debilitar su competitividad.
Contrato inteligente
En las plataformas utilizadas por Aw y otros, los métodos de facturación y pago están diseñados para brindar a los participantes un alto grado de anonimato.
Los compradores y vendedores de potencia computacional usan un "contrato inteligente" en el que los términos se establecen en un libro de registro digital de acceso público. Las partes del contrato se identifican sólo mediante una serie de letras y números y el comprador paga con criptomonedas.
Aw señaló que incluso él podría no conocer la verdadera identidad del comprador. Adicionalmente, él y otros dijeron que las empresas chinas de IA a menudo realizan transacciones vía subsidiarias en Singapur u otros lugares.
"Desde finales del año pasado, ha habido un aumento significativo en el número de clientes chinos en nuestra plataforma", destacó Aw. "A menudo me preguntan si tenemos los chips de Nvidia".
GPUs descentralizados
Plataformas como la de Aw han surgido en los últimos dos años para aprovechar la menor actividad en el campo de las criptomonedas, lo que ha liberado algunas computadoras usadas antes para crear monedas digitales como bitcoin. Estas plataformas intentan reunir potencia computacional repartida por el mundo y rentarla a desarrolladores de IA.
El servicio de venta de potencia computacional diseminada se denomina modelo GPU descentralizado, en referencia a las unidades de procesamiento de gráficos. Los GPUs de Nvidia se utilizan ampliamente en aplicaciones de IA y son codiciadas en estas plataformas. Desde que EU restringió la venta de chips avanzados a China en el 2022, más clientes chinos han recurrido a plataformas descentralizadas para obtener potencia computacional, indican los operadores.
Joseph Tse, que hasta hace poco trabajaba para una startup de IA con sede en Shanghai, dijo que su antiguo patrón recurrió a un servicio de GPU descentralizado tras ya no poder rentar potencia computacional de Amazon Web Services. El servicio organizó más de 400 servidores en un centro de datos en California con chips H100 de Nvidia para ayudar a la empresa para la que trabajaba Tse a entrenar su modelo de IA.
Construyendo clusters más grandes
En una feria de la industria de IA en Singapur en junio, al menos tres empresas de GPUs descentralizados promocionaban plataformas que brindan acceso ilimitado a potencia computacional costeable de Nvidia en todo el mundo. Todos dijeron tener clientes de China.
Las startups y los desarrolladores individuales utilizan las plataformas descentralizadas para crear y operar pequeñas aplicaciones de inteligencia artificial que no requieren potencia computacional pesada ni respuestas en fracciones de segundo. Sin embargo, las redes descentralizadas normalmente no pueden entrenar grandes modelos de IA como el que impulsa ChatGPT. Estos requieren miles de chips para transmitir datos entre ellos rápidamente.
Esa es la razón por la que operadores como Aw están construyendo grupos más grandes de procesadores en un solo lugar, a menudo teniendo en cuenta las necesidades de clientes específicos.
Edge Matrix Computing, fundada en el 2022, es una empresa que busca construir grupos de chips más grandes. EMC ha conectado más de 3 mil GPUs en su red descentralizada, incluyendo chips Nvidia utilizados para el entrenamiento de IA que están sujetos a controles de exportación de EU. Los usuarios compran acceso a los chips con tokens de EMC.
EMC dijo que estaba solicitando a los inversionistas que compraran chips Nvidia H100 -cada uno de los cuales puede costar tanto como un sedán Cadillac- y los ensamblaran en un centro de datos para entrenamiento más intensivo en IA. Los usuarios que compren potencia computacional a granel podrían pagar menos de 2 dólares por cada hora de uso de los H100, destacó.
Mientras tanto, Aw está recaudando más dinero de un grupo de inversionistas en Arabia Saudita y Corea del Sur. Planean construir un grupo de los últimos chips Blackwell de Nvidia para otra empresa de Singapur con matriz china.
"Nadie está violando los controles de exportación", afirmó Aw. "Legalmente, son empresas de Singapur".