La inteligencia artificial, la misma tecnología que impulsan los chips de Nvidia, ahora alimenta a nuevas startups que buscan alterar la posición de mercado del gigante de los chips. Wafer y Ricursive Intelligence están implementando IA para optimizar software para hardware diverso y agilizar la creación de chips, lo que podría alterar el panorama competitivo. «Queremos maximizar la inteligencia por vatio», afirmó Emilio Andere, cofundador de Wafer, enfatizando la eficiencia sobre los puntos de referencia de potencia bruta.
El panorama del hardware de inteligencia artificial está cambiando, con nuevas empresas aplicando la propia IA para abordar desafíos de ingeniería complejos que durante mucho tiempo han reforzado el dominio de actores establecidos como Nvidia. Mientras que las unidades de procesamiento gráfico (GPU) de Nvidia siguen siendo la columna vertebral para entrenar los modelos de IA más grandes, una nueva ola de innovación se centra en hacer que cualquier chip funcione de manera óptima. Wafer, una startup que recientemente obtuvo 4 millones de dólares en financiación inicial, está a la vanguardia de este movimiento.
La empresa entrena modelos de IA para realizar una de las tareas más exigentes en ingeniería de software: optimizar el código para que se ejecute con máxima eficiencia en chips de silicio específicos. Esto implica generar lo que se conoce como código de kernel, la capa de software que interactúa directamente con el hardware de un chip, un proceso que históricamente ha requerido una experiencia humana altamente especializada. Emilio Andere, cofundador y director ejecutivo de Wafer, explicó que su enfoque implica el aprendizaje por refuerzo en modelos de código abierto.
Enseñan a estos modelos a escribir código de kernel desde cero. Más allá de esto, Wafer también integra «arneses agénticos» con modelos de lenguaje grandes existentes, como Claude de Anthropic y GPT de OpenAI, para mejorar su capacidad de escribir código directo al chip. Esta estrategia dual tiene como objetivo crear software altamente eficiente adaptado para diversas arquitecturas de hardware.
Optimizar el software para diferentes diseños de chips ha sido durante mucho tiempo un cuello de botella para las empresas que se aventuran más allá del ecosistema de Nvidia. Si bien muchos chips de gama alta de competidores como AMD, Trainium de Amazon y las TPU de Google ofrecen un rendimiento de punto flotante comparable al silicio de primera categoría de Nvidia, el desafío radica en su programabilidad. Nvidia construyó un ecosistema de software integral, que incluye bibliotecas y herramientas, que simplifica el desarrollo y mantenimiento de código para sus GPU.
Esto facilita el trabajo a los desarrolladores. Otras arquitecturas de chips a menudo carecen de este soporte robusto, lo que dificulta incluso a las grandes empresas tecnológicas alcanzar el máximo rendimiento de forma independiente. Considere la experiencia de Anthropic, una destacada empresa de investigación de IA.
Cuando Anthropic optó por construir sus modelos de IA en el hardware Trainium de Amazon, se enfrentó a la considerable tarea de reescribir por completo el código de su modelo. Esto fue necesario para asegurar que el software se ejecutara de la manera más eficiente posible en el nuevo hardware no-Nvidia. Tales esfuerzos son costosos y requieren mucho tiempo.
Requieren un conjunto de habilidades específico. Andere cree que la IA, que ya ha logrado capacidades sobrehumanas en la escritura de código general, pronto erosionará esta ventaja de software. «La ventaja competitiva reside en la programabilidad del chip», observó Andere, refiriéndose a las extensas herramientas de software que Nvidia proporciona. «Creo que es hora de empezar a reconsiderar si eso es realmente una ventaja competitiva sólida.» Este cambio podría democratizar el acceso a la computación de alto rendimiento, permitiendo que una gama más amplia de empresas aproveche hardware diverso sin los prohibitivos costos generales de ingeniería. Más allá de optimizar el software para el silicio existente, otra startup, Ricursive Intelligence, está abordando un desafío aún más fundamental: diseñar los propios chips utilizando inteligencia artificial.
Cofundada por las exingenieras de Google Azalia Mirhoseini y Anna Goldie, Ricursive está desarrollando métodos novedosos para automatizar y acelerar el diseño de chips, un campo tradicionalmente dominado por ingenieros humanos altamente especializados. Diseñar chips de computadora es un proceso intrincado y exigente. Los ingenieros deben organizar con precisión miles de millones de componentes en una pequeña pieza de silicio, optimizando diversas funcionalidades como la velocidad, el consumo de energía y la eficiencia térmica.
Después de un diseño inicial, el rendimiento del chip se somete a rigurosas pruebas y verificación a través de un ciclo iterativo antes de que pueda ser enviado a una fundición para su fabricación. Esto requiere una inmensa cantidad de tiempo y recursos. Mirhoseini, también profesora asistente en la Universidad de Stanford, explicó que Ricursive se enfoca en «los pilares más complejos del diseño de chips —el diseño físico y la verificación del diseño», dos de los aspectos que consumen más tiempo.
Mirhoseini y Goldie desarrollaron previamente un método impulsado por IA en Google que optimizó la disposición de componentes clave dentro de los chips de computadora. Ese enfoque transformó los procesos internos de diseño de procesadores de Google y desde entonces se ha convertido en una técnica ampliamente adoptada en toda la industria para organizar características en varios chips. Ricursive tiene como objetivo construir sobre este éxito, automatizando más elementos del flujo de trabajo de diseño e integrando modelos de lenguaje grandes.
El objetivo es permitir que los ingenieros utilicen lenguaje natural para describir cambios deseados o hacer preguntas específicas sobre el diseño de un chip, avanzando hacia un futuro donde uno podría «diseñar por intuición» un chip, como sugirió Goldie. El potencial de la IA para codiseñar tanto chips como algoritmos ofrece una visión de mejora recursiva de la IA. Goldie describió un futuro en el que la IA podría ajustar su propio silicio y código, creando una «ley de escalado para el diseño de chips». Este concepto sugiere un bucle de retroalimentación continuo donde el hardware diseñado por IA mejora la capacidad de la IA para diseñar hardware aún mejor, acelerando el ritmo de la innovación.
Los inversores están prestando mucha atención a estos desarrollos. Ricursive Intelligence ha recaudado rápidamente 335 millones de dólares, alcanzando una valoración de 4 mil millones de dólares en solo unos meses. Esta importante inyección de capital subraya la creencia del mercado en el potencial transformador del diseño de chips impulsado por IA.
La política dice una cosa sobre la competencia del mercado, pero la realidad a menudo está moldeada por estos avances tecnológicos. Lo que esto realmente significa para su familia, o al menos para las empresas tecnológicas que los emplean, es un cambio en quién tiene las claves de la computación avanzada. Si la IA puede democratizar la capacidad de optimizar el código para cualquier chip, e incluso diseñar silicio personalizado, entonces la barrera de entrada para desarrollar IA de vanguardia podría reducirse.
Las empresas más pequeñas podrían obtener la capacidad de innovar a la par de los gigantes, fomentando un ecosistema tecnológico más diverso y competitivo. Esto podría conducir a hardware más especializado y eficiente para tareas específicas de IA, reduciendo potencialmente el costo de ejecutar grandes modelos de IA para las empresas y, por extensión, para los consumidores. Ambas partes reclaman la victoria en la carrera por la innovación.
Aquí están los números: los miles de millones en inversión sugieren un verdadero desafío al status quo. Esta competencia emergente no es meramente teórica. Empresas como Apple, Google y Amazon ya han invertido fuertemente en silicio personalizado durante años para mejorar el rendimiento y la eficiencia en sus productos, desde teléfonos inteligentes hasta plataformas de computación en la nube.
Meta Platforms anunció recientemente planes para desplegar un gigavatio de capacidad de cómputo utilizando un nuevo chip desarrollado con Broadcom. Desplegar silicio personalizado implica escribir código extenso para asegurar un funcionamiento fluido y eficiente. Esta tendencia existente valida el mercado para servicios como los de Wafer y tecnologías como las de Ricursive.
Las implicaciones se extienden más allá del resultado final para los fabricantes de chips. Para los miles de ingenieros especializados en diseño de chips y optimización del rendimiento, estas herramientas de IA representan una nueva frontera. Mientras que algunos podrían temer la automatización, otros la ven como una oportunidad para delegar tareas tediosas y centrarse en la innovación de nivel superior.
La demanda de ingenieros de rendimiento cualificados sigue siendo alta, pero la IA podría aumentar sus capacidades, permitiendo a los equipos lograr más con menos recursos. Este cambio podría redefinir lo que significa ser un ingeniero de hardware en la era de la IA, pasando de la optimización manual a la gestión y guía de agentes de diseño inteligentes. - La IA está empezando a optimizar el código para diversas arquitecturas de chips, desafiando la ventaja del ecosistema de software de Nvidia. - Startups como Wafer están utilizando IA para escribir código de kernel altamente eficiente para hardware no-Nvidia. - Ricursive Intelligence está aplicando IA para automatizar y acelerar procesos fundamentales de diseño de chips, desde el diseño físico hasta la verificación. - Estos desarrollos podrían democratizar el acceso a la computación de alto rendimiento y fomentar una mayor competencia en el mercado de hardware de IA. De cara al futuro, los próximos 12 a 18 meses serán cruciales.
Esté atento a futuras rondas de financiación para estas startups y a anuncios específicos de grandes empresas tecnológicas sobre su adopción de código optimizado por IA o chips diseñados por IA. Cualquier asociación importante entre un gran proveedor de la nube o desarrollador de IA y una de estas empresas emergentes de silicio impulsadas por IA podría señalar un punto de inflexión. La evolución continua de la capacidad de la IA para construir y programar su propio hardware determinará el verdadero alcance de esta disrupción tecnológica.
Puntos Clave
— - La IA está empezando a optimizar el código para diversas arquitecturas de chips, desafiando la ventaja del ecosistema de software de Nvidia.
— - Startups como Wafer están utilizando IA para escribir código de kernel altamente eficiente para hardware no-Nvidia.
— - Ricursive Intelligence está aplicando IA para automatizar y acelerar procesos fundamentales de diseño de chips, desde el diseño físico hasta la verificación.
— - Estos desarrollos podrían democratizar el acceso a la computación de alto rendimiento y fomentar una mayor competencia en el mercado de hardware de IA.
Fuente: Wired
