El chip NorthPole desarrollado por IBM reúne memoria y procesamiento, lo que permite grandes mejoras en el reconocimiento de imágenes y otras tareas informáticas. Crédito: IBM Corp.

Un “alucinante” chip de IBM acelera la IA

El procesador NorthPole de IBM elude la necesidad de acceder a la memoria externa, lo que aumenta la potencia informática y ahorra energía.

Davide Castelvecchi

Investigadores de IBM en San José, California, han desarrollado un chip de computadora inspirado en el cerebro que podría potenciar la inteligencia artificial (IA) trabajando más rápido con mucha menos energía. Su enorme chip procesador NorthPole elimina la necesidad de acceder con frecuencia a la memoria externa y, por lo tanto, realiza tareas como el reconocimiento de imágenes más rápido que las arquitecturas existentes, y al mismo tiempo consume mucha menos energía.

“Su eficiencia energética es simplemente alucinante”, afirma Damien Querlioz, investigador de nanoelectrónica de la Universidad de París-Saclay en Palaiseau. El trabajo, publicado en Science (1) , demuestra que la informática y la memoria pueden integrarse a gran escala, afirma. “Siento que el documento sacudirá el pensamiento común en arquitectura de computadoras”.

NorthPole ejecuta redes neuronales: conjuntos de múltiples capas de unidades computacionales simples programadas para reconocer patrones en los datos. Una capa inferior recibe datos, como los píxeles de una imagen; cada capa sucesiva detecta patrones de complejidad creciente y pasa información a la siguiente capa. La capa superior produce una salida que, por ejemplo, puede expresar la probabilidad de que una imagen contenga un gato, un automóvil u otros objetos.

Frenado por un cuello de botella

Algunos chips de computadora pueden manejar estos cálculos de manera eficiente, pero aún necesitan usar una memoria externa llamada RAM cada vez que calculan una capa. Transferir datos entre chips de esta manera ralentiza las cosas, un fenómeno conocido como cuello de botella de Von Neumann, en honor al matemático John von Neumann, quien fue el primero en concebir la arquitectura estándar de las computadoras basada en una unidad de procesamiento y una unidad de memoria separada.

El cuello de botella de Von Neumann es uno de los factores más importantes que ralentizan las aplicaciones informáticas, incluida la IA. También da lugar a ineficiencias energéticas. El coautor del estudio, Dharmendra Modha, ingeniero informático de IBM, dice que una vez estimó que simular un cerebro humano en este tipo de arquitectura podría requerir el equivalente a la producción de 12 reactores nucleares.

NorthPole está formado por 256 unidades informáticas o núcleos, cada uno de los cuales contiene su propia memoria. “Se está mitigando el cuello de botella de Von Neumann dentro de cada núcleo”, dice Modha, científico jefe de computación inspirada en el cerebro de IBM en el centro de investigación Almaden de la compañía en San José.

Los núcleos están conectados entre sí en una red inspirada en las conexiones de materia blanca entre partes de la corteza cerebral humana, dice Modha. Este y otros principios de diseño, la mayoría de los cuales existían antes pero nunca se habían combinado en un solo chip, permiten a NorthPole superar a las máquinas de IA existentes por un margen sustancial en las pruebas estándar de reconocimiento de imágenes. También utiliza una quinta parte de la energía de los chips de IA de última generación, a pesar de no utilizar los procesos de fabricación más recientes y miniaturizados. Si el diseño del NorthPolese implementara con el proceso de fabricación más moderno, su eficiencia sería 25 veces mejor que la de los diseños actuales, estiman los autores.

En el camino correcto

Pero ni siquiera los 224 megabytes de RAM de NorthPole son suficientes para modelos de lenguajes grandes, como los utilizados por el chatbot ChatGPT, que ocupan varios miles de megabytes de datos incluso en sus versiones más simplificadas . Y el chip sólo puede ejecutar redes neuronales preprogramadas que necesitan ser "entrenadas" de antemano en una máquina separada. Pero los autores del artículo dicen que la arquitectura del NorthPolepodría ser útil en aplicaciones en las que la velocidad es crítica, como los coches autónomos.

NorthPole acerca físicamente las unidades de memoria a los elementos informáticos del núcleo. En otros lugares, los investigadores han estado desarrollando innovaciones más radicales utilizando nuevos materiales y procesos de fabricación. Esto permite que las propias unidades de memoria realicen cálculos, lo que en principio podría aumentar aún más la velocidad y la eficiencia.

Otro chip, descrito el mes pasado (2), realiza cálculos en memoria utilizando memristores , elementos de circuito capaces de alternar entre resistencia y conductor. “Ambos enfoques, el de IBM y el nuestro, son prometedores a la hora de mitigar la latencia y reducir los costos de energía asociados con las transferencias de datos", sostiene Bin Gao de la Universidad de Tsinghua, Beijing, coautor del estudio sobre memristores.

Otro enfoque, desarrollado por varios equipos (incluido uno en un laboratorio independiente de IBM en Zúrich, Suiza (3) almacena información cambiando la estructura cristalina de un elemento de circuito. Queda por ver si estos nuevos enfoques pueden ampliarse económicamente.

doi: https://doi.org/10.1038/d41586-023-03267-0

Referencias

1. Modha, D. S. et al. Science 382, 329–335 (2023).Article
2. Zhang, W. et al. Science 381, 1205–1211 (2023).Article 
3. Le Gallo, M. et al. Nature Electron. 6, 680–693 (2023).Article 

 




El contenido al que intenta acceder no se encuentra disponible para su dispositivo.

En breve este contenido estará disponible.