Loading...

Arma tu PC para Inteligencia Artificial y Bases de Datos

Hardware explicado sin vueltas: qué comprar, por qué, y cuánto rinde.

Componentes clave

Lo esencial y su rol cuando hablamos de IA y datos.

El Corazón Inteligente de la Máquina

CPU, NPU e iGPU: roles complementarios

Introducción

  • CPU: el “cerebro general”. Ejecuta sistema, apps y lógica secuencial. Brilla en baja latencia por hilo y control.
  • NPU: una “mini‑fábrica” para inferencia de IA (matmul y afines) con muy bajo consumo. Ideal para efectos/IA en tiempo real y tareas en segundo plano.

Procesadores (CPU)

AMD Ryzen AI 300 Series “Strix Point”

amd_ryzen_ai

La respuesta de AMD para notebooks con IA integrada (2024/25), mezclando núcleos Zen y una NPU XDNA 2.

CPU (mixta)

  • Zen 5: núcleos “grandes” de alto rendimiento por hilo.
  • Zen 5c: núcleos “compactos” de alta densidad/eficiencia (misma ISA).
  • Cache: L2 total 12 MB, L3 total 24 MB (16 MB Zen 5 + 8 MB Zen 5c).
  • Ejemplo tope: Ryzen AI 9 HX 370 = 12 núcleos / 24 hilos (4 Zen 5 + 8 Zen 5c).

NPU (XDNA 2): ~50 TOPS y soporte BF16; matriz de “tiles” con SRAM local y DMAs para mover datos con muy poco consumo.

Gráficos: iGPU RDNA 3.5 (Radeon 800M), útil para IA por GPU y juegos ligeros.

Por qué importa para IA: más hilos de CPU ayudan en pre/post‑proceso (tokenizar, compresión, I/O); la NPU toma el “matmul” repetitivo; la iGPU acelera cargas grandes optimizadas para GPU.

Intel Core Ultra “Lunar Lake” (Series 2)

El chip de Intel para notebooks finas de 2024/25, con dos tipos de núcleos y una NPU nueva (NPU 4).

CPU (híbrida)

  • P‑cores (Performance): máximo rendimiento por hilo, baja latencia.
  • E‑cores (Efficient): ahorro de energía y paralelismo con buen rendimiento por watt.
  • Thread Director reparte trabajo entre P/E automáticamente.

Ejemplo tope: Core Ultra 9 288V: 8 núcleos/8 hilos → 4 P‑cores (Lion Cove) + 4 E‑cores (Skymont).

NPU: hasta ~48 TOPS para inferencia local (traducción en vivo, efectos de cámara, subtítulos) sin agotar batería.

Gráficos: iGPU Xe2‑LPG (Battlemage) para 3D e IA por GPU cuando conviene.

Memoria: LPDDR5X soldada en el paquete para menor latencia y consumo (beneficia CPU, iGPU y NPU).

Por qué importa para IA: si parte del modelo no entra en la NPU o requiere otra instrucción, la CPU lo toma; si es muy paralelo/gráfico, la iGPU ayuda. Combina baja latencia y buena autonomía.

Placa de video (GPU)

NVIDIA GeForce RTX 5090 (arquitectura Blackwell)

fuente

  • Arquitectura/GPU: Blackwell / GB202; 170 SM.
  • Cómputo: 21.760 CUDA, 680 Tensor (5ª gen), 170 RT (4ª gen).
  • Reloj boost: ~2407 MHz (ref.).
  • Memoria: 32 GB GDDR7, 512‑bit, 28 Gbps, 1.792 GB/s.
  • Caché: L2 96 MB.
  • Interfaz/TGP: PCIe 5.0, ~575 W (ref.).
  • Novedades: FP4 en Tensor Cores (hasta 2× vs FP8), DLSS 4 MFG, SM optimizados para neural shaders.

La RTX 5090 es tope de gama: paralelismo masivo con 32 GB GDDR7 y hardware dedicado para IA y ray tracing. Permite modelos grandes, lotes altos y edición/juegos a resoluciones muy altas.

El “AI Management Processor (AMP)” orquesta tareas dentro de la GPU: prioriza la respuesta del modelo y ordena el render para frames estables. Sin AMP, IA y gráficos compiten por recursos y puede haber picos de latencia.

El SM Blackwell integra Tensor Cores de 5ª gen preparados para neural shaders (FP4/FP8/FP16) con gran rendimiento por vatio en IA.

Resumen: Tensor Cores para redes, RT Cores para geometría, AMP para coordinar, y GDDR7 ultrarrápida alimentando todo: más calidad + más FPS con IA rápida y frames estables.

La Batalla de los SSD: SATA vs NVMe

¿Qué son y por qué importa?

¿Qué es un SSD?

Un SSD usa memoria flash NAND para guardar datos de forma persistente y no tiene partes móviles, a diferencia de los HDD. Esto habilita mayor velocidad, fiabilidad y operación silenciosa.

  • ▪️ SATA → Tecnología más antigua, confiable y económica.
  • ▪️ NVMe → Nueva generación en PCIe, diseñada para velocidad.

Comparativa General

SATA

Disco_SATA
  • Compatibilidad altísima (PCs viejas y nuevas)
  • Más barato por GB
  • Ideal para archivos, backups o datos poco usados
  • Límite práctico ~550–600 MB/s

NVMe

Disco_NVme
  • Usa PCIe (3.000–7.000+ MB/s según generación)
  • Latencia muy baja
  • Formatos M.2 compactos
  • Más caro por GB y requiere soporte de la placa

La ruta vs la autopista

Tecnología Comparación Velocidad aproximada
SATA Ruta de 2 carriles Hasta 550 MB/s
NVMe Autopista de 8 carriles Entre 3000 y 7000 MB/s

Para archivos grandes o IA, NVMe es como pasar de una moto en calle lenta a un F1 en pista libre.

Gráficos

Velocidad secuencial (MB/s)

Latencia (µs, menor es mejor)

Video comparativo!

Fuente: @benchmarker64

¿Por qué es clave para IA y datasets grandes?

En escenarios de entrenamiento con millones de muestras:

  • Con SATA → los datos entran de a poco, como autos en ruta vieja.
  • Con NVMe → fluyen a toda velocidad, como autopista con muchos carriles.
  • ⚡ Menor tiempo de carga
  • ⚡ Menos cuellos de botella
  • ⚡ Entrenamientos más rápidos y eficientes
Tipos y formatos

SATA

  • 2.5 pulgadas (SSD)
  • Conector SATA tradicional
  • Algunos M.2 usan SATA (más lentos)

NVMe

  • M.2 (2280 estándar)
  • U.2 (datacenters)
  • PCIe (tarjeta) rendimiento extremo
¿Cuándo conviene cada uno?

SATA si…

  • Querés ahorrar dinero
  • Guardás archivos, backups o cosas poco usadas
  • Tenés una PC vieja sin ranura M.2

NVMe si…

  • IA, bases de datos, edición, render o gaming
  • Necesitás velocidad para cargar/transferir
  • Rendimiento óptimo en notebooks o PCs nuevas
Versión en tabla (comparativa completa)
Característica SSD SATA SSD NVMe
Interfaz / BusSATA (AHCI)PCIe
Velocidad máx. aprox.Hasta 550 MB/s3.000–7.000 MB/s (según PCIe)
LatenciaMás altaMuy baja
Colas de comando1 cola · 32 comandosHasta 65.535 colas · 65.536 comandos
Formato habitual2.5” / M.2 SATAM.2 NVMe / U.2 / PCIe
CompatibilidadAltísimaPCs modernas con PCIe/M.2
Costo por GBMás económicoMás caro
Uso idealArchivos, backups, uso generalGaming, IA, bases de datos, cargas pesadas
ConsumoBajoBajo – medio
InstalaciónCable SATA + energíaDirecto M.2/PCIe
Capacidades típicas240GB – 4TB500GB – 8TB (+)
LimitacionesTope bus SATA (6Gbps)No compatible con hardware muy viejo
¿Qué es PCIe Gen5?

PCIe Gen5 duplica el ancho de banda de Gen4 (hasta 32 GT/s) y habilita lecturas ~2.5× más rápidas y escrituras hasta ~5× más rápidas que Gen4, logrando el SSD más veloz en PC hoy.

Compatibilidad

Ryzen serie 7000+ y Core 12ª–14ª soportan PCIe 5.0. Requiere motherboard compatible (AMD X670E/X670/B650E; Intel Z890/Z790/Z690). Verificar la placa específica.

Tecnología DirectStorage

API de Microsoft que aprovecha SSD NVMe y GPU-driven IO para reducir latencia y carga en CPU, y acelerar descompresión por GPU.

  • Menos carga sobre CPU
  • Menos cuellos de botella
  • Mejores tiempos de carga

En IA: datasets gigantes cargan más rápido y se alimenta mejor a la GPU.

Bibliografía

Comparativa de Equipos IA

Una bestia para entreno y una opción económica.

🔧 Componente Workstation Extrema Equipo de Entrada (~USD 800)
CPU Threadripper 7980X Ryzen 5 5600
GPU 4× RTX 4090 24GB RTX 4060 Ti 16GB
RAM 256 GB DDR5 ECC 32 GB DDR4 3200
Almacenamiento 4 TB NVMe Gen5 + 16 TB SATA 1 TB NVMe Gen4
Fuente 2000 W 80+ Platinum 750 W 80+ Gold

Configuración de PC para Científico de Datos

Especialista en Modelos de Lenguaje

Optimización de Hardware para Machine Learning

Dos configuraciones enfocadas en LLMs: una premium sin límites de presupuesto y una económica con la mejor relación costo/beneficio.

🏆 "Money is No Object" — La Bestia Absoluta

Especificaciones Premium · $18,000–22,000 USD

  • CPU: AMD Ryzen Threadripper 7980X (64c/128t) — Preprocesamiento paralelo masivo y múltiples experimentos en simultáneo.
  • GPU: 4× NVIDIA RTX 4090 24GB — 96GB VRAM total; clave para modelos grandes. Ada Lovelace con FP8 y transform engines.
  • RAM: 512GB DDR5 4800 (8×64GB) — Datasets masivos en memoria; buffers para 70B+ parámetros.
  • Almacenamiento: 4TB NVMe Gen5 + 16TB SSD SATA — Gen5 para checkpoints; SATA para datasets sin comprimir.
  • Placa Base: ASUS Pro WS TRX50-SAGE WIFI — 4 GPUs full-size sin throttling, 8 slots DDR5, múltiples M.2 con disipación activa.

💡 "El Punto Dulce" — Hasta $800 USD

Especificaciones Económicas · ~$800 USD

  • GPU: NVIDIA RTX 4060 Ti 16GB (~$450) — 16GB VRAM para fine-tuning 7B–13B con eficiencia Ada.
  • CPU: AMD Ryzen 5 5600 (~$130) — 6c suficientes para ETL; PCIe 4.0; 65W TDP.
  • RAM: 32GB DDR4 3200 (2×16GB) (~$65) — Balance costo/capacidad; DDR4 más accesible.
  • Almacenamiento: 1TB NVMe Gen4 (~$80) — 5GB/s+ para carga rápida de modelos y proyectos.
  • Placa Base: ASRock B550M-HDV (~$75) — PCIe 4.0, 4 slots RAM, conectividad confiable.
🔧 Componente Premium (Money is No Object) Económico (El Punto Dulce)
CPUThreadripper 7980X (64c/128t)Ryzen 5 5600 (6c/12t)
GPU4× RTX 4090 24GB (96GB VRAM)RTX 4060 Ti 16GB
RAM512GB DDR5 4800 (8×64GB)32GB DDR4 3200 (2×16GB)
Almacenamiento4TB NVMe Gen5 + 16TB SSD SATA1TB NVMe Gen4
Placa BaseASUS Pro WS TRX50-SAGE WIFIASRock B550M-HDV
Presupuesto$18,000–22,000 USD~$800 USD
🔍 Análisis de compromisos (presupuesto ajustado)

Donde ahorramos inteligentemente

  • CPU: menos núcleos, misma arquitectura
  • RAM: DDR4 vs DDR5
  • GPU: una sola vs múltiples
  • Almacenamiento: calidad sobre cantidad

Donde NO comprometimos

  • ✅ VRAM suficiente (16GB mínimo)
  • ✅ Arquitectura GPU moderna (Ada Lovelace)
  • ✅ SSD NVMe rápido
  • ✅ 32GB RAM mínima
📚 Bibliografía y fuentes
🎯 Conclusión profesional

La configuración premium está optimizada para investigación y producción a escala enterprise, mientras que la configuración económica representa el mínimo viable profesional para un científico de datos serio. Ambas configuraciones priorizan la VRAM sobre todos los demás componentes, reconociendo que en el ML moderno, la memoria de GPU es el recurso más escaso y valioso.

Ambas priorizan la VRAM por encima del resto: en ML moderno, la memoria de GPU es el recurso más escaso y valioso. Recomendación: comenzar con la económica y escalar a cloud para experimentos que excedan su capacidad local.

Mirando al futuro

Cúbits semiconductores y la próxima era

¿Qué son los cúbits semiconductores?

Son bits cuánticos implementados en materiales semiconductores (como silicio) que aprovechan propiedades cuánticas para representar 0 y 1 al mismo tiempo. Buscan combinar escalabilidad de la industria del chip con el poder de la computación cuántica.

  • Objetivo: menor error y mayor estabilidad.
  • Ventaja potencial: fabricación más cercana a procesos CMOS.
  • Reto: sensibilidad al ruido y a condiciones extremas.

Impacto potencial

  • Nuevos materiales y química acelerada
  • Optimización de procesos industriales y logísticos
  • Avances en fármacos y simulaciones complejas
Bibliografía

FAQ

¿GPU o CPU para IA?

Entrenar = GPU. Inferencia liviana/ETL = CPU+RAM.

¿RAM “cuánta”?

32–64 GB para empezar; 128 GB si vas fuerte con DB o VMs.

Certificados SSL Argentina