Què fan els enginyers d'IA?

Us heu preguntat mai què s'amaga darrere la paraula de moda "enginyer d'IA"? Jo també. Des de fora sona brillant, però en realitat és a parts iguals treball de disseny, barrejant dades desordenades, unint sistemes i comprovant obsessivament si les coses fan el que se suposa que han de fer. Si voleu la versió d'una sola línia: converteixen problemes borrosos en sistemes d'IA que funcionen i que no col·lapsen quan apareixen usuaris reals. La versió més llarga i una mica més caòtica... bé, aquesta és a continuació. Agafeu cafeïna. ☕

Articles que potser t'agradaria llegir després d'aquest:

🔗 Eines d'IA per a enginyers: impulsar l'eficiència i la innovació
Descobreix potents eines d'IA que milloren la productivitat i la creativitat de l'enginyeria.

🔗 La IA substituirà els enginyers de programari?
Explora el futur de l'enginyeria de programari en l'era de l'automatització.

🔗 Aplicacions d'enginyeria de la intel·ligència artificial que transformen les indústries
Descobreix com la IA està remodelant els processos industrials i impulsant la innovació.

🔗 Com convertir-se en enginyer d'IA
Guia pas a pas per començar el teu camí cap a una carrera en enginyeria d'IA.

realment un enginyer d'IA 💡

En el nivell més simple, un enginyer d'IA dissenya, construeix, distribueix i manté sistemes d'IA. El dia a dia sol implicar:

Traduir necessitats vagues de productes o negocis en quelcom que els models realment puguin gestionar.
Recopilar, etiquetar, netejar i, inevitablement, tornar a comprovar les dades quan comencen a desviar-se.
Triar i entrenar models, jutjar-los amb les mètriques adequades i anotar on fallaran.
Embolicant-ho tot en pipelines MLOps perquè es pugui provar, desplegar i observar.
Observant-ho en plena natura: precisió, seguretat, justícia... i ajustaments abans que descarrili.

Si esteu pensant "és enginyeria de programari més ciència de dades amb una mica de pensament de producte", sí, això és el que té a veure.

Què diferencia els bons enginyers d'IA de la resta ✅

Pots conèixer tots els articles d'arquitectura publicats des del 2017 i, tot i així, construir un desastre fràgil. Les persones que prosperen en aquest paper solen:

Pensa en sistemes. Veuen tot el cicle: dades entrants, decisions sortints, tot rastrejable.
No persegueixis la màgia primer. Línies de referència i comprovacions simples abans d'apilar complexitat.
Incorpora els comentaris. El reentrenament i la reversió no són extres, sinó que formen part del disseny.
Anota les coses. Compromisos, suposicions, limitacions: avorrits, però or després.
Tracteu seriosament la IA responsable. Els riscos no desapareixen amb optimisme, es registren i es gestionen.

Mini-història: Un equip de suport va començar amb una línia base de regles i recuperació sense complicacions. Això els va donar proves d'acceptació clares, de manera que quan van canviar un model gran més tard, van tenir comparacions clares i una alternativa fàcil quan es comportava malament.

El cicle vital: realitat desordenada vs. diagrames ordenats 🔁

Planteja el problema. Defineix els objectius, les tasques i què significa ser "prou bo".
Fes la trituració de dades. Neteja, etiqueta, divideix, versiona. Valida sense parar per detectar la deriva de l'esquema.
Experiments model. Prova'n de senzills, comprova les línies de base, itera, documenta.
Envia-ho. Canalitzacions de CI/CD/CT, desplegaments segurs, versions canàries, reversions.
Vigila. Monitoritza la precisió, la latència, la deriva, la justícia i els resultats de l'usuari. Després, torna a entrenar.

En una diapositiva, això sembla un cercle net. A la pràctica, és més com fer malabars amb espaguetis amb una escombra.

IA responsable quan la carretera comença a funcionar 🧭

No es tracta de presentacions boniques. Els enginyers es basen en marcs de treball per fer que el risc sigui real:

El NIST AI RMF proporciona una estructura per detectar, mesurar i gestionar riscos des del disseny fins al desplegament [1].
Els Principis de l'OCDE actuen més com una brúixola: unes directrius generals a les quals s'alineen moltes organitzacions [2].

Molts equips també creen les seves pròpies llistes de control (revisions de privadesa, portes human-in-loop) assignades a aquests cicles de vida.

Documents que no semblen opcionals: Targetes de models i fulls de dades 📝

Dos documents que t'agrairàs més tard:

Targetes model → expliquen l'ús previst, avaluen els contextos i les advertències. Escrites perquè els responsables del producte/legal també les puguin seguir [3].
Fulls de dades per a conjunts de dades → expliquen per què existeixen les dades, què hi ha, possibles biaixos i usos segurs i no segurs [4].

El teu futur (i els teus futurs companys d'equip) et felicitareu en silenci per escriure-les.

Immersió profunda: canals de dades, contractes i control de versions 🧹📦

Les dades es tornen incontrolades. Els enginyers d'IA intel·ligents fan complir els contractes, incorporen xecs i mantenen les versions lligades al codi perquè pugueu rebobinar més tard.

Validació → codificar l'esquema, els rangs, l'actualitat; generar documents automàticament.
Versionament → alinea conjunts de dades i models amb commits de Git, de manera que tinguis un registre de canvis en què realment puguis confiar.

Petit exemple: un minorista va introduir comprovacions d'esquema per bloquejar els feeds dels proveïdors plens de nuls. Aquest únic cable trampa va aturar les repetides caigudes a recall@k abans que els clients se n'adonessin.

Immersió profunda: enviament i escalabilitat 🚢

Aconseguir que un model s'executi a prod no és només model.fit() . Les eines aquí inclouen:

Docker per a un empaquetament coherent.
Kubernetes per a l'orquestració, l'escalat i els desplegaments segurs.
Frameworks MLOps per a canaries, divisions A/B, detecció de valors atípics.

Darrere la cortina hi ha comprovacions d'estat, traçat, programació de CPU vs GPU, ajust del temps d'espera. No és glamurós, absolutament necessari.

Immersió profunda: sistemes GenAI i RAG 🧠📚

Els sistemes generatius aporten un altre gir: la connexió a terra de la recuperació.

Incrustacions + cerca vectorial per a cerques de similitud a gran velocitat.
d'orquestració per encadenar la recuperació, l'ús d'eines i el postprocessament.

Opcions de segmentació, reclassificació i avaluació: aquestes petites decisions decideixen si obtens un chatbot maldestre o un copilot útil.

Habilitats i eines: què hi ha realment a la pila 🧰

Una barreja d'equips clàssics d'aprenentatge automàtic i aprenentatge profund:

Frameworks: PyTorch, TensorFlow, scikit-learn.
Canonades: Flux d'aire, etc., per a treballs programats.
Producció: Docker, K8s, frameworks de servei.
Observabilitat: monitors de deriva, seguidors de latència, comprovacions d'equitat.

Ningú ho fa servir tot . El truc és saber prou coses al llarg del cicle vital per raonar amb seny.

Taula d'eines: allò que realment busquen els enginyers 🧪

Eina	Públic	Preu	Per què és pràctic
PyTorch	Investigadors, enginyers	Codi obert	Flexible, pitònic, comunitat enorme, xarxes personalitzades.
TensorFlow	Equips orientats al producte	Codi obert	Profunditat de l'ecosistema, TF Serving i Lite per a desplegaments.
scikit-learn	Usuaris d'aprenentatge automàtic clàssic	Codi obert	Excel·lents línies de base, API ordenada, preprocessament integrat.
MLflow	Equips amb molts experiments	Codi obert	Manté organitzats els cicles, els models i els artefactes.
Flux d'aire	Gent de la canonada	Codi obert	Els DAG, la programació i l'observabilitat són prou bons.
Docker	Bàsicament tothom	Nucli lliure	El mateix entorn (principalment). Menys baralles de "només funciona al meu portàtil".
Kubernetes	Equips infrapesats	Codi obert	Escalat automàtic, desplegaments, poder empresarial.
Model que serveix als K8s	Usuaris del model K8s	Codi obert	Ració estàndard, hams de deriva, escalable.
Biblioteques de cerca vectorial	Constructors de RAG	Codi obert	Similitud ràpida, compatible amb GPU.
Botigues de vectors gestionades	Equips RAG empresarials	Nivells de pagament	Índexs sense servidor, filtratge, fiabilitat a escala.

Sí, la fraseologia sembla desigual. L'elecció d'eines normalment ho és.

Mesurar l'èxit sense ofegar-se en xifres 📏

Les mètriques que importen depenen del context, però normalment són una barreja de:

Qualitat de la predicció: precisió, recuperació, F1, calibratge.
Sistema + usuari: latència, p95/p99, augment de la conversió, taxes de finalització.
Indicadors d'equitat: paritat, impacte desigual - utilitzats amb cura [1][2].

Les mètriques existeixen per posar de manifest els inconvenients. Si no hi són, canvieu-les.

Patrons de col·laboració: és un esport d'equip 🧑🤝🧑

Els enginyers d'IA solen situar-se a la intersecció amb:

Gent de producte i domini (definiu l'èxit, les barreres de seguretat).
Enginyers de dades (fonts, esquemes, SLA).
Seguretat/legal (privacitat, compliment normatiu).
Disseny/recerca (proves d'usuari, especialment per a GenAI).
Operacions/SRE (temps de funcionament i simulacres d'incendi).

Espereu pissarres blanques cobertes de gargots i debats mètrics acalorats ocasionals: és saludable.

Trampes: el pantà del deute tècnic 🧨

Els sistemes d'aprenentatge automàtic atrauen deutes ocults: configuracions enredades, dependències fràgils, scripts d'enllaç oblidats. Els professionals estableixen barreres de seguretat (proves de dades, configuracions tipificades, reversions) abans que el pantà creixi. [5]

Mantenir la salut mental: pràctiques que ajuden 📚

Comença a poc a poc. Demostra que el procés funciona abans de complicar els models.
Canalitzacions MLOps. CI per a dades/models, CD per a serveis, CT per a reentrenament.
Llistes de control d'IA responsable. Assignades a la vostra organització, amb documents com ara targetes de model i fulls de dades [1][3][4].

Repetició ràpida de preguntes freqüents: resposta d'una frase 🥡

Els enginyers d'IA construeixen sistemes integrals que són útils, provables, desplegables i en certa manera segurs, alhora que fan explícites les contrapartides perquè ningú no quedi a les fosques.

TL;DR 🎯

Prenen problemes difusos → sistemes d'IA fiables mitjançant treball amb dades, modelització, MLOps i monitorització.
El millor és simplificar-ho primer, mesurar sense parar i documentar les suposicions.
IA de producció = pipelines + principis (CI/CD/CT, equitat on calgui, pensament de risc integrat).
Les eines són només eines. Fes servir el mínim que et permeti anar de tren a via → servir → observar.

Enllaços de referència

NIST AI RMF (1.0). Enllaç
Principis d'IA de l'OCDE. Enllaç
Targetes model (Mitchell et al., 2019). Enllaç
Fulls de dades per a conjunts de dades (Gebru et al., 2018/2021). Enllaç
Deute tècnic ocult (Sculley et al., 2015). Enllaç

Troba la darrera versió d'IA a la botiga oficial d'assistents d'IA

Sobre nosaltres

Torna al bloc

País/regió