T'has estat mai assegut gratant-te el cap i dient... d'on surt realment tot això ? Vull dir, la IA no busca entre piles de biblioteques plenes de pols ni mira curts de YouTube d'amagat. Tot i això, d'alguna manera, treu respostes a tot, des de trucs de lasanya fins a la física dels forats negres, com si tingués un armari d'arxiu sense fons a dins. La realitat és més estranya, i potser més intrigant del que podríeu imaginar. Desxifrem-ho una mica (i sí, potser desmuntem un parell de mites pel camí).
És bruixeria? 🌐
No és bruixeria, tot i que de vegades ho sembla. El que passa sota el capó és bàsicament predicció de patrons . Els grans models de llenguatge (LLM) no emmagatzemen fets de la mateixa manera que el teu cervell s'aferra a la recepta de galetes de la teva àvia; en canvi, estan entrenats per endevinar la següent paraula (token) basant-se en el que ha vingut abans [2]. A la pràctica, això vol dir que s'aferren a les relacions: quines paraules s'uneixen, com solen prendre forma les frases, com es construeixen idees senceres com bastides. És per això que el resultat sona correcte, tot i que -amb tota la sinceritat- és mimetisme estadístic, no comprensió [4].
Aleshores, què fa que la informació generada per IA sigui útil ? Un grapat de coses:
-
Diversitat de dades : extreure'n innombrables fonts, no un flux estret.
-
Actualitzacions : sense cicles d'actualització, es torna obsolet ràpidament.
-
Filtratge : idealment, atrapar la brossa abans que s'infiltri (encara que, siguem realistes, aquesta xarxa té forats).
-
Verificació creuada : basant-se en fonts d'autoritat (penseu en la NASA, l'OMS, les principals universitats), que és imprescindible en la majoria de manuals de governança de la IA [3].
Tot i això, de vegades inventa coses, amb confiança. Aquelles anomenades al·lucinacions ? Bàsicament, ximpleries polides dites amb cara seriosa [2][3].
Articles que potser t'agradaria llegir després d'aquest:
🔗 La IA pot predir els números de la loteria?
Explorant mites i realitats sobre les prediccions de loteria amb IA.
🔗 Què significa adoptar un enfocament holístic de la IA?
Comprendre la IA amb perspectives equilibrades sobre ètica i impacte.
🔗 Què diu la Bíblia sobre la intel·ligència artificial
Examinant les perspectives bíbliques sobre la tecnologia i la creació humana.
Comparació ràpida: d'on prové la IA 📊
No totes les fonts són iguals, però cadascuna hi juga el seu paper. Aquí teniu una vista general.
| Tipus de font | Qui l'utilitza (IA) | Cost/Valor | Per què funciona (o no funciona...) |
|---|---|---|---|
| Llibres i articles | Models de llenguatge grans | Inestimable (més o menys) | Coneixement dens i estructurat: envelleix ràpidament. |
| Llocs web i blocs | Pràcticament totes les IA | Gratuït (amb soroll) | Varietat salvatge; barreja de brillantor i absoluta porqueria. |
| Treballs acadèmics | IA amb una forta demanda de recerca | De vegades amb mur de pagament | Rigor + credibilitat, però expressat en argot pesat. |
| Dades de l'usuari | IA personalitzades | Altament sensible ⚠️ | Sastreria elegant, però molts maldecaps de privacitat. |
| Web en temps real | IA vinculades a la cerca | Gratuït (si està en línia) | Manté la informació fresca; l'inconvenient és el risc d'amplificació de rumors. |
L'Univers de Dades d'Entrenament 🌌
Aquesta és la fase d’“aprenentatge infantil”. Imagineu-vos donar a un nen milions de contes, retalls de notícies i entrades de la Viquipèdia alhora. Això és el que sembla la formació prèvia. Al món real, els proveïdors combinen dades disponibles públicament, fonts amb llicència i text generat per l’entrenador [2].
Superposats en capes: exemples humans seleccionats (bones respostes, males respostes, empentes en la direcció correcta) abans que comenci el reforç [1].
Advertència de transparència: les empreses no revelen tots els detalls. Algunes barreres de seguretat són secretes (propietat intel·lectual, problemes de seguretat), de manera que només s'obté una finestra parcial de la barreja real [2].
Cerca en temps real: el complement extra 🍒
Alguns models ara poden treure el cap de la seva bombolla d'entrenament. Això és la generació augmentada per recuperació (RAG), que bàsicament extreu fragments d'un índex o magatzem de documents en directe i els integra a la resposta [5]. Perfecte per a coses que canvien ràpidament, com ara titulars de notícies o preus de les accions.
El problema? Internet és a parts iguals genialitat i brossa. Si els filtres o les comprovacions de procedència són febles, us arrisqueu a que les dades brossa tornin a aparèixer, exactament allò que adverteixen els marcs de risc [3].
Una solució alternativa habitual: les empreses enllacen els models a les seves pròpies bases de dades internes, de manera que les respostes citen una política de recursos humans actual o un document de producte actualitzat en lloc d'improvisar. Pensa: menys moments de "uh-oh", respostes més fiables.
Afinament: el pas de poliment de la IA 🧪
Els models preentrenats en brut són maldestres. Per tant, s'afinen amb precisió :
-
Ensenyant-los a ser útils, inofensius i honestos (mitjançant l'aprenentatge per reforç a partir de la retroalimentació humana, RLHF) [1].
-
Poliment de vores insegures o tòxiques (alineació) [1].
-
Ajustant el to, ja sigui amistós, formal o sarcàstic de manera juganera.
No es tracta tant de polir un diamant com d'atracar una allau estadística perquè et comportis més com un company de conversa.
Els entrebancs i els fracassos 🚧
No fem veure que és impecable:
-
Al·lucinacions : respostes clares que són completament errònies [2][3].
-
Biaix : reflecteix patrons integrats a les dades; fins i tot els pot amplificar si no es controla [3][4].
-
Sense experiència de primera mà : pot parlar de receptes de sopes però mai n'ha tastat cap [4].
-
Excés de confiança : la prosa flueix com si ho sabés, fins i tot quan no ho fa. Els marcs de risc emfatitzen les suposicions de detecció [3].
Per què sembla que ho saps 🧠
No té creences, ni memòria en el sentit humà, i certament no té un jo. Tot i això, com que encadena frases amb fluïdesa, el teu cervell ho llegeix com si ho entengués . El que està passant és només una predicció a gran escala del següent token : calcular bilions de probabilitats en fraccions de segon [2].
La vibració d'"intel·ligència" és un comportament emergent: els investigadors l'anomenen, una mica irònic, l' "lloro estocàstic" [4].
Analogia per a nens 🎨
Imagineu-vos un lloro que ha llegit tots els llibres de la biblioteca. No entén les històries, però pot remesclar les paraules per crear alguna cosa que sembli sàvia. De vegades encerta de ple; de vegades no té sentit, però amb prou habilitat, no sempre es nota la diferència.
En resum: d'on prové la informació de la IA 📌
En termes senzills:
-
Dades de formació massives (públiques + amb llicència + generades per formadors) [2].
-
Ajustament fi amb retroalimentació humana per modelar el to/comportament [1].
-
Sistemes de recuperació quan es connecten a fluxos de dades en directe [5].
La IA no "sap" coses, sinó que prediu text . Aquest és alhora el seu superpoder i el seu taló d'Aquil·les. En resum? Verifiqueu sempre les coses importants amb una font fiable [3].
Referències
-
Ouyang, L. et al. (2022). Entrenament de models lingüístics per seguir instruccions amb retroalimentació humana (InstructGPT) . arXiv .
-
OpenAI (2023). Informe tècnic GPT-4 : barreja de dades amb llicència, públiques i creades per humans; objectiu i limitacions de la predicció del següent token. arXiv .
-
NIST (2023). Marc de gestió de riscos d'IA (AI RMF 1.0) : procedència, fiabilitat i controls de risc. PDF .
-
Bender, EM, Gebru, T., McMillan-Major, A., Mitchell, S. (2021). Sobre els perills dels lloros estocàstics: poden els models lingüístics ser massa grans? PDF .
-
Lewis, P. et al. (2020). Generació augmentada de recuperació per a la PNL intensiva en coneixement . arXiv .