Què és la IA de codi obert?

Què és la IA de codi obert?

Es parla de la IA de codi obert com si fos una clau màgica que ho obre tot. No ho és. Però és una manera pràctica i sense permisos de construir sistemes d'IA que es poden entendre, millorar i distribuir sense demanar a un proveïdor que premi un interruptor. Si us heu preguntat què es considera "obert", què és només màrqueting i com utilitzar-lo realment a la feina, sou al lloc correcte. Preneu un cafè: això us serà útil i potser una mica teòric ☕🙂.

Articles que potser t'agradaria llegir després d'aquest:

🔗 Com incorporar la IA al teu negoci
Passos pràctics per integrar eines d'IA per a un creixement empresarial més intel·ligent.

🔗 Com utilitzar la IA per ser més productiu
Descobreix fluxos de treball d'IA eficaços que estalvien temps i augmenten l'eficiència.

🔗 Què són les habilitats d'IA?
Aprèn les competències clau en IA essencials per als professionals preparats per al futur.

🔗 Què és la IA de Google Vertex?
Entendre la IA Vertex de Google i com simplifica l'aprenentatge automàtic.


Què és la IA de codi obert? 🤖🔓

En la seva forma més simple, la IA de codi obert significa que els ingredients d'un sistema d'IA (el codi, els pesos del model, les pipelines de dades, els scripts d'entrenament i la documentació) es publiquen sota llicències que permeten a qualsevol persona utilitzar-los, estudiar-los, modificar-los i compartir-los, subjecte a termes raonables. Aquest llenguatge bàsic de llibertat prové de la Definició de codi obert i els seus principis de llarga durada de llibertat d'usuari [1]. La peculiaritat de la IA és que hi ha més ingredients que només codi.

Alguns projectes ho publiquen tot: codi, fonts de dades d'entrenament, receptes i el model entrenat. D'altres només publiquen els pesos amb una llicència personalitzada. L'ecosistema utilitza abreviatures descuidades de vegades, així que ho aclarim a la secció següent.


IA de codi obert vs. pesos oberts vs. accés obert 😅

Aquí és on la gent parla per sobre de l'altra.

  • IA de codi obert — El projecte segueix els principis de codi obert en tota la seva pila. El codi està sota una llicència aprovada per OSI i els termes de distribució permeten un ús, modificació i compartició amplis. L'esperit aquí reflecteix el que descriu OSI: la llibertat de l'usuari és el primer [1][2].

  • Pesos oberts : els pesos del model entrenats es poden descarregar (sovint gratuïts) però sota termes personalitzats. Veureu condicions d'ús, límits de redistribució o regles d'informes. La família Llama de Meta ho il·lustra: l'ecosistema de codi és força obert, però els pesos del model es distribueixen sota una llicència específica amb condicions basades en l'ús [4].

  • Accés obert : pots accedir a una API, potser gratuïtament, però no n'obtens els pesos. Útil per a l'experimentació, però no de codi obert.

Això no és només semàntica. Els vostres drets i riscos canvien en aquestes categories. El treball actual d'OSI sobre IA i obertura desglossa aquests matisos en un llenguatge planer [2].


Què fa que la IA de codi obert sigui realment bona ✅

Siguem ràpids i sincers.

  • Auditabilitat : podeu llegir el codi, inspeccionar receptes de dades i rastrejar els passos d'entrenament. Això ajuda amb el compliment normatiu, les revisions de seguretat i la curiositat tradicional. El Marc de gestió de riscos d'IA del NIST fomenta pràctiques de documentació i transparència que els projectes oberts poden satisfer més fàcilment [3].

  • Adaptabilitat : no estàs encasellat en la guia d'un proveïdor. Fes-ho servir. Fes-hi pedaços. Envia'l. Lego, no plàstic enganxat.

  • Control de costos : autoallotjament quan sigui més barat. Transferència al núvol quan no ho sigui. Combina i barreja maquinari.

  • Velocitat de la comunitat : es corregeixen errors, apareixen funcions i aprens dels companys. Desordenat? De vegades. Productiu? Sovint.

  • Claritat de governança : les llicències obertes reals són predictibles. Compareu-ho amb les Condicions del servei de l'API que canvien discretament els dimarts.

És perfecte? No. Però els inconvenients són llegibles: més que els que s'obtenen de molts serveis de caixa negra.


La pila d'IA de codi obert: codi, pesos, dades i cola 🧩

Pensa en un projecte d'IA com una lasanya peculiar. Capes per tot arreu.

  1. Frameworks i runtimes : eines per definir, entrenar i servir models (per exemple, PyTorch, TensorFlow). Les comunitats i els documents saludables importen més que les marques.

  2. Arquitectures de models — El pla: transformadors, models de difusió, configuracions augmentades per recuperació.

  3. Pesos — Els paràmetres apresos durant l'entrenament. «Obert» aquí depèn dels drets de redistribució i ús comercial, no només de la descàrrega.

  4. Dades i receptes : scripts de curació, filtres, augments, programes d'entrenament. La transparència aquí és clau per a la reproductibilitat.

  5. Eines i orquestració : servidors d'inferència, bases de dades vectorials, arnesos d'avaluació, observabilitat, CI/CD.

  6. Llicències : l'eix central silenciós que decideix què pots fer realment. Més informació a continuació.


Llicències 101 per a la IA de codi obert 📜

No cal que siguis advocat. Sí que cal que sàpigues detectar patrons.

  • Llicències de codi permissives : MIT, BSD, Apache-2.0. Apache inclou una concessió explícita de patents que molts equips agraeixen [1].

  • Copyleft — La família GPL requereix que els derivats romanguin oberts sota la mateixa llicència. Potent, però planifiqueu-ho a la vostra arquitectura.

  • Llicències específiques del model : per a pesos i conjunts de dades, veureu llicències personalitzades com la família de llicències d'IA responsable (OpenRAIL). Aquestes codifiquen permisos i restriccions basats en l'ús; algunes permeten l'ús comercial de manera àmplia, d'altres afegeixen barreres de protecció contra el mal ús [5].

  • Creative Commons per a dades : CC-BY o CC0 són habituals per a conjunts de dades i documents. L'atribució es pot gestionar a petita escala; creeu un patró aviat.

Consell professional: Mantingueu un document d'una pàgina on s'enumerin cada dependència, la seva llicència i si es permet la redistribució comercial. Avorrit? Sí. Necessari? També sí.


Taula comparativa: projectes populars d'IA de codi obert i on destaquen 📊

lleugerament desordenat a propòsit: així és com es veuen les notes reals

Eina / Projecte Per a qui és Preu raonable Per què funciona bé
PyTorch Investigadors, enginyers Gratuït Gràfics dinàmics, comunitat enorme, documentació sòlida. Provat en producció.
TensorFlow Equips empresarials, operacions d'aprenentatge automàtic Gratuït Mode gràfic, TF-Serving, profunditat de l'ecosistema. Aprenentatge més pronunciat per a alguns, però encara sòlid.
Transformadors de cares abraçades Constructors amb terminis Gratuït Models preentrenats, canalitzacions, conjunts de dades, ajustos fàcils. Sincerament, una drecera.
vLLM Equips amb mentalitat infraestructural Gratuït Servei LLM ràpid, memòria cau KV eficient, rendiment elevat en GPU comunes.
Llama.cpp Retocadors, dispositius de vora Gratuït Executar models localment en ordinadors portàtils i telèfons amb quantització.
LangChain Desenvolupadors d'aplicacions, prototipadors Gratuït Cadenes, connectors i agents componibles. Victòries ràpides si ho mantens simple.
Difusió estable Creatius, equips de producte pesos lliures Generació d'imatges local o al núvol; fluxos de treball massius i interfícies d'usuari al seu voltant.
Ollama Desenvolupadors que estimen les CLI locals Gratuït Models locals de tipus "pull-and-run". Les llicències varien segons la targeta del model; vés amb compte.

Sí, molt de "gratuït". L'allotjament, les GPU, l'emmagatzematge i les hores de treball no són gratuïts.


Com les empreses utilitzen realment la IA de codi obert a la feina 🏢⚙️

Sentiràs dos extrems: o tothom hauria de fer-ho tot sol, o ningú no ho hauria de fer. La vida real és més fluixa.

  1. Prototipatge ràpid : comença amb models oberts permissius per validar l'experiència d'usuari i l'impacte. Refactoritza més tard.

  2. Servei híbrid : mantingueu un model allotjat en un VPC o local per a trucades sensibles a la privadesa. Recorreu a una API allotjada per a càrregues de cua llarga o punta. Molt normal.

  3. Ajust per a tasques estretes : l'adaptació al domini sovint supera l'escalabilitat en brut.

  4. RAG a tot arreu : la generació augmentada per recuperació redueix les al·lucinacions basant les respostes en les vostres dades. Les bases de dades i els adaptadors vectorials oberts ho fan accessible.

  5. Edge i fora de línia : models lleugers compilats per a ordinadors portàtils, telèfons o navegadors amplien les superfícies de productes.

  6. Compliment i auditoria : com que podeu inspeccionar les entranyes, els auditors tenen alguna cosa concreta per revisar. Combineu-ho amb una política d'IA responsable que s'ajusti a les categories RMF i a la guia de documentació del NIST [3].

Nota de camp petita: un equip SaaS amb interès per la privadesa que he vist (usuaris del mercat mitjà de la UE) va adoptar una configuració híbrida: un model obert petit dins de la VPC per al 80% de les sol·licituds; ràfega a una API allotjada per a sol·licituds rares i de context llarg. Van reduir la latència de la ruta comuna i van simplificar la documentació de la DPIA, sense bullir l'oceà.


Riscos i contratemps que hauries de tenir en compte 🧨

Siguem adults sobre això.

  • Canvi de llicències : un repositori inicia el MIT i després els pesos es mouen a una llicència personalitzada. Mantingueu el registre intern actualitzat o rebreu una sorpresa de compliment [2][4][5].

  • Procedència de les dades : les dades d'entrenament amb drets difusos poden fluir cap als models. Feu un seguiment de les fonts i seguiu les llicències del conjunt de dades, no les vibracions [5].

  • Seguretat : tracta els artefactes del model com qualsevol altra cadena de subministrament: sumes de verificació, versions signades, SBOM. Fins i tot un SECURITY.md mínim supera el silenci.

  • Variància de qualitat : els models oberts varien molt. Avalueu-ho amb les vostres tasques, no només amb les taules de classificació.

  • Cost d'infraestructura ocult : la inferència ràpida requereix GPU, quantificació, emmagatzematge per lots i memòria cau. Les eines obertes ajuden; encara pagues en computació.

  • Deute de governança : si ningú és el propietari del cicle de vida del model, obtindreu un embolic de configuració. Una llista de comprovació lleugera per a MLOps és or pur.


Triar el nivell d'obertura adequat per al vostre cas d'ús 🧭

Un camí de decisió una mica tortuós:

  • Necessiteu lliuraments ràpids amb requisits de compliment lleugers? Comenceu amb models oberts permissius, ajustaments mínims i servei al núvol.

  • Necessiteu privadesa estricta o fora de línia ? Trieu una pila oberta ben suportada, una inferència autoallotjada i reviseu les llicències acuradament.

  • Necessiteu drets comercials amplis i redistribució? Preferiu codi alineat amb OSI més llicències de model que permetin explícitament l'ús comercial i la redistribució [1][5].

  • Necessiteu flexibilitat en la recerca ? Aneu amb permissiu de principi a fi, incloent-hi les dades, per a la reproductibilitat i la compartibilitat.

  • No n'estàs segur? Prova tots dos. Un camí et semblarà millor d'aquí a una setmana.


Com avaluar un projecte d'IA de codi obert com un professional 🔍

Una llista de comprovació ràpida que guardo, de vegades en un tovalló.

  1. Claritat de la llicència : aprovat per OSI per al codi? I què passa amb els pesos i les dades? Hi ha restriccions d'ús que alterin el vostre model de negoci [1][2][5]?

  2. Documentació : instal·lació, inici ràpid, exemples, resolució de problemes. La documentació és un indicador cultural.

  3. Cadència de llançaments : els llançaments etiquetats i els registres de canvis suggereixen estabilitat; els llançaments esporàdics suggereixen gestes heroiques.

  4. Punts de referència i avaluacions : tasques realistes? Avaluacions executables?

  5. Manteniment i governança : propietaris de codi clars, classificació de problemes, capacitat de resposta de relacions públiques.

  6. Ajust de l'ecosistema : funciona bé amb el maquinari, els magatzems de dades, el registre i l'autenticació.

  7. Postura de seguretat : artefactes signats, escaneig de dependències, gestió de CVE.

  8. Senyal de la comunitat : debats, respostes al fòrum, exemples de repositoris.

Per a una alineació més àmplia amb pràctiques fiables, assigneu el vostre procés a les categories i artefactes de documentació RMF de NIST AI [3].


Immersió profunda 1: el mig desordenat de les llicències de models 🧪

Alguns dels models més capaços es troben a la categoria de "pesos oberts amb condicions". Són accessibles, però amb límits d'ús o regles de redistribució. Això pot estar bé si el vostre producte no depèn de reempaquetar el model o enviar-lo a entorns de clients. Si necessiteu , negocieu o trieu una base diferent. La clau és mapejar els vostres plans posteriors amb el real , no amb l'entrada del blog [4][5].

Les llicències d'estil OpenRAIL intenten trobar un equilibri: fomentar la recerca i la compartició obertes, alhora que desincentivar el mal ús. La intenció és bona; les obligacions continuen sent teves. Llegeix els termes i decideix si les condicions s'ajusten a la teva tolerància al risc [5].


Immersió profunda 2: transparència de dades i el mite de la reproductibilitat 🧬

«Sense abocaments de dades complets, la IA de codi obert és falsa.» No del tot. La procedència i les receptes poden oferir una transparència significativa fins i tot quan alguns conjunts de dades en brut estan restringits. Podeu documentar filtres, ràtios de mostreig i heurístiques de neteja prou bé perquè un altre equip pugui aproximar els resultats. La reproductibilitat perfecta és bona. La transparència accionable sovint és suficient [3][5].

Quan els conjunts de dades són oberts, les llicències Creative Commons com CC-BY o CC0 són habituals. L'atribució a escala pot ser incòmoda, així que estandarditzeu la manera de gestionar-la des del principi.


Immersió profunda 3: MLOps pràctics per a models oberts 🚢

Enviar un model obert és com enviar qualsevol servei, més algunes peculiaritats.

  • Capa de servei : els servidors d'inferència especialitzats optimitzen el processament per lots, la gestió de la memòria cau KV i la transmissió de tokens.

  • Quantificació : pesos més petits → inferència més econòmica i desplegament de vores més fàcil. Els compromisos de qualitat varien; mesureu amb les vostres tasques.

  • Observabilitat : registra les indicacions/sortides tenint en compte la privadesa. Mostra per a l'avaluació. Afegeix comprovacions de deriva com ho faries per a l'aprenentatge automàtic tradicional.

  • Actualitzacions : els models poden canviar el comportament subtilment; utilitzar canaries i mantenir un arxiu per a la reversió i les auditories.

  • Arnès d'avaluació : mantingueu un conjunt d'avaluació específic per a cada tasca, no només punts de referència generals. Incloeu-hi indicacions d'adversitat i pressupostos de latència.


Un mini plànol: de zero a un pilot utilitzable en 10 passos 🗺️

  1. Defineix una tasca i una mètrica limitades. Encara no hi ha plataformes grandioses.

  2. Trieu un model base permissiu que sigui àmpliament utilitzat i ben documentat.

  3. Defenseu la inferència local i una API de contenidor prim. Manteniu-ho avorrit.

  4. Afegiu la recuperació a les sortides de terra de les vostres dades.

  5. Prepareu un petit conjunt d'avaluació etiquetat que reflecteixi els vostres usuaris, defectes i tot.

  6. Feu un ajustament precís o un ajustament ràpid només si l'avaluació ho diu.

  7. Quantifica si hi ha picades de latència o de cost. Torna a mesurar la qualitat.

  8. Afegiu registre, indicacions de red-teaming i una política d'abús.

  9. Porta amb una bandera de funció i alliberament per a una petita cohort.

  10. Itera. Envia petites millores setmanalment... o quan sigui realment millor.


Mites comuns sobre la IA de codi obert, una mica desmentits 🧱

  • Mite: els models oberts sempre són pitjors. Realitat: per a tasques específiques amb les dades adequades, els models oberts ajustats poden superar els models allotjats més grans.

  • Mite: obert significa insegur. Realitat: l'obertura pot millorar l'escrutini. La seguretat depèn de les pràctiques, no del secret [3].

  • Mite: la llicència no importa si és gratuïta. Realitat: importa més quan és gratuïta, perquè la llicència n'escala l'ús. Vols drets explícits, no vibracions [1][5].


IA de codi obert 🧠✨

La IA de codi obert no és una religió. És un conjunt de llibertats pràctiques que permeten construir amb més control, una governança més clara i una iteració més ràpida. Quan algú digui que un model és "obert", pregunteu quines capes són obertes: codi, pesos, dades o només accés. Llegiu la llicència. Compareu-la amb el vostre cas d'ús. I després, crucialment, proveu-la amb la vostra càrrega de treball real.

La millor part, curiosament, és cultural: els projectes oberts conviden a contribucions i escrutini, cosa que tendeix a millorar tant el programari com les persones. Potser descobrireu que el moviment guanyador no és el model més gran ni el punt de referència més cridaner, sinó aquell que realment podeu entendre, corregir i millorar la setmana vinent. Aquest és el poder silenciós de la IA de codi obert: no una bala de plata, sinó més aviat una eina multifunció ben gastada que salva el dia constantment.


Massa temps sense llegir 📝

La IA de codi obert tracta sobre la llibertat significativa d'utilitzar, estudiar, modificar i compartir sistemes d'IA. Es manifesta a través de capes: marcs de treball, models, dades i eines. No confongueu el codi obert amb els pesos oberts o l'accés obert. Comproveu la llicència, avalueu-la amb les vostres tasques reals i dissenyeu per a la seguretat i la governança des del primer dia. Feu això i obtindreu velocitat, control i una guia més tranquil·la. Sorprenentment rar, sincerament inestimable 🙃.


Referències

[1] Iniciativa de codi obert - Definició de codi obert (OSD): llegiu-ne més
[2] OSI - Immersió profunda en IA i obertura: llegiu-ne més
[3] NIST - Marc de gestió de riscos d'IA: llegiu-ne més
[4] Meta - Llicència del model Llama: llegiu-ne més
[5] Llicències d'IA responsable (OpenRAIL): llegiu-ne més

Troba la darrera versió d'IA a la botiga oficial d'assistents d'IA

Sobre nosaltres

Torna al bloc