Kënschtlech Intelligenz klaut Är Donnéeën op dës Manéier

Ryan Sheikh Mohammed2023-06-21Last Update: 2023-06-21

Kënschtlech Intelligenz klaut Är Donnéeën op dës Manéier

Kënschtlech Intelligenz klaut Är Donnéeën op dës Manéier

Eng Grupp vu Fuerscher op amerikaneschen a Schwäizer Universitéiten, an Zesummenaarbecht mat Google a senger Duechtergesellschaft DeepMind, publizéiert e Fuerschungspabeier, deen erkläert wéi Daten aus Bildkreatiounsplattforme kënne lekken, déi hir Aarbecht op generativen kënschtlechen Intelligenz Modeller baséieren wéi: DALL-E, Imagen, oder stabil Diffusioun.

Si funktionnéieren all op déiselwecht Aart a Weis op Basis vun deem de Benotzer eng spezifesch Textprompt aschreift, zB "Fotell a Form vun engem Avocado", an e Bild aus dem Text bannent Sekonne generéiert kritt.

Déi generativ AI Modeller, déi an dëse Plattformen benotzt ginn, goufen op enger ganz grousser Zuel vu Biller mat enger virbestëmmter Beschreiwung trainéiert. D'Iddi ass datt neural Netzwierker fäeg sinn nei an eenzegaarteg Biller ze generéieren nodeems se eng enorm Quantitéit un Trainingsdaten veraarbecht hunn.

Wéi och ëmmer, déi nei Etude weist datt dës Biller net ëmmer eenzegaarteg sinn. An e puer Fäll kann den neuralen Netzwierk e Bild reproduzéieren dat genee mat engem fréiere Bild dat am Training benotzt gëtt, reproduzéieren. Dëst bedeit datt neural Netzwierker onbedéngt privat Informatioune kënnen opdecken.

Dës Etude fuerdert d'Meenungen eraus datt AI Modeller benotzt fir Biller ze generéieren hir Trainingsdaten net späicheren, an datt Trainingsdaten privat kënne bleiwen wann se net verroden.

Gitt méi Daten

D'Resultater vun Deep Learning Systemer kënnen erstaunlech sinn fir Net-Spezialisten, a si kënnen denken datt se Magie sinn, awer a Wierklechkeet gëtt et keng Magie an der Matière, well all neural Netzwierker baséieren hir Aarbecht um selwechte Prinzip, wat Training ass. mat enger grousser Formatioun vun Donnéeën, a korrekt Beschreiwunge vun all Bild, zum Beispill: Serie vu Biller vun Kazen an Hënn.

Nom Training weist den neurale Netzwierk en neit Bild a gëtt gefrot fir ze entscheeden ob et eng Kaz oder en Hond ass. Vun dësem bescheidenen Punkt ginn d'Entwéckler vun dëse Modeller op méi komplex Szenarie weider, fir e Bild vun engem net existente Hausdéier ze kreéieren mat engem Algorithmus deen op ville Biller vu Kazen trainéiert gouf. Dës Experimenter ginn net nëmme mat Biller gemaach, awer och mat Text, Video a souguer Toun.

Den Ausgangspunkt fir all neural Netzwierker ass den Trainingsdatenset. Neural Netzwierker kënnen net nei Objeten aus der Loft kreéieren. Zum Beispill, fir e Bild vun enger Kaz ze kreéieren, muss den Algorithmus Dausende vu richtege Fotoen oder Zeechnunge vu Kazen studéieren.

Grouss Efforte fir d'Datesätz vertraulech ze halen

An hirem Pabeier bezuelen d'Fuerscher besonnesch Opmierksamkeet op Maschinn Léieren Modeller. Si funktionnéieren wéi follegt: Si verzerren d'Trainingsdaten - Biller vu Leit, Autoen, Haiser, an esou weider - andeems Kaméidi bäigefüügt. Als nächst gëtt den neurale Netzwierk trainéiert fir ze restauréieren dës Biller an hiren ursprénglechen Zoustand.

Dës Method mécht et méiglech Biller vun akzeptabel Qualitéit ze generéieren, awer e potenziellen Nodeel - am Verglach mat Algorithmen an generativen kompetitive Netzwierker, zum Beispill - ass seng méi grouss Tendenz fir Daten ze lecken. Déi ursprénglech Donnéeën kënnen op d'mannst dräi verschidde Manéieren extrahéiert ginn, nämlech:

Benotzt spezifesch Ufroen fir den neurale Netzwierk ze zwéngen fir e spezifescht Quellbild erauszekréien, net eppes eenzegaarteg generéiert baséiert op Dausende vu Biller.
D'Originalbild kann rekonstruéiert ginn och wann nëmmen en Deel dovun verfügbar ass.
Et ass méiglech einfach ze bestëmmen ob e bestëmmt Bild an den Trainingsdaten abegraff ass oder net.
Vill Mol sinn neural Netzwierker faul an amplaz en neit Bild ze produzéieren, produzéiere se eppes aus dem Trainingsset wann et méi Duplikate vum selwechte Bild enthält. Wann e Bild am Trainingsset méi wéi honnert Mol widderholl gëtt, ass et eng ganz grouss Chance datt et a senger bal ursprénglecher Form leeft.

D'Fuerscher hunn awer Weeër gewisen fir d'Trainingsbiller ze recuperéieren déi nëmmen eemol am Original Set opgetaucht sinn.Vun de 500 Biller déi d'Fuerscher getest hunn, huet den Algorithmus dräi vun hinnen zoufälleg erstallt.

Wien huet geklaut?

Am Januar 2023 hunn dräi Kënschtler AI-baséiert Bildgeneratiounsplattforme verklot fir hir Online Biller ze benotzen fir hir Modeller ouni Respekt vum Copyright ze trainéieren.

En neuralt Netzwierk kann tatsächlech de Stil vun engem Kënschtler kopéieren, an domat d'Akommes entzunn. De Pabeier stellt fest, datt an e puer Fäll Algorithmen aus verschiddene Grënn kënne Plagiat maachen, Zeechnungen, Fotoen an aner Biller generéieren, déi bal identesch mat der Aarbecht vun echte Leit sinn.

Also hunn d'Fuerscher Empfehlungen gemaach fir d'Spezifizitéit vun der ursprénglecher Trainingsgrupp ze verbesseren:

1- Eliminéiert Widderhuelung an Trainingsgruppen.
2- Reprocesséiert d'Trainingsbilder, zB andeems Kaméidi bäigefüügt oder d'Hellegkeet ännert; Dëst mécht Datenleckage manner wahrscheinlech.
3- Testen den Algorithmus mat speziellen Trainingsbilder, a verifizéieren dann datt et net onbedéngt präzis reproduzéiert.

wat ass nächst?

Generativ Konschtplattformen hu sécherlech an der leschter Zäit eng interessant Debatt ausgeléist, an där e Gläichgewiicht tëscht Kënschtler an Technologieentwéckler gesicht muss ginn. Engersäits muss d'Urheberrechter respektéiert ginn, an op der anerer Säit ass d'Konscht vun AI ganz anescht wéi d'mënschlech Konscht?

Mä loosst eis iwwer Sécherheet schwätzen. De Pabeier presentéiert e spezifesche Set vu Fakten iwwer just ee Maschinnléiermodell. D'Konzept op all ähnlech Algorithmen ausdehnen, komme mir zu enger interessanter Situatioun. Et ass net schwéier e Szenario virzestellen an deem en intelligenten Assistent vun engem mobilen Netzwierkbetreiber sensibel Firmeninformatioun iwwerhëlt als Äntwert op d'Ufro vun engem Benotzer, oder e schreckleche Skript schreift, deen en ëffentlechen neurale Netzwierk freet fir eng Kopie vun engem Pass ze kreéieren. D'Fuerscher betounen awer, datt esou Problemer fir de Moment theoretesch bleiwen.

Awer et ginn aner richteg Probleemer déi mir elo erliewen, well Skript Generatioun Modeller wéi: ChatGPT ginn elo benotzt fir richteg béiswëlleg Code ze schreiwen.

A GitHub Copilot hëlleft Programméierer Code ze schreiwen mat enger enormer Quantitéit vun Open Source Software als Input. An d'Instrument respektéiert net ëmmer d'Urheberrechter an d'Privatsphär vun Auteuren, deenen hire Code an enger ganz erweiderter Formatioun vun Trainingsdaten opgehalen ass.

Wéi neural Netzwierker entwéckelen, wäerten och Attacke géint si entwéckelen, mat Konsequenzen déi nach kee versteet.

Dem Maguy Farah seng Horoskop Prognosen fir d'Joer 2023

Kënschtlech Intelligenz klaut Är Donnéeën op dës Manéier