Жасанды интеллект осылайша деректеріңізді ұрлайды

Райан шейх Мұхаммед2023-06-21Соңғы жаңарту: 2023 ж

Жасанды интеллект осылайша деректеріңізді ұрлайды

Жасанды интеллект осылайша деректеріңізді ұрлайды

Америкалық және Швейцариялық университеттердегі бір топ зерттеушілер Google және оның еншілес ұйымы DeepMind-пен бірлесіп, DALL-E, Imagen, немесе Тұрақты диффузия.

Олардың барлығы пайдаланушының белгілі бір мәтіндік нұсқауды енгізуіне, мысалы, «авокадо түріндегі креслоға» және мәтіннен бірнеше секунд ішінде жасалған кескінді алуға негізделген бірдей жұмыс істейді.

Бұл платформаларда қолданылатын генеративті AI үлгілері алдын ала анықталған сипаттамасы бар өте көп суреттерде оқытылды.Идеясы нейрондық желілер оқу деректерінің үлкен көлемін өңдегеннен кейін жаңа және бірегей кескіндерді жасай алады.

Дегенмен, жаңа зерттеу көрсеткендей, бұл кескіндер әрқашан бірегей бола бермейді.Кейбір жағдайларда нейрондық желі жаттығуда пайдаланылған бұрынғы кескінге дәл сәйкес келетін кескінді қайта жасай алады.Бұл нейрондық желілер байқаусызда жеке ақпаратты ашуы мүмкін дегенді білдіреді.

Бұл зерттеу кескіндерді жасау үшін пайдаланылатын AI үлгілері олардың оқу деректерін сақтамайды және оқу деректері ашылмаған жағдайда құпия болып қалуы мүмкін деген көзқарастарға қарсы тұрады.

Қосымша деректерді беріңіз

Терең оқыту жүйелерінің нәтижелері маман емес адамдар үшін таңқаларлық болуы мүмкін және олар өздерін сиқырлы деп ойлауы мүмкін, бірақ іс жүзінде бұл мәселеде ешқандай сиқыр жоқ, өйткені барлық нейрондық желілер өз жұмысын бір принципке негіздейді, яғни оқыту. деректердің үлкен жинағын және әрбір Суреттің дәл сипаттамаларын пайдалану, мысалы: мысықтар мен иттердің суреттерінің сериясы.

Жаттығудан кейін нейрондық желі жаңа кескінді көрсетеді және оның мысық немесе ит екенін шешуді сұрайды. Осы қарапайым нүктеден бастап, осы модельдерді әзірлеушілер мысықтардың көптеген кескіндері бойынша үйретілген алгоритмді пайдалана отырып, жоқ үй жануарларының бейнесін жасай отырып, күрделі сценарийлерге көшеді. Бұл эксперименттер тек суреттермен ғана емес, мәтінмен, бейнемен және тіпті дыбыспен де жүргізіледі.

Барлық нейрондық желілер үшін бастапқы нүкте – жаттығу деректерінің жинағы.Нейрондық желілер жұқа ауадан жаңа объектілер жасай алмайды. Мысалы, мысықтың бейнесін жасау үшін алгоритм мыңдаған нақты фотосуреттерді немесе мысықтардың сызбаларын зерттеуі керек.

Деректер жиынын құпия сақтауға үлкен күш салу

Зерттеушілер өз мақалаларында машиналық оқыту үлгілеріне ерекше көңіл бөледі.Олар келесідей жұмыс істейді: олар шу қосу арқылы оқу деректерін – адамдардың, көліктердің, үйлердің және т.б. кескіндерді бұрмалайды.Кейін нейрондық желіні қалпына келтіруге үйретеді. бұл суреттерді бастапқы күйіне келтіріңіз.

Бұл әдіс қолайлы сападағы кескіндерді жасауға мүмкіндік береді, бірақ ықтимал кемшілігі – мысалы, генеративті бәсекеге қабілетті желілердегі алгоритмдермен салыстырғанда – оның деректердің ағып кетуіне көбірек бейімділігі. Түпнұсқа деректер одан кем дегенде үш түрлі жолмен алынуы мүмкін, атап айтқанда:

Нейрондық желіні мыңдаған кескіндер негізінде жасалған бірегей нәрсе емес, нақты бастапқы кескінді шығаруға мәжбүрлеу үшін арнайы сұрауларды пайдалану.
Түпнұсқа кескінді оның бір бөлігі ғана қол жетімді болса да қалпына келтіруге болады.
Белгілі бір суреттің жаттығу деректеріне қосылғанын немесе жоқтығын жай ғана анықтауға болады.
Көбінесе нейрондық желілер жалқау және жаңа кескін жасаудың орнына, егер ол бір кескіннің бірнеше көшірмелерін қамтитын болса, оқу жинағынан бірдеңе шығарады. Жаттығу жиынында кескін жүзден астам қайталанса, оның түпнұсқаға жақын түрінде ағып кету ықтималдығы өте жоғары.

Дегенмен, зерттеушілер бастапқы жиынтықта бір-ақ рет пайда болған жаттығу кескіндерін алу жолдарын көрсетті.Зерттеуші сынаған 500 кескіннің ішінде алгоритм олардың үшеуін кездейсоқ түрде қайта жасады.

Кімнен ұрлады?

2023 жылдың қаңтарында үш суретші AI негізіндегі кескін генерациялау платформаларын өздерінің онлайн кескіндерін авторлық құқықты сақтамай модельдерін үйрету үшін пайдаланғаны үшін сотқа берді.

Нейрондық желі суретшінің стилін көшіре алады, осылайша оны табыстан айырады. Қағазда кейбір жағдайларда алгоритмдер әртүрлі себептермен тікелей плагиатпен айналыса алатынын, сызбаларды, фотосуреттерді және нақты адамдардың жұмысымен бірдей дерлік басқа кескіндерді жасай алатынын атап өтеді.

Сондықтан зерттеушілер бастапқы оқу жиынтығының ерекшелігін арттыру үшін ұсыныстар жасады:

1- Жаттығу топтарында қайталауды жою.
2- Жаттығу кескіндерін қайта өңдеңіз, мысалы, шу қосу немесе жарықтығын өзгерту арқылы; Бұл деректердің ағып кету ықтималдығын азайтады.
3- Алгоритмді арнайы оқу кескіндері арқылы сынау, содан кейін оның оны байқаусызда дәл қайта жасамайтынын тексеру.

келесі не?

Генеративті өнер платформалары соңғы кездері қызықты пікірталас тудырды, онда суретшілер мен технологияны әзірлеушілер арасында тепе-теңдікті іздеу керек. Бір жағынан, авторлық құқықты сақтау керек, ал екінші жағынан, AI тудыратын өнер адам өнерінен айтарлықтай ерекшеленеді ме?

Бірақ қауіпсіздік туралы сөйлесейік. Бұл мақалада бір ғана машинаны оқыту моделі туралы нақты деректер жиынтығы ұсынылған. Тұжырымдаманы барлық ұқсас алгоритмдерге кеңейте отырып, біз қызықты жағдайға келеміз. Ұялы байланыс операторының зияткерлік көмекшісі пайдаланушының сұрауына жауап ретінде компанияның құпия ақпаратын беретін немесе жалпыға ортақ нейрондық желіге біреудің төлқұжатының көшірмесін жасауға шақыратын жалған сценарий жазатын сценарийді елестету қиын емес. Дегенмен, зерттеушілер мұндай мәселелер әзірге теориялық күйінде қалып отырғанын атап көрсетеді.

Бірақ қазір біз бастан кешіріп жатқан басқа да нақты проблемалар бар, мысалы, сценарийді құру үлгілері: ChatGPT қазір нақты зиянды кодты жазу үшін пайдаланылады.

Және GitHub Copilot бағдарламашыларға енгізу ретінде ашық бастапқы бағдарламалық қамтамасыз етудің үлкен көлемін пайдаланып код жазуға көмектеседі. Бұл құрал әрқашан коды оқу деректерінің өте кеңейтілген жинағында аяқталған авторлардың авторлық құқықтары мен құпиялылығын құрметтемейді.

Нейрондық желілер дамыған сайын оларға қарсы шабуылдар да болады, оның салдары әлі ешкім түсінбейді.

Магуи Фарахтың 2023 жылға арналған жұлдыз жорамалдары

Тегтер

Райан шейх Мұхаммед2023-06-21Соңғы жаңарту: 2023 ж

Жасанды интеллект осылайша деректеріңізді ұрлайды