HomeIT & TechMeta și Google se confruntă cu o nouă problemă: protecțiile AI pot...

Meta și Google se confruntă cu o nouă problemă: protecțiile AI pot fi eliminate în câteva minute

spot_img

Modelele open-source de inteligență artificială devin tot mai greu de controlat, după apariția unor instrumente care elimină rapid filtrele de siguranță integrate de dezvoltatori.

Sistemele de inteligență artificială dezvoltate de mari companii tehnologice precum Meta și Google pot fi modificate relativ ușor pentru a elimina restricțiile de siguranță impuse de producători, potrivit unei analize publicate de Financial Times.

Conform investigației FT, unele versiuni modificate ale modelelor AI au oferit răspunsuri legate de arme biologice, malware sau conținut ilegal, după ce filtrele de protecție au fost eliminate prin software disponibil public pe platforme precum GitHub.

Jurnaliștii Financial Times, împreună cu organizația de siguranță AI Alice, au testat versiuni alterate ale modelului open-source Gemma 3, dezvoltat de Google. În urma modificărilor, sistemul a generat inclusiv instrucțiuni privind dispersarea gazului toxic în spații aglomerate și exemple de cod pentru furt de date financiare.

În paralel, modelul Llama 3.3 al Meta ar fi putut fi „deblocat” în mai puțin de 10 minute folosind un instrument software numit Heretic, fără echipamente speciale sau expertiză avansată, potrivit informațiilor publicate de FT.

Fenomenul ridică noi semne de întrebare privind eficiența mecanismelor de siguranță dezvoltate de companiile AI. Pe măsură ce modelele open-source devin mai performante și mai accesibile, autoritățile și companiile pierd controlul asupra modului în care acestea sunt replicate și utilizate.

Experții citați de publicația britanică avertizează că procesul de eliminare a filtrelor de siguranță, cunoscut în industrie sub termenul „abliteration”, a devenit semnificativ mai simplu în ultimii ani. Dacă anterior astfel de intervenții necesitau cunoștințe tehnice avansate, acum ele pot fi realizate rapid de utilizatori obișnuiți.

Problema afectează în special modelele open-source, unde codul și parametrii sistemului sunt disponibili public. În cazul platformelor proprietare precum OpenAI sau Anthropic, accesul direct la infrastructura internă este limitat, ceea ce face modificările mai dificile.

Totuși, diferența de performanță dintre modelele open-source și cele comerciale s-a redus accelerat în ultimii ani. În consecință, specialiștii în securitate cibernetică avertizează că riscurile asociate distribuirii unor modele AI „decenzurate” cresc simultan cu performanța acestora.

Potrivit FT, creatorul instrumentului Heretic susține că software-ul său a fost folosit pentru generarea a peste 3.500 de versiuni modificate de modele AI, descărcate de milioane de ori de la lansare.

Google a declarat pentru Financial Times că eliminarea protecțiilor reprezintă „o provocare tehnică cunoscută” pentru modelele open-source și că sistemele companiei sunt supuse unor evaluări interne de siguranță înainte de lansare. Meta nu a comentat oficial informațiile.

Discuția apare într-un moment în care guvernele europene și autoritățile de reglementare încearcă să stabilească reguli mai stricte pentru dezvoltarea și utilizarea inteligenței artificiale, inclusiv prin implementarea AI Act în Uniunea Europeană. Apariția unor versiuni modificate și distribuite independent ar putea complica aplicarea acestor reglementări.

Sursa: Financial Times

spot_img

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Dailybiz nu răspunde pentru conținutul comentariilor și își rezervă dreptul de a le modera sau de a le respinge. Vă rugăm să folosiți un limbaj respectuos și civilizat în exprimarea opiniilor.

Articole similare

spot_img

Ultimele articole

Etichete

spot_img