Meta și Google se confruntă cu o nouă problemă: protecțiile AI pot fi eliminate în câteva minute

Modelele open-source de inteligență artificială devin tot mai greu de controlat, după apariția unor instrumente care elimină rapid filtrele de siguranță integrate de dezvoltatori.

Sistemele de inteligență artificială dezvoltate de mari companii tehnologice precum Meta și Google pot fi modificate relativ ușor pentru a elimina restricțiile de siguranță impuse de producători, potrivit unei analize publicate de Financial Times.

Conform investigației FT, unele versiuni modificate ale modelelor AI au oferit răspunsuri legate de arme biologice, malware sau conținut ilegal, după ce filtrele de protecție au fost eliminate prin software disponibil public pe platforme precum GitHub.

Jurnaliștii Financial Times, împreună cu organizația de siguranță AI Alice, au testat versiuni alterate ale modelului open-source Gemma 3, dezvoltat de Google. În urma modificărilor, sistemul a generat inclusiv instrucțiuni privind dispersarea gazului toxic în spații aglomerate și exemple de cod pentru furt de date financiare.

În paralel, modelul Llama 3.3 al Meta ar fi putut fi „deblocat” în mai puțin de 10 minute folosind un instrument software numit Heretic, fără echipamente speciale sau expertiză avansată, potrivit informațiilor publicate de FT.

Fenomenul ridică noi semne de întrebare privind eficiența mecanismelor de siguranță dezvoltate de companiile AI. Pe măsură ce modelele open-source devin mai performante și mai accesibile, autoritățile și companiile pierd controlul asupra modului în care acestea sunt replicate și utilizate.

Experții citați de publicația britanică avertizează că procesul de eliminare a filtrelor de siguranță, cunoscut în industrie sub termenul „abliteration”, a devenit semnificativ mai simplu în ultimii ani. Dacă anterior astfel de intervenții necesitau cunoștințe tehnice avansate, acum ele pot fi realizate rapid de utilizatori obișnuiți.

Problema afectează în special modelele open-source, unde codul și parametrii sistemului sunt disponibili public. În cazul platformelor proprietare precum OpenAI sau Anthropic, accesul direct la infrastructura internă este limitat, ceea ce face modificările mai dificile.

Totuși, diferența de performanță dintre modelele open-source și cele comerciale s-a redus accelerat în ultimii ani. În consecință, specialiștii în securitate cibernetică avertizează că riscurile asociate distribuirii unor modele AI „decenzurate” cresc simultan cu performanța acestora.

Potrivit FT, creatorul instrumentului Heretic susține că software-ul său a fost folosit pentru generarea a peste 3.500 de versiuni modificate de modele AI, descărcate de milioane de ori de la lansare.

Google a declarat pentru Financial Times că eliminarea protecțiilor reprezintă „o provocare tehnică cunoscută” pentru modelele open-source și că sistemele companiei sunt supuse unor evaluări interne de siguranță înainte de lansare. Meta nu a comentat oficial informațiile.

Discuția apare într-un moment în care guvernele europene și autoritățile de reglementare încearcă să stabilească reguli mai stricte pentru dezvoltarea și utilizarea inteligenței artificiale, inclusiv prin implementarea AI Act în Uniunea Europeană. Apariția unor versiuni modificate și distribuite independent ar putea complica aplicarea acestor reglementări.

Sursa: Financial Times

Meta și Google se confruntă cu o nouă problemă: protecțiile AI pot fi eliminate în câteva minute

LEAVE A REPLY Cancel reply

Articole similare

Cetățenii cer servicii publice bazate pe AI, dar nu vor eliminarea controlului uman

Un grup de construcții din Timiș investește 9,5 milioane de euro într-un centru de agrement cu simulator de parașutism

Fosta fabrică Clujana va fi transformată într-un hub regional pentru inovare și transfer tehnologic

Ultimele articole

România găzduiește unul dintre cele mai importante proiecte digitale ale UE. Peste 450 de experți vin la București în noiembrie

BNR, mesaj despre banii din conturi: riscul cibernetic crește, dar nu există motiv pentru retrageri masive

Aproape 100 km din Autostrada Transilvania ar putea fi deschiși în 2026. Lotul care rămâne până în 2032

Etichete

JP Morgan este consultantul Premier Energy în tranzacţia de 700 mil. euro pentru preluarea Distribuţie Energie Oltenia.

Romgaz plasează depozite la termen în valoare de 470 mil. lei la Raiffeisen Bank şi BCR.

BCE semnalează noi majorări de dobândă pe fondul scumpirii energiei și al presiunilor inflaționiste

Ministerul Finanțelor atrage aproape 717 milioane lei prin cea mai recentă emisiune Fidelis listată la BVB

JP Morgan este consultantul Premier Energy în tranzacţia de 700 mil. euro pentru preluarea Distribuţie Energie Oltenia.

Romgaz plasează depozite la termen în valoare de 470 mil. lei la Raiffeisen Bank şi BCR.

BCE semnalează noi majorări de dobândă pe fondul scumpirii energiei și al presiunilor inflaționiste

Ministerul Finanțelor atrage aproape 717 milioane lei prin cea mai recentă emisiune Fidelis listată la BVB