AI pajki: Cloudflare predstavil funkcijo za blokado

Uporaba umetne inteligence za raziskovalne nalogeChatGPT [Foto: Unsplash]

AI pajki: Cloudflare predstavil funkcijo za blokado

V zadnjem času smo priča razcvetu tehnologij, ki omogočajo blokiranje neželenih vsebin na spletu. Po uspehu blokad oglasov je zdaj tu še nova inovacija za blokiranje umetne inteligence (AI). Ameriško podjetje za kibernetsko varnost Cloudflare je predstavilo novo funkcijo, s katero lahko lastniki spletnih mest preprečijo zbiranje svojih podatkov s strani AI pajkov. AI pajki so internetni boti, ki zbirajo podatke za usposabljanje modelov umetne inteligence.

John Graham-Cumming, glavni tehnični direktor podjetja Cloudflare, je za Euronews Next pojasnil, da je nova funkcija namenjena zaščiti vsebine pred strganjem. “Ljudem smo že pomagali zaščititi svoja spletna mesta pred boti, zato verjamem, da je to logičen korak naprej za lastnike vsebin, ki želijo nadzorovati uporabo svoje vsebine,” je dejal Graham-Cumming.

Kako deluje blokator AI pajkov?

Ko povezava do spletnega mesta, gostovanega pri Cloudflare, zazna zahtevo, lahko identificira, kdo dostopa do spletnega mesta, vključno z AI pajki. Če pajek poskuša dostopati, se mu prikaže napaka, ki prepreči pridobivanje podatkov. Nekateri roboti se poskušajo pretvarjati, da so človeški uporabniki, zato je Cloudflare razvil model strojnega učenja, ki ocenjuje verjetnost, ali je zahteva resnično človeška.

Graham-Cumming ni želel razkriti, katere stranke uporabljajo novo funkcijo. Dejal je, da je “zelo priljubljena” in jouporabljajo tako mala kot velika podjetja.

Glede na študijo Data Provenance Initiative, ki vključuje neodvisne raziskovalce umetne inteligence, postaja blokiranje AI pajkov vse bolj razširjeno. Njihova analiza več kot 14.000 spletnih domen je pokazala, da je pet odstotkov vseh podatkov v javnih internetnih zbirkah podatkov C4, RefinedWeb in Dolma zdaj omejenih. Pri virih najvišje kakovosti ta številka naraste na 25 odstotkov.

Metode za ročno blokiranje AI pajkov

Obstajajo tudi načini, kako ročno preprečiti dostop AI pajkov do vaše vsebine. Podjetje Raptive, ki podpira ustvarjalce vsebin, je v svojem vodniku navedlo, da lahko gostitelji spletnih mest ročno dodajo ukaze v datoteko robots.txt. V to datoteko lahko dodajo imena priljubljenih podjetij z umetno inteligenco, kot je Anthropic, in uporabijo ukaz “disallow” za blokiranje dostopa.

Nekatera podjetja in platforme družbenih medijev omogočajo blokado AI pajkov. Meta AI je uporabnikom omogočila, da zavrnejo novo politiko, kjer bi se javne objave uporabljale za usposabljanje njihovih modelov AI. OpenAI je leta 2023 objavil nize kode za blokiranje treh vrst robotov s spletnih mest: OAI-SearchBot, ChatGPT-User in GPTBot.

Standardizacija blokiranja AI pajkov

Spletna mesta lahko prepoznajo AI pajke zaradi dolgotrajnega internetnega protokola, imenovanega Robots Exclusion Protocol, ki ga je leta 1994 ustvaril Martijn Koster. Ta protokol pomaga upravljati strežniške vire, vendar ni uradni internetni standard. To pomeni, da si ga razvijalci razlagajo različno.

Graham-Cumming je poudaril potrebo po industrijskem standardu, ki bi jasno opredelil, ali lahko AI pajki zbirajo podatke s spletnih mest. Odbor za internetno arhitekturo (IAB) septembra gosti dvodnevne delavnice, kjer se pričakuje, da bo postavljen industrijski standard.

[Vir: Euronews]; Portal24;

Foto: Unsplash