DeepSeek-R1 mudel laialdane levik toob esile kaks peamist ohukohta: eelprogrammeeritud tsensuur ning kasutajate andmete ja info hoidmine Hiinas asuvates serverites. Andmeid võidakse muu hulgas jagada Hiina luureasutustega ja Hiinas puudub Euroopa Liiduga võrreldav andmekaitse regulatsioon.
Seetõttu soovitab RIA DeepSeeki rakendustesse mitte sisestada tundlikku tööga seotud ja isiklikku informatsiooni. Samamoodi tuleks küberturvalisuse riske hoolikalt hinnata ka teiste suurte keelemudelite puhul. Tehisaru turvaliseks kasutuselevõtuks tasub asutustel ja ettevõtetel tutvuda RIA tellimusel 2024. aastal valminud Cybernetica analüüsiga AI tehnoloogia riskidest ja nende leevendamise võimalustest.
Mis DeepSeeki mudelis erilist on?
DeepSeek on väidetavalt suutnud treenida oma keelemudelit võrreldes Lääne analoogidega odavamalt ning vajab ka tunduvalt vähem ja nõrgema arvutusvõimsusega kiipe. Juhul kui need andmed vastavad tõele, on tegemist võimekama ja efektiivsema mudeliga.
Lisaks on DeepSeeki R1 mudel „läbipaistvam“ ehk näitab osaliselt, kuidas tema mõtteprotsess toimib. Selle ülesehitus- ja toimeloogika on teistest veidi erinev – kui ChatGPT puhul võib öelda, et kasutaja vestleb väga targa vastaspoolega, siis DeepSeeki puhul suhtleb ta grupi „ekspertidega“. Lihtsustatult öeldes, kui küsida DeepSeekilt meelelahutuse kohta Lõuna-Eestis, siis vastabki turismile keskendunud „ekspert“ ja teised puhkavad samal ajal. Asjatundjad peavad taolist ülesehitamist Lääne mudelite omast nutikamaks.
Millised ohud kaasnevad DeepSeeki R-1 mudeli kasutamisega?
Peamised mured DeepSeek R-1 mudeli kasutamisel on seotud tsensuuri ning andmete leviku ja kasutusega Hiinas.
DeepSeek mudel tsenseerib teatuid teemasid, mis on Hiinas poliitiliselt tundlikud – nagu 1989. aasta Tiananmeni väljaku veresaun, inimõigused Hiinas ja Taiwani olukorraga seotud teemad. See tähendab, et kasutajad saavad infot, mis ühtib Hiina riigi ametliku narratiividega.
DeepSeeki mudel hoiab kogutud andmeid Hiina Rahvavabariigis asuvates serverites ning pole teada, kuidas ja milleks neid kasutatakse. Hiina 2017. aasta riikliku luureseaduse kohaselt peavad kõik ettevõtted tegema koostööd riigi luureasutustega. DeepSeeki kasutajatingimustes on kirjas, et nad koguvad kasutaja poolt sisestatud andmeid, tehnilist infot (IP-aadress, arvutimudel), küpsiseid jne. DeepSeeki kasutamiseks on vaja teha konto, mis tähendab, et kõik päringud seostatakse ühe konkreetse kasutajaga. Erinevalt näiteks OpenAI ChatGPT rakendusest ei järgi DeepSeek Euroopa Liidu isikuandmete kaitse üldmäärust (GDPR) ning kasutajatel pole õigust oma andmeid kustutada.
Küll aga tasub mainida, et DeepSeek tarkvara on vabavaraline, mis tähendab, et sisuliselt võib selle endale alla tõmmata ja kasutada ka seadmetes, mis ei ole internetiga ühendatud. Samas nõuab see märkimisväärset arvutusvõimsust, mis pole tavakasutajale tihti ligipääsetav. See teeb mudeli kasutamise küll potentsiaalselt turvalisemaks andmete leviku osas, aga jätab lahendamata tsenseerimise küsimuse.
Taoline vabavaraline levik võib kaasa tuua ka tehisaru plahvatusliku leviku, sest potentsiaalselt saavad seda modifitseerida ja edasi arendada kõik soovijad. Ehk kui eelnevalt oli tehisaru ainult käputäie suurte tehnoloogiahiidude käes, siis nüüd on see potentsiaalselt kättesaadav ka halbade kavatsustega väiksematele toimijatele.
Samuti tasub rõhutada, et Venemaa ja Hiina teevad aina rohkem koostööd ka kübervaldkonnas, mis potentsiaalselt võib tähendada kogutud andmete jagamist.
Riikide reaktsioonid DeepSeeki osas
Kuigi DeepSeek-R1 mudel on suhteliselt uus, on osad riigid juba astunud samme rakenduse piiramiseks. DeepSeek kogub ja töötleb küll Euroopa Liidu kodanike andmeid, aga väidab, et ei tegutse Euroopas ja seega neile ei kohaldu ELi õigusaktid. Itaalia on DeepSeeki juba keelustanud. Samuti on teatanud keelust India, Austraalia ja Taiwan. Mitmed teised riigid, sh USA, Saksamaa ja Belgia, on kaalumas rakenduse kasutamise piiramist.
RIA soovitus
Lähtuvalt eelnevast ning Eesti julgeolekuasutuste hinnangutest* Hiina tehnoloogia riskidele soovitab RIA mitte kasutada Hiina firma DeepSeek rakendusi riigi poolt antud tööseadmetes.
Tavakasutajatel ja ettevõtetel soovitame mudeli rakendustesse mitte sisestada tundlikku informatsiooni – näiteks isikut tuvastav teave, terviseinfo, ärisaladused jne –, arvestades ka kehtivaid andmekaitse reegleid. Sama soovitus kehtib teiste suurte keelemudelite kasutamisel. Kasutajad peaksid enda jaoks põhjalikult läbi mõtlema, millist infot nad soovivad tehnoloogiaettevõtetega jagada.
*Kaitsepolitseiameti aastaraamat 2023–2024 ja Välisluureameti avalik raport 2024.
Loomise kuupäev: 11.02.2025