ChatGPT ja teised tekstirobotid


Seda teksti on viimati muudetud 08.01.2024. Tekstirobotite kiire arengu tõttu võib allolev info olla vahepeal aegunud.

Tekstiroboti tööpõhimõtted

Viimase aasta jooksul on järjest enam levinud suurtel keelemudelitel põhinevad tekstirobotid, mis loovad kasutaja antud küsimuse või ülesande (nn prompt) põhjal teksti. Neist kuulsaim on OpenAI arendatud ChatGPT, mille versioon 3.5 on praegu tasuta kättesaadav ja 4.0 tasulisena. ChatGPT ja teiste sarnaste süsteemide tööpõhimõte seisneb selles, et neid on väga suurte (enamasti internetis leiduvate) tekstihulkade põhjal treenitud ära tundma sõnade koosesinemise sagedusi ning sellest lähtuvalt ennustama, mis võiks olla igale sõnale eelnevad ja järgnevad sõnad.

Tekstirobotite kasutamine akadeemilise teksti loomisel

Tekstiroboti kasutamisel õppetöös tuleb alati lähtuda sellest, kas ja kuidas konkreetse aine õppejõud seda lubab (vajadusel küsi õppejõult ise üle). Kellegi teise – ka rakenduse – loodud teksti oma nime all esitamine on plagiaat, isegi kui teksti on veidi muudetud. Küll aga saab ChatGPTd jt sarnaseid tööriistu kasutada kavandamise etapis ideede otsimisel ja omavahel seostamisel: nt võid küsida ülevaadet mingi valdkonna uurimistulemustest, et leida endale huvipakkuv suund, või paluda tutvustada mõne probleemi erinevaid tahke, et siis nende kohta ise edasi otsida. Ükskõik mida sa täpselt küsisid, tuleb tekstirobotite toodetud väljundisse alati kriitiliselt suhtuda – see tähendab, et saad ChatGPTd täie kindlusega mingil teemal kasutada ainult siis, kui oskaksid samale küsimusele ka ise vastata. Eriti ettevaatlik tuleb olla allikatega. Ehkki ChatGPTl saab paluda tekstis allikaid kasutada, võib see viidata olematutele või akadeemilisse teksti sobimatutele allikatele ega suuda viiteid tekstiga siduda. Samuti tasub silmas pidada, et ChatGPTd arendatakse pidevalt edasi, mistõttu võib saadaval olevaid funktsioone ootamatult lisanduda või kaduda.

Sõltumata sellest, kuidas täpselt sa ChatGPTd või teisi tekstiroboteid töös kasutanud oled, tuleb neile alati viidata (arendaja, keskkond, versioon, kasutamise kuupäev) ja täpsustada, mida täpselt küsisid ning missuguse vastuse said. Erinevalt traditsioonilistest allikatest ei ole ChatGPT vestlused taastatavad või kõigile kättesaadavad (ka sama prompti kasutades toodab see iga kord erineva vastuse), mistõttu on nii Tartu ülikooli suunistes kui ka mujal maailmas soovitatud ChatGPT-le viidata kui isiklikule suhtlusele (personal communication; vt ka viitamist APA stiilis). Soovitame ka, et ChatGPTd kirjaliku töö jaoks kasutades salvestaksid igaks juhuks terve vestluse (nt screenshotina, mille failinimeks paned vestluse kuupäeva), et saaksid selle juurde vajadusel tagasi minna või selle oma töösse allikana lisada. ChatGPT võimaldab küll luua ka lingi, millega vestlust jagada, kuid see toimib vaid nii kaua, kuni sa vestlust ära ei kustuta – seega on kindlam endale vestlus ka muul moel salvestada. 

Probleemid ja ohukohad

Tekstirobotid ei saa tegelikult aru, mida ja miks need teevad – valminud tekst on lihtsalt statistilistest koosesinemise tõenäosustest lähtuv sõnade rida, mitte sisuline teadmine või mõte. Näiteks võib ChatGPT sulle küll selgitada, mis on termodünaamika seadused või mitu käänet on eesti keeles, kuid selle aluseks pole teadmine füüsikast või eesti keele struktuurist, vaid tekstid, kus neist teemadest kirjutatakse. Sealjuures tuleb tähele panna, et ühed ja samad sõnad esinevad tekstides paljudes eri kombinatsioonides ja eri tähendustega, mistõttu võib ChatGPT sõnu sinu teema seisukohast “valesti” kombineerida. Seetõttu pole ka täpne kasutada ChatGPT ja teiste tekstirobotite kohta mõistet tehisintellekt (artificial intelligence ehk AI), sest see võib tekitada eksliku ootuse, et tekstirobot mõtleb ise. Tegelikke faktiteadmisi tekstirobotitel aga pole, mistõttu ei saa kunagi kindel olla, kas nende esitatud info on tõene. Olukorda, kus tekstirobot ise suvaliselt loodud infot faktina esitab, nimetatakse hallutsineerimiseks. 

Samuti tuleb tekstiroboteid kasutades arvesse võtta, et nende teadmised piirduvad vaid selle andmestikuga, mille peal neid on treenitud. Näiteks ChatGPT versiooni 3.5 andmed lõppevad 2022. aasta jaanuariga, seega ei paku see usaldusväärset infot uuemate sündmuste kohta. Lisaks pärineb kogu varasem materjal internetis kättesaadavatest allikatest, mida keegi pole ükshaaval üle kontrollinud, mistõttu võivad ChatGPT vastused sisaldada ekslikku või aegunud infot ning ebaeetilisi hoiakuid ja seisukohti. Üks ChatGPTga seotud probleeme ongi see, et selle arendajad ei ole avaldanud, missuguste andmete põhjal ja kuidas täpselt on 3.5 ja 4.0 versioone treenitud. See tähendab, et ChatGPT vastused võivad sisaldada ka autorikaitse all olevatest materjalidest pärinevat sisu ning selliste tekstide kasutamine võib tähendada autoriõiguste rikkumist. Samuti tuleks ettevaatlik olla promptide kasutamisel (nt mitte avaldada promptis isiklikke andmeid vm tundlikku infot), sest pole täpselt teada, kas ja kuidas kasutajate prompte salvestatakse ja edasisel treenimisel kasutatakse. 

Keelemudeli treeninguks kasutatud andmete kvantiteet ja kvaliteet sõltub ka keelest – paratamatult ei ole ChatGPT eesti keeles teksti luues sama võimekas kui inglise keeles, sest eestikeelseid lähteandmeid on olnud palju vähem. See tähendab, et roboti genereeritud eestikeelsed tekstid võivad sisaldada elemente, mis on pigem iseloomulikud ingliskeelsetele tekstidele – olgu selleks näiteks läbiva suurtähega kirjutatud pealkirjad, ingliskeelsete väljendite otsetõlked eesti keelde (millel eesti keeles sellist tähendust pole) või tekstide struktuur (lõikude alustamine kindlate sõnadega, nt kokkuvõtte algus sõnaga kokkuvõtteks). Kuigi abivahendi nagu ChatGPT kasutamine võib tunduda ahvatlev, siis masinalt üht sisukat ja faktiliselt korrektset teksti oodata siiski ei tasu – eestikeelseid tekste kirjutades oled sina ise masinast tunduvalt targem ja osavam.

Kasutatud allikad

Tartu Ülikooli suunis tekstiroboti kasutamiseks õppetöös. https://ut.ee/et/sisu/tartu-ulikooli-suunis-tekstiroboti-kasutamiseks-oppetoos (vaadatud 08.01.2024)
Generative Artificial Intelligence guidance for students. University of Edinburgh. https://www.ed.ac.uk/bayes/ai-guidance-for-staff-and-students/ai-guidance-for-students (vaadatud 08.01.2024)
How to cite ChatGPT. APA Style. https://apastyle.apa.org/blog/how-to-cite-chatgpt (vaadatud 08.01.2024)

Kommentaarid, soovitused ja kogemused selle teema kohta saab lisada siia.