Tehisintellektil põhinevate tööriistade kaasamine kirjutamisprotsessi


2024/25. õa-l katsetame erinevaid tekstiloome protsessi toetavaid tööriistu. Katsetamise eesmärk on analüüsida, kuidas tehisintellektil (TI) põhinevad tööriistad (edaspidi läbivalt “tööriistad”) kirjutamisprotsessi eri etappidega hakkama saavad. Siin lehel ilmuvad jooksvalt katsete tulemused koos meie kommentaaride ja hinnanguga.

Katsetamiseks teemasid valides lähtusime 2023. ja 2024. aastal Tartu Ülikooli tudengite hulgas korraldatud  küsitluse “Üliõpilased ja ülikoolis kirjutamine: TÜ üliõpilaste küsitlus” tulemustest. Eelkõige saime sisendit kahe küsimuse vastustest: (1) millised on kirjutamisprotsessis ette tulevad raskused ja (2) kuidas tehisintellekti tekstide loomisel kasutatakse.

Nende küsimuste vastuste põhjal valisime välja kirjutamisprotsessi etapid, milles tööriistade kasulikkust katsetada: vastavalt tööriista otstarbele palusime sellel aidata kirjutamisprotsessi ette valmistada, teksti mingit osa kirjutada, pindmiselt kontrollida ja/või tõlkida. Nende ülesannete täitmiseks koostasime promptid (ee ka viip, ingl prompt), mida näeb järgnevast kirjeldusest. Meie eesmärk ei olnud koostada ‘ideaalseid’ prompte, vaid sõnastada need võimalikult lihtsalt ja selgelt (ehk viisil nagu üks teksti kirjutamisel abi otsiv üliõpilane seda teha võiks). Seetõttu on võimalik, et teisiti sõnastatud promptid annaksid teistsuguseid väljundeid. Vaata ka kasutatud prompte.

Ettevalmistavad tegevused (eestikeelne prompt):

  • Ideede kogumise prompt: “Paku mulle ideid, millest võiks kirjutada. Ülesanne on selline:”
  • Ajakava koostamise prompt: “Tee mulle ajakava ühe teksti kirjutamiseks. Tekst peab olema valmis kuu aja pärast. Ülesanne teksti kirjutamiseks on selline:”
  • Promptiga kaasasolev tekst on 2023/24. õa TÜ aine "Rahvusvaheline poliitika" kodutöö juhend, mille järgi tuli kirjutada 700-900 sõnaline essee rahvusvahelise elu probleemidest ühe sündmuse põhjal.

 

Teksti mingi osa kirjutamine (eesti- või ingliskeelne prompt):

  • Sissejuhatuse kirjutamise promptid: “Palun kirjuta tekstile sissejuhatus” / “Please write an introduction to the text”.
  • Kokkuvõtte kirjutamise prompt: “Palun kirjuta tekstile kokkuvõte” / “Please write a conclusion to the text”
  • Tekstile pealkirja panemise prompt: “Palun pane tekstile pealkiri” / “Please give the text a title”
  • Promptiga kaasasolev tekst on (a) üliõpilase eestikeelne essee, mis analüüsib Catalina afääri eelmainitud ülesande juhendi põhjal või (b) üliõpilase ingliskeelne essee, mis on kirjutatud Newcastle University kursusel “Politics and Society”. Essee analüüsib eestlaste rahvuslikkuse tunnetust kujutletud kogukonna kontekstis. 
  • Tekstidest on eemaldatud vastavalt kas sissejuhatus, kokkuvõte või pealkiri.

 

Teksti pindmine kontroll (eesti- või ingliskeelne prompt):

  • Teksti struktuuri parendamise prompt: “Kontrolli, kas teksti struktuur on loogiline. Soovita, mida parandada.” / “Check the structure of the text. Suggest improvements.”
  • Teksti stiili parendamise prompt: “Kontrolli, kas tekst on akadeemilise/formaalse stiiliga. Soovita, mida parandada.” / “Check the style of the text. Suggest improvements.”
  • Teksti terminikasutuse parendamise prompt: “Kontrolli, kas olen termineid õigesti kasutanud. Soovita, mida parandada.” / Check the usage of terminology. Suggest improvements.”
  • Teksti õigekirja parendamise prompt: “Kontrolli õigekirja. Soovita, mida parandada.” / Check the spelling and grammar of the text. Suggest improvements.
  • Promptiga on kaasas samad tekstid, mis teksti mingi osa kirjutamise puhul. Pindmise kontrolli puhul on aga tekstide struktuuri, stiili, terminikasutust või õigekirja halvendatud. Näiteks oleme eestikeelses tekstis terminikasutuse kontrolliks vahetanud sõna diplomaatilisel sõnaga demagoogilisel ning ingliskeelses tekstis õigekirja kontrolliks muutnud sõna national sõnaks natsional.

 

Teksti tõlkimine (eestikeelne prompt):

  • Teksti tõlkimise prompt: “Palun tõlgi järgnev tekst inglise/eesti keelde.”
  • Promptiga on kaasas kas (1) 2023/2024. õa kõigepealt eesti keeles kirjutatud abstrakt töömälu soorituse seosest negatiivse afektiseisundi, depressiivsuse ja metakognitsiooniga, mille üliõpilane on pärast ise tõlkinud ka inglise keelde, või (2) kõigepealt 2015. aastal inglise keeles kirjutatud abstrakt vadja keele deiktilise pronoomeni grammatikaliseerumisest, mis on seejärel tõlgitud eesti keelde. Abstraktide eesti- ja ingliskeelsete versioonide sisu on peaaegu sama.


Seega andsime tööriistale ette vastavas keeles prompti ja inimese kirjutatud teksti. Näiteks järgnes lausele “Palun kirjuta tekstile sissejuhatus” tekst, millele tööriist pidi sissejuhatuse kirjutama. Vajadusel tegime ka lisaprompte: näiteks siis, kui tahtsime, et tööriist genereeritud teksti lühendaks või kui väljund ei vastanud päris täpselt promptile.

Katseid tööriistadega tegid seitse inimest. Igaüks katsetas vastavat tööriista oma arvutis keskkonda sisselogituna ning tegeles valitud promptiga. Pärast promptimist võrdlesime tööriista väljundit originaaltekstiga kohtades, kus see oli võimalik ja asjakohane. Iga tööriista peal kasutasime kindlat prompti ühe korra.

Isegi kui inimese kirjutatud tekst ei ole kõigi lugejate arvates ideaalne, vastab see ikkagi inimtajule, sest teksti autor on inimene. Tehisintellektil põhineva tööriista taju on aga summeeritud tõenäosused ehk see tekst on kooskõlas statistiliste arvutustega. Inimene tajub mõlemaid tekste inimtajuga ehk inimese vaatenurgast. Seega näitavad katsete analüüsid seda, kuidas subjektiivne, kuid laialdase kirjutamise (õpetamise) kogemusega inimanalüüsija tajub teise inimese (ehk autori) teksti ja tööriista genereeritud teksti või originaalteksti parenduste erinevusi. Kuna tööriistad on teksti loonud konkreetsete promptide järgi, ei saa tulemustest järeldada, kuidas saaksid tööriistad hakkama mõne teise juhendiga.

Alljärgnevalt kirjeldame erinevate tehisintellektil põhinevate tööriistade katsetamise tulemusi.

Promptimise kuupäevad: 06.01, 21.01, 25.01, 26.01, 27.01.2025

Suhtluses ChatGPT-ga saab üliõpilane kirjutamisprotsessis tööriistalt mõningat abi. Näiteks võib ChatGPT anda väljundina ideid ja lisalugemist, millega edasi töötada. Samas tuleb saadud väljundit alati ise kriitiliselt hinnata ning üle kontrollida.

IDEEDE GENEREERIMINE tööjuhise põhjal
Palusime ChatGPT-l tööülesande põhjal pakkuda teemasid, millest kirjutada. Tööriist pakkus vastuseks erinevaid asjakohaseid sündmusi ning tõi välja ka nende tausta ehk konflikti olulisuse, asjaosalised ja võimalikud probleemid või lahendused (vt pilti). See tulemus ei ole väga üllatav, kuna ChatGPT vastas ülevaate andmiseks küsimustele, mis olid esitatud algses tööülesandes. Kui palusime allikaid soovitada, siis saime vastuseks küll päriselt eksisteerivaid allikaid, kuid ükski ei olnud teaduslik.

AJAKAVA KOOSTAMINE
Tööriista koostatud kirjutamisprotsessi ajakava on loogiline ja realistlik ning annab aimu, millistest tegevustest kirjutamine koosneb (vt pilti). Prompti ja genereeritud plaani tuleb siiski vastavalt oma soovidele täpsustada.

SISSEJUHATUSE JA KOKKUVÕTTE KIRJUTAMINE
Nii sissejuhatuse kui ka kokkuvõtte puhul tuli välja ChatGPT kalduvus genereerida essees käsitletud teema(de)st üldine kokkuvõte ja tuua välja sündmuste tähtsus – mõlemad tekstiosad kujutasid endast sõnarohket sisu ümberjutustust (vt pilte). Tudengite kirjutatud originaaltekstidel oli kindlam ja selgem fookus. Näiteks oli neis kirjeldatud ka teooriat, mis lugeja jaoks teksti mõistmist lihtsustas ning mis võimaldas autoril paremini oma väiteni jõuda ja hiljem seda tõestada. Esseega samal teemal sõnu ritta ladudes võib ChatGPT kirjutada ka millestki, millest essee ei räägi.

PEALKIRJA PANEMINE
Pealkirjadega on ChatGPT edukam (võrreldes nt sissejuhatuse ja kokkuvõtte kirjutamisega) ning pakub erineva pikkuse ja asjakohasusega variante. Seejuures on roboti pakutud pealkirjad sageli kaheosalised. Siiski on pealkirju lihtne kohendada ja kombineerida ehk jällegi võib ChatGPT ideid anda, mida saab edasi arendada või mis aitavad mõtte “käima lükata”.

STRUKTUURI, STIILI, TERMINITE, ÕIGEKIRJA KONTROLL
Ilmnes, et tööriist on agar tagasisidestaja ning paari lihtsa paranduse tegemiseks tuleb sellega pikka dialoogi pidada. Struktuuri parandamiseks annab tööriist esimesel küsimisel küllaltki asjalikke üldiseid nõuandeid, ent kommenteerib samas ka näiteks teksti sisulist poolt ja lähtub struktuurisoovituste jagamisel pigem sellest, mis tekstis võiks olla, mitte sellest, mis on (vt pilti).

Samasugune muster kordub ka stiili ja õigekirja kontrollimisel: ChatGPT tuvastab küllaltki asjalikult suure osa vigadest, ent jagab ka asjassepuutumatuid soovitusi (vt pilti).

Terminite vale kasutuse tuvastamisega on tööriistal mõlemas keeles raskusi (vt pilti).

Kui paluda tekstis eelnimetatud probleemid parandada, kirjutab tööriist ümber kogu teksti, muutes seejuures märkimisväärselt sõnastust, mõnel juhul ka info järjestust, jätab olulisi mõtteid või allikaviiteid tekstist välja jne. Seda ka juhul, kui otsesõnu paluda alusteksti võimalikult vähe muuta (vt pilti).

TEKSTI TÕLKIMINE
Palusime tööriistal tõlkida ühe teksti eestikeelse versiooni inglise keelde ning ingliskeelse versiooni eesti keelde. Meie katsest selgus, et kuigi tõlgitud tekstid oli arusaadavad, oli tööriistal selgeid raskusi terminoloogia tõlkimisega, samuti ei kohandanud see tõlketekstide sõnajärge alati sihtkeelele vastavaks ning eestikeelses tõlkes esines ebaproportsionaalselt palju võõrsõnu (vt pilte).

Promptimise kuupäevad: 04.02 ja 11.02.

Kõigi katsete puhul täheldasime, et Copilotis esineb mitu üldist anomaaliat, mida ChatGPT-s (enam) ei ole. Esiteks on promptil tähemärkide piirang (16 000) ja väljund jääb sageli pooleli (tuleb promptida, et Copilot jätkaks kirjutamist). Lisaks esines olukordi, kus Copilot ei teinud/vastanud midagi, kustutas promptis antud teksti osi või lühendas neid ning vahel vastas, et ei saa sellest teemast rääkida. Samuti tuli ette, et väljundis oli vahetunud keel (nt kui prompt oli eesti keeles, oli väljund inglise keeles).

IDEEDE GENEREERIMINE tööjuhise põhjal
Nagu ChatGPT-ga, palusime Copilotil tööjuhendi põhjal pakkuda teemasid, millest kirjutada. Copilot lähtus juhendis püstitatud küsimustest ning tõi kirjutamiseks välja asjakohased sündmused, nende tausta ja osapooled.  Lisaks oli väljundis kirjeldatud ka sündmustega seotud probleeme ja lahendusi, kuid polnud täpsustatud, mis mille alla kuulub (vt pilti). Lisapromptina küsisime teaduslike allikate soovitusi, millele vastas Copilot küll allikate loendiga, kuid enamik neist ei olnud teaduslikud. Allikate loendi puhul on tähelepanuväärne, et Copilot oli sinna lisanud väga värsked meediaallikad, nagu promptimise päeval ilmunud artikkel.

Kokkuvõttes oli selle katse tulemus sama nagu ChatGPT-l: Copiloti vastustest saab ülevaate võimalikest teemadest ja lisalugemist, kuid edasi peab mõtlema ise – valima teema, allikaid kriitiliselt hindama ja välja valima jne.

AJAKAVA KOOSTAMINE
Tööriista koostatud kirjutamisprotsessi ajakava oli üpris loogiline ja realistlik ning andis aimu, millistest tegevustest kirjutamine koosneb. Copiloti esmane ajakava (vt pilti) sisaldas ka puhkepäevi, kuid mitte tagasiside saamist kirjutatavale tekstile. Kui palusime tagasisidevoorudega ajakava täiendada, kadus mitu puhkepäeva. Seega tuleks ajakava sättida vastavalt oma vajadustele.

SISSEJUHATUSE KIRJUTAMINE
Sissejuhatuse asemel genereeris Copilot teksti lühikokkuvõtte. See tähendab, et sissejuhatuses oli infot, mis eeldaks, et lugeja on teksti varem lugenud. Nii olid esitatud "sissejuhatuses" üksikasjad, mis selguvad alles tekstist, viitamata kuidagi, et mingitest väidetest või teemadest saab tekstis lähemalt lugeda. Ka oli nimetatud erinevaid olulisi isikuid, täpsustamata nende täisnime või tegevusvaldkonda.

Sissejuhatuse väljundites torkas silma, et Copilot on eestikeelses suhtluses viisakam kui ingliskeelses, küsides näiteks peale väljundi esitamist, kuidas see promptijale sobib (vt pilti).

KOKKUVÕTTE KIRJUTAMINE
Copilotilt saadud kokkuvõte oli pigem olemasoleva teksti ümberjutustus. Selleks et saada täpsemat tulemust, pidime tegema lisaprompte (vt pilti), kuid tulemus oli originaaliga võrreldes siiski puudulik. Meie katses puudusid roboti kokkuvõttes järeldused ja neil põhinevad mõtisklused, nagu olid originaaltekstis. Lisaks oli roboti kokkuvõte võrreldes inimese omaga isikupäratum ja emotsioonitum.

Seega saab Copilotilt üsna adekvaatse kokkuvõtte enda tekstist ehk ülevaate olulisematest ideedest, mida oma teksti sissejuhatuses ja/või kokkuvõttes kasutada, kuid sissejuhatuse ja kokkuvõtte kirjutamine jääb ikkagi enda teha.

PEALKIRJA PANEMINE
Copilotilt saadud pealkirjad olid enamasti kaheosalised ning robot põhjendas oma esmast pealkirja. Prompte muutes sai eri pikkuse, asjakohasuse ning stiiliga pealkirjavariante. Seega saab Copilotiga mängides pealkirjastamise mõtte käima lükata: pealkirjade eri variante kombineerida ja muuta. Eraldi tähelepanu väärib siin see, kuidas väljund oli sõnastatud: Copilot esitas vastuse küsimusena, justkui suunates promptijat kaasa mõtlema (vt pilti).

TEKSTI PINDMINE KONTROLL. ÕIGEKIRI, STIIL, STRUKTUUR, TERMINIKASUTUS
Teksti pindmises kontrollis torkas kõigi väljundite puhul silma, et kui eestikeelse teksti puhul oli väljundis soovituste loend, siis inglise keeles oli väljundiks parandatud tekst. See tähendab, et esimese prompti järel peaks eestikeelses tekstis ise probleemsed kohad leidma ning parandama, aga ingliskeelse tekstiga lisatööd pole.

Kõige paremini, kuid siiski kesiselt, õnnestus Copilotil õigekirja parandamine. Ehkki selle tegevuse osas Copilot esiti tõrkus (andes väljundiks Hmm...it looks like I can't chat about this. Let's try a different topic.), oli pärast mitmekordset küsimist tulemus arvestatav. Terminite kasutamise eksimusi tuvastas Copilot paremini eesti keeles, tuues välja 5/9 (vt pilti), inglise keeles leidis vaid ühe viiest ning sellegi mitmekordse promptimise järel. Tähtis on tähelepanu pöörata sellele, et Copiloti puhul on terminid võrdväärsed võõrsõnadega (vt pilti).

Võrdselt lootusetud olid struktuuri kohendamine ja stiil. Kummaski keeles ei tuvastanud Copilot, et lõigud on ebaloogilises järjekorras (nt et analüüsist kirjutatakse enne andmete kirjeldamist), ning põhilise soovitusena pakkus Copilot välja alapealkirjade lisamise. Stiili akadeemiliseks muutmise soovile tuli vastuseks küll mõlemas keeles lootustandvaid sähvatusi (eestikeelses tekstis leidis kõnekeelsed väljendid, inglise keeles märkas ebaühtlast viitamist), kuid väljundi hulgas oli ka ebavajalikke soovitusi (nt et kasutada ning asemel ja, argued asemel posited) või selliseid, mis ei puutu konkreetselt akadeemilisse stiili (nt lauses sõnajärje muutmine; vt pilte).

TÕLKIMINE
Tõlkimises ei olnud Copilot kuigi edukas. Nii eesti-inglise kui ka inglise-eesti tõlge oli otsetõlge, säilitades seejuures vastava keele sõnajärje. Mõlemas tõlkes eksis Copilot ka terminitega, tõestades, et ei suuda konteksti mõista (nt ee aktivatsioon = ingl *activation (arousal); ingl abstract = ee *abstraktne (abstrakt); vt pilti).

Promptimise kuupäevad: 18.02 ja 25.02.

Gemini on Google’i arendatud tehisintellektil põhinev tööriist ning seega ühendatud teiste Google’i rakendustega. Näiteks on väljundis rohelisega märgitud viited sarnase sisuga Google’i otsingutulemustele ning kui Geminile vastav luba anda, võib see ühendatud Google’i konto kalendrisse sündmusi lisada. Nagu ka eelnevate tööriistadega, on Gemini vastused genereeritud inglise keele kaudu, mis muudab eestikeelsed väljundid keeleliselt ebaloomulikuks. Samuti märkasime nimetuste asendumist (näiteks “Catalina afääri” asemel “DC-3 intsident”).

IDEEDE GENEREERIMINE tööjuhise põhjal
Palusime Geminil tööülesande põhjal pakkuda kirjutamiseks teemasid. Erinevalt teistest tööriistadest pakkus see konkreetsete ideede asemel üldisemaid teemavaldkondi koos märksõnade ning suunavate küsimustega, mille põhjal teemade üle täpsemalt mõelda. Kui palusime täiendavalt täpsustada, millisele teemale võiks keskenduda, tegi tööriist asjalikke ettepanekuid. Samas ei toonud Gemini erinevalt eelmisest kahest tööriistast välja sündmuste tausta ja osapooli, mainides vaid nendega seotud probleeme ja lahendusi.

Teaduslike allikate soovitusi küsides oli vastuseks loend ajakirjadest ja raamatutest ning teemakohastest aruannetest, kuid erinevalt teistest tööriistadest ei andnud Gemini ühtegi allikani viivat linki. Soovitatud teadusajakirjad olid üldjuhul asjakohased ja sisaldasid sobivaid artikleid, kuid need tuli ise välja otsida. Samas soovitas Gemini ka allikaid, mida meie otsingute põhjal olemas ei ole.  Tööriist andis ka täiendavaid näpunäiteid, kuidas allikaid otsida ja kasutada (vt pilti).

AJAKAVA KOOSTAMINE
Tööriista koostatud kirjutamisprotsessi ajakava asemel oli esimese prompti tulemus see, et promptija Google’i kalendrisse ilmus meeldetuletus “Kirjuta üks tekst”, mille tähtaeg oli ühe kuu pärast. Seda võisid põhjustada mitu asjaolu: Geminile oli Google’i kalendri ligipääs antud ja/või tööriist tõlgendas prompti valesti. Edasisel promptimisel saadud ajakava andis küll üldise ülevaate võimalikest etappidest, kuid ei olnud kõige praktilisem: kolmekümnepäevalises kavas oli käsitletud allikate lugemist, mõtlemist ja kirjutamist üksteisest eraldi, kuigi need tegevused võiksid toimuda paralleelselt. Erinevalt teistest tööriistadest hoiatas Gemini, et koostatud ajakava on soovituslik ja vajab kohandamist (vt pilti). Seega võib tööriistalt mõningaid ideid saada, kuid nendesse tuleb suhtuda kriitiliselt ja tõepoolest genereeritud ajakava endale sobivaks muuta.

SISSEJUHATUSE JA KOKKUVÕTTE KIRJUTAMINE
Sarnaselt teiste mudelite väljunditele sisaldab Gemini kirjutatud sissejuhatus tekstis käsitletud sündmuste kokkuvõtet ja rõhutab nende olulisust. Mainimisväärne on ka eestikeelsete sissejuhatuste pikkuste erinevus: esialgne sissejuhatus oli ootamatult lühike (vt pilti), kui palusime seda pikemaks kirjutada, saime väljundiks neli lõiku. Ingliskeelne tulemus sarnanes nii stiililt kui sõnavaralt teiste mudelite väljunditega.

Sarnaselt ChatGPT ja Copiloti väljundiga koosnes kokkuvõte sisendtekstist võetud ja kohati ümbersõnastatud mõtetest, sisaldamata arutluskäigu põhjal tehtavaid peamisi järeldusi. Samuti esines sama mõtte kordamist erinevas sõnastuses (vt pilti).

PEALKIRJA PANEMINE
Gemini pandud pealkirjad olid sarnaselt teiste tööriistade väljunditele nii eesti kui inglise keeles sama struktuuriga ehk pealkiri: täpsustus (vt pilti). Mõlemas keeles olid pealkirjad pigem kujundlikud ja ilukirjanduslikus stiilis. Ingliskeelsed pealkirjad muutusid lisaprompti tulemusel akadeemilisemaks, aga ka pikemaks.

TEKSTI PINDMINE KONTROLL. ÕIGEKIRI, STIIL, STRUKTUUR, TERMINIKASUTUS
Paludes Geminil õigekirja kontrollida, saime lisaks muid soovitusi nt sissejuhatuse, kokkuvõtte ja viitamise kohta. Tööriist pakkus küll asjalikke soovitusi, nt viitamist ühtlustada või trükivigu parandada, kuid tuvastas ka vigu, mis tegelikult ei olnud vead (vt pilte).

Stiilisoovitusi küsides saime samuti muid juhiseid teksti eri aspektide kohta. Enamjaolt olid nõuanded väga üldised, nt “Korrektuur: Loe tekst hoolikalt läbi ja paranda kõik õigekirja- ja grammatikavead”, mida võib öelda iga teksti kohta (vt pilti). Konkreetseid näiteid probleemsetest lausetest Gemini ei toonud.

Struktuuriparandusi paludes tuletas Gemini taaskord meelde, et promptija saadud väljundit kontrolliks (vt pilti). Selline kommentaar oleks kasuks tulnud ka mujal: kui eestikeelses originaaltekstis oli kasutatud nimetust “Catalina afäär”, siis Gemini võis selle asemel hoopis kasutada “DC-3 intsident” (vt ka pilti osas “Pealkirjade panemine”). Seega tuleb eriti mõistete kasutamise osas igasugust väljundit väga hoolikalt hinnata. Üldiselt sai Gemini struktuuri parandamisega siiski enam-vähem hästi hakkama, kuid sarnaselt teistele mudelitele suunas ka see meid alapealkirju kasutama.

Valede terminite tuvastamise käigus ilmnes Gemini kalduvus manitseda autorit teksti sisu osas (“Võiksid selliste väidetega ettevaatlikum olla”). Ingliskeelses tekstis leidis tööriist 3/5 valedest terminitest ning eestikeelses tekstis mitte ühtegi. Terminite parandamise ülesande juures saime Geminilt ka vastuse, et see ei tea konteksti (vt pilti). Niisugune vastus võib viidata nii sellele, et tööriist  “unustas ära” teksti, mida sellega oli eelnevas sõnumis jagatud, kui ka sellele, et Geminil oli probleeme laiema (ühiskondliku või töö kirjutamise) konteksti tajumisega, mille põhjal vajalikke parandusi teha.


TÕLKIMINE
Tõlkimisel oli Gemini võrdlemisi edukas, kasutades umbes pooli termineid õigesti. Siiski oli lausestus endiselt lähtekeelele omane ja sisaldas kohati kohmakat otsetõlget (originaal: “The paper is devoted to…”; Gemini tõlge: “Käesolev artikkel on pühendatud…”; vrd inimautori originaal “Käesoleva artikli fookuses on…”).

Promptimise kuupäevad: 4.–8. ja 11.03.2025.
Kasutasime mõlemat versiooni (Haiku 3.5 ja Sonnet 3.7) vastavalt sellele, mida Claude kasutada lasi. Oleme katsetuste kirjelduste juures vastava versiooni välja toonud.

Enne esmast promptima hakkamist annab Claude eksplitsiitselt infot, milleks see võimeline on (vt pilti). Teiste TI tööriistade puhul me sellist teadet ei täheldanud. Samuti erineb Claude eelnevalt katsetatud tööriistadest selle poolest, et selgitab väljundis, mida ja miks see teinud on (nt kuidas pealkirja eri osad väljendavad essee eri tahke). Sellised kommentaarid võivad aidata teksti paremini läbi mõelda ning seeläbi kirjutamisprotsessist rohkem õppida. Samas tuleb ka siin meeles pidada, et igasugust väljundit tuleb alati ise kriitiliselt hinnata.

Eesti keelega esines Claude’il veel suuremaid probleeme kui teistel tööriistadel, eriti teksti tootmisel (nt “Tee outline'i ehk kontuurjoonis”, “Ära torgi veel vormistamisega”, “Viimeista sisu”). Samuti oli seda sagedaste tõrgete ning tasuta versiooni mahupiirangute tõttu teistest tülikam kasutada. Sarnaselt teiste mudelitega ilmnes Claude’il kalduvus mistahes kindla küsimuse ehk prompti (nt struktuuri või stiili parandamine) väljundis teha ettepanekuid ka teksti teiste aspektide kohta. 

IDEEDE GENEREERIMINE tööjuhise põhjal (versioon Haiku 3.5)
Teksti teemadeks olid Claude'il originaalsemad ideed kui teistel TI tööriistadel, üllatades oma spetsiifilisusega (nt "Mereveo julgeolekuohud ja piraatlus Somaalia rannikul"). Teiste ideede hulgas pakkus Claude välja uurida AI reguleerimist eri riikides, mis tekitas huvitava metatasandi. Allikate pakkumisel tõdes Claude esmalt, et sellel puudub ligipääs internetile, mistõttu lingid võivad olla valed (vt pilti).

Sarnaselt kõigi katsetustega olid väljundis enamjaolt päriselt eksisteerivad allikad, mõned neist ka teaduslikud, kuid autor peab ise hindama, millised neist ikkagi teemakohased ja sobilikud on.

AJAKAVA KOOSTAMINE (versioon Haiku 3.5)
Claude’i koostatud ajakava ei olnud adekvaatne. Esiteks olid osad tegevused ebaloogilises järjekorras (nt soovitas Claude allikate põhjal märkmeid teha enne, kui nende usaldusväärsust kontrollida; suvalisel ajal on ülesanne “valmista ette viited”). Teiseks olid ühed tegevused tööriistale olulisemad kui teised (nt oli kolm korda ajakavas ülesandeks kontrollida, et tekst vastab nõuetele). Kolmandaks, kui palusime tööriistal tagasiside küsimise ajakavva lisada, siis soovitas Claude teha seda kolm korda nädalas. Lisaks õppejõu tagasisidele soovitas Claude tagasisidet küsida kaasõpilastelt ning teha enesehindamist, selgitamata viimase sisu. Samas soovitas Claude sarnaselt teiste tööriistadega olla ajakavas paindlik ning jätta aega puhkamiseks (vt pilti).

SISSEJUHATUSE JA KOKKUVÕTTE KIRJUTAMINE (versioon Sonnet 3.7)
Esimese prompti väljund oli mõlemas keeles tekstide puhul kolme lõigu pikkune sissejuhatus. Pärast palvet seda lühendada, kahandas Claude sissejuhatuse üheks kompaktseks ja tihedaks lõiguks. Sissejuhatus algas Claude'i kokkuvõttega kõnealusest sündmusest ja selle tähendusest ning lõppes laiema üldistuse ja küsimusega. Claude lisas väljundile selgitava kommentaari selle kohta, mida koostatud sissejuhatus sisaldab ning miks see sobib selle teksti “eessõnaks” (vt pilti). Mõlemas keeles oli sissejuhatustele pandud pealkiri. 


Nii inglis- kui ka eestikeelse teksti kokkuvõttes jutustas Claude esmalt teksti pikalt ümber (vt pilti). Lisapromptide tulemusena kokkuvõte lühenes ning oli loogilise struktuuriga. Eestikeelse teksti kokkuvõttes ja ka sissejuhatuses esines keelevigu.

PEALKIRJA PANEMINE (versioon Sonnet 3.7)
Üldiselt on Claude’i pealkirjad nii eesti kui inglise keeles täpsemad kui teiste tööriistade omad, samas on need tunduvalt pikemad ja annavad tekstist selge ülevaate. Pealkirja lühendamisel pidi olema kannatlik, sest Claude’ile tuli mitu prompti kirjutada. Sarnaselt teiste tööriistadega kasutab Claude enamasti pealkirjades koolonit. Mõlemas keeles tekstile antud pealkirjadega kaasneb selgitus, miks pealkiri sellele tekstile sobib (vt pilte). Seejuures on ingliskeelne selgitus põhjalikum.

TEKSTI PINDMINE KONTROLL. STRUKTUUR, STIIL, TERMINIKASUTUS, ÕIGEKIRI (versioon Sonnet 3.7)
Nagu teised tööriistad, esitab Claude struktuuriparanduste soovitused pealkirjastatud täpploendite kujul (vt pilti). Claude suutis tuvastada struktuuri ebaloogilisused (nt et analüüs tuleb enne andmete esitamist), kuid kui palusime sellel soovituste asemel tekst ise loogilisemalt ümber kirjutada, tegi see teiste tööriistadega sarnaselt isetegevust, näiteks lühendas teksti ulatuslikult.

Stiili kohendamine varieerus samuti: eestikeelses tekstis parandas Claude ära kõik vead (vt pilti), aga inglise keeles see nii hästi ei õnnestunud. Positiivne on see, et Claude osutas konkreetsetele tekstikohtadele (nt et teine lõik on liiga pikk) ja esitas ka soovitusi, kuidas teksti sõnastust parandada saaks. Samas oli väljundis ebavajalikke soovitusi, nt soovitus tekstis mainida, mis viitamisstiili järgi viiteid vormistatakse.

Terminikasutuse kontrollimine oli samuti eestikeelses tekstis tulemuslikum: Claude leidis esimese promptiga pea pooled valed terminid üles (vt pilti), ingliskeelses tekstis ei leidnud ühtegi.

Õigekirjavigadest tõi Claude mõlemas keeles tekstist umbes 2/3 välja. Eestikeelses tekstis jäid aga märkamata mustrid (ehk nt tõi välja üksikud sõnad, kus ü asemel oli y, aga mitte kõik). Nagu teisedki TI-l põhinevad tööriistad, soovitas Claude muuta ka viitestiili: tegelikult oli originaalteksti viitamine õige, aga see lihtsalt ei vastanud tööriista ootustele/eelistustele. Kui eestikeelse teksti õigekirjas andis Claude parandatud versiooni ette (vt pilti), siis ingliskeelse teksti väljundis oli soovituslikke muudatusi pigem kirjeldatud. Igal juhul peab vead (nii stiililised, terminoloogilised kui ka õigekirja) tekstis ise üles otsima ning mõlemas keeles oli paranduste hulgas ebatäpsusi, mitte-vigu ja muid ebavajalikke soovitusi.

TÕLKIMINE
Samamoodi nagu teised TI tööriistad, teeb Claude otsetõlget ja säilitab seejuures promptis antud teksti lauseehituse (ka juhul, kui sõnajärg on keeltes erinev). Seetõttu esines väljundis kohmakust ja kummalisi fraase (nt “Artikkel on pühendatud [teemale]”). Kuigi eesti keelest inglise keelde tõlkimine paistis paremini sujuvat, esines ka selles vigu (nt ei avaldunud = *not evident, mis pigem viitab sellele, et mõju polnud ilmne). Kuna siin kasutasime kahte Claude'i versiooni (Haiku 3.5 ja Sonnet 3.7), joonistusid välja versioonide erinevused. Näiteks oli Claude 3.5 Haiku terminite tõlge vigane: näiteks ingl Votic 'vadja keel' tõlkis Claude sõnaks voodi (vt pilte).

 

Promptimise kuupäevad: 06. ja 13.05.2025
Mudel: “Best” (valib iga otsingu järgi parima mudeli), säte “Search” (“Fast answers to everyday questions”)

Perplexity suurim eelis teiste TI-l põhinevate tööriistade ees on vastuste varustatus allikatega – need ei ole alati akadeemilised allikad, kuid on pigem asjalikud. Samas pakub Perplexity allikaid ka sellistes etappides, kus seda oodata ei oskaks (nt pealkirja panemise juures). Eri etappides jääb silma muster, et tööriist saab ülesannetega paremini hakkama inglise keeles.

Perplexityt saab kasutada sisse logimata, kuid sellisel juhul ei salvestu päringud ajalukku. Lisaks on tekstikastil kasutaja jaoks peidetud tähemärkide limiit: väga pika prompti puhul (nt andes sisendiks terve teksti) peab selle Perplexitysse lisama failina, mis on aga tasuline. Sellest piirangust saab üle teksti lõik lõigu haaval tekstikasti kopeerides.

IDEEDE GENEREERIMINE tööjuhise põhjal
Perplexity pakub teksti teemade jaoks mitmeid asjakohaseid ideid. Tegu on meie katsetustest ainsa tööriistaga, mis ilma küsimata selle ülesande juures allikatele viitab. Need allikad ei ole küll akadeemilised, aga on teemakohased ja usaldusväärsed.

AJAKAVA KOOSTAMINE
Perplexity koostab üldjoontes mõistliku ajakava, kus on tegevused esitatud nädalate kaupa, määramata täpselt seda, mis päeval millega tegelema peab. Kava tekitab kohati küsimusi, sest tegevuste hulgas on nimetatud mitmel korral “mõtlemist”, “arutlemist” ja “analüüsimist”, aga samas ei ole arusaadav, kas seda tuleks teha kirjalikul kujul – kui mõeldud pole kirjalikku tegevust, toimub esimene päris kirjutamisessioon ajakava järgi alles kolmanda nädala lõpus. Kui palusime lisada ajakavasse tagasiside küsimise, siis saime soovituse küsida tagasisidet igal nädalal kas juhendaja või (usaldusväärse) kaasõppija käest. Plaani tagasiside lisamisega muutus mõnel määral muude tegevuste kirjeldus: nt kui eelnevalt pidi kolmandal nädalal arutlema, “kas sündmus on probleem”, on nüüd kavas kirjas, et tuleb kirjutada osa, kus arutleda “sündmuse probleemse poole üle” (vt pilte).

SISSEJUHATUSE JA KOKKUVÕTTE KIRJUTAMINE
Nii eesti kui inglise keeles kirjutas Perplexity suhteliselt asjalikud ja hea keelekasutusega sissejuhatused, kusjuures ka siin lisab tööriist tekstile allikad (ajakirjanduslikud tekstid ja Vikipeedia; vt pilti).

Kokkuvõtte kirjutamisel saab Perplexity inglise keeles hakkama märgatavalt paremini kui eesti keeles. Eestikeelses tekstis esinevad muu hulgas õigekirjaprobleemid (nt vorm vältitud ‘välditud’; vt pilti). Lisaks jääb silma muster, kus kokkuvõttesse on jõudnud tekstist pärit laused, mida on vaid veidi muudetud. Ka selle ülesande juures lisab tööriist teksti külge allikaid – eestikeelse kokkuvõtte puhul üksnes Vikipeedia, ingliskeelse teksti kokkuvõtele on lisatud lausa kaheksa allikat.

PEALKIRJA PANEMINE
Perplexity pakutud pealkirjad järgivad üldiselt struktuuri nimisõnafraas: nimisõnafraas. Ka selles etapis soovitab Perplexity allikaid, mis on etapi olemust arvestades küllaltki ootamatu (tegu pole õpetustega, kuidas pealkirju panna, vaid allikad on sisuliselt teksti teemaga seotud). Palve peale eestikeelset pealkirja lühendada jooksis tööriist aga kokku ja lõpetas oma pakkumised alles stopp-nupu vajutamisel (vt pilti).

TEKSTI PINDMINE KONTROLL. STRUKTUUR, STIIL, TERMINIKASUTUS, ÕIGEKIRI
Teksti pindmise kontrolli kvaliteet varieerub ja sõltub väga palju keelest. Lõikude järjestamisel ei saanud Perplexity pihta ei lõikude sisule ega tekstis olevatele vihjetele (nt lõik, mis algas sõnadega “Viimane õppetund”, ei olnud teksti viimane lõik). Lisaks soovitas Perplexity nii eesti kui ka inglise keeles lõike või lauseid lühemaks teha ja sidusust parandada konkreetseid näiteid toomata. Ingliskeelse teksti struktuuri osas soovitas tööriist panna alapealkirju, eestikeelses tekstis keelt lihtsustada.

Stiili teemal promptides kontrollis tööriist lisaks stiilile ka struktuuri ja õigekirja, mille kohta küsitud polnud. Seejuures ei mõista tööriist kujundlikku keelt, kuid tunneb slängi. Lisaks ilmnes, et Perplexityl on inglise keeles kindel ettekujutus, mida essees olema ei peaks: mina-vormi, viidet lause keskel, palju tsitaate ega ajaloolist konteksti.

Termineid tuvastas Perplexity vahelduva eduga: kohati tuvastas see vale termini ning pakkus korrektset alternatiivi, ülejäänud pakkumised alternatiivi ei pakkunud või ei olnud tegemist terminitega, vaid muude sõnastusküsimustega. Ingliskeelse teksti puhul lähtus tööriist hoopis teemaga seonduvast terminoloogiast ja kontrollis seda. Kui prompti täpsustasime, tuvastas Perplexity kaks problemaatilist terminit viiest ja seejärel väitis, et kõik ülejäänud sõnavalikud on korrektsed.

Õigekirja parandamisega sai Perplexity pindmise kontrolli teemadest kõige paremini hakkama (eriti inglise keeles), kuid ka siin tegi tööriist ebavajalikke parandusi. Eesti keele puhul olid mõned soovitused kahtlased ja isegi segadusttekitavad (vt pilte). Näiteks, tekstis ühe korra kasutatud sõna päiva soovitas Perplexity asendada sõnaga päeva kuuel korral; TI-l põhinev tööriist annab soovituse ühe viidatud asutuse nime (Riksarkivet ehk Rootsi Riigiarhiiv) järjepidevalt suure või väikese tähega kirjutada jne.

TÕLKIMINE
Tõlkimisel ilmnes, et Perplexity oskab inglise keelde paremini tõlkida kui eesti keelde (vt pilte). Inglise keeles eksis see paari terminiga, kuid tekst tervikuna sarnanes inimese tõlgituga (siiski oli inimautor keelega rohkem mänginud). Inglise keelest eesti keelde tõlkides oli tulemus palju halvem: tekst oli kantseliitlik, kohmakas ja valesti tõlgitud termineid täis. Eesti keelde tõlkides pakkus Perplexity teemaga seonduvaid allikaid, kuid inglise keelde tõlkides olid allikad hoopis tõlkimisega seotud.


Tagasi: ChatGPT ja teised tekstirobotid
Edasi: MS Wordi abivahendid viimistluseks

Kommentaarid, soovitused ja kogemused selle teema kohta saab lisada siia.