In fertaalprogram is net foar leafdesbrieven

  • A. Dykstra

Press/Media: Public Engagement Activities

Description

Op 2 febrewaris komt it Taalweb Frysk fan de Fryske Akademy on-line, mei dêryn in automatyske oersetter Nederlânsk- Frysk en oarsom. Oan de ein fan it jier folget Google Translate foar it Frysk en it Ingelsk. It wurdt foar wa’t it Frysk, Ingelsk of Nederlânsk net goed yn ’e macht hat hieltyd makliker om oan in oersetting te kommen. By beide projekten is foar taalkundige dr. Anne Dykstra in sintrale rol weilein. Hy mei septimber ferline jier dan mei pensjoen gien wêze as meiwurker fan de Fryske Akademy, dat betsjut net dat er him folslein weromlutsen hat. It Taalweb Frysk is no klear, dat it kin iepensteld wurde foar it publyk. Wa’t wat fan it Frysk yn it Nederlânsk of wat fan it Nederlânsk yn it Frysk oersette wol, kin tenei op dat taalweb terjochte. Typ lofts in sin yn en rjochts ferskynt de fertaling. Garânsjes foar de kwaliteit fan de oersettingen – mar dat jildt foar elke fertaalprogramma – binne der net. It programma is basearre op statistyk, net op taalkunde. Meiwurkers van de Fryske Akademy hawwe de ôfrûne jierren in smite teksten út boeken, folders, nota’s en websiden dy’t yn it Frysk en it Nederlânsk beskikber wiene ynfierd. It korpus omfettet alles mei elkoar sa’n 2,5 miljoen wurden. Yn it fertaalprogram giet it lykwols net om wurden, mar om wurdgroepen. Dat program berekkenet neffens Dykstra op grûn fan de frekwinsje fan dy wurdgroepen yn it korpus de meast wierskynlike konstruksje. FERRASSEND De kwaliteit fan de oersettingen dy’t brûkt binne foar it korpus spilet gjin rol, tiid om dêr nei te sjen wie der net. Se hawwe by de Akademy wol sjoen oft de Nederlânske en de Fryske tekst sa’n bytsje like lang wiene en se der dus fanút gean mochten dat it om in yntegrale oersetting en net om in gearfetting gie. Gaadlike teksten binne foarbewurke om foar de oersetter in sa goed mooglik resultaat te krijen. De útkomsten binne lykwols faak ferrassend, soms yn geunstige, oare kearen yn in minder geunstige sin. Samar wat foarbylden. ,,De man koopt een fles melk’’ moat neffens it taalweb oerset wurde as ,,De man keapet foar in flesse molke’’. Anne Dykstra: ,,Dat komt, ‘keapet’ dûkt sa faak yn kombinaasje mei ‘foar’ op, dat it program op grûn fan de sifers yn it korpus gokt dat it der ek yn dy sin by moat.’’ In folgjende sin: ,,Zij is naar Leeuwarden verhuisd.’’ Dat wurdt: ,,Hja is nei Ljouwert ferhuze.’’ Moai- e kombinaasje, dat âldfrinzige ‘hja’ mei it eigentiidske ‘ferhuze’. Immen dy’t geef Frysk foarstiet, soe ‘ferfearn’ brûkt hawwe. De ferklearring foar ‘hja’ is dat it korpus foar in grut part út boeken wei opboud is. Oant foar koart wie it gebrûklik om ‘zij’ – dat yn it Nederlânsk faak brûkt wurdt as dêr de klam op leit – oer te setten mei ‘hja’. In lytse kontrôle toant oan dat dy ûnderstelling hout snijt. ,,Hja is siik’’ wurdt ,,Zij is ziek’’, ,,Ze is ziek’’ wurdt ,,Se is siik’’. Anne Dykstra krijt de smaak te pakken en betinkt noch wat foarbyldsintsjes mei konstruksjes dêr’t er it measte net fan ferwachtet: ,,Ze gaan trouwen.’’ Wêr’t er bang foar is, bart. As oersetting wurdt jûn: ,,Se geane trouwe.’’ Soks docht elkenien dy’t wat mei it Frysk hat sear oan ’e eagen. It wurd ‘gean’ is allinne tastien yn kombinaasje mei wurden as ‘stean’ - ,,hy giet stean’’ -, ‘lizze’ en ‘sitte’. De goede oersetting: ,,Se sille trouwe.’’ Anne Dykstra: ,,Dêr kinst oan sjen dat it korpus noch te lyts is. Der binne net genôch data om mei te rekkenjen. Nei alle gedachten komt de kombinaasje ‘gaan trouwen’ net ien kear foar, en pakt it program dy wurden apart.’’ Dykstra ferwachtet ek dat de tiidwurdfolchoarder problemen jaan sil foar de oersetter. En yndie, as er ,,dat ze gaan trouwen’’ yntikket, krijt er as oersetting ,,dat se gean trouwen’’. It giet ek wolris goed. ,,Dat hij ziek zou zijn’’ fertaalt it program yn ,,Dat er siik wêze soe’’. Dykstra: ,,De kombinaasje ‘zou zijn’ komt blykber sa faak foar, dat er dêr ‘wêze soe’ fan makket. Itselde jildt foar ‘dat er’. It ûnbeklamme ‘hy’ wurdt ‘er’ yn Frysk. GOOGLE TRANSLATE Oersette mei in fertaalprogram is neffens Dykstra in kwestje fan statistyk. Wat grutter it korpus, wat grutter de kâns dat der in goede oersetting út ’e bus rôlet. Dêrom is it foar in lyts taalgebiet as it Frysk ek dreger om ta in goed fertaalprogram te kommen as foar in gruttere taal. Dykstra: ,,Earder is ek wol besocht om taalkundige regels yn te fieren, mar dat wie fierste yngewikkeld. Dat tsjintwurdich wurkje al dy fertaalprogramma’s op basis fan statistyk en dat wurket no ALING ienkear better mei in sa grut mooglik korpus.’’ Underwilens is er drok dwaande mei de tariedingen om Frysk ta te foegjen oan Google Translate. Dat is net allinne fan belang foar minsken dy’t teksten fan it Frysk yn it Ingelsk of fan it Ingelsk yn it Frysk oersette wolle. It Ingelsk wurdt ek as helptaal brûkt om talen dy’t net as ‘pearke’ op Google Translate foarkomme oan elkoar te keppeljen. Sa soe men aanst ek sinnen fan it Frysk yn it Italiaansk of it Spaansk fertale litte kinne. Anne Dykstra jout daliks ta dat de betrouberens der mei in tuskentaal net grutter op wurdt. ,,Ast ien fan beide talen net goed behearskest, soe ik net blyn ôfgean op in fertaalprogram. Seker net by in saaklike brief. Ek net by in leafdesbrief trouwens.’’ Dykstra hat it kontakt mei Google lein mei in mailtsje, yn fideokonferinsjes ha se de plannen fierder útwurke. It foel him op dat Google hiel graach meiwurkje wol en ek net te beroerd is om sels yn it projekt te ynvestearjen. Hat it feit dat it Frysk fan alle besteande talen it tichtste by it Ald-Ingelsk stiet dêr noch by holpen? Anne Dykstra: ,,Dat ha’k wol ferteld fansels en dat fûne se ek bêst aardich, mar ik leau net dat it in rol spile hat. Se hiene it oars ek wol dien. Google wol gewoan oeral wêze yn alle talen.’’ Google Translate wurket mei communities, foar it Frysk-Ingelsk is soks der no ek. Foar it taalweb Nederlânsk-Frysk hat de Akademy alles wat se oan twatalige teksten fine koene ynfierd, Google wurket oars. Dykstra: ,,De ûnderfining hat har leard dat minsken foaral koarte Der binne net genôch data om mei te rekkenjen sintsjes oersette litte. En Google wit op grûn fan dyselde ûnderfining ek hokker sintsjes it meast foarkomme. Wa’t yn dy community stapt, krijt hieltyd nije sintsjes foarlein dy’t oerset wurde moatte.’’ OERSETDEI Dykstra is in pear moanne lyn úteinset mei it oersetten fan dy sintsjes. Doe’t er in stik as hûndert klear hie, hat er kontakt socht mei de LC. De deis nei publikaasje, telde er fiifhûndert nije oersettingen. Nei dat earste entûsjaste begjin sakke it oantal bydragen fan oaren wer yn. Dykstra hopet dat er de kommende tiid wer wat mear stipe krijt. Betingst is wol dat de meiwurkers beide talen, it Ingelsk en it Frysk, goed yn ’e macht hawwe. De Akademy hat yn oerlis mei Google ek besletten om in oantal boeken dy’t fan it Frysk yn it Ingelsk en fan it Ingelsk yn it Frysk oerset binne, yn te fieren. Dêrby giet it faak om wat langere sinnen en om wat mear spesifike ûnderwerpen dy’t yn de sintsjes fan Google net foarkomme. Om’t Google leafst dit jier noch on line wol, sammelje se ek sels teksten. Ek TRANSLA binne se mei it foarstel kommen om ynkoarten ris in provinsjale Google-oersetdei te organisearjen. Dykstra: ,,Gewoan in hiele ploech saakkundigen in hiele dei oan it fertalen sette, krekt as wy eartiids dien hawwe by de Frysktalige Leeuwarder Courant. Dat liket my wol wat.’’ Dykstra hat mei Google ôfpraat dat hy as trusted translator alle oersettingen ûnder eagen krijt. De ferkearde smyt er fuort of past er oan, foar it oare is it – krekt as op it taalweb – in kwestje fan statistyk. De meast foarkommende oersettingen wurde oan de fraachsteller presintearre. Dat it ek foar immen as Anne Dykstra, dy’t Frysk en Ingelsk studearre hat, soms noch dreech genôch is om in goede oersetting te betinken, jout er oan mei in foarbyld. ,,Nim in útdrukking as ,,easy come, easy go’’. It earste dat my yn it sin komt is it Nederlânske ,,zo gewonnen, zo geronnen’’. ‘Geronnen’ ferwiist yn ’e fierte nei ‘rennen’, maar om der dan ,,sa wûn, sa rûn’’ fan te meitsjen… Dat haw ik noch noait ien sizzen heard. As ien in goed idee hat, graach.’’

Period23 Jan 2015

Media coverage

1

Media coverage

  • TitleIn fertaalprogram is net foar leafdesbrieven
    Media name/outletLeeuwarder Courant
    Duration/Length/SizeLjouwert
    Date23/01/2015
    Producer/AuthorSietse de Vries
    PersonsA. Dykstra