Jeg er nu fan af undervisningsministeriet

TænkFor et år siden var der ballade, fordi elever “snød” ved at bruge Google Translate til oversættelser. Lærernes reaktion var at forbyde i stedet for at undervise i de nye muligheder: Elever snyder med Google Translate. Forbud er ikke vejen – undervis i korrekt brug.

Nu giver undervisningsministeriet lov til at benytte Google Translate: Danske elever må tage Google med til eksamen. Det er klogt. Kvalitets- og Tilsynsstyrelsen begrunder:

For det første har udviklingen på it-området betydet, at man med it-værktøjer i stadig stigende grad kan udforme autentiske prøver, som modsvarer de udfordringer, eleven vil møde i sit videre uddannelsesforløb og arbejdsliv.

For det andet vil en udvidet brug af digitale prøver indvirke på tilrettelæggelsen af undervisningen, som derved i højere grad kommer til at nærme sig den virkelighed, eleverne møder uden for undervisningslokalet.

Google Translate bliver stadig bedre – dog mest til oversættelse mellem sprog i samme sprogstamme. Forleden oversatte jeg et gæsteindlæg her på dSeneste fra engelsk til dansk: Vi har brug for reformer af ophavsret, ikke ACTA. Det gik forbløffende godt med Google Translate, men oversættelsen var bestemt ikke korrekt. For eksempel oversatte Google a broader picture til et bredere billede, som nok er forståeligt men burde være et større perspektiv.

Det skal man undervise, og så skal man lære eleverne, hvordan de kan hjælpe Google Translate ved at foreslå bedre oversættelser.

Undervisningsministeriet er på rette spor. Eleverne skal bruge alle de muligheder, der er på nettet – og alle andre steder. De skal være kritiske og forstå, at Google, Wikipedia og alle websteder er fantastiske kilder, men de er ikke autoriserede og kanoniserede. Eleverne skal lære kildekritik.

Der skal slet ikke være autoriserede og kanoniserede kilder – for det er der ikke ude i virkeligheden. Der er kaos, misinformation og manipulation. Det skal man lære at navigere i.

Man skal afskaffe lærebøger og indføre kildekritik. Tak til Undervisningsministeriet, vi er på rette vej.

Foto: dSeneste.

Følg de tyske mediestemmer med Google Reader og Translate

Tyske medierDRs ugentlige mediemagasin på P1, Mennesker og Medier, sender for tiden serien Mediestemmer fra Tyskland.

Det er spændende. Lasse Jensen har rejst rundt i det tyske medielandskab og spurgt, hvordan det går, og det går tilsyneladende meget bedre end i Danmark.

Og han har jo ret, når han siger, at vi her i Danmark er alt for fokuserede på det angelsaksiske og nordiske, så jeg har besluttet at følge lidt med i, hvad der foregår syd for grænsen og har som udgangspunkt valgt nedenstående kilder, som alle fokuserer på, hvad der sker på nettet. Og jeg regner med, at de vil føre mig videre til andre interessante kilder:

Da jeg ikke er så skrap til tysk, får jeg Google Translate til at oversætte for mig. Det foregår helt automatisk på følgende måde:

  1. Opret en konto på Google Reader;
  2. Vælg et af ovenstående RSS-feeds (klik med højre musetast og vælg “kopier link” eller “kopier genvej” eller noget i den stil);
  3. Klik på knappen “Tilføj et abonnement” øverst til venstre i Google Reader;
  4. Tast Ctrl. + V for at indsætte det kopierede link;
  5. Klik på knappen “Feed-indstillinger”;
  6. Vælg “Ny mappe” og navngiv mappen “Tyskland”;
  7. Klik på mappen og derefter på “Mappeindstillinger”;
  8. Vælg “Oversæt til mit sprog”.

Google Reader

De øvrige feeds skal kopieres på samme måde og lægges i samme mappe, så bliver de alle automatisk oversat til dansk eller det sprog, der er valgt i Google Reader. Du kan skifte sprog i Google Reader ved at klikke på “indstillinger” øverst til højre og vælge “Læser-indstillinger”. Her kan du angive det sprog, Google oversætter til.

Nogle feeds indeholder kun korte uddrag af artiklerne. Man skal klikke på overskriften og åbne webstedet for at læse hele artiklen, men Google Translate oversætter automatisk artiklen.

Oversættelserne er langt fra perfekte, men de er gode nok til mig.

Se også: Sådan får du en ny vinkel på VM i fodbold og slipper for at skrive det samme som de andre.

Elever snyder med Google Translate. Forbud er ikke vejen – undervis i korrekt brug

Google TranslateDanske elever snyder med Google translate, skriver comon.dk i dag, og det skal nok passe. Hvorfor skulle de ikke det? Google Translate er fantastisk og kan bruges til mange ting – men ikke til at oversætte korrekt.

Det er ikke snyd at bruge ny teknologi, men det er dårlige lærere, der ikke underviser i at bruge den rigtigt. Hvis en elev kun bruger maskinoversættelse til hjemmearbejdet og tror, oversættelsen er korrekt, har læreren svigtet eleven.

Lærernes reaktion er at forbyde Google Translate. Det er dumt. Det er ikke Google, der er noget galt med, det er undervisningen.

Google Translate bør være en del af sprogundervisningen, og det kan gøres på mange kreative måder.

Her er et par forslag:

  • Oversæt en tekst med Google Translate og bed eleverne rette den;
  • Bed eleverne analysere oversættelserne for at finde Googles styrker og svagheder;
  • Oversæt fra et sprog til et andet og derefter tilbage. Det er sjovt.

Afløsningsordbog

Knud Hjortø, AfløsningsordbogDu har uden tvivl savnet Knud Hjortøs Afløsningsordbog, der anviser gode, danske ord i stedet for de frygtelige fremmedord, som truer vort sprog.

Afløsningsordbogen forsvandt fra nettet, da TDC nedlagde alle kundernes hjemmesider – og altså også min, som jeg muntrede mig med tilbage i 90erne.

Nu har ordbogen så fundet et nyt hjem på min nye legeplads, DCentral, og du kan igen se, hvad du skal skrive i stedet for advokat, bifald, chok, debat, egoist, familie, garderobe, humor, idiot, jalousi, klima, logik, maskulin, naiv, onkel, politik, relativ, sarkasme, tilbehør, ukrudt, vulgær, xylofon, zone, æstetisk, økonomi og alle de andre misfostre, som ikke hører hjemme i vort smukke sprog.

Hele nettet er arabisk, og der er ingen dokumenter

FlowI den seneste uge har alle talt om den arabiske oversættelse af bogen “Jæger – i krig med eliten” og alle har ledt efter den på nettet.

Det svarer til at lede efter et dokument med et søgeresultat for at dokumentere, at søgeresultatet findes.

Når man søger på Google, viser Google ikke et “dokument”, og man taler ikke om, at søgeresultatet “ligger på nettet”.

Oversættelser fungerer på samme måde. Man sender en forespørgsel – altså originalteksten – og beder om et svar – oversættelsen. Google Translate producerer oversættelsen, men den ligger ikke noget sted på nettet.

Hvis en tekst findes på dansk, findes den på alle de sprog, Google Translate understøtter. Det kræver bare et klik. Kvaliteten er ofte tvivlsom, men det er en anden diskussion.

Det er meget muligt, at “Jæger – i krig med eliten” eller uddrag af den er oversat tusindvis af gange, uden der nogensinde er produceret et dokument med oversættelsen.

Sådan fungerer nettet i stadig større omfang. Det er ikke en samling dokumenter. Det er informationer, som bliver produceret til lejligheden ud fra kriterier i en forespørgsel. Disse informationer “findes” ikke – kun i det øjeblik, forespørgslen behandles.

Denne udvikling er tydeligst med informationer, der genereres af computere: søgeresultater, maskinoversættelser, beregninger og statistikker. Disse informationer ændrer sig hele tiden og “findes” ikke.

Udviklingen gælder dog også almindelige tekster, skrevet af mennesker. De er heller ikke statiske dokumenter. Et opslag på Wikipedia kan ændre sig fra time til time. Man kan nok sige, at opslaget “ligger på nettet”, og man kan linke til det, men det er ikke en statisk tekst, for der er hele tiden nogen, der ændrer den.

På nettet bliver begreber som artikler og bøger opløst og meningsløse. Der er ingen “dokumenter”.

Dette er tilsyneladende svært at forstå, hvis man er vant til en papirvirkelighed, hvor en tekst er en tekst, som ikke står til at ændre.

Men denne udvikling vil fortsætte, og vi vil i stadig stigende omfang få informationer, der er tilpasset tidspunktet, vores køn, alder, opholdssted, sprog og alt muligt andet. Den individuelle tilpasning sker allerede med søgninger, hvor søgeresultatet blandt andet er tilpasset efter, hvor i verden man befinder sig.

Når vi alle gradvist løsriver os fra papirvirkeligheden, vil vi i stigende omfang forvente disse tilpasninger.

Vi forventer, at et søgeresultat er aktuelt og relevant. Vi er ikke interesseret i sidste uges søgeresultat. Det samme gælder vejrudsigten, valutakurser og prisen på leverpostej, og sådan bliver det med flere typer information, for eksempel nyheder. Vi forventer ikke et “dokument”, vi forventer aktuel og relevant information, ofte sammensat fra mange kilder og tilpasset vores situation og behov.

En oversættelse vil vi end ikke klikke for at få. Vi vil forvente, at alt automatisk bliver oversat til vores foretrukne sprog. Derfor er det meningsløst at lede efter et “dokument” med en arabisk oversættelse af en bog. Hvis teksten findes på et sprog, findes den på alle.

Foto: armintalic.

Internettet elsker Danmark

What Does The Internet ThinkSøgemaskinen What Does The Internet Think undersøger den generelle holdning til et søgeord. Ud fra søgninger på Google, Yahoo, Bing og Twitter vurderer den, om omtalen af søgeordet er overvejende positiv, negativ eller neutral.

Hvis man søger “Denmark” konkluderer den ud fra 42 søgninger og 131.008.590 søgeresultater, at holdningen er 100 procent positiv. Desværre er den ikke så smart, at den kan se, om den positive holdning skyldes VisitDenmarks KarenDK26, men hun har ihvertfald ikke gjort nogen skade, hvis man skal fæste lid til analysen – og det skal man nok være forsigtig med.

Man kan ikke søge på arabisk, og det ville da være en interessant sammenligning.

Det kan man til gengæld på Google Insights for Search, som viser interessen for et søgeord gennem en periode. Her kan man se, at interessen for Danmark – altså det arabiske ord – var særlig stor i begyndelsen af 2006, og det er vel ikke nødvendigt at forklare, hvorfor.

Google fortæller ikke noget om holdningen men linker til relevante nyhedshistorier. Den seneste historie er fra et irakisk medie, som under rubrikken Skandale i Danmark refererer Ekstra Bladets historie om irakiske politikere, der både får løn i Irak og pension i Danmark.

Den historie kan man så oversætte med Google Translate. Oversættelsen vinder ingen priser, men man kan bestemt forstå det.

Jeg elsker internet ligeså højt, som det ifølge What Does The Internet Think elsker Danmark.

Google oversætter internet

FlagGoogle er stille og roligt ved at implementere oversættelsesfunktioner i alle deres tjenester. Dette er en gennemgang af mulighederne.

Hidtil har Google udelukkende benyttet maskinoversættelser, men det nye Translator Toolkit kombinerer oversættelser foretaget af mennesker med maskinoversættelser for at få en bedre kvalitet. Mere om det længere nede.

Kvaliteten af oversættelserne afhænger i høj grad af, hvilke sprog man oversætter imellem – og der er 41 at vælge imellem. Google er temmelig god til oversættelser mellem dansk og engelsk, men det kniber mere med oversættelser mellem sprog, der ikke ligner hinanden så meget.

Vi har næppe set enden på denne udvikling. Googles mål er formodentlig at vise hele internettet på det sprog, man ønsker, og ingen vil spekulere over, hvilket sprog teksten oprindeligt er skrevet på. Der vil formodentlig også komme oversættelser i realtid, så man kan chatte på tværs af sprog – hvad Microsoft allerede har implementeret på MSN Messenger.

På lidt længere sigt vil Google måske også tilbyde oversættelser af bøger i Google Books. Det svimlende perspektiv er, at al tekst kan læses på alle sprog, men der er nok et stykke vej.

Her er en oversigt over Googles oversættelsesfunktioner, og jeg har næppe fået dem alle med.

Almindelig søgning
Google TranslateI almindelige søgninger ser jeg stadig oftere en mulighed for at søge det samme på et andet sprog. På skærmbilledet her har jeg søgt ordet “forfatning”, og Google tilbyder så at søge den engelske betegnelse “constitution”. Hvis jeg klikker, søger Google det engelske udtryk og oversætter automatisk alle søgeresultater til dansk.

Google Oversæt
Dette er en samling oversættelsestjenester til forskellige formål.

  • Tekst og websteder: Her indsætter man en tekst eller adressen på en webside og vælger de sprog, man vil oversætte fra og til;
  • Oversat søgning: Man skriver et eller flere ord – nøjagtig som i almindelig søgning, og så vælger man, hvilket sprog man ønsker at søge på. Google oversætter så søgeteksten og foretager søgningen. Derefter bliver alle søgeresultaterne oversat tilbage;
  • Widget: Kan tilføjes en blog eller et andet websted. Læserne kan så få siden oversat til et sprog efter eget valg;
  • Knap på værktøjslinje: Man vælger et eller flere sprog, man vil have som knapper på browserens værktøjslinje. Man kan så få alle websteder oversat til disse sprog;
  • Google Toolbar: Installeres som en udvidelse til browseren og oversætter sætninger på websteder, blot man fører markøren hen over teksten. Det er meget praktisk, hvis man forstår sproget nogenlunde men ofte er usikker på enkelte ord. Toolbar er netop blevet opdateret med en række nye funktioner: Toolbar, now with advanced translation.

Translator Toolkit
Man kan uploade dokumenter – for eksempel Word – og få dem oversat. Løsningen er mere avanceret end Google Oversæt, fordi den først forsøger at finde sætningerne i en database med oversættelser foretaget eller kontrolleret af mennesker, et koncept kaldet Translation Memory. Hvis den ikke finder noget, benytter den maskinoversættelse. Resultatet bliver ofte bedre, især når man oversætter mellem store sprog, for eksempel engelsk til spansk. Translator Toolkit vil formodentlig blive implementeret i Google Docs, som er en online kontorpakke med blandt andet tekstbehandling.

Gmail
Googles service til e-mail kan automatisk oversætte ind- og udgående e-mails.

Google Reader
Google Reader bruges til at abonnere på RSS-feeds, som alle blogs og medier udsender – et godt alernativ til nyhedsbreve og meget bedre end at besøge websteder for at se, om der er kommet nyt. Nu kan man også abonnere på feeds på andre sprog og bede Google Reader oversætte dem automatisk.

Foto: fleno.de.

Google redder det danske sprog

Corporate LanguageI sidste uge føjede Google 10 nye sprog til tjenesten Google Translate, blandt andre dansk, svensk og norsk. Man kan nu oversætte mellem 24 sprog.

Den mest synlige anvendelse af Google Translate er et link med teksten “oversæt denne side” ved hvert fremmedsprogede søgeresultat på google.dk, men Google Translate giver også mulighed for at søge på sprog, man ikke forstår. Man kan skrive et dansk ord i søgefeltet og bede om resultater på et af de øvrige 23 sprog, tjenesten omfatter. Man behøver ikke at kende ordet på det valgte sprog – det hele foregår på dansk, selvom man søger på et sprog, man ikke forstår et ord af.

For en måneds tid siden ytrede jeg min utilfredshed med, at Google Translate ikke omfattede dansk og spåede det danske sprog en krank skæbne på nettet, hvis der ikke blev gjort noget: Google udrydder det danske sprog.

Sjældent her jeg set en virksomhed reagere så hurtigt og effektivt. Tak Google.

De 24 sprog er:

  • Arabisk
  • Bulgarsk
  • Dansk
  • Engelsk
  • Finsk
  • Fransk
  • Græsk
  • Hindi
  • Hollandsk
  • Italiensk
  • Japansk
  • Kinesisk (forenklet)
  • Kinesisk (traditionel)
  • Koreansk
  • Kroatisk
  • Norsk
  • Polsk
  • Portugisisk
  • Rumænsk
  • Russisk
  • Spansk
  • Svensk
  • Tjekkisk
  • Tysk

Se også:

Illustration: Kate_A

Google udrydder det danske sprog

[Opdatering 12. maj 2008: Google Translate omfatter nu også dansk. Se Google redder det danske sprog].

Google har indført en funktion til at søge på sprog, man ikke forstår, og få søgeresultaterne på det sprog, man ønsker.

Man kan for eksempel se, hvad arabiske websteder skriver om Danmark og genoptrykningen af de famøse tegninger, eller hvad kineserne skriver om protesterne mod deres politik i Tibet. Og man behøver ikke at forstå et ord arabisk eller kinesisk.

Funktionen er gemt lidt væk og nærmest lusket ind. Formodentlig fordi oversættelserne ikke er særlig gode, men den vil helt sikkert bliver mere fremtrædende i takt med, at oversættelserne bliver bedre. Og det vil ende med, at man helt automatisk får søgeresultater fra alle sprog og læser dem på sit eget. Man vil slet ikke opdage, at teksten er skrevet på et andet sprog end det, man læser den på, og i de fleste tilfælde vil man være ligeglad.

Google er ved at udrydde sprogbarrierer.

Funktionen omfatter 13 sprog:

  • Arabisk
  • Italiensk
  • Hollandsk
  • Græsk
  • Spansk
  • Tysk
  • Fransk
  • Portugisisk
  • Russisk
  • Engelsk
  • Koreansk
  • Kinesisk
  • Japansk

Tekster på disse 13 sprog kan søges og forstås af alle, der forstår et af sprogene. Dansk er ikke blandt de 13 sprog, og tekster skrevet på dansk vil fortsat kun være tilgængelige for de få, der forstår dansk.

Hvor andre kan skrive på deres modersmål og alligevel få et globalt publikum, skal danskere skrive på et fremmedsprog for at få en stemme udenfor landets grænser. Danskerne vil have samme sprogbarrierer som hidtil, men store dele af verden vil ikke.

Det er meget sandsynligt, at Google vil udvide funktionen med flere sprog, men de sprog, der kommer til senere, vil have dårligere oversættelser, udviklingen vil være flere år efter, og der vil ikke blive investeret så meget i at forbedre dem. Google er en forretning, og der er kun økonomi i større sprog.

Det danske sprog er ubrugeligt på et internet, hvor størstedelen af jordens befolkning kan færdes uden sprogbarrierer, fordi oversættelser foretages automatisk på et sekund eller to.

Hvis det danske sprog skal være med i den udvikling, skal der investeres i sprogteknologi. Der er næppe nogen udenfor Danmark, der ønsker at foretage disse investeringer, så det skal gøres her. Og der er næppe nogen virksomheder, der vil finansiere forskningen og udviklingen, for det er et arbejdskrævende og dyrt projekt, der aldrig får en ende og kun har ringe udsigt til profit.

Det er en opgave, den danske stat må påtage sig helt eller delvist, og resultatet skal tilbydes Google, Microsoft, IBM og andre til en meget favorabel pris. Måske gratis. Måske skal vi ligefrem betale virksomhederne for at implementere dansk oversættelse i deres løsninger. De penge er givet godt ud.

Googles nye funktion findes på translate.google.com, hvor der er et faneblad med titlen Oversat søgning.

Google Translate: maskinoversættelse og sprogteknologi

Her har jeg søgt university of southern denmark og valgt at få resultater på japansk. I venstre kolonne vises den engelske oversættelse, i højre den originale tekst på japansk.

Google Translate: engelsk - japansk

Når man klikker på et søgeresultat i venstre kolonne, viser Google en engelsk oversættelse af teksten:

Google Translate: maskinoversættelse

Når man fører musen hen over en sætning i det oversatte søgeresultat, åbner en taleboble med den originale tekst samt en funktion til at foreslå forbedring af oversættelsen.

Det er smart, selvom oversættelsen ikke er særlig god – det bliver den – men altså uden dansk, indtil nogen får øjnene op.

Tak til denjapaner.

Se også:

Sprog til tiden – fremtiden

I kølvandet på sprogudvalgets rapport Sprog til tiden har der været en del debat, som desværre overser Den virkelige trussel mod det danske sprog.

Debatten om det danske sprog har ikke udviklet sig i hundrede år, men det har sprogteknologien.

Sprogrøgterne er ikke sene til at latterliggøre maskinoversættelse og affærdige den, for den kan jo ikke oversætte korrekt. Nej, det kan den ikke, og det kommer den formodentlig aldrig til, men den kan noget, ingen sprogrøgter kan: oversætte hurtigt. Og i stadig højere kvalitet.

Maskinoversættelse bliver en væsentlig faktor for bevarelse af det danske sprog, for den betyder, at det, der skrives på dansk, kan læses af andre, og at danskere kan læse tekster på sprog, de ikke forstår.

Rapportens forfattere har forstået alvoren:

“Danmark er et uinteressant forretningsområde for udenlandske virksomheder, der producerer sprogteknologi. Omkostningerne forbundet med udvikling af sprogteknologi – uanset hvilket sprog det gælder, er så store, at de udenlandske producenter af sprogteknologi prioriterer de mest anvendte sprog i deres produktudvikling, dvs. typisk engelsk, tysk, fransk, spansk, japansk og kinesisk. Programmer, som kan anvendes på dansk og med danske data, bliver i reglen først tilgængelige i anden eller tredje række – ofte flere år efter, at den engelske udgave er udkommet. I mange tilfælde fremstilles der aldrig en dansk version, og programmerne bliver som regel dårligt tilpasset de enkelte virksomheders eller institutioners behov.”

Og:

“Vi kan konstatere, at midlerne til forskning på området har været begrænsede.”

Derfor:

“Skal dansk fagsprog fastholdes som aktivt sprog i skrift og tale, er der brug for en koordineret strategisk indsats over en ca. 10-årig periode.”

Læs hele kapitlet her: Sprogteknologi og terminologi.

Se også:

Foto: Green_Mamba