Søppelpostfilter
Det engelske ordet for søppelpost har opphav i ein klassisk Monty Python-sketsj.
Ein dag kom dette tilbodet ramlande inn i e-postsystemet: «Dear sir/madam, I have decided to seek confidential cooperation with you for the execution of the deal described here. I have discovered an unclaimed fund totaling US $ 3.5 million that belongs to a customer who unfortunately lost his life and entire family in a car accident.»
Vidare vert vi lova ein stor del av desse pengane viss vi oppgjev ein del personleg informasjon. Men dette flotte tilbodet kom aldri inn i e-postkassa vår. Det vart stoppa av e-postfilteret som Universitetet i Bergen har sentralt.
Det skal ikkje mykje til før e-postadressa di er spreidd for alle vindar. Det er nok å kjøpe eit produkt på ein utanlandsk nettstad, så dukkar slike meldingar opp. E-postadressene til oss universitetstilsette ligg ope på vevsider og er lette å få tak i. Adressene vert samla i databasar som blir brukte til masseutsendingar av tvilsame økonomiske forslag, tilbod om seksuelle tenester og meir uskuldige tilbod som invitasjon til falske akademiske konferansar. Titusenvis av slik e-post strøymer til e-postsystemet ved universitetet kvar einaste dag.
For mange ville slik e-post ha vore eit uhandterleg problem om vi ikkje hadde hatt søppelpostfilter. Kampen mot misbruk av opne kommunikasjonskanalar har medført at alle større verksemder i dag bruker slike filter. Du kan òg byggje opp ditt eige søppelpostfilter i eit privat e-postprogram.
E-postfilter bruker mange teknikkar for å velje ut kva e-post som skal stoppast. Det kan til dømes vere slik at e-post frå utvalde internettdomene eller til og med land vert stoppa. Mottakarsystemet kan krevje at e-post som skal godkjennast, stettar strenge krav til form og informasjon om avsendaren. E-postsystemet kan sjå etter vevlenkjer som er kjende for å vere problematiske, og dei kan sjå etter heilt spesifikke mønster i teksten som til dømes «herbal Viagra» eller «I want a man now».
Men søppelspreiarane tilpassar seg filteralgoritmane og finn stadig nye triks for å skjule at dei sender ut søppel. Til dømes legg dei falsk avsendarinformasjon i e-posten, slik at systemet ikkje oppdagar at han er send frå ein kjend søppelspreiar. Eller dei skriv meldingane på ein måte som ikkje passar med mønsteret systemet har lært seg å sjå etter så langt.
Ein viktig del av filtreringa skjer gjennom ein prosess som heiter bayesiansk søppelpostfiltrering. Denne teknikken krev at e-postbrukarar markerer e-post som søppel når han kjem inn. Det at filteret får vite om ord som er vanlege i søppel, hjelper til i utrekninga av sannsynet for at vi har med ei søppelpostmelding å gjere. Eit ord som «million» vil gjerne vere meir sannsynleg i søppelpost enn i annan e-post, og det vil auke sannsynet for at ei melding er søppel. Når og ord som «confidential», «transaction», «fund» og «account» også dukkar opp, aukar sannsynet endå meir, slik at systemet kan velje å klassifisere e-post som søppel.
Bayesianske søppelpostfilter er baserte på ein samanheng mellom sannsyn som vart formulert på 1700-talet av den britiske pastoren Thomas Bayes. Han sa at sannsynet for at noko (for eksempel ei setning p) er sant (eller usant) gjeve ein observasjon (gjerna kalla e), er proporsjonal med sannsynet for at vi observerer e når p er sann (ev. usann), multiplisert med sannsynet for at p er sann (ev. usann) i det heile teke. Dette medfører blant anna at hendingar som er uvanlege, treng ein del stadfestande observasjonar for at vi skal tru på dei. Folk flest er nok ikkje så flinke til å tenkje ut frå regelen til Bayes, men legar er nøydde til bruke dette prinsippet. Dei vil ikkje nødvendigvis stille ein sjeldan diagnose, sjølv om ein pasient har fleire av symptoma.
Baysianske system krev at nokon markerer e-post som søppel, og det er du som e-postbrukar som må gjere dette. Kvar gong du får ei søppelmelding, må du markere henne, og så tek det bayesianske filteret seg av resten. Det registrerer orda i meldinga og legg dei til i statistikken over ord som har vore med i søppelpostar.
Etter kvart vert meldingar med mange typiske søppelord automatisk avviste, og søppelspreiarane må finne nye taktikkar for å sleppe gjennom. I e-postverda går det føre seg eit evig kappløp mellom dei gode, som vil finne ut kva som er søppel, og dei vonde, som prøver stadig nye triks for å sleppe gjennom filteret med ei melding.
Slike filter vil aldri verte 100 prosent sikre, så vi som e-postbrukarar må òg syne litt kritisk sans. Ei og anna svindelmelding kjem til å komme gjennom, og då er det smart å ta seg bryet med å markere henne som søppel.
Samstundes vil det òg vere slik at meldingar du gjerne vil ha, kan ha vorte filtrerte vekk. Derfor kan det vere smart av og til å ta ein kik på meldingar som har vorte stoppa.
Ein sjeldan gong er søppelposten såpass (ufriviljug) morosam at det faktisk er kjekt å få han. Lars Nyre får innimellom høflege e-brev av typen «Dear Dr. Lars Kidney. I hope this email finds you well.»
Det automatiske omsetjingssystemet som vert brukt til å lage teksten i e-brevet, var visst ikkje så suverent, og det er ei trøyst i ein kvardag der teknologien ofte verkar feilfri og styrande.
Bjørnar Tessem og Lars Nyre
Er du abonnent? Logg på her for å lese vidare.
Digital tilgang til DAG OG TID – heilt utan binding
Prøv ein månad for kr 49.
Deretter kr 199 per månad. Stopp når du vil.
Ein dag kom dette tilbodet ramlande inn i e-postsystemet: «Dear sir/madam, I have decided to seek confidential cooperation with you for the execution of the deal described here. I have discovered an unclaimed fund totaling US $ 3.5 million that belongs to a customer who unfortunately lost his life and entire family in a car accident.»
Vidare vert vi lova ein stor del av desse pengane viss vi oppgjev ein del personleg informasjon. Men dette flotte tilbodet kom aldri inn i e-postkassa vår. Det vart stoppa av e-postfilteret som Universitetet i Bergen har sentralt.
Det skal ikkje mykje til før e-postadressa di er spreidd for alle vindar. Det er nok å kjøpe eit produkt på ein utanlandsk nettstad, så dukkar slike meldingar opp. E-postadressene til oss universitetstilsette ligg ope på vevsider og er lette å få tak i. Adressene vert samla i databasar som blir brukte til masseutsendingar av tvilsame økonomiske forslag, tilbod om seksuelle tenester og meir uskuldige tilbod som invitasjon til falske akademiske konferansar. Titusenvis av slik e-post strøymer til e-postsystemet ved universitetet kvar einaste dag.
For mange ville slik e-post ha vore eit uhandterleg problem om vi ikkje hadde hatt søppelpostfilter. Kampen mot misbruk av opne kommunikasjonskanalar har medført at alle større verksemder i dag bruker slike filter. Du kan òg byggje opp ditt eige søppelpostfilter i eit privat e-postprogram.
E-postfilter bruker mange teknikkar for å velje ut kva e-post som skal stoppast. Det kan til dømes vere slik at e-post frå utvalde internettdomene eller til og med land vert stoppa. Mottakarsystemet kan krevje at e-post som skal godkjennast, stettar strenge krav til form og informasjon om avsendaren. E-postsystemet kan sjå etter vevlenkjer som er kjende for å vere problematiske, og dei kan sjå etter heilt spesifikke mønster i teksten som til dømes «herbal Viagra» eller «I want a man now».
Men søppelspreiarane tilpassar seg filteralgoritmane og finn stadig nye triks for å skjule at dei sender ut søppel. Til dømes legg dei falsk avsendarinformasjon i e-posten, slik at systemet ikkje oppdagar at han er send frå ein kjend søppelspreiar. Eller dei skriv meldingane på ein måte som ikkje passar med mønsteret systemet har lært seg å sjå etter så langt.
Ein viktig del av filtreringa skjer gjennom ein prosess som heiter bayesiansk søppelpostfiltrering. Denne teknikken krev at e-postbrukarar markerer e-post som søppel når han kjem inn. Det at filteret får vite om ord som er vanlege i søppel, hjelper til i utrekninga av sannsynet for at vi har med ei søppelpostmelding å gjere. Eit ord som «million» vil gjerne vere meir sannsynleg i søppelpost enn i annan e-post, og det vil auke sannsynet for at ei melding er søppel. Når og ord som «confidential», «transaction», «fund» og «account» også dukkar opp, aukar sannsynet endå meir, slik at systemet kan velje å klassifisere e-post som søppel.
Bayesianske søppelpostfilter er baserte på ein samanheng mellom sannsyn som vart formulert på 1700-talet av den britiske pastoren Thomas Bayes. Han sa at sannsynet for at noko (for eksempel ei setning p) er sant (eller usant) gjeve ein observasjon (gjerna kalla e), er proporsjonal med sannsynet for at vi observerer e når p er sann (ev. usann), multiplisert med sannsynet for at p er sann (ev. usann) i det heile teke. Dette medfører blant anna at hendingar som er uvanlege, treng ein del stadfestande observasjonar for at vi skal tru på dei. Folk flest er nok ikkje så flinke til å tenkje ut frå regelen til Bayes, men legar er nøydde til bruke dette prinsippet. Dei vil ikkje nødvendigvis stille ein sjeldan diagnose, sjølv om ein pasient har fleire av symptoma.
Baysianske system krev at nokon markerer e-post som søppel, og det er du som e-postbrukar som må gjere dette. Kvar gong du får ei søppelmelding, må du markere henne, og så tek det bayesianske filteret seg av resten. Det registrerer orda i meldinga og legg dei til i statistikken over ord som har vore med i søppelpostar.
Etter kvart vert meldingar med mange typiske søppelord automatisk avviste, og søppelspreiarane må finne nye taktikkar for å sleppe gjennom. I e-postverda går det føre seg eit evig kappløp mellom dei gode, som vil finne ut kva som er søppel, og dei vonde, som prøver stadig nye triks for å sleppe gjennom filteret med ei melding.
Slike filter vil aldri verte 100 prosent sikre, så vi som e-postbrukarar må òg syne litt kritisk sans. Ei og anna svindelmelding kjem til å komme gjennom, og då er det smart å ta seg bryet med å markere henne som søppel.
Samstundes vil det òg vere slik at meldingar du gjerne vil ha, kan ha vorte filtrerte vekk. Derfor kan det vere smart av og til å ta ein kik på meldingar som har vorte stoppa.
Ein sjeldan gong er søppelposten såpass (ufriviljug) morosam at det faktisk er kjekt å få han. Lars Nyre får innimellom høflege e-brev av typen «Dear Dr. Lars Kidney. I hope this email finds you well.»
Det automatiske omsetjingssystemet som vert brukt til å lage teksten i e-brevet, var visst ikkje så suverent, og det er ei trøyst i ein kvardag der teknologien ofte verkar feilfri og styrande.
Bjørnar Tessem og Lars Nyre
Kvar gong du får ei søppelmelding, må du markere henne, og så tek det bayesianske filteret seg av resten.
Fleire artiklar
Penélope Cruz i rolla som mor til Adriana eller Andrea, spelt av Luana Giuliani.
Foto: Wildside
Roma – ein lukka by
Filmmelding: Italiensk oppvekstdrama sveipt i 70-talet skildrar tronge kjønnsnormer og fridomstrong.
Studentar på Universitetsbiblioteket på Blindern i Oslo.
Foto: Håkon Mosvold Larsen / NTB
Ja til skule, nei til studentfabrikk
Diverre er samarbeidet mellom skulen og høgre utdanningsinstitusjonar ofte dårleg.
Ein soldat ber eit portrett av den drepne våpenbroren og aktivisten Pavel Petrisjenko i gravferdsseremonien hans i Kyiv 19. april. Petrisjenko døydde i kamp mot russiske okkupantar aust i Ukraina. Han er tidlegare omtalt i denne spalta fordi han arbeidde for å stogge pengespel som finansiering av det ukrainske forsvaret.
Foto: Valentyn Ogirenko / Reuters / NTB
Hagen til Kvilinskyj finst ikkje lenger
Alle historier, det gjeld òg dei som ser ut til å ha nådd slutten, har eit framhald.
Christine Hope, Thomas Bye og Gisle Børge Styve står på scenen i revyen om E16.
Foto: Andreas Roksvåg
Syltynt
E16 Dødsvegen er ei framsyning som har lite å melde – og som melder det i over halvannan time.
Eskil Skjeldal har skrive fleire bøker, både sakprosa og romanar.
Foto: Vegard Giskehaug
Der mørkeret bur
Eskil Skjeldal er ikkje redd for å gå dit det gjer mest vondt.