Category: nettsøking

Poster som på hander om teknikker og teknologi for nettsøking, søk i databaser eller andre former for research på nettet. En god del poster om søkemotorer og søketeknologi

Google med automatisk oversettelse fra norsk til engelsk

I mai lanserte Google automatisk oversettelse til norsk, både i språkverktøyene og med translate this page-lenker i resultatlista.

Nå har de også begynt med automatisk oversettelse fra norsk til engelsk. Gjør du et søk der du får treff på norske sider, som for eksempel et søk på ordet ferievær ser du at translate this page lenkene dukker opp.

Automatisk oversettelse er aldri helt bra. Stort sett er det beste du kan håpe på en sånn passe forståelig tekst. Enn så lenge ser det ut til at de sliter med ordforrådet i databasen. Det kan bli bedre, men aldri helt bra siden norsk behandler sammensatte ord helt anderledes enn engelsk, noe følgende tekstprøve viser:

Googles versjon:

Svenskene would end in October-november of last year’s journey to Thailand’s capital Bangkok and to the small Kingdom of Bhutan further north in Asia. They asked the tour operators pick and choose more specific destination for them, wrote the Stockholm-newspaper Svenska Dagbladet on Thursday.

The choice fell on the island of Koh Samui in Thailandbukta. But when they arrived there, it turned out that the island had been hit by strong monsunregn in more than a week, and according to the Swedish tourists were oversvømt the streets and entrances to shops and restaurants closed with sandsekker.

Originalen fra NTB:

Svenskene skulle i månedsskiftet oktober-november i fjor reise til Thailands hovedstad Bangkok og til det lille kongedømmet Bhutan lenger nord i Asia. De ba turoperatøren velge ut mer konkrete reisemål for dem, skrev Stockholm-avisen Svenska Dagbladet torsdag.

Valget falt på øya Koh Samui i Thailandbukta. Men da de kom dit, viste det seg at øya hadde vært rammet av sterkt monsunregn i mer enn en uke, og ifølge de svenske turistene var gatene oversvømt og inngangene til butikker og restauranter stengt med sandsekker.

En ekstra bug er at oversetteren tok med originalsetningene i resultatet. I teksten over har jeg fjernet dem manuelt. Resultatet fra Google var opprinnelig som dette:

Svenskene would end in October-november of last year’s journey to Thailand’s capital Bangkok and to the small Kingdom of Bhutan further north in Asia. De ba turoperatøren velge ut mer konkrete reisemål for dem, skrev Stockholm-avisen Svenska Dagbladet torsdag. They asked the tour operators pick and choose more specific destination for them, wrote the Stockholm-newspaper Svenska Dagbladet on Thursday. Osv…

Share

Microsoft legger ned boksøk og vitenskapssøk

Microsofts søkemotor Live legger ned både boksøket sitt og vitenskapssøket Live Academic. Grunnen er, i følge Live-bloggen, at de tjener for dårlig på disse søkemotorene:

For example, this past Wednesday we announced our strategy to focus on verticals with high commercial intent, such as travel, and offer users cash back on their purchases from our advertisers.

Heretter blir bok- og vitenskapsresultater blandet inn i det vanlige nettsøket. Dermed står Google Scholar og Books

Live Academic var langt bedre enn Google Scholar. Først og fremst fordi Live oppga hvilke kilder de indexerte innhold fra. Det gjør ikke Google Scholar der du kan risikere å få treff på alt fra en seminaroppgave fra en fersk bachelorstudent til epokegjørende avhandlinger fra Nobelprisvinnere. Heretter blir det opp til deg selv å skille skitt og kanel.

Share

Google.no med automatisk oversettelse av søkeresultater til norsk


Google.no har endelig lansert automatisk oversettelse til norsk. Dersom man gjør et søk etter engelske ord, for eksempel “perverse and often baffling”, dukker det nå opp “oversett denne siden”-lenker ved siden av resultatene.

Foreløpig ser det ut til at den automatiske oversettelsen bare gjelder fra engelsk, men går du inn på språkverktøysiden til Google.no kan du velge mellom en lang rekke språk og oversette i begge retninger. Ganske fint, eller prili?no dobro som det heter på kroatisk. (Lenke til språkverktøyene finner du ved enden av søkefeltet – under lenka til avansert søk.)

Google.com har hatt disse oversettertjenestene lenge, men min erfaring er at ikke mange norske brukere har visst om dem. Den automatiske oversettelsen av nettsider kan aktiveres med en hurtig knapp i den engelskspråklige utgaven av Googles populære toolbar. Rr i dag er dette ikke lagt til i den norske versjonen.

Så mye om det tekniske: Jeg skjønner ikke hvorfor har Google.no så langt bare lansert den automatiske oversettelsen fra engelsk. De fleste norske nettbrukere behersker engelsk rimelig godt. Jeg ville tro at tjenesten vil bli mer brukt og omtalt dersom de hadde åpent for automatisk oversettelse fra andre språk enn engelsk, for eksempel japansk, russisk, fransk, spansk og tysk. Nettet er for engelsksentrert allerede.

Automatisk oversettelse blir aldri bra. Datamaskinene forstår ikke språk og oversetter ord for ord. Dermed blir oversettelsene pussigere desto større avstand det er mellom språkene du oversetter mellom. Ordspill, idiomer og ironi er selvsagt også tapt. Her et eksempel fra første treff på søket over:

Dette er den. Den siste dagen. Jeg føler meg rå, naken, utsatt for. Hvor mye mer kan jeg muligens avsløre om meg selv? Problemet for hva du skal si er enda verre i dag, fordi jeg er stor-league lei. Det er den største ulempen med å jobbe på The New Yorker, fordi hvis du kjeder deg, det er virkelig ikke noe sted å gå.

Oversettelsen har ikke akkurat samme eleganse som Malcolm Galdwells originaltekst.

For journalistisk bruk er ikke det så farlig. Automatisk oversettelse gir oss mulighet til drive research eller nyhetsovervåking på språk vi ikke behersker. Du søker etter et navn og oversetter siden fra for eksempel portugisisk eller japansk. Språkføringen er så som så, men du vil få ett noenlunde korrekt inntrykk av faktainnholdet. I det minste nok til å vite om du bør få tak i en som kan oversette ordentlig.

Share

Tips og triks fra BBCs Paul Myers

Researcher Paul Myers fra BBC hadde et veldig bra seminar på SKUP forrige lørdag. Han hadde en delig blanding av nerdekunnskap, paranoia og journalistisk teft og nysgjerrighet som i sum fører til skikkelig bra researchevner på nettet.

Sjekk ut sidene hans for en oppsummering av foredraget på Skup.

Journalisten skriver litt om foredraget hans, men har dessverre surret litt med noen av linkene, noe de sikkert retter etterhvert. Journalisten unnlater forresten et par lenker som er verd å merke seg:
Netcraft – her kan du se hvilke servere et domene har vært plassert på opp gjennom tidene – Eksempel: historikken til www.kampanje.com
Visualroute – en veldig fin traceroute-variant som viser servernes plassering i kart.
Domaintools – har alltid vært en av de beste whois-tilbyderne etter min mening, selv om det er en betalingstjeneste. Jeg bare minner om Reverse IP og Whois-historikken.

Share

Nyheter i Google Earth

Google Earth har fått et nytt lag som inneholder nyheter fra NY Times. Nyhetene oppdateres hvert kvarter. National Geographic har i flere år levert innhold til Google Earth, og her hjemme har blant andre Budstikka gjort det. Men NY Times er første mediehus som leverer oppdaterte nyheter til Google Earth.

Det er strengt tatt litt pussig at det har tatt så langt tid. Geo-tagging har vært et brennhett tema i nettpubliseringskretser en god stund, med hendelseskartet flere Edda-aviser har og skipstrafikk-kartet hos Stavanger Aftenblad som noen eksempler. Når stadig flere medier har som strategi å være tilstede på flest mulig platformer til enver tid leder dette kanskje til at flere kommer etter.

Les mer på Google Earth-bloggen.

Share

Ny layout for Google advanced search

Google har endret layout på sin avansert søk-side. Den nye layouten er ved første øyekast enklere, og vil nok være mer inutitiv i bruk for de fleste. Når jeg har undervist i nettsøking har layouten på den avanserte søkesiden vært vanskelig for mange å forstå. Mye av årsaken er at beskrivelsen for et valg har ligget til venstre på siden, mens nedtrekksmenyen der du gjør valget har vært plassert et sykke unna til høyre, slik det fortsatt er på den norske utgaven av siden.
Den nye layouten er mye klarere på dette punktet.

(Klikk på bildet for å få det større)

De har også gjort en opprydding i de etterhvert mange funksjonene på siden. Mens alle mulige valg tidligere lå synlig, er noen valg (som blant andre dato for publisering, hvor serveren sidene ligger på er lokalisert, og hvor på siden søkeordet ditt dukker opp) nå skjult bak en ekspansjonslenke.

Selv om oppryddingen i seg selv er et godt skritt i riktig retning er det en annen ting jeg liker spesielt godt. Øverst på siden er det et felt der søkestrengen til søket du lager dukker opp etterhvert som du gjør valg og innstillinger. Dermed har du mulighet til å lære søkesyntaksen, slik at du neste gang vet at du bare kan skrive eller når du vil bruke disse funksjonene. Det er ikke akkurat nybrottsarbeid: Søkestrengen dukket opp før også, men først på resultatsiden. Og Live Search har vist søkestrengen på denne måten i årevis i det de kaller sin “search builder” i det avanserte søket.

Foreløpig er endringen bare gjort på com-utgaven.

Share

Googles site:-funksjon blir egen boks på resultatsiden

Erfarne nettsøkere kjenner godt til Googles site:-operatør for å begrense søket til et enkelt nettsted eller landsdomene. (Skriv site:www.ij.no for bare å søke på IJs nettsider etter et eller annet begrep) Rett før helga begynte Google å lage en egen “Serach within this site-boks allerede i resultatlista når noen søkte etter bestemte amerikanske nettsteder. Som for eksempel NASA, Whitehouse, FAA, og Library of Congress:

I følge Googlebloggen har dette ført til at de som søker finner fram til nøyaktig den informasjonen på nettstedet de er ute etter.
Så langt ser det ut til å funke bare for offentlige amerikanske nettsider, men det kommer sikkert flere.

Eller du kan skrive site: og adressen selv :-)

Share

Car 2008: "Houston, we have a problem!"

Klokka er tre på natta i Norge og i hodet mitt. Her i Houston er den bare åtte på kvelden. Jeg har akkurat ankommet for å delta på CAR 2008, den store årlige konferansen i USA for “computer assisted reporting” i regi av Investigative reporters and editors. Programmet lover godt med mange praktiske sesjoner:

One track of panels will show how mash-ups, wikis, interactive databases on the Web and other applications can help build and present investigative and in-depth stories. The top practitioners in the country and the world will be in Houston to lead this exciting track.

There also will be panels at which beat reporters can learn about databases for their areas of interests and how to analyze those databases to produce high-impact stories on a regular basis. Other sessions will address the interest and needs of editors ? who need to know how to ask the right questions and bulletproof CAR stories ? and of broadcast journalists who work under heavy deadline pressure.

Dette lover godt!

Jeg er her sammen med kollega Ståle de Lange Kofoed og sammen skal vi prøve å få blogget en del om godbitene fra konferansen. Men først skal jeg prøve å sove bort jetlagen.

Share

Anonymisering og identifisering i googlingens tid

I dekningen av lommemannensaken har så langt ingen medier gått ut med navnet på den siktede mannen. Men mange har likevel gått langt i å identifisere han, gjennom de detaljene de har publisert om vedkommende. Dette har mine kolleger på IJ Gunnar Bodahl-Johansen, Ståle de Lange Kofoed og jeg skrevet en kronikk som er publisert på Journalisten.no.

Du kan lese og delta i debatten i Journalistens artikkel om saken .

Share

Ord folk bruker når de søker på nettet og hva de egentlig er ute etter

Under digital sporhund-kursene på IJ understreker vi hele tiden hvor viktig et bevisst forhold til språk er når du søker på nettet. Søkemotorens et sentralt problem for å finne fram på nettet at søkemotoren ikke skjønner språk, mens vi bruker språk for å få den til å lete. Siden datamaskinene bare leter etter samme rekkefølge av tegn, skjønner den ikke at vi like gjerne er interessert i sider med ordet mineralvann når vi søker på ordet brus. Den skjønner forsåvidt heller ikke at vi bare vil ha informasjon drikken brus og ikke sider med informasjon om brus fra orgel eller fossefall.

Gerry McGovern presenterer en del data rundt et beslektet problem i bloggen sin. Det er en forskjell på hvilke ord folk bruker når de søker etter en vare eller tjeneste og hvilke ord de oppgir at de ønsker skal stå på nettsidene de vil fram til.

After polling over 2,000 people in 12 countries, we found that when planning a vacation, people preferred to read about “special offers” rather than “deals”. People thought that the word “deal” was a bit suspicious, like something a shady second-hand car salesman would sell you. Special offers, on the other hand, were, well, special.

According to Keyword Discovery, there were about 13,000 searches for “hotel deals” in a particular period, but NO searches for “hotel special offers.”

Dette leder selvsagt ut i elendigheten for de søk søker etter billige ferieopphold. Og siden spamdexing har vært et viktig prinsipp for søkemotorene det siste knappe tiåret, er det ikke store hjelpen å få der heller.

Så enn så lenge: Husk at du må kopiere språkbruken på den siden du er ute etter når du søker på nettet.

Share

Wikipedia mot Google: Wikia search lansert i alfaversjon

Jimmy Wales, mannen bak Wikipedia og selskapet Wikia, lanserte i dag som annonsert en ny sosial søkemotor, Wikia Search, enn så lenge alfautgave. Som alt annet mannen tar i baserer søkemotoren seg på fellesskapets innsats for å bli bedre. Dette er ikke helt nytt: Som tidligere omtalt her i bloggen gjør blant andre Mahalo dette allerede.

I Search Wikia kan alle gi tilbakemeldinger på ranking av resultater, flertydighet i søkeord osv. I motsetning til de fleste andre søkemotorer er rangeringsalgoritmen offentlig tilgjengelig for den som forstår seg på slike ting.

Siden dette er en alfautgave er søkeresultatene så som så, men det litt av poenget, i følge Wikia:

“Of course, before we start, we have no user feedback data. So the results are pretty bad. But we expect them to improve rapidly in coming weeks, so please bookmark the site and return often.”

Search Wikia – Om søkemotoren av de som står bak

Ikke alt Jimmy Wales tar i blir til gull. Det blir spennende å se om folk trykker denne søkemotoren like hardt til sine dugnadshjerter som Wikipedia. Jeg er ikke sikker: Det er mer umiddelbar og håndgripelig payoff når du redigerer et oppslag i wikipedia enn når du justerer et søkeresultat. Forsøket Wikinews har ikke opplevd store suksessen; Trafikkmessig er de litt mindre enn NRK og Aftenposten, ifølge Alexa. Med all respekt for Aftenposten og NRK, så er det lite å skryte av for et nyhetsnettsted som henvender seg til hele verden.

Share

Søkeskyer – search clouds

Søkemotoren Quintura.com har viser deg søkeresultater i søkeskyer, a la de såkalte tag cloud’ene som den i høyremargen på denne bloggen. Over her ser du eksempel på søkeskyen for søkeordene .

Du får en vanlig resultatliste i tillegg til skyen. Samtidig gir de deg muligheten til å lage skyen din, sende den til noen på epost eller lime den inn i en blog eller på en annen nettside gjennom embed-funksjonen. Prøv selv på www.quintura.com

Share

Google tester ut nye måter å vise resulater på

Her kommer endelig en oppdatering etter noen ukers fravær. Men selv om jeg ikke skriver om det skjer det likevel ting der ute. Google har sparket litt liv i Google labs igjen etter at de ikke har lansert særlig mye nytt der på lenge.

Siste tilskudd er et eksperiment rundt resultatvisning for et vanlig websøk, enten som en klassisk liste, en tidslinje, et kart eller såkalt infovisning. Tidslinje og kart skulle være selvforklarende. I Infoview kan man utheve spesiell informasjon i resultatene som f.eks datoer, mål/vekt, bilder.

Her er et eksempel med søkeordene Thor Heyerdahl

Timeline- og kartvisningene egner seg åpenbart best til søk etter fenomener som har en utstrekning i enten tid eller rom. Jeg synes visningene gir en annen og nyttig innfallsvinkel til stoffet. Et rom for uklarhet er selvsagt at tidslinjen kun viser årstall (eller tall med liknende format) som er nevnt i teksten, usortert og uten tanke for hva tekstene omtaler. I dette eksempelet får vi altså en tidslinje over historiske fenomener Thor Heyerdahl har jobbet med og hans liv. Ikke enten eller, slik man kanskje kunne ønske.

Eksperimentet rundt visningen av resultater er bare et av flere nye prosjekter i Google Labs. Her er oversikt over flere.

Share

Google Custom Search

Google har en stund nå latt folk få lage sine egne spesialtilpassede søkemotorer med Google Custom Search. Du kan triske og mikse med farger og layout, og avgrense hvilke domener søket skal omfatte. Er det en håndfull steder du ofte leter etter infomasjon i kan du altså, realtivt enkelt og uten behov for noe datakunnskap, lage din egen spesialsøkemotor akkurat for de sidene du ønsker (Evt alle sider på webben men med prioritet på sider du har valgt.

I bunn og grunn er brukergrensesnittet og avgrensningen du lager. Selve basen med indekserte websider er Googles gode gamle. Jeg har nyss laget en søkemotor som bare leter i en håndfull sider som skriver om søkemotorkunnskap. Dere finner mitt custom googlesøk i margen til høyre.

Share

Windows Live lanserer automatisk oversetting

Google har hatt sin egen utgave, og Yahoo og Altavista har hatt det lenge gjennom babelfish. Endelig lanserer også Windows Live en automatisk oversetter. Den er så langt jeg kan se ikke like integret som hos Google og tar færre språk. Jeg har ikke fått fintestet den, men som de fleste slike automatiske tjenester oversetter også denne bare ord for ord, og ikke mening. Dermed kan det bli noen pussige utslag. Likefullt er det, om man tar det for det det er, et hendig verktøy for å orientere seg i informasjon på et språk man ikke forstår.

Share

Google News begynner å “hoste” stoff fra de store byråene.

En nyhet i dag som på sikt kan være en utfordring for de tradisjonelle nyhetsmediene på nett: Google News begynner å publisere nyheter fra de største engelskspråklige nyhetsbyråene. Tidligere har Google News pekt videre til andre nettsteder for alle sakene de plukker opp i Google News; Heretter blir saker fra AFP, AP, Canadian Press og Press Association of Britain publisert på Googles egne servere og det er her du havner når du klikker på en sak fra en av disse byråene. Det kommer sikkert flere redaksjoner inn i denne avtalen. Når alle store og viktige land er unnagjort kommer sikkert en henvendelse til NTB.

Hva betyr så det:

1) Google tar mer av trafikken og dermed reklamekronene.
2) Google fortsetter å bli mer å mer et medieselskap. Det er lenge siden de bare drev med søk.
3) Nyhetsnettsteder som i større eller mindre grad publiserer byråstoff bør ta noen grep for å beholde et særpreg og et fortrinn. Enten videreforedle byråstoffet eller satse mer på eget stoff.

De tradisjonelle nyhetsredaksjonene er utvilsomt bedre skikket til å drive seriøs og kritisk nyhetsjournalistikk en Google. Men dem som finner nyhetene sine gjennom Google News gir en halv ert i det. Hvor mange bruker Google News vs andre medier? Her er en sammenligning mellom trafikken på CNN.com og Google News. Sistnevnte i rødt:

Share

Tafiti – Ny søkemotor fra Microsoft

Microsoft har lansert søkemotoren Tafiti. Eller rettere sagt, søkegrensesnittet Tafiti, for det er presentasjonen av søkeresultatene som er nytt og annerledes. Selve nettsøket er hentet fra Windows Live. Tafiti har en visuel og grafisk ganske elegant måte å presentere søkeresultatene og den gir deg mulighet til å spare resultater ved å dra dem bort til høyremargen. Du kan velge mellom listevisning eller presentasjon av resultatene i et trediagram. Jeg har ikke fått fintestet ennå, men det er lett å bla i resultatene og filtrere mellom bildesøk, nettsøk, boksøk og søk i feeder blant annet. Ulempen med Tafiti er at du må installere Microsoftprogrammet Silverlight for å få det til å virke. Lurer du på mer om bruk, sjekk ut Tafitis egen faq.

Share

Slik får du Google Map på siden din på 15 sekunder

Google har lansert en enkel mulighet til å lime inn et interaktivt kart på hvilken som helst nettside. Gjør et søk i Google Maps, enten på sted, virksomhet eller kjørerute, og klikk på “link to this page”. I tillegg til lenka til kartet får du da en html-bit du kan lime inn på sida di, og du får mulighet til å endre størrelse osv på kartet. Du kan selvsagt også velge om du vil ha kart, satellitt-/flyfoto eller hybridvisning. Du kan velge mellom 16 forskjellige landutgaver av Google Maps, inkludert den norske.

Her kan du for eksempel se hvor jeg sitter og skriver dette blogginnlegget:

View Larger Map

Pandia har snappet opp denne nyheten før meg. Derfor peker jeg dit og ikke rett til Googles pressemelding: » Google makes it easier to embed maps in web pages

Share