Header Image

Denne siden er en oversikt over alle hovedfunksjonene til DocFetcher Pro og DocFetcher Server, ment for de som ikke er kjent med DocFetcher. Hvis du er det, kan du finne Sammenligning-siden og dens undersider mer nyttige.

Alle skjermbildene nedenfor viser brukergrensesnittet til DocFetcher Pro. Nettgrensesnittet til DocFetcher Server ser lignende ut og er nestet inne i et nettleservindu.

Brukergrensesnittet

Hovedvindu

Som vist på skjermbildet ovenfor består hovedvinduet til DocFetcher Pro av følgende deler:

  1. Søkefelt: Skriv inn ordene du vil søke etter her.
  2. Resultatpanel: Søkeresultatene vises her. Dette er filene, mappene eller Outlook-e-postene som inneholder ordene du skrev inn i søkefeltet.
  3. Forhåndsvisningsrute: Viser en tekstbasert forhåndsvisning av filen eller Outlook-e-posten som for øyeblikket er valgt i resultatpanelet. Treff i teksten blir uthevet.
  4. Minste/største filstørrelse-filter: Søkeresultatene kan filtreres etter minimum og/eller maksimum filstørrelse her. Free Available in the free DocFetcher Pro Available in DocFetcher Pro Server Not available in DocFetcher Server
  5. Beholdertyper-panel: Sett her om mapper og arkiver skal inkluderes i søkeresultatene. I DocFetcher blir ikke mapper og arkiver inkludert i søkeresultatene, bare filer og Outlook-e-poster. Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
  6. Dokumenttyper-panel: Søkeresultatene kan filtreres etter filtype her.
  7. Brukerdefinerte typer-panel: Et alternativ til Dokumenttyper-panelet. Her kan du definere dine egne filtyper å filtrere søkeresultatene etter. Definisjonene er basert på å matche jokertegnmønstre eller regulære uttrykk mot filnavn. Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Not available in DocFetcher Server
  8. Søkeområde-panel: Dette panelet har to formål: Filtrere søkeresultatene etter plassering, og administrere dine “indekser”, som forklares nedenfor. Indekser kan legges til, oppdateres og fjernes. Hver indeks tilsvarer en søkbar plassering på datamaskinen din.
  9. Forskjellige kontroller: De tre kontrollene til høyre for Søk-knappen er: antallet søkeresultater som for øyeblikket er synlige, en knapp for å åpne brukerhåndboken, og en knapp for å åpne programinnstillingene.

Kraftig søkesyntaks

Søkesyntaks

Skjermbildet ovenfor viser et eksempel på de komplekse søkespørringene du kan skrive inn i DocFetcher, DocFetcher Pro og DocFetcher Server. Eksempelspørringen betyr: Finn alle dokumenter som inneholder (1) frasen “reproduction or redistribution”, og (2) ordene “documentation” og “agreement” med høyst tre ord mellom seg.

Søkesyntaksen drives av den underliggende søkemotoren Apache Lucene. Her er en rask gjennomgang av hovedfunksjonene:

  • Boolske operatører: (hund OR katt) AND mus NOT hest
  • Frasesøk, det vil si å finne ord i en bestemt rekkefølge: "hund katt mus"
  • Påkrevde søkeord: +hund +katt
  • Jokertegn: Plassholdertegn * og ? for å matche henholdsvis ‘null eller flere’ tegn og ‘nøyaktig ett’ tegn. Eksempler:
    • bil? matcher bila, bile, …
    • bil* matcher bil, bila, bile, bilene, …
    • *ene* matcher bilene, husene, generene, …
  • Uskarpt søk, det vil si å finne ord som ligner på et gitt ord. For eksempel vil søk etter løpe~ gi dokumenter som inneholder ord som lupe og løper.
  • Nærhetssøk, det vil si å finne ord som ikke er mer enn et visst antall ord fra hverandre. Eksempel: "dokumentasjon avtale"~3

Indeksbasert søk

Indeksbasert søk: DocFetcher, DocFetcher Pro og DocFetcher Server søker etter ord i filnavn og filinnhold, samt i felt og brødtekst av Outlook-e-poster. For effektivitetens skyld kjører søket imidlertid på såkalte indekser i stedet for direkte på filene og e-postene. En indeks er i hovedsak en ordbok hvor programmet raskt kan slå opp for ethvert gitt ord hvilke filer eller e-poster som inneholder det ordet.

Avveining: raskt søk og indeksopprettelse: Indeksbasert søk er en flott idé fordi det er størrelsesordener raskere enn å søke uten indekser: DocFetcher, DocFetcher Pro og DocFetcher Server kan typisk finne tusenvis av matchende filer på mindre enn ett sekund. Hovedulempen er at indeksene må opprettes først — en prosess kjent som indeksering — og dette kan ta litt tid avhengig av det totale antallet filer og e-poster, og deres individuelle størrelser.

Rask indeksering og “indekser bare det du trenger”-filosofi: Ulempen med å måtte opprette en indeks blir mildnet av det faktum at indeksering i DocFetcher, DocFetcher Pro og DocFetcher Server er ganske rask: 200 filer per minutt er en ganske normal indekseringshastighet. I tillegg følger de tre programmene en “indekser bare det du trenger”-filosofi: Ut av boksen er ingenting på datamaskinen din indeksert, og det er helt opp til deg å bestemme hva som blir indeksert. Dette står i kontrast til andre søkeprogramvarer som ut av boksen sløser bort masse tid og datakraft på å indeksere stort sett alt, siden de ikke stoler på at du kan bestemme selv. For ikke å snakke om personvernimplikasjonene av denne “indekser alt”-tilnærmingen…

Indeksopprettelse vs. indeksoppdatering: Sist men ikke minst er indeksering av en bestemt mappe vanligvis bare tidkrevende første gang, hvis i det hele tatt. Etterpå, når du kjører en såkalt indeksoppdatering, vil programmet være smart nok til bare å indeksere nye og modifiserte filer, og hoppe over alt annet. I praksis vil det vanligvis bare være et relativt lite antall filer som har blitt lagt til eller modifisert, så en indeksoppdatering tar vanligvis lite tid.

Opprette indekser

Indekseringsdialog

Skjermbildet ovenfor viser indekseringsdialogen til DocFetcher Pro. Dette er konfigurasjonsdialogen du ser når du oppretter en ny indeks. Bemerkelsesverdige funksjoner:

  1. Tilpassbare ren tekst- og zip-utvidelser: Filutvidelsene programmet gjenkjenner rene tekstfiler og zip-arkiver med kan tilpasses. Tilpassing av ren tekst-filutvidelser er nyttig når man arbeider med kildekode.
  2. Inkluderings- og ekskluderingsregler: Du kan definere regler for å inkludere eller ekskludere bestemte filer basert på jokertegn eller regulære uttrykk. Denne tabellen finnes også i DocFetcher, men jokertegn og inkluderingsregelen er bare tilgjengelig i DocFetcher Pro og DocFetcher Server. Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
  3. Automatisk oppdatering av indekser: Hvis “Oppdater indeks automatisk”-boksen er avkrysset, vil programmet overvåke den indekserte mappen for filendringer og oppdatere indeksen automatisk når en endring oppdages.
  4. Indekseringskø: Flere indekseringsjobber kan settes i kø, med hver jobb på en egen fane.
  5. Lagre og laste indekseringsinnstillinger: Denne “krukke”-knappen åpner en meny for å lagre og laste indekseringsinnstillinger. Dette er praktisk hvis du trenger å definere mange inkluderings- og ekskluderingsregler. Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Not available in DocFetcher Server

Støttede dokumentformater

  • AbiWord (abw, abw.gz, zabw)
  • EPUB (epub)
  • FictionBook (fb2, fbz, fb2.zip) Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
  • FLAC-metadata (flac)
  • HTML (html, xhtml, …)
  • JPEG Exif-metadata (jpg, jpeg)
  • MP3-metadata (mp3)
  • Microsoft Compiled HTML Help (chm)
  • Microsoft Office før 2007 (doc, xls, ppt, …)
  • Microsoft Office 2007 og nyere (docx, xlsx, pptx, …)
  • Microsoft Outlook OST (ost) * Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
  • Microsoft Outlook PST (pst) *
  • Microsoft Visio (vsd, vss, vst, vsw)
  • Mobipocket (mobi) — støtte er for øyeblikket eksperimentell Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
  • OpenDocument (odt, ods, odg, odp, …)
  • Portable Document Format (pdf)
  • Ren tekst (tilpassbare utvidelser)
  • Rich Text Format (rtf)
  • Scalable Vector Graphics (svg)

For alle filformater som ikke er inkludert i listen ovenfor, kan i det minste filnavnet indekseres. Også kan alle filformater som kan identifiseres med en spesifikk filutvidelse tvinges til å bli indeksert som ren tekst, siden ren tekst-filutvidelsene er tilpassbare.

* Begrensninger for PST- og OST-filstøtte

Ingen e-postforhåndsvisning: Av tekniske årsaker kan verken DocFetcher, DocFetcher Pro eller DocFetcher Server åpne e-poster i søkeresultatene med Outlook. E-postene kan bare vises i programmets tekstbaserte forhåndsvisningsrute. Muligheten til å åpne e-poster i Outlook kan legges til i en fremtidig hovedutgivelse av DocFetcher Pro (v2.0 eller senere). Det kan ikke implementeres i DocFetcher Server siden brukerens Outlook-instans og PST- eller OST-filen som inneholder e-posten befinner seg på potensielt forskjellige datamaskiner.

Foretrekk PST fremfor OST: Selv om DocFetcher Pro og DocFetcher Server kan lese OST-filer til en viss grad, vær advart om at OST-filer faktisk bare er hurtigbufferfiler hvor Outlook midlertidig lagrer noe av dataene fra en online-konto for frakoblet bruk. Derfor, hvis du indekserer OST-filer, vil du finne at mange e-poster og e-postvedlegg du forventer å se rett og slett ikke er der. PST-filer er det Outlook bruker for fullstendig, langsiktig lagring av e-poster, så foretrekk alltid å indeksere PST-filer fremfor OST-filer hvor det er mulig. For mer informasjon om PST- og OST-filer, og instruksjoner for hvordan eksportere til PST-filer, se denne siden fra Microsoft.

Store PST- og OST-filer: For å indeksere en PST- eller OST-fil må applikasjonen laste hele filen inn i RAM. Derfor støttes ikke indeksering av PST- eller OST-filer som er større enn tilgjengelig RAM-mengde (f.eks. 30 GB PST-fil mot 16 GB RAM), og forsøk på å gjøre dette vil krasje applikasjonen. For å håndtere dette problemet kan du enten ekskludere den store PST- eller OST-filen fra indeksering, eller oppgradere RAM-en din. I tilfelle RAM-oppgradering, merk at den totale mengden RAM som trengs er større enn PST- eller OST-filen, på grunn av det faktum at operativsystemet og andre prosesser tar opp noe av den RAM-en.

Ansvarsfraskrivelse om best-effort indeksering

Som praktisk talt all søkeprogramvare støtter DocFetcher, DocFetcher Pro og DocFetcher Server de ulike filformatene oppført ovenfor på best-effort grunnlag. Dette betyr for eksempel at hvis du prøver å indeksere 10 000 filer, kan programvaren lykkes med å indeksere bare 9 500 filer (dvs. 95 %), mens den feiler på de resterende 500 filene. Selvfølgelig avhenger den faktiske suksessraten av datasettet ditt.

Videre, selv om en bestemt fil blir vellykket indeksert, kan programvaren feile i å trekke ut noe tekst i den, spesielt når man har å gjøre med gamle filformater som “doc” eller “xls”. For eksempel kan den feile i å trekke ut noen cellekommentarer eller metadata fra gamle Excel-filer.

Uansett vil DocFetcher Pro og DocFetcher Server mest sannsynlig gjøre en bedre jobb med å indeksere filer enn den eldre DocFetcher.

Hvis du ser en spesielt høy feilrate under indeksering, rapporter gjerne problemet, med noen testfiler vedlagt. Det er imidlertid ingen garanti for at problemet kan løses.

Støttede arkivformater

  • 7z-arkiver (7z), opp til versjon v0.3 av 7z-formatet
  • 7z-arkiver (7z), opp til versjon v0.4 av 7z-formatet (siden 7-Zip 9.34, fra 2014-11-23) Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
  • Rar-arkiver (rar) — RAR 5.0-format støttes ikke
  • Tar og Tar.*-arkiver:
    • tar, tar.gz, tgz, tar.bz2, tb2, tbz
    • tbz2, tar.lzma, tlz, tar.xz, txz, tar.z, tz Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
  • Zip-arkiver (tilpassbare utvidelser)

Andre bemerkelsesverdige funksjoner

Kryssplattform: DocFetcher, DocFetcher Pro og DocFetcher Server kan kjøres på Windows, Linux og macOS. I tillegg kan DocFetcher Server nås fra hvilken som helst stasjonær datamaskin med en oppdatert versjon av Chrome, Firefox, Safari eller Edge installert.

Portabel versjon: DocFetcher Pro-pakkene for Windows, Linux og macOS kommer hver i en portabel og ikke-portabel versjon. Den portable versjonen er nyttig ved at den lar deg samle portabel DocFetcher Pro, dens indekser og de indekserte dokumentene, til bruk på en rekke måter:

  • Du kan bære denne pakken rundt på en USB-stasjon.
  • Du kan arkivere den på et eller annet sikkerhetskopieringsmedium.
  • Du kan plassere den i et kryptert volum.
  • Du kan plassere den i en sky-stasjon og synkronisere den på tvers av datamaskiner.

Vær oppmerksom på at redistribusjon av slike portable pakker til andre brukere ikke er tillatt med DocFetcher Pro, siden hver kjøpte kopi er knyttet til en enkelt bruker. (Hver mottakende bruker må kjøpe sin egen kopi.) Redistribusjon er imidlertid tillatt med den åpen kildekode-baserte DocFetcher.

Unicode-støtte: DocFetcher, DocFetcher Pro og DocFetcher Server kommer med solid Unicode-støtte for alle store formater, inkludert Microsoft Office, OpenDocument, PDF, HTML, RTF og rene tekstfiler.

Indeksering av nettverksstasjoner: DocFetcher, DocFetcher Pro og DocFetcher Server kan indeksere nettverksstasjoner så vel som sky-stasjoner. Mer generelt, hvis en datastruktur kan monteres som noe som ser ut som et filsystem i operativsystemet, kan alle tre programmene indeksere det.

Ubegrensede nivåer av arkiv-nesting: DocFetcher, DocFetcher Pro og DocFetcher Server støtter ubegrensede nivåer av arkiv-nesting. Med andre ord kan de lese arkiver innenfor arkiver innenfor arkiver… Eksempel:
C:\arkiv1.7z\arkiv2.rar\arkiv3.zip

Oppdaging av HTML-par: Under indeksering oppdager DocFetcher, DocFetcher Pro og DocFetcher Server par av HTML-filer (f.eks. en fil med navn dokument.html og en mappe med navn dokument_files), og behandler hvert par som ett enkelt dokument. Denne funksjonen kan virke ganske ubrukelig først, men det viste seg at dette dramatisk øker kvaliteten på søkeresultatene når du har å gjøre med HTML-filer, siden alt “rotet” inne i HTML-mappene forsvinner fra resultatene.