Denne side er en oversigt over alle de vigtigste funktioner i DocFetcher Pro og DocFetcher Server, beregnet til dem, der ikke er bekendt med DocFetcher. Hvis du er det, vil du måske finde siden Sammenligning og dens undersider mere nyttige.
Alle skærmbilleder nedenfor viser brugergrænsefladen i DocFetcher Pro. Webgrænsefladen i DocFetcher Server ligner denne og er indlejret i et browservindue.
Brugergrænsefladen

Som vist i skærmbilledet ovenfor består hovedvinduet i DocFetcher Pro af følgende dele:
- Søgefelt: Indtast de ord, der skal søges efter her.
- Resultatpanel: Søgeresultaterne vises her. Det er de filer, mapper eller Outlook-e-mails, der indeholder de ord, du indtastede i søgefeltet.
- Preview-rude: Viser en tekstbaseret forhåndsvisning af den fil eller Outlook-e-mail, der aktuelt er valgt i resultatpanelet. Træffere i teksten fremhæves.
- Minimum/maksimum Filstørrelse filter: Søgeresultaterne kan filtreres efter minimum og/eller maksimum filstørrelse her. Free Available in the free DocFetcher Pro Available in DocFetcher Pro Server Not available in DocFetcher Server
- Beholdertyper panel: Indstil her, om mapper og arkiver skal inkluderes i søgeresultaterne. I DocFetcher er mapper og arkiver ikke inkluderet i søgeresultaterne, kun filer og Outlook-e-mails. Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
- Dokumenttyper panel: Søgeresultaterne kan filtreres efter filtype her.
- Brugerdefinerede typer panel: Et alternativ til Dokumenttyper panelet. Her kan du definere dine egne filtyper til at filtrere søgeresultaterne efter. Definitionerne er baseret på matchende jokertegn-mønstre eller regulære udtryk mod filnavne. Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Not available in DocFetcher Server
- Søgeområde panel: Dette panel har to formål: Filtrering af søgeresultaterne efter placering og administration af dine »indekser«, som forklares nedenfor. Indekser kan tilføjes, opdateres og fjernes. Hvert indeks svarer til en søgbar placering på din computer.
- Forskellige kontroller: De tre kontroller til højre for Søg knappen er: antallet af aktuelt synlige søgeresultater, en knap til at åbne brugermanualen og en knap til at åbne programindstillingerne.
Kraftfuld forespørgselssyntaks

Ovenstående skærmbillede viser et eksempel på den slags komplekse søgeforespørgsler, du kan indtaste i DocFetcher, DocFetcher Pro og DocFetcher Server. Eksempelforespørgslen betyder: Find alle dokumenter, der indeholder (1) sætningen »reproduction or redistribution«, og (2) ordene »documentation« og »agreement« med højst tre ord imellem.
Forespørgselssyntaksen drives af den underliggende søgemaskine Apache Lucene. Her er en hurtig gennemgang af dens vigtigste funktioner:
- Booleske operatorer: (hund OR kat) AND mus NOT hest
- Frasesøgning, dvs. at finde ord i en bestemt rækkefølge: "hund kat mus"
- Påkrævede termer: +hund +kat
- Jokertegn: Pladsholder-tegn * og ? til at matche henholdsvis ›nul eller flere‹ tegn og ›præcis ét‹ tegn. Eksempler:
- luc? matcher lucy, luca, …
- luc* matcher luc, lucy, luck, lucene, …
- *ene* matcher lucene, energy, generator, …
- Fuzzy-søgning, dvs. at finde ord, der ligner et givet ord. For eksempel vil søgning efter roam~ finde dokumenter, der indeholder ord som foam og roams.
- Nærhedssøgning, dvs. at finde ord, der ikke er mere end et bestemt antal ord fra hinanden. Eksempel: "documentation agreement"~3
Indeksbaseret søgning
Indeksbaseret søgning: DocFetcher, DocFetcher Pro og DocFetcher Server søger efter ord i filnavnet og filindholdet af filer, samt i felterne og hovedteksten i Outlook-e-mails. For effektivitetens skyld kører søgningen dog på såkaldte indekser snarere end direkte på filerne og e-mailsene. Et indeks er i bund og grund en ordbog, hvor programmet hurtigt kan slå op for ethvert givet ord, hvilke filer eller e-mails der indeholder det ord.
Afvejning: hurtig søgning og indeksoprettelse: Indeksbaseret søgning er en fantastisk idé, fordi den er størrelsesordener hurtigere end søgning uden indekser: DocFetcher, DocFetcher Pro og DocFetcher Server kan typisk finde tusindvis af matchende filer på under et sekund. Den største ulempe er, at indekserne først skal oprettes — en proces kendt som indeksering — og dette kan tage nogen tid afhængigt af det samlede antal filer og e-mails og deres individuelle størrelser.
Hurtig indeksering og »indeksér kun det, du har brug for« filosofi: Ulempen ved at skulle oprette et indeks lindres af det faktum, at indeksering i DocFetcher, DocFetcher Pro og DocFetcher Server er ret hurtig: 200 filer pr. minut er en ret normal indekseringshastighed. Derudover følger de tre programmer en »indeksér kun det, du har brug for« filosofi: Ud af boksen er intet på din computer indekseret, og det er helt op til dig at bestemme, hvad der bliver indekseret. Dette er i modsætning til andre søgeprogrammer, der ud af boksen spilder en masse tid og computerkraft på at indeksere stort set alt, da de ikke stoler på, at du selv kan bestemme. For ikke at nævne privatlivskonsekvenserne af denne »indeksér alt« tilgang…
Indeksoprettelse vs. indeksopdatering: Sidst men ikke mindst er indeksering af en bestemt mappe normalt kun tidskrævende første gang, hvis overhovedet. Herefter, når du kører en såkaldt indeksopdatering, vil programmet være smart nok til kun at indeksere nye og modificerede filer og springe alt andet over. I praksis vil normalt kun et relativt lille antal filer være blevet tilføjet eller modificeret, så en indeksopdatering tager normalt kort tid.
Oprettelse af indekser

Ovenstående skærmbillede viser indekseringsdialogen i DocFetcher Pro. Dette er konfigurationsdialogen, du ser, når du opretter et nyt indeks. Bemærkelsesværdige funktioner:
- Tilpasselige plain text og zip-udvidelser: Filendelserne, hvormed programmet genkender plain text-filer og zip-arkiver, kan tilpasses. Tilpasning af plain text-filendelser er nyttigt, når man arbejder med kildekode.
- Inkluderings- og ekskluderingsregler: Du kan definere regler for at inkludere eller ekskludere bestemte filer baseret på jokertegn eller regulære udtryk. Denne tabel findes også i DocFetcher, men jokertegn og inkluderingsreglen er kun tilgængelige i DocFetcher Pro og DocFetcher Server. Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
- Automatisk opdatering af indekser: Hvis »Opdater indeks automatisk« boksen er afkrydset, vil programmet overvåge den indekserede mappe for filændringer og opdatere indekset automatisk, når en ændring detekteres.
- Indekseringskø: Flere indekseringsjobs kan sættes i kø, med hvert job på en separat fane.
- Gem og indlæs indekseringsindstillinger: Denne »krukke« knap åbner en menu til at gemme og indlæse indekseringsindstillinger. Dette er praktisk, hvis du har brug for at definere mange inkluderings- og ekskluderingsregler. Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Not available in DocFetcher Server
Understøttede dokumentformater
- AbiWord (abw, abw.gz, zabw)
- EPUB (epub)
- FictionBook (fb2, fbz, fb2.zip) Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
- FLAC metadata (flac)
- HTML (html, xhtml, …)
- JPEG Exif metadata (jpg, jpeg)
- MP3 metadata (mp3)
- Microsoft Compiled HTML Help (chm)
- Microsoft Office pre-2007 (doc, xls, ppt, …)
- Microsoft Office 2007 and newer (docx, xlsx, pptx, …)
- Microsoft Outlook OST (ost) * Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
- Microsoft Outlook PST (pst) *
- Microsoft Visio (vsd, vss, vst, vsw)
- Mobipocket (mobi) — support is currently experimental Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
- OpenDocument (odt, ods, odg, odp, …)
- Portable Document Format (pdf)
- Plain Text (customizable extensions)
- Rich Text Format (rtf)
- Scalable Vector Graphics (svg)
For ethvert filformat, der ikke er inkluderet i ovenstående liste, kan i det mindste filnavnet indekseres. Desuden kan ethvert filformat, der kan identificeres ved en specifik filendelse, tvinges til at blive indekseret som plain text, da plain text-filendelserne kan tilpasses.
* Begrænsninger ved PST og OST filunderstøttelse
Ingen e-mail forhåndsvisning: Af tekniske årsager kan hverken DocFetcher, DocFetcher Pro eller DocFetcher Server åbne e-mails i søgeresultaterne med Outlook. E-mailsene kan kun vises i programmets tekstbaserede forhåndsvisningsrude. Muligheden for at åbne e-mails i Outlook kan blive tilføjet i en fremtidig hovedudgivelse af DocFetcher Pro (v2.0 eller senere). Det kan ikke implementeres i DocFetcher Server, da brugerens Outlook-instans og PST- eller OST-filen, der indeholder e-mailen, potentielt befinder sig på forskellige computere.
Foretræk PST frem for OST: Selvom DocFetcher Pro og DocFetcher Server kan læse OST-filer til en vis grad, skal du være opmærksom på, at OST-filer faktisk bare er cache-filer, hvor Outlook midlertidigt gemmer en del af dataene fra en online-konto til offline brug. Hvis du indekserer OST-filer, vil du derfor opleve, at mange e-mails og e-mail-vedhæftninger, du ville forvente at se, simpelthen ikke er der. PST-filer er det, Outlook bruger til komplet, langsigtet lagring af e-mails, så foretræk altid indeksering af PST-filer frem for OST-filer, hvor det er muligt. For mere info om PST- og OST-filer og instruktioner om, hvordan du eksporterer til PST-filer, se denne side fra Microsoft.
Store PST- og OST-filer: For at indeksere en PST- eller OST-fil skal applikationen indlæse hele filen i RAM. Derfor understøttes indeksering af PST- eller OST-filer, der er større end den tilgængelige mængde RAM (f.eks. 30 GB PST-fil vs. 16 GB RAM), ikke, og forsøg på at gøre dette vil få applikationen til at gå ned. For at håndtere dette problem kan du enten ekskludere den store PST- eller OST-fil fra indeksering eller opgradere dit RAM. I tilfælde af RAM-opgradering skal du bemærke, at den samlede mængde RAM, der er nødvendig, er større end PST- eller OST-filen på grund af det faktum, at operativsystemet og andre processer optager noget af dette RAM.
Ansvarsfraskrivelse om bedste-indsats indeksering
Som stort set al søgesoftware understøtter DocFetcher, DocFetcher Pro og DocFetcher Server de forskellige filformater, der er anført ovenfor, på bedste-indsats basis. Det betyder for eksempel, at hvis du forsøger at indeksere 10.000 filer, kan softwaren muligvis kun med succes indeksere 9.500 filer (dvs. 95%), mens den fejler på de resterende 500 filer. Naturligvis afhænger den faktiske succesrate af dit datasæt.
Desuden, selv hvis en bestemt fil indekseres med succes, kan softwaren fejle i at udtrække noget tekst i den, især når man arbejder med gamle filformater som »doc« eller »xls«. For eksempel kan den fejle i at udtrække nogle cellekommentarer eller metadata fra gamle Excel-filer.
Under alle omstændigheder vil DocFetcher Pro og DocFetcher Server højst sandsynligt gøre et bedre stykke arbejde med at indeksere filer end den ældre DocFetcher.
Hvis du ser en særligt høj fejlrate under indeksering, så rapportér problemet med nogle testfiler vedhæftet. Der er dog ingen garanti for, at problemet kan løses.
Understøttede arkivformater
- 7z-arkiver (7z), op til version v0.3 af 7z-formatet
- 7z-arkiver (7z), op til version v0.4 af 7z-formatet (siden 7-Zip 9.34, fra 2014-11-23) Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
- Rar-arkiver (rar) — RAR 5.0-format ikke understøttet
- Tar og Tar.* arkiver:
- tar, tar.gz, tgz, tar.bz2, tb2, tbz
- tbz2, tar.lzma, tlz, tar.xz, txz, tar.z, tz Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
- Zip-arkiver (tilpasselige endelser)
Andre bemærkelsesværdige funktioner
Krydsplatform: DocFetcher, DocFetcher Pro og DocFetcher Server kan køre på Windows, Linux og macOS. Derudover kan DocFetcher Server tilgås fra enhver desktop-computer med en opdateret version af Chrome, Firefox, Safari eller Edge installeret.
Portabel version: DocFetcher Pro pakkerne til Windows, Linux og macOS kommer hver i en portabel og ikke-portabel version. Den portable version er nyttig, da den giver dig mulighed for at samle portable DocFetcher Pro, dens indekser og de indekserede dokumenter, der kan bruges på forskellige måder:
- Du kan bære dette bundt omkring på et USB-drev.
- Du kan arkivere det på et backup-medium.
- Du kan lægge det i en krypteret enhed.
- Du kan lægge det i et cloud-drev og synkronisere det på tværs af computere.
Bemærk venligst, at videredistribution af sådanne portable bundter til andre brugere ikke er tilladt med DocFetcher Pro, da hver købte kopi er knyttet til en enkelt bruger. (Hver modtagende bruger skulle købe deres egen kopi.) Videredistribution er dog tilladt med det open-source DocFetcher.
Unicode-understøttelse: DocFetcher, DocFetcher Pro og DocFetcher Server kommer med solidt Unicode-understøttelse for alle større formater, inklusive Microsoft Office, OpenDocument, PDF, HTML, RTF og plain text-filer.
Indeksering af netværksdrev: DocFetcher, DocFetcher Pro og DocFetcher Server kan indeksere netværksdrev såvel som cloud-drev. Mere generelt, hvis en datastruktur kan mountes som noget, der ligner et filsystem i operativsystemet, så er alle tre programmer i stand til at indeksere det.
Detektering af HTML-par: Under indeksering detekterer DocFetcher, DocFetcher Pro og DocFetcher Server par af HTML-filer (f.eks. en fil kaldet eksempel.html og en mappe kaldet eksempel_files), og behandler hvert par som et enkelt dokument. Denne funktion kan virke ret ubrugelig i starten, men det viste sig, at dette dramatisk øger kvaliteten af søgeresultaterne, når du arbejder med HTML-filer, da alt »rodet« inde i HTML-mapperne forsvinder fra resultaterne.