Den här sidan är en översikt över alla huvudfunktioner i DocFetcher Pro och DocFetcher Server, avsedd för dem som inte är bekanta med DocFetcher. Om du är det, kan du finna sidan Jämförelse och dess undersidor mer hjälpsam.
Alla skärmdumpar nedan visar användargränssnittet för DocFetcher Pro. Webbgränssnittet för DocFetcher Server ser liknande ut och är inbäddat i ett webbläsarfönster.
Användargränssnittet

Som visas i skärmdumpen ovan består huvudfönstret i DocFetcher Pro av följande delar:
- Sökfält: Ange orden att söka efter här.
- Resultatfönster: Sökresultaten visas här. Detta är filerna, mapparna eller Outlook-mejlen som innehåller orden du angav i sökfältet.
- Förhandsgranskningsfönster: Visar en förhandsgranskning av filen eller Outlook-mejlet som för närvarande är valt i resultatfönstret. Träffar i texten markeras.
- Minimi/maximal filstorlek-filter: Sökresultaten kan filtreras efter minimi- och/eller maximal filstorlek här. Free Available in the free DocFetcher Pro Available in DocFetcher Pro Server Not available in DocFetcher Server
- Behållartyper-fönster: Ange här om mappar och arkiv ska inkluderas i sökresultaten. I DocFetcher inkluderas inte mappar och arkiv i sökresultaten, endast filer och Outlook-mejl. Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
- Dokumenttyper-fönster: Sökresultaten kan filtreras efter filtyp här.
- Egna filter-fönster: Ett alternativ till dokumenttyper-fönstret. Här kan du definiera dina egna filtyper att filtrera sökresultaten efter. Definitionerna baseras på matchning av jokertecken eller reguljära uttryck mot filnamn. Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Not available in DocFetcher Server
- Sökningsområde-fönster: Detta fönster har två syften: Filtrera sökresultaten efter plats, och hantera dina ”index”, som förklaras nedan. Index kan läggas till, uppdateras och tas bort. Varje index motsvarar någon sökbar plats på din dator.
- Olika kontroller: De tre kontrollerna till höger om Sök-knappen är: antalet för närvarande synliga sökresultat, en knapp för att öppna användarmanualen och en knapp för att öppna programinställningarna.
Kraftfull sökfrågesyntax

Skärmdumpen ovan visar ett exempel på de typer av komplexa sökfrågor du kan ange i DocFetcher, DocFetcher Pro och DocFetcher Server. Exempelfrågan betyder: Hitta alla dokument som innehåller (1) frasen ”reproduction or redistribution”, och (2) orden ”documentation” och ”agreement” högst tre ord ifrån varandra.
Sökfrågesyntaxen drivs av den underliggande sökmotorn Apache Lucene. Här är en snabb genomgång av dess huvudfunktioner:
- Booleska operatorer: (hund OR katt) AND mus NOT häst
- Frassökning, dvs hitta ord i en specifik ordning: "hund katt mus"
- Obligatoriska termer: +hund +katt
- Jokertecken: Platshållartecken * och ? för att matcha ’noll eller flera’ tecken respektive ’exakt ett’ tecken. Exempel:
- luc? matchar lucy, luca, …
- luc* matchar luc, lucy, luck, lucene, …
- *ene* matchar lucene, energy, generator, …
- Oskarp sökning, dvs hitta ord som liknar ett givet ord. Till exempel kommer sökning efter roam~ att visa dokument som innehåller ord som foam och roams.
- Närhetssökning, dvs hitta ord som inte är mer än ett visst antal ord ifrån varandra. Exempel: "documentation agreement"~3
Indexbaserad sökning
Indexbaserad sökning: DocFetcher, DocFetcher Pro och DocFetcher Server söker efter ord i filnamn och filinnehåll för filer, såväl som i fält och brödtext för Outlook-mejl. Men för effektivitetens skull körs sökningen på så kallade index, snarare än på filerna och mejlen direkt. Ett index är i grund och botten en ordbok där programmet snabbt kan slå upp för vilket givet ord som finns i vilka filer eller mejl.
Avvägning: snabb sökning och indexskapande: Indexbaserad sökning är en bra idé eftersom den är storleksordningar snabbare än att söka utan index: DocFetcher, DocFetcher Pro och DocFetcher Server kan typiskt hitta tusentals matchande filer på mindre än en sekund. Den huvudsakliga nackdelen är att index måste skapas först — en process som kallas indexering — och detta kan ta lite tid beroende på det totala antalet filer och mejl, och deras individuella storlekar.
Snabb indexering och ”indexera bara vad du behöver”-filosofi: Nackdelen med att behöva skapa ett index mildras av det faktum att indexering i DocFetcher, DocFetcher Pro och DocFetcher Server är ganska snabb: 200 filer per minut är en ganska normal indexeringshastighet. Dessutom följer de tre programmen en ”indexera bara vad du behöver”-filosofi: Direkt från början indexeras ingenting på din dator, och det är helt upp till dig att bestämma vad som indexeras. Detta står i kontrast till andra sökprogram som direkt från början slösar bort massor av tid och datorkraft för att indexera i princip allt, eftersom de inte litar på att du kan bestämma själv. För att inte tala om integritetsimplikationerna av denna ”indexera allt”-approach…
Indexskapande vs. indexuppdatering: Sist men inte minst är indexering av en viss mapp vanligtvis bara tidskrävande första gången, om överhuvudtaget. Därefter, när du kör en så kallad indexuppdatering, kommer programmet att vara smart nog att endast indexera nya och modifierade filer, och hoppa över allt annat. I praktiken har vanligtvis endast ett relativt litet antal filer lagts till eller modifierats, så en indexuppdatering tar vanligtvis lite tid.
Skapa index

Skärmdumpen ovan visar indexeringsdialogen för DocFetcher Pro. Detta är konfigurationsdialogen du ser när du skapar ett nytt index. Anmärkningsvärda funktioner:
- Anpassningsbara vanlig text- och zip-tillägg: Filtilläggen som programmet använder för att känna igen vanliga textfiler och zip-arkiv kan anpassas. Anpassning av vanliga textfiltillägg är användbart när du arbetar med källkod.
- Inkluderings- och exkluderingsregler: Du kan definiera regler för att inkludera eller exkludera vissa filer baserat på jokertecken eller reguljära uttryck. Denna tabell finns också i DocFetcher, men jokertecken och inkluderingsregeln är endast tillgängliga i DocFetcher Pro och DocFetcher Server. Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
- Automatisk uppdatering av index: Om rutan ”Uppdatera index automatiskt” är markerad kommer programmet att övervaka den indexerade mappen för filändringar och uppdatera indexet automatiskt när en förändring upptäcks.
- Indexeringskö: Flera indexeringsjobb kan köas, vart och ett på en separat flik.
- Spara och ladda indexeringsinställningar: Denna ”burk”-knapp öppnar en meny för att spara och ladda indexeringsinställningar. Detta är praktiskt om du behöver definiera många inkluderings- och exkluderingsregler. Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Not available in DocFetcher Server
Dokumentformat som stöds
- AbiWord (abw, abw.gz, zabw)
- EPUB (epub)
- FictionBook (fb2, fbz, fb2.zip) Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
- FLAC metadata (flac)
- HTML (html, xhtml, …)
- JPEG Exif metadata (jpg, jpeg)
- MP3 metadata (mp3)
- Microsoft Compiled HTML Help (chm)
- Microsoft Office pre-2007 (doc, xls, ppt, …)
- Microsoft Office 2007 and newer (docx, xlsx, pptx, …)
- Microsoft Outlook OST (ost) * Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
- Microsoft Outlook PST (pst) *
- Microsoft Visio (vsd, vss, vst, vsw)
- Mobipocket (mobi) — support is currently experimental Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
- OpenDocument (odt, ods, odg, odp, …)
- Portable Document Format (pdf)
- Plain Text (customizable extensions)
- Rich Text Format (rtf)
- Scalable Vector Graphics (svg)
För alla filformat som inte finns i listan ovan kan åtminstone filnamnet indexeras. Dessutom kan alla filformat som kan identifieras med ett specifikt filtillägg tvångsindexeras som vanlig text, eftersom vanliga textfiltillägg är anpassningsbara.
* Begränsningar för PST- och OST-filstöd
Ingen förhandsgranskning av mejl: Av tekniska skäl kan varken DocFetcher eller DocFetcher Pro eller DocFetcher Server öppna mejl i sökresultaten med Outlook. Mejlen kan endast visas i programmets förhandsgranskningsfönster med endast text. Möjligheten att öppna mejl i Outlook kan läggas till i en framtida större version av DocFetcher Pro (v2.0 eller senare). Det kan inte implementeras i DocFetcher Server eftersom användarens Outlook-instans och PST- eller OST-filen som innehåller mejlet kan finnas på olika datorer.
Föredra PST framför OST: Medan DocFetcher Pro och DocFetcher Server kan läsa OST-filer till viss del, var varnad att OST-filer egentligen bara är cachefiler där Outlook tillfälligt lagrar vissa delar av data från ett onlinekonto för offlineanvändning. Således, om du indexerar OST-filer, kommer du att upptäcka att många mejl och mejlbilagor som du skulle förvänta dig att se helt enkelt inte finns där. PST-filer är vad Outlook använder för fullständig, långsiktig lagring av mejl, så föredra alltid att indexera PST-filer framför OST-filer när det är möjligt. För mer information om PST- och OST-filer, och instruktioner om hur man exporterar till PST-filer, se denna sida från Microsoft.
Stora PST- och OST-filer: För att indexera en PST- eller OST-fil måste applikationen ladda hela filen i RAM. Således stöds inte indexering av PST- eller OST-filer som är större än den tillgängliga mängden RAM (t.ex. 30 GB PST-fil vs. 16 GB RAM), och försök att göra det kommer att krascha applikationen. För att hantera detta problem kan du antingen exkludera den stora PST- eller OST-filen från indexering, eller uppgradera ditt RAM. Vid RAM-uppgradering, notera att den totala mängden RAM som behövs är större än PST- eller OST-filen, på grund av att operativsystemet och andra processer använder en del av det RAM:et.
Friskrivning om bästa-möjliga indexering
Liksom praktiskt taget all sökprogramvara stöder DocFetcher, DocFetcher Pro och DocFetcher Server de olika filformaten som listas ovan på bästa-möjliga basis. Detta betyder till exempel att om du försöker indexera 10 000 filer, kan programvaran framgångsrikt indexera endast 9 500 filer (dvs 95%), medan den misslyckas med de återstående 500 filerna. Naturligtvis beror den faktiska framgångsgraden på din datamängd.
Dessutom, även om en viss fil framgångsrikt indexeras, kan programvaran misslyckas med att extrahera viss text i den, särskilt när den hanterar gamla filformat som ”doc” eller ”xls”. Till exempel kan den misslyckas med att extrahera vissa cellkommentarer eller metadata från urgamla Excel-filer.
I alla fall kommer DocFetcher Pro och DocFetcher Server med största sannolikhet att göra ett bättre jobb med att indexera filer än det äldre DocFetcher.
Om du ser en särskilt hög misslyckanderate under indexering, rapportera gärna problemet, med några testfiler bifogade. Det finns dock ingen garanti för att problemet kan lösas.
Arkivformat som stöds
- 7z archives (7z), up to version v0.3 of the 7z format
- 7z archives (7z), up to version v0.4 of the 7z format (since 7-Zip 9.34, from 2014-11-23) Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
- Rar archives (rar) — RAR 5.0 format not supported
- Tar and Tar.* archives:
- tar, tar.gz, tgz, tar.bz2, tb2, tbz
- tbz2, tar.lzma, tlz, tar.xz, txz, tar.z, tz Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
- Zip archives (customizable extensions)
Andra anmärkningsvärda funktioner
Multiplattform: DocFetcher, DocFetcher Pro och DocFetcher Server kan köras på Windows, Linux och macOS. Dessutom kan DocFetcher Server nås från vilken stationär dator som helst med en uppdaterad version av Chrome, Firefox, Safari eller Edge installerad.
Portabel version: DocFetcher Pro-paketen för Windows, Linux och macOS kommer var och en i en portabel och icke-portabel version. Den portabla versionen är användbar eftersom den tillåter dig att paketera portabel DocFetcher Pro, dess index och de indexerade dokumenten, för att användas på olika sätt:
- Du kan bära detta paket på en USB-enhet.
- Du kan arkivera det på något säkerhetskopieringsmedium.
- Du kan lägga det i en krypterad volym.
- Du kan lägga det i en molnenhet och synkronisera det över datorer.
Observera att vidaredistribution av sådana portabla paket till andra användare inte är tillåten med DocFetcher Pro, eftersom varje köpt kopia är knuten till en enskild användare. (Varje mottagande användare skulle behöva köpa sin egen kopia.) Vidaredistribution är dock tillåten med det öppna källkods-DocFetcher.
Unicode-stöd: DocFetcher, DocFetcher Pro och DocFetcher Server kommer med klipphärd Unicode-stöd för alla större format, inklusive Microsoft Office, OpenDocument, PDF, HTML, RTF och vanliga textfiler.
Indexering av nätverksenheter: DocFetcher, DocFetcher Pro och DocFetcher Server kan indexera nätverksenheter såväl som molnenheter. Mer generellt, om en datastruktur kan monteras som något som ser ut som ett filsystem i operativsystemet, så kan alla tre program indexera det.
Detektering av HTML-par: Under indexering upptäcker DocFetcher, DocFetcher Pro och DocFetcher Server par av HTML-filer (t.ex. en fil med namnet namn.html och en mapp med namnet namn_files), och behandlar varje par som ett enda dokument. Denna funktion kan verka ganska oanvändbar först, men det visade sig att detta dramatiskt ökar kvaliteten på sökresultaten när du hanterar HTML-filer, eftersom allt ”stök” inne i HTML-mapparna försvinner från resultaten.