Ez az oldal áttekintést nyújt a DocFetcher Pro és DocFetcher Server összes főbb funkciójáról, azoknak szánva, akik nem ismerik a DocFetcher-t. Ha ismeri, akkor az Összehasonlítás oldal és aloldalai hasznosabbak lehetnek.
Az alábbi képernyőképek mindegyike a DocFetcher Pro felhasználói felületét mutatja. A DocFetcher Server webes felülete hasonlóan néz ki, és egy böngészőablakban helyezkedik el.
A felhasználói felület

Amint a fenti képernyőképen látható, a DocFetcher Pro főablaka a következő részekből áll:
- Keresőmező: Itt adhatja meg a keresendő szavakat.
- Eredményterület: Itt jelennek meg a keresési eredmények. Ezek azok a fájlok, mappák vagy Outlook e-mailek, amelyek tartalmazzák a keresőmezőben megadott szavakat.
- Előnézeti ablak: Az eredményterületen kiválasztott fájl vagy Outlook e-mail szöveges előnézetét mutatja. A szövegben található találatok kiemelve jelennek meg.
- Minimális/maximális fájlméret szűrő: A keresési eredmények minimális és/vagy maximális fájlméret szerint szűrhetők itt. Free Available in the free DocFetcher Pro Available in DocFetcher Pro Server Not available in DocFetcher Server
- Konténertípusok ablaktábla: Itt állíthatja be, hogy a mappák és archívumok szerepeljenek-e a keresési eredményekben. A DocFetcher-ben a mappák és archívumok nem szerepelnek a keresési eredményekben, csak a fájlok és Outlook e-mailek. Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
- Dokumentumtípusok ablaktábla: A keresési eredmények fájltípus szerint szűrhetők itt.
- Testreszabott típusok ablaktábla: A Dokumentumtípusok ablaktábla alternatívája. Itt definiálhatja saját fájltípusait a keresési eredmények szűréséhez. A definíciók helyettesítő karakterek vagy reguláris kifejezések fájlnevekhez való illesztésén alapulnak. Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Not available in DocFetcher Server
- Keresési tartomány ablaktábla: Ennek az ablaktáblának két célja van: a keresési eredmények hely szerinti szűrése, valamint az “indexek” kezelése, amelyeket alább magyarázunk. Az indexek hozzáadhatók, frissíthetők és eltávolíthatók. Minden index a számítógép valamilyen kereshető helyének felel meg.
- Különböző vezérlők: A Keresés gomb jobb oldalán található három vezérlő: az aktuálisan látható keresési eredmények száma, a felhasználói kézikönyv megnyitására szolgáló gomb, valamint a program beállításainak megnyitására szolgáló gomb.
Hatékony lekérdezési szintaxis

A fenti képernyőkép példát mutat arra, hogy milyen összetett keresési lekérdezéseket adhat meg a DocFetcher-ben, DocFetcher Pro-ban és DocFetcher Server-ben. A példa lekérdezés jelentése: Keressen minden olyan dokumentumot, amely tartalmazza (1) a “reproduction or redistribution” kifejezést, és (2) a “documentation” és “agreement” szavakat legfeljebb három szó távolságra egymástól.
A lekérdezési szintaxist a mögöttes keresőmotor, az Apache Lucene hajtja. Íme a főbb funkcióinak gyors áttekintése:
- Logikai operátorok: (kutya OR macska) AND egér NOT ló
- Kifejezéskeresés, azaz szavak keresése meghatározott sorrendben: "kutya macska egér"
- Kötelező kifejezések: +kutya +macska
- Helyettesítő karakterek: A * és ? helyettesítő karakterek ‘nulla vagy több’ illetve ‘pontosan egy’ karakter illesztésére. Példák:
- luc? illeszkedik: lucy, luca, …
- luc* illeszkedik: luc, lucy, luck, lucene, …
- *ene* illeszkedik: lucene, energy, generator, …
- Közelítő keresés, azaz egy adott szóhoz hasonló szavak keresése. Például a roam~ keresésével olyan dokumentumokat talál, amelyek olyan szavakat tartalmaznak, mint foam és roams.
- Közelségi keresés, azaz olyan szavak keresése, amelyek legfeljebb egy meghatározott számú szó távolságra vannak egymástól. Példa: "documentation agreement"~3
Index-alapú keresés
Index-alapú keresés: A DocFetcher, DocFetcher Pro és DocFetcher Server szavakat keres a fájlnevekben és fájltartalmakban, valamint az Outlook e-mailek mezőiben és törzsében. A hatékonyság kedvéért azonban a keresés úgynevezett indexeken fut, nem közvetlenül a fájlokon és e-maileken. Az index lényegében egy szótár, ahol a program gyorsan meg tudja keresni bármely szóhoz, hogy mely fájlok vagy e-mailek tartalmazzák azt.
Kompromisszum: gyors keresés és indexkészítés: Az index-alapú keresés nagyszerű ötlet, mert nagyságrendekkel gyorsabb, mint a keresés indexek nélkül: a DocFetcher, DocFetcher Pro és DocFetcher Server általában másodpercen belül több ezer egyező fájlt tud megtalálni. A fő hátránya, hogy először létre kell hozni az indexeket — ez az indexelés nevű folyamat — és ez időigényes lehet a fájlok és e-mailek teljes számától és egyedi méretüktől függően.
Gyors indexelés és “csak azt indexelje, amire szüksége van” filozófia: Az index létrehozásának hátrányát enyhíti az a tény, hogy az indexelés a DocFetcher-ben, DocFetcher Pro-ban és DocFetcher Server-ben meglehetősen gyors: percenként 200 fájl meglehetősen normális indexelési sebesség. Ezenkívül a három program a “csak azt indexelje, amire szüksége van” filozófiát követi: Alapból semmi nincs indexelve a számítógépén, és teljes mértékben az Ön döntése, hogy mi legyen indexelve. Ez ellentétben áll más keresőszoftverekkel, amelyek alapból rengeteg időt és számítógépes erőforrást pazarolnak lényegében minden indexelésére, mivel nem bíznak abban, hogy Ön maga döntse el. Nem is beszélve ennek az “indexelj mindent” megközelítésnek az adatvédelmi vonatkozásairól…
Indexkészítés vs. indexfrissítés: Végül, de nem utolsósorban, egy adott mappa indexelése általában csak az első alkalommal időigényes, ha egyáltalán. Ezután, amikor úgynevezett indexfrissítést futtat, a program elég okos lesz ahhoz, hogy csak az új és módosított fájlokat indexelje, mindent mást kihagyva. A gyakorlatban általában csak viszonylag kevés fájlt adnak hozzá vagy módosítanak, így az indexfrissítés általában kevés időt vesz igénybe.
Indexek létrehozása

A fenti képernyőkép a DocFetcher Pro indexelési párbeszédablakát mutatja. Ez az a konfigurációs párbeszédablak, amelyet új index létrehozásakor lát. Figyelemre méltó funkciók:
- Testreszabható egyszerű szöveges és zip kiterjesztések: A fájlkiterjesztések, amelyek alapján a program felismeri az egyszerű szöveges fájlokat és zip archívumokat, testreszabhatók. Az egyszerű szöveges fájlkiterjesztések testreszabása hasznos forráskód kezelésekor.
- Befoglalási és kizárási szabályok: Meghatározhat szabályokat bizonyos fájlok befoglalására vagy kizárására helyettesítő karakterek vagy reguláris kifejezések illesztése alapján. Ez a táblázat a DocFetcher-ben is létezik, de a helyettesítő karakterek és a befoglalási szabály csak a DocFetcher Pro-ban és DocFetcher Server-ben érhetők el. Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
- Indexek automatikus frissítése: Ha a “Index automatikus frissítése” jelölőnégyzet be van jelölve, a program figyeli az indexelt mappát fájlváltozásokra, és automatikusan frissíti az indexet, amikor változást észlel.
- Indexelési sor: Több indexelési feladat várakoztatható, mindegyik feladat külön lapon.
- Indexelési beállítások mentése és betöltése: Ez a “befőttes” gomb menüt nyit az indexelési beállítások mentésére és betöltésére. Ez hasznos, ha sok befoglalási és kizárási szabályt kell definiálnia. Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Not available in DocFetcher Server
Támogatott dokumentumformátumok
- AbiWord (abw, abw.gz, zabw)
- EPUB (epub)
- FictionBook (fb2, fbz, fb2.zip) Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
- FLAC metadata (flac)
- HTML (html, xhtml, …)
- JPEG Exif metadata (jpg, jpeg)
- MP3 metadata (mp3)
- Microsoft Compiled HTML Help (chm)
- Microsoft Office pre-2007 (doc, xls, ppt, …)
- Microsoft Office 2007 and newer (docx, xlsx, pptx, …)
- Microsoft Outlook OST (ost) * Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
- Microsoft Outlook PST (pst) *
- Microsoft Visio (vsd, vss, vst, vsw)
- Mobipocket (mobi) — support is currently experimental Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
- OpenDocument (odt, ods, odg, odp, …)
- Portable Document Format (pdf)
- Plain Text (customizable extensions)
- Rich Text Format (rtf)
- Scalable Vector Graphics (svg)
A fenti listában nem szereplő fájlformátumok esetén legalább a fájlnév indexelhető. Emellett bármely, konkrét fájlkiterjesztéssel azonosítható fájlformátum kényszeríthető egyszerű szövegként történő indexelésre, mivel az egyszerű szöveges fájlkiterjesztések testreszabhatók.
* A PST és OST fájltámogatás korlátai
Nincs e-mail előnézet: Technikai okokból sem a DocFetcher, sem a DocFetcher Pro, sem a DocFetcher Server nem tudja megnyitni az e-maileket a keresési eredményekben az Outlook-kal. Az e-mailek csak a program szöveges előnézeti ablakában jeleníthetők meg. Az e-mailek Outlook-ban történő megnyitásának lehetősége a DocFetcher Pro egy jövőbeli nagyobb kiadásában (v2.0 vagy későbbi) kerülhet hozzáadásra. Ez nem implementálható a DocFetcher Server-ben, mivel a felhasználó Outlook-példánya és az e-mailt tartalmazó PST vagy OST fájl potenciálisan különböző számítógépeken található.
Részesítse előnyben a PST-t az OST-vel szemben: Bár a DocFetcher Pro és DocFetcher Server bizonyos mértékig képes OST fájlok olvasására, figyelmeztetjük, hogy az OST fájlok valójában csak gyorsítótár fájlok, ahol az Outlook ideiglenesen tárolja az online fiók adatainak egy részét offline használatra. Így ha OST fájlokat indexel, azt fogja tapasztalni, hogy sok e-mail és e-mail melléklet, amelyet elvárna, egyszerűen nincs ott. A PST fájlok azok, amelyeket az Outlook az e-mailek teljes, hosszú távú tárolására használ, ezért amikor csak lehetséges, mindig részesítse előnyben a PST fájlok indexelését az OST fájlokéval szemben. A PST és OST fájlokról szóló további információkért és a PST fájlokba történő exportálás utasításaiért lásd ezt a Microsoft oldalt.
Nagy PST és OST fájlok: Egy PST vagy OST fájl indexeléséhez az alkalmazásnak a teljes fájlt be kell töltenie a RAM-ba. Ezért a rendelkezésre álló RAM mennyiségnél nagyobb PST vagy OST fájlok indexelése (pl. 30 GB PST fájl vs. 16 GB RAM) nem támogatott, és ennek kísérlete összeomlasztja az alkalmazást. A probléma megoldásához vagy kizárhatja a nagy PST vagy OST fájlt az indexelésből, vagy bővítheti a RAM-ot. RAM bővítése esetén vegye figyelembe, hogy a szükséges RAM teljes mennyisége nagyobb a PST vagy OST fájlnál, mivel az operációs rendszer és más folyamatok is felhasználnak egy részét a RAM-ból.
Jogi nyilatkozat a “legjobb erőfeszítés” elvű indexelésről
Mint szinte minden keresőszoftver, a DocFetcher, DocFetcher Pro és DocFetcher Server is legjobb erőfeszítés alapján támogatja a fent felsorolt különböző fájlformátumokat. Ez azt jelenti, hogy például ha 10 000 fájlt próbál indexelni, akkor a szoftver valószínűleg csak 9500 fájlt (azaz 95%-ot) indexel sikeresen, a maradék 500 fájlnál hibázik. Természetesen a tényleges sikerarány az adatkészlettől függ.
Továbbá, még akkor is, ha egy adott fájl sikeresen indexelődött, a szoftver képtelen lehet kinyerni belőle néhány szöveget, különösen régi fájlformátumok, mint a “doc” vagy “xls” kezelésekor. Például képtelen lehet kinyerni néhány cellamegjegyzést vagy metaadatot ősi Excel fájlokból.
Mindenesetre a DocFetcher Pro és DocFetcher Server nagy valószínűséggel jobban indexeli a fájlokat, mint a régebbi DocFetcher.
Ha kivételesen magas hibarátát tapasztal az indexelés során, mindenképpen jelentse a problémát, néhány tesztfájl melléklésével. Azonban nincs garancia arra, hogy a probléma megoldható.
Támogatott archívumformátumok
- 7z archívumok (7z), a 7z formátum v0.3 verziójáig
- 7z archívumok (7z), a 7z formátum v0.4 verziójáig (7-Zip 9.34 óta, 2014-11-23-tól) Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
- Rar archívumok (rar) — RAR 5.0 formátum nem támogatott
- Tar és Tar.* archívumok:
- tar, tar.gz, tgz, tar.bz2, tb2, tbz
- tbz2, tar.lzma, tlz, tar.xz, txz, tar.z, tz Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
- Zip archívumok (testreszabható kiterjesztések)
Egyéb figyelemre méltó funkciók
Platformfüggetlen: A DocFetcher, DocFetcher Pro és DocFetcher Server futtatható Windows, Linux és macOS rendszereken. Emellett a DocFetcher Server elérhető bármely asztali számítógépről, amelyen a Chrome, Firefox, Safari vagy Edge naprakész verziója telepítve van.
Hordozható verzió: A Windows, Linux és macOS DocFetcher Pro csomagok mindegyike hordozható és nem hordozható verzióban is elérhető. A hordozható verzió hasznos, mert lehetővé teszi a hordozható DocFetcher Pro, indexei és az indexelt dokumentumok összecsomagolását, sokféle módon használhatóan:
- Magukkal vihetik ezt a csomagot egy USB meghajtón.
- Archíválhatják valamilyen biztonsági méntuma adathordozón.
- Elhelyezhetik egy titkosított kötetben.
- Elhelyezhetik egy felhőmeghajtóban és szinkronizálhatják a számítógépek között.
Kérjük vegye figyelembe, hogy az ilyen hordozható csomagok más felhasználóknak való továbbádása nem engedélyezett a DocFetcher Pro esetében, mivel minden megvásárolt példány egyetlen felhasználóhoz kötött. (Minden címzett felhasználónak meg kell vásárolnia a saját példányát.) A továbbádás azonban engedélyezett a nyílt forráskódú DocFetcher esetében.
Unicode támogatás: A DocFetcher, DocFetcher Pro és DocFetcher Server szílszárd Unicode támogatással rendelkezik minden főbb formátumhoz, beleértve a Microsoft Office, OpenDocument, PDF, HTML, RTF és egyszerű szöveges fájlokat.
Hálózati meghajtók indexelése: A DocFetcher, DocFetcher Pro és DocFetcher Server képes hálózati meghajtók és felhőmeghajtók indexelésére is. Általánosabban, ha egy adatstruktúra csatolható valami olyanként, ami fájlrendszerként jelenik meg az operációs rendszerben, akkor mindhárom program képes annak indexelésére.
HTML párok észlelése: Az indexelés során a DocFetcher, DocFetcher Pro és DocFetcher Server észleli a HTML fájlpárokat (pl. egy teszt.html nevű fájl és egy teszt_files nevű mappa), és minden párt egyetlen dokumentumként kezel. Ez a funkció első pillantásra meglehetősen haszontalannak tűnhet, de kiderült, hogy ez dramátikusan növeli a keresési eredmények minőségét HTML fájlok kezelésekor, mivel az összes “zürzávar” a HTML mappákban eltűnik az eredményekből.