Header Image

Bu sayfa DocFetcher Pro ve DocFetcher Server’ın tüm önemli özelliklerinin bir özetini sunar ve DocFetcher’a aşina olmayanlara yöneliktir. Eğer aşinaysanız, Karşılaştırma sayfasını ve alt sayfalarını daha yararlı bulabilirsiniz.

Aşağıdaki tüm ekran görüntüleri DocFetcher Pro’nun kullanıcı arayüzünü göstermektedir. DocFetcher Server’ın web arayüzü benzer görünür ve bir tarayıcı penceresi içinde yer alır.

Kullanıcı Arayüzü

Ana pencere

Yukarıdaki ekran görüntüsünde gösterildiği gibi, DocFetcher Pro’nun ana penceresi aşağıdaki bölümlerden oluşur:

  1. Arama alanı: Aranacak kelimeleri buraya girin.
  2. Sonuç paneli: Arama sonuçları burada görüntülenir. Bunlar arama alanına girdiğiniz kelimeleri içeren dosyalar, klasörler veya Outlook e-postalarıdır.
  3. Önizleme bölmesi: Sonuç panelinde seçili olan dosya veya Outlook e-postasının yalnızca metin önizlemesini gösterir. Metindeki eşleşmeler vurgulanır.
  4. En küçük/en büyük dosya boyutu filtresi: Arama sonuçları burada minimum ve/veya maksimum dosya boyutuna göre filtrelenebilir. Free Available in the free DocFetcher Pro Available in DocFetcher Pro Server Not available in DocFetcher Server
  5. Konteyner türleri bölmesi: Klasörlerin ve arşivlerin arama sonuçlarına dahil edilip edilmeyeceğini buradan ayarlayın. DocFetcher’da klasörler ve arşivler arama sonuçlarına dahil edilmez, yalnızca dosyalar ve Outlook e-postaları dahil edilir. Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
  6. Belge türleri bölmesi: Arama sonuçları burada dosya türüne göre filtrelenebilir.
  7. Özelleştirilmiş türler bölmesi: Belge türleri bölmesine alternatif. Burada arama sonuçlarını filtrelemek için kendi dosya türlerinizi tanımlayabilirsiniz. Tanımlar dosya adlarına karşı joker karakter desenleri veya düzenli ifadelerin eşleştirilmesine dayanır. Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Not available in DocFetcher Server
  8. Arama kapsamı bölmesi: Bu bölmenin iki amacı vardır: Arama sonuçlarını konuma göre filtrelemek ve aşağıda açıklanan “dizinlerinizi” yönetmek. Dizinler eklenebilir, güncellenebilir ve kaldırılabilir. Her dizin bilgisayarınızda aranabilir bir konuma karşılık gelir.
  9. Çeşitli kontroller: Ara düğmesinin sağındaki üç kontrol şunlardır: şu anda görünen arama sonuçlarının sayısı, kullanıcı kılavuzunu açmak için bir düğme ve program tercihlerini açmak için bir düğme.

Güçlü Sorgu Sözdizimi

Sorgu sözdizimi

Yukarıdaki ekran görüntüsü DocFetcher, DocFetcher Pro ve DocFetcher Server’a girebileceğiniz karmaşık arama sorgularının bir örneğini göstermektedir. Örnek sorgu şunu anlatır: (1) “reproduction or redistribution” ifadesini ve (2) “documentation” ve “agreement” kelimelerini en fazla üç kelime aralığında içeren tüm belgeleri bul.

Sorgu sözdizimi, altta yatan arama motoru Apache Lucene tarafından desteklenir. Ana özelliklerinin hızlı bir özeti:

  • Mantıksal operatörler: (köpek OR kedi) AND fare NOT at
  • İfade araması, yani kelimeleri belirli bir sırada bulma: "köpek kedi fare"
  • Gerekli terimler: +köpek +kedi
  • Joker karakterler: ‘Sıfır veya daha fazla’ karakterle eşleşmek için * ve ‘tam olarak bir’ karakterle eşleşmek için ? yer tutucu karakterleri. Örnekler:
    • luc? şunlarla eşleşir: lucy, luca, …
    • luc* şunlarla eşleşir: luc, lucy, luck, lucene, …
    • *ene* şunlarla eşleşir: lucene, energy, generator, …
  • Bulanık arama, yani belirli bir kelimeye benzer kelimeleri bulma. Örneğin, roam~ araması foam ve roams gibi kelimeleri içeren belgeleri getirir.
  • Yakınlık araması, yani belirli sayıda kelimeden fazla ayrı olmayan kelimeleri bulma. Örnek: "documentation agreement"~3

Dizin Tabanlı Arama

Dizin tabanlı arama: DocFetcher, DocFetcher Pro ve DocFetcher Server dosyaların dosya adı ve içeriğinde aynı zamanda Outlook e-postalarının alan ve gövde kısımlarında kelime arar. Ancak verimlilik adına arama, dosya ve e-postalarda doğrudan değil, dizin adı verilen yapılarda çalışır. Dizin özünde, programın herhangi bir kelime için hangi dosya veya e-postaların o kelimeyi içerdiğini hızlıca arayabildiği bir sözlük gibidir.

Denge: hızlı arama ve dizin oluşturma: Dizin tabanlı arama harika bir fikirdir çünkü dizinsiz aramadan kat kat daha hızlıdır: DocFetcher, DocFetcher Pro ve DocFetcher Server tipik olarak binlerce eşleşen dosyayı bir saniyeden kısa sürede bulabilir. Ana dezavantajı, dizinlerin önce oluşturulması gerekmesidir — bu işleme dizin oluşturma denir — ve bu toplam dosya ve e-posta sayısına ve bunların tek tek boyutlarına bağlı olarak biraz zaman alabilir.

Hızlı dizin oluşturma ve “yalnızca ihtiyacın olanı dizinle” felsefesi: Dizin oluşturmak zorunda olmanın dezavantajı, DocFetcher, DocFetcher Pro ve DocFetcher Server’da dizin oluşturmanın oldukça hızlı olması gereceğiyle hafıfletilir: dakikada 200 dosya oldukça normal bir dizin oluşturma hızıdır. Ayrıca, üç program da “yalnızca ihtiyacın olanı dizinle” felsefesini takip eder: Kutusundan çıkar çıkmaz bilgisayarınızda hiçbir şey dizinlenmez ve nelerin dizinleneceğine karar vermek tamamen size kalmıştır. Bu, kutusundan çıkar çıkmaz temelde her şeyi dizinlemek için çok zaman ve bilgisayar gücü harcayan diğer arama yazılımlarından farklıdır, çünkü sizin kendi başınıza karar vermenize güvenmezler. Bu “her şeyi dizinle” yaklaşımının gizlilik sonuçlarından bahsetmiyorum bile…

Dizin oluşturma vs. dizin güncelleme: Son olarak ama önemsiz değil, belirli bir klasörü dizinlemek genellikle yalnızca ilk seferde zaman alıcıdır. Daha sonra, dizin güncelleme adı verilen işlemi her çalıştırdığınızda program yalnızca yeni ve değiştirilmiş dosyaları dizinleyecek kadar akıllı olur, diğer her şeyi atlar. Pratikte genellikle yalnızca görece küçük sayıda dosya eklenmiş veya değiştirilmiş olur, dolayısıyla dizin güncelleme genellikle kısa sürer.

Dizin Oluşturma

Dizin oluşturma diyaloğu

Yukarıdaki ekran görüntüsü DocFetcher Pro’nun dizin oluşturma diyaloğunu göstermektedir. Bu, yeni bir dizin oluştururken gördüğünüz yapılandırma diyaloğudur. Önemli özellikler:

  1. Özelleştirilebilir düz metin ve zip uzantıları: Programın düz metin dosyalarını ve zip arşivlerini tanıdığı dosya uzantıları özelleştirilebilir. Düz metin dosya uzantılarını özelleştirmek kaynak koduyla uğraşırken yararlıdır.
  2. Dahil etme ve hariç tutma kuralları: Joker karakter veya düzenli ifade eşleştirilmesine dayalı olarak belirli dosyaları dahil etmek veya hariç tutmak için kurallar tanımlayabilirsiniz. Bu tablo DocFetcher’da da vardır, ancak joker karakterler ve dahil etme kuralı yalnızca DocFetcher Pro ve DocFetcher Server’da mevcuttur. Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
  3. Dizinlerin otomatik güncellenmesi: Eğer “Dizini otomatik güncelle” kutusu işaretliyse, program dizinlenmiş klasörü dosya değişiklikleri için izler ve bir değişiklik algılandığında dizini otomatik olarak günceller.
  4. Dizin oluşturma kuyruğu: Birden fazla dizin oluşturma işi sıraya konabilir, her iş ayrı bir sekmede.
  5. Dizin oluşturma ayarlarını kaydetme ve yükleme: Bu “kavanoz” düğmesi dizin oluşturma ayarlarını kaydetmek ve yüklemek için bir menü açar. Çok sayıda dahil etme ve hariç tutma kuralı tanımlamak gerekirse işe yarar. Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Not available in DocFetcher Server

Desteklenen Belge Formatları

  • AbiWord (abw, abw.gz, zabw)
  • EPUB (epub)
  • FictionBook (fb2, fbz, fb2.zip) Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
  • FLAC metadata (flac)
  • HTML (html, xhtml, …)
  • JPEG Exif metadata (jpg, jpeg)
  • MP3 metadata (mp3)
  • Microsoft Compiled HTML Help (chm)
  • Microsoft Office pre-2007 (doc, xls, ppt, …)
  • Microsoft Office 2007 and newer (docx, xlsx, pptx, …)
  • Microsoft Outlook OST (ost) * Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
  • Microsoft Outlook PST (pst) *
  • Microsoft Visio (vsd, vss, vst, vsw)
  • Mobipocket (mobi) — support is currently experimental Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
  • OpenDocument (odt, ods, odg, odp, …)
  • Portable Document Format (pdf)
  • Plain Text (customizable extensions)
  • Rich Text Format (rtf)
  • Scalable Vector Graphics (svg)

Yukarıdaki listede yer almayan herhangi bir dosya formatı için en azından dosya adı dizinlenebilir. Ayrıca, belirli bir dosya uzantısıyla tanımlanabilen herhangi bir dosya formatı düz metin olarak zorla dizinlenebilir, çünkü düz metin dosya uzantıları özelleştirilebilir.

* PST ve OST dosya desteğinin sınırları

E-posta önizlemesi yok: Teknik nedenlerden dolayı DocFetcher, DocFetcher Pro ve DocFetcher Server’dan hiçbiri arama sonuçlarındaki e-postaları Outlook ile açamaz. E-postalar yalnızca programın yalnızca metin önizleme bölmesinde gösterilebilir. E-postaları Outlook’ta açma özelliği DocFetcher Pro’nun gelecekteki ana sürümünde (v2.0 veya sonrası) eklenebilir. Kullanıcının Outlook örneği ve e-postayı içeren PST veya OST dosyası potansiyel olarak farklı bilgisayarlarda bulunduğundan DocFetcher Server’da uygulanamaz.

OST’ye göre PST’yi tercih edin: DocFetcher Pro ve DocFetcher Server OST dosyalarını bir dereceye kadar okuyabilse de, OST dosyalarının aslında Outlook’un çevrimiçi bir hesaptan gelen verilerin yalnızca bir kısmını çevrimdışı kullanım için geçici olarak depoladığı önbellek dosyaları olduğu konusunda uyarılırız. Dolayısıyla OST dosyalarını dizinlerseniz, görmeyi beklediğiniz birçok e-posta ve e-posta ekinin basitçe orada olmadığını görürsünüz. PST dosyaları Outlook’un e-postaların tam, uzun süreli depolaması için kullandığı dosyalardır, dolayısıyla mümkün olduğunda her zaman OST dosyaları dizinlemeye göre PST dosyaları dizinlemeyi tercih edin. PST ve OST dosyaları hakkında daha fazla bilgi ve PST dosyalarına nasıl dışa aktarılacağı talimatları için Microsoft’un bu sayfasını görün.

Büyük PST ve OST dosyaları: Bir PST veya OST dosyasını dizinlemek için uygulama tüm dosyayı RAM’e yüklemek zorundadır. Dolayısıyla mevcut RAM miktarından daha büyük PST veya OST dosyaları dizinlemek (napörnek, 30 GB PST dosyası karşı 16 GB RAM) desteklenmez ve bunu yapmaya çalışmak uygulamayı çökertür. Bu sorunla başa çıkmak için büyük PST veya OST dosyasını dizinlemeden hariç tutabilir veya RAM’inizi yükseltebilirsiniz. RAM yükseltme durumunda, işletim sistemi ve diğer süreçlerin bu RAM’ın bir kısmını kullanması nedeniyle gerekli toplam RAM miktarının PST veya OST dosyasından daha büyük olduğunu not edin.

En iyi çaba ile dizin oluşturma hakkında sorumluluk reddi

Hemen hemen tüm arama yazılımları gibi, DocFetcher, DocFetcher Pro ve DocFetcher Server yukarıda listelenen çeşitli dosya formatlarını en iyi çaba temelinde destekler. Bu, örneğin 10.000 dosyayı dizinlemeye çalışırsanız, yazılımın yalnızca 9.500 dosyayı (%95) başarılı bir şekilde dizinleyebileceği, kalan 500 dosyada başarısız olabileceği anlamına gelir. Elbette gerçek başarı oranı veri setinize bağlıdır.

Ayrıca, belirli bir dosya başarılı bir şekilde dizinlense bile, yazılım özellikle “doc” veya “xls” gibi eski dosya formatlarıyla uğraşırken dosyadaki bazı metinleri çıkarmakta başarısız olabilir. Örneğin, eski Excel dosyalarından bazı hücre yorumlarını veya meta verileri çıkarmakta başarısız olabilir.

Her durumda, DocFetcher Pro ve DocFetcher Server büyük olasılıkla dosyaları dizinlemede eski DocFetcher’dan daha iyi bir iş çıkaracaktır.

Dizin oluşturma sırasında özellikle yüksek bir başarısızlık oranı görürseniz, mutlaka sorunu bildirin, bazı test dosyaları ekleyerek. Ancak, sorunun çözülebileceğine dair hiçbir garanti yoktur.

Supported Archive Formats

  • 7z archives (7z), up to version v0.3 of the 7z format
  • 7z archives (7z), up to version v0.4 of the 7z format (since 7-Zip 9.34, from 2014-11-23) Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
  • Rar archives (rar) — RAR 5.0 format not supported
  • Tar and Tar.* archives:
    • tar, tar.gz, tgz, tar.bz2, tb2, tbz
    • tbz2, tar.lzma, tlz, tar.xz, txz, tar.z, tz Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
  • Zip archives (customizable extensions)

Other Notable Features

Çapraz platform: DocFetcher, DocFetcher Pro ve DocFetcher Server Windows, Linux ve macOS’ta çalıştırılabilir. Ayrıca, DocFetcher Server güncel Chrome, Firefox, Safari veya Edge sürümü yüklü herhangi bir masaüstü bilgisayardan erişilebilir.

Taşınabilir sürüm: Windows, Linux ve macOS için DocFetcher Pro paketlerinin her biri taşınabilir ve taşınabilir olmayan sürümde gelir. Taşınabilir sürüm, taşınabilir DocFetcher Pro’yu, dizinlerini ve dizinlenmiş belgeleri çeşitli şekillerde kullanılmak üzere paketlemenize olanak tanıması açısından yararlıdır:

  • Bu paketi USB sürücüde taşıyabilirsiniz.
  • Bazı yedekleme ortamlarında arşivleyebilirsiniz.
  • Şifrelenmiş bir birimde saklayabilirsiniz.
  • Bulut sürücüsüne koyabilir ve bilgisayarlar arasında senkronize edebilirsiniz.

Satın alınan her kopya tek bir kullanıcıya bağlı olduğundan, DocFetcher Pro ile bu tür taşınabilir paketleri diğer kullanıcılara yeniden dağıtmanın izin verilmediğini lütfen unutmayın. (Paketi alan her kullanıcının kendi kopyasını satın alması gerekir.) Ancak açık kaynaklı DocFetcher ile yeniden dağıtıma izin verilir.

Unicode desteği: DocFetcher, DocFetcher Pro ve DocFetcher Server Microsoft Office, OpenDocument, PDF, HTML, RTF ve düz metin dosyaları dahil olmak üzere tüm ana formatlar için sağlam Unicode desteğiyle gelir.

Ağ sürücülerini dizinleme: DocFetcher, DocFetcher Pro ve DocFetcher Server ağ sürücülerinin yanı sıra bulut sürücüleri de dizinleyebilir. Daha genel olarak, bir veri yapısı işletim sisteminde dosya sistemi gibi görünen bir şey olarak bağlanabiliyorsa, üç program da onu dizinleyebilir.

Sınırsız arşiv iç içe geçme seviyesi: DocFetcher, DocFetcher Pro ve DocFetcher Server sınırsız seviyede arşiv iç içe geçmeyi destekler. Diğer bir deyişle, arşivlerin içindeki arşivlerin içindeki arşivleri okuyabilirler… Örnek:
C:\arşiv1.7z\arşiv2.rar\arşiv3.zip

HTML çiftlerinin algılanması: Dizin oluşturma sırasında DocFetcher, DocFetcher Pro ve DocFetcher Server HTML dosya çiftlerini (örneğin, dosya.html adlı bir dosya ve dosya_files adlı bir klasör) algılar ve her çifti tek bir belge olarak ele alır. Bu özellik ilk başta oldukça işe yaramaz görünebilir, ancak HTML dosyalarıyla uğraşırken arama sonuçlarının kalitesini önemli ölçüde artırdığı ortaya çıktı, çünkü HTML klasörlerinin içindeki tüm “dağınıklık” sonuçlardan kaybolur.