Header Image

< üst sayfaya geri dön

Desen Tablosunun Yeniden Düzenlenmesi

DocFetcher Pro’nun dizinleme iletişim kutusundaki desen tablosu ve DocFetcher Server’ın dizinleme panelindaki desen tablosu, DocFetcher’daki tablodan şu şekillerde farklıdır:

  • Düzenli ifadelere ek olarak, daha az güçlü ancak çok daha basit olan * ve ? joker karakterlerini kullanarak eşleşme kuralları yazabilirsiniz. * joker karakteri sıfır veya daha fazla karakter için yer tutucu iken, ? joker karakteri tam olarak bir karakter için yer tutucudur.
  • “Hariç Tut” eylemine ek olarak yeni bir “Dahil Et” eylemi.
  • “Mime türünü algıla” eylemi kaldırıldı. Dosya uzantısı olmayan dosyaları metin dosyaları olarak dizinlemek istiyorsanız, desen tablosunun altındaki aynı açıklamaya sahip onay kutusunu kullanın.
  • Eşleşme büyük/küçük harf duyarlı veya duyarsız olabilir. DocFetcher’da ise eşleşme her zaman büyük/küçük harf duyarlıdır.
  • Eşleşme sadece normal dosyalara karşı değil, aynı zamanda klasörlere ve arşiv dosyalarına karşı da gerçekleştirilebilir.
  • Windows’ta kurallar dosya yollarıyla eşleştirildiğinde, yol ayırıcı olarak / karakteri değil \ karakteri kullanılır. Örnek: C:/Yol/İçin/Dosya.docx yerine C:\Yol\İçin\Dosya.docx.

Sonucunda, DocFetcher Pro’daki desen tablosu şöyle görünür:

Desen tablosu

DocFetcher Server’daki desen tablosu aynı görünür, ancak tablonun altındaki “Seçili kalıp aşağıdaki dosya ile eşleşir” test widget’ı şu anda mevcut değildir. Server Not available in DocFetcher Server

DocFetcher, DocFetcher Pro ve DocFetcher Server’daki desen tablosunun ayrıntılı tartışılması için buraya tıklayın.

DocFetcher Pro ve DocFetcher Server’daki desen tablosunun yeniden düzenlenmesi nasıl ortaya çıktı işte. Baştan başlayalım: DocFetcher’in dizinleme iletişim kutusunda, dizinleme sırasında belirli desenlerle eşleşen dosyalar üzerinde belirli eylemler gerçekleştirmek için bir desen tablosu vardır:

DocFetcher'dan desen tablosu

Desenler düzenli ifadeler olmalıdır ve eylemler olarak DocFetcher’da ikisi mevcuttur: Eşleşen dosyayı dizinlemeden dışlama ve “mime-türü algılama”, yani eşleşen dosyanın dosya adına değil içeriğine dayanarak doğru ayrıştırma yöntemini tahmin etmeye çalışma. Şuraya kadar her şey yolunda. Ancak pratikte yukarıdaki uygulamada bir dizi sorun olduğu ortaya çıkar:

  • Çok az insan düzenli ifade yazmayı bilir.
  • Bazen sadece belirli dosyaları dizinlemek ve diğerlerine gereksiz yere dizinleme zamanı harcamamak istersiniz. Örneğin, sadece “txt” dosyalarını dizinlemek ve başka hiçbir şey yapmamak. DocFetcher aslında bunu yapabilir, ancak oldukça gelişmiş düzenli ifade hiçkirlikleri gerektirir.
  • Bazen belirli bir desenle eşleşen tüm dosyaları dizinlemeden dışlamak istersiniz, ancak belirli bir başka desenle eşleşen tüm dosyalar dışında. Örneğin, tüm PDF dosyalarını dizinlemeden dışlamak, ancak adları “rapor_” ile başlayan PDF dosyaları dışında. Yine, DocFetcher’da bu gelişmiş düzenli ifade kullanımı gerektirir.
  • Genel olarak mime-türü algılama oldukça kullanışsızdır çünkü: (1) Dosya uzantısı neredeyse her zaman doğrudur ve bu nedenle çoğu durumda dosya formatını anlamak için gerekli olan tek şeydir. (2) Dosya uzantısı doğru değilse ve mime-türü algılama gerekiyorsa, ikincisi zaten pek güvenilir olmadığı ortaya çıkar. (3) Kimse mime-türü algılamanın gerçekten gerekli olduğu nadir durumlar için eşleşme kuralları yazmaya uğraşmaz ve/veya nasıl yazılacağını bilmez. Ancak, DocFetcher bağlamında mime-türü algılamanın gerçekten önemli bir kullanım alanı olduğu ortaya çıkar: Programın dosya uzantısı olmayan dosyaları düz metin dosyaları olarak görmesini sağlamak, örneğin README adındaki dosyalar. Ancak ancak, bunu başarmak için şu belirsiz düzenli ifadeyi yazmak gerekir: [^.]*
  • Dosya bazı ikili veriler içeriyorsa mime-türü algılama dosyayı düz metin olarak tanımlamakta başarısız olabilir.
  • DocFetcher’in taşınabilir sürümünün desteklenen tüm platformlarda çalışması gerektiği için, kurallar dosya yollarıyla eşleştirildiğinde, ikincisi her zaman yol ayırıcı olarak / karakterini kullanır, Windows’ta bile, bu da çoğu Windows kullanıcısı için oldukça sezgiye aykırıdır.

Uzun lafin kısası, DocFetcher’in desen tablosu tam bir karmaşadır ve DocFetcher Pro ile gelen yeniden yazma, hepsini temizlemek için iyi bir fırsattı:

  • Joker karakterler eklendi ve varsayılan olarak ayarlandı, şimdi sıradan insanlar bile eşleşme kuralları yazabilir.
  • “Dahil Et” eylemi hem sadece belirli bir tür dosyayı dizinlemek istediğiniz durumu hem de eşleşme kurallarına istisnalar tanımlamak istediğiniz durumu kapsar. Hatta istisnaların istisnaları bile artık mümkündür.
  • Genel olarak kullanışsız “Mime türünü algıla” eylemi kaldırıldı ve ana kullanım alanı olan dosya uzantısı olmayan dosyaları metin dosyaları olarak dizinleme, desen tablosunun altındaki basit bir onay kutusuyla kapsandı. Ve bu onay kutusu dosya bazı ikili veriler içerse bile çalışır.
  • Windows yol ayırıcı sorunu düzeltildi.
  • Ve diğer bazı şeyler de (çoğunlukla büyük/küçük harf duyarlılığı ve dosyalar/klasörler/arşivlere karşı eşleşme) iyi ölçü için eklendi.

Dizinleme Ayarlarını Yükleme ve Kaydetme

Not: Bu özellik şu anda sadece DocFetcher Pro’da mevcuttur, DocFetcher Server’da değil. Server Not available in DocFetcher Server

Sorun: DocFetcher’da her yeni dizin oluşturduğunuzda, desen tablosundaki tüm kuralları tek tek girmeniz gerekir. Eğer çok sayıda bu tür kuralınız varsa bu oldukça sıkıcı hale gelir. Bunları yüklemek ve kaydetmek için hiçbir yol yoktur.

DocFetcher'dan desen tablosu, çok giriş

DocFetcher Pro’da yukarıdaki sorun şöyle çözülür: DocFetcher Pro’nun dizinleme iletişim kutusunun sağ üst köşesinde göze çarpmayan küçük bir “belge ile kavanoz” düğmesi bulunur. Bu düğmeye tıklamak dizinleme ayarlarını yükleme ve kaydetme için çeşitli eylemler içeren bir menü açar:

Dizinleme ayarlarını yükleme ve kaydetme menüsü

“Ayarları kaydet” üzerine tıklamak bu iletişim kutusunu açar:

Dizinleme ayarlarını kaydetme iletişim kutusu

Esas olarak, bu iletişim kutusuyla yapabileceğiniz şey, şu anda görünen dizinleme ayarlarını yeni bir adlandırılmış yuvaya kaydetmek, örneğin “Yeni Dizinleme Ayarlarım”, veya şu anda görünen dizinleme ayarlarını yeni varsayılan olarak kaydetmektir.

Bu varsayılan “Özel varsayılan” olarak adlandırılır ve yeni dizinler oluşturulurken otomatik olarak yüklenecektir. Ayrıca DocFetcher Pro’nun kutunun dışında kullandığı varsayılan olan “Fabrika varsayılanı” da vardır. Oluşturduğunuz adlandırılmış ayarlar, yani “Özel varsayılan” ve “Fabrika varsayılanı”, tümü yukarıda gösterilen menü aracılığıyla yüklenebilir.

İşleri tamamlamak için, menü ayrıca tüm dizinleme ayarlarınızı içe ve dışa aktarmanıza izin verir, böylece DocFetcher Pro’yu yeni bir ortamda kurduğunuzda bunları yeniden kullanabilirsiniz.

Diğer Önemli Geliştirmeler

FB2 desteği: DocFetcher Pro ve DocFetcher Server, FB2 e-kitap formatına destek sağlar. Zip sıkıştırılmış FB2 dosyaları, fb2.zip veya fbz dosya uzantısıyla “yerli olarak” desteklenir, yani DocFetcher Pro ve DocFetcher Server her bir dosyayı zip arşivine sarılmış dosya olarak değil tek dosya olarak görür.

Deneysel Mobipocket desteği: DocFetcher Pro ve DocFetcher Server, “mobi” dosya uzantısına sahip Mobipocket e-kitap formatına destek sağlar. Ancak DocFetcher Pro ve DocFetcher Server genel olarak mobi dosyalarından metin çıkarma konusunda oldukça sağlam bir iş çıkarırken, şu anda ya dosyanın sonundaki küçük bir metin bölümünü çıkarmada başarısız oluyor ya da bazı durumlarda tamamen başarısız oluyor. Bu nedenle Mobipocket desteği şimdilik deneysel olarak işaretlenmiştir.

Mevcut v0.4 formatı için 7z arşiv desteği: DocFetcher, 7z arşiv formatının v0.3’üne kadar 7z arşivlerini okuyabilir. DocFetcher Pro ve DocFetcher Server ayrıca mevcut v0.4 formatındaki 7z arşivlerini de okuyabilir. Bu v0.4 formatı, 2014-11-23’te yayınlanan 7-Zip 9.34 ile tanıtıldı.

Genişletilmiş tar arşiv desteği: DocFetcher şu tar arşiv uzantılarını destekler: tar, tar.gz, tgz, tar.bz2, tb2, tbz. DocFetcher Pro ve DocFetcher Server ayrıca şu tar arşiv uzantılarını da destekler: tbz2, tar.lzma, tlz, tar.xz, txz, tar.z, tz

Klasör ve arşiv adlarını dizinleme: DocFetcher’dan farklı olarak, DocFetcher Pro ve DocFetcher Server sadece normal dosyaları değil, aynı zamanda klasörleri ve arşiv dosyalarını da dizinler — daha doğrusu, klasörlerin ve arşiv dosyalarının adlarını. Bu nedenle klasörler ve arşiv dosyaları DocFetcher Pro ve DocFetcher Server’in arama sonuçlarında görünecektir. Ayrıca arama sonuçlarından klasörleri ve/veya arşivleri dışlamak için ana uygulama penceresinin sol tarafında bir Konteyner türleri paneli vardır.

Klasör ve arşiv arama

MacOS: Otomatik dizin güncelleme için daemon: DocFetcher ve DocFetcher Pro otomatik dizin güncellemesi yapabilir, yani dizin güncellemelerini manuel olarak başlatmak yerine, dosya değişiklikleri algılanır algılanmaz program tarafından dizin güncellemeleri başlatılır. Ancak bu işlevsellik sadece iki program gerçekten çalışırken kullanılabilir. Çalışmıyorlarken, boşluğu doldurmak için ayrı bir daemon süreci gereklidir. DocFetcher’da daemon sadece Windows ve Linux’ta mevcut iken, DocFetcher Pro’da macOS’ta da mevcuttur. DocFetcher Server içinse, sunucu sürekli çalışacak şekilde tasarlandığı için daemon gerekmez. Server Not available in DocFetcher Server

Daha akıllı dosya adı dizinleme: DocFetcher Pro ve DocFetcher Server’da dosya adlarının dizinlenmesi DocFetcher’dakinden daha akıllıdır. Örneğin, DocFetcher bunu_bu_dosyayı.pdf adlı bir dosyayla karşılaştığında “bunu_bu_dosyayı” üç ayrı kelime değil tek kelime olarak görür. Bu nedenle DocFetcher bu dosyayı sadece DocFetcher’in arama alanına tam olarak “bunu_bu_dosyayı” yazarsanız bulur. DocFetcher Pro ve DocFetcher Server ise dosyayı “bunu_bu_dosyayı” yazarsanız veya üç kelimenin herhangi birini yazarsanız bulur. Genel olarak konuşmak gerekirse, DocFetcher Pro ve DocFetcher Server’in yaptığı şey alt çizgi gibi karakterleri potansiyel kelime ayırıcıları olarak tanımaktır.

Daha akıllı dosya adı dizinleme

Hata durumunda dosya adı dizinleme: DocFetcher Pro ve DocFetcher Server bir hata nedeniyle veya şifre korunması yüzünden bir dosyanın içeriğini okumakta başarısız olursa, dosya adı yine de dizinlenir. DocFetcher’da ise dosya tamamen atlanır.

Derin iç içe geçmiş klasör yapılarıyla hata yok: C:\klasör1\klasör2\...\klasör99\klasör100 gibi derin iç içe geçmiş klasör yapılarını dizinlemeye çalışırken DocFetcher “Klasör hiyerarşisi çok derin” hatasıyla başarısız olma eğilimindedir. Programcı jargonunda buna “stack overflow” denir. DocFetcher Pro ve DocFetcher Server ise bu tür hatalara karşı tamamen bağışıktır.

Dizinleme hatalarının CSV olarak dışa aktarılması: DocFetcher Pro’da programın dizinleme sırasında okumakta başarısız olduğu dosyalar tablosunu CSV dosyasına dışa aktarabilirsiniz. Bu aşağıdaki ekran görüntüsünde gösterildiği gibi hata tablosunun bağlam menüsü aracılığıyla yapılabilir. Bu özellik şu anda DocFetcher Server’da mevcut değildir. Server Not available in DocFetcher Server

Dizinleme hatalarının CSV olarak dışa aktarılması

Dizini yeniden oluşturmadan klasör izlemeyi açıp kapatma: DocFetcher’in “Dosya değişiklikleri için klasörleri izle” ayarı, klasör izleme olarak da bilinir, açıldığında programın dizinlenmiş klasördeki dosya değişikliklerini algıladığında dizini otomatik olarak güncellemesini sağlayan dizin bazında bir ayardir. Sorun şu ki, belirli bir dizinde bu ayarı açmak veya kapatmak istediğinizde tüm dizini yeniden oluşturmanız gerekir. DocFetcher Pro’da bu ayarı Arama Kapsamı panelinin bağlam menüsü aracılığıyla dizini yeniden oluşturmadan açıp kapatabilirsiniz. Ayrıca ayar “Dizini otomatik güncelle” olarak yeniden adlandırıldı. Benzer işlevsellik DocFetcher Server’da da mevcuttur.

Dizini otomatik güncelle

Eş zamanlı arama ve dizin yeniden oluşturma: DocFetcher’da bir dizini yeniden oluşturmayı seçerseniz, yeniden oluşturma devam ederken o dizin arama için kullanılamaz hale gelir. DocFetcher Pro ve DocFetcher Server’da ise dizin yeniden oluşturma sırasında aranabilir durumda kalır. (Daha doğrusu, gerçek dizin arka planda yeniden oluşturulurken dizinin eski bir kopyası aranabilir durumda kalır.)

Windows: UNC yollarının düzeltilmiş işlenmesi: DocFetcher’da Windows üzerinde UNC yollarının işlenmesi ciddi şekilde bozuktu ve DocFetcher Pro’da sıfırdan yeniden tasarlandı. Yeniden tasarlandıktan sonra DocFetcher Server’a da taşındı.

Modal olmayan dizinleme iletişim kutusu: DocFetcher’in dizinleme iletişim kutusunun aksine, DocFetcher Pro’daki “modal değildir”, yani ana program penceresine bağlı değildir ve açıkken ana program penceresine girişi engellemez. Bunun ana faydası, dizinleme süreçleri çalışırken ana program penceresini simge durumuna küçültebilmeniz ancak dizinleme iletişim kutusunu görünür tutup yana park edebilmenizdir. Bu, diğer uygulamalarda çalışırken dizinleme süreçlerini gözünüzde tutmanıza olanak tanır. Bu özellik DocFetcher Server için uygulanamaz. Server Not available in DocFetcher Server

Modal olmayan dizinleme iletişim kutusu

Dizinleme sonrası ses çalma: Varsayılan olarak DocFetcher Pro dizinleme sonrası “tamamlandı” sesi çalar. Bu tercihlerden kapatılabilir. Bu özellik şu anda DocFetcher Server’da mevcut değildir. Server Not available in DocFetcher Server

Dizinleme sonrası ses çalma

Japon metnini dizinleme: DocFetcher, Çince metni dizinlerken kullanılabilir arama sonuçları elde etmek için “kelime segmentasyonu” adında bir seçeneğe sahiptir. DocFetcher Pro, Japonca metni işlemek için ek bir kelime segmentasyonu seçeneğine sahiptir. Hem Çince hem de Japonca kelime segmentasyonu şu anda DocFetcher Server’da mevcut değildir. Server Not available in DocFetcher Server