Header Image

यह पृष्ठ DocFetcher Pro और DocFetcher Server की सभी प्रमुख विशेषताओं का एक अवलोकन है, जो उन लोगों के लिए है जो DocFetcher से परिचित नहीं हैं। यदि आप हैं, तो आपको तुलना पृष्ठ और उसके उप-पृष्ठ अधिक सहायक लग सकते हैं।

नीचे दिए गए सभी स्क्रीनशॉट DocFetcher Pro के यूजर इंटरफेस को दिखाते हैं। DocFetcher Server का वेब इंटरफेस समान दिखता है और एक ब्राउज़र विंडो के अंदर नेस्टेड होता है।

यूजर इंटरफेस

मुख्य खिड़की

जैसा कि ऊपर दिए गए स्क्रीनशॉट में दिखाया गया है, DocFetcher Pro की मुख्य विंडो में निम्नलिखित भाग होते हैं:

  1. खोज फ़ील्ड: खोजने के लिए शब्द यहाँ दर्ज करें।
  2. परिणाम पैनल: खोज परिणाम यहाँ प्रदर्शित होते हैं। ये वे फ़ाइलें, फ़ोल्डर या आउटलुक ईमेल हैं जिनमें खोज फ़ील्ड में आपके द्वारा दर्ज किए गए शब्द हैं।
  3. पूर्वावलोकन फलक: परिणाम पैनल में वर्तमान में चयनित फ़ाइल या आउटलुक ईमेल का केवल-पाठ पूर्वावलोकन दिखाता है। पाठ में मिलान हाइलाइट किए गए हैं।
  4. न्यूनतम/अधिकतम फ़ाइल आकार फ़िल्टर: खोज परिणामों को यहाँ न्यूनतम और/या अधिकतम फ़ाइल आकार द्वारा फ़िल्टर किया जा सकता है। Free Available in the free DocFetcher Pro Available in DocFetcher Pro Server Not available in DocFetcher Server
  5. कंटेनर प्रकार पैनल: यहाँ सेट करें कि फ़ोल्डर्स और अभिलेखागार को खोज परिणामों में शामिल किया जाना चाहिए या नहीं। DocFetcher में, फ़ोल्डर्स और अभिलेखागार खोज परिणामों में शामिल नहीं होते हैं, केवल फ़ाइलें और आउटलुक ईमेल। Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
  6. दस्तावेज़ प्रकार पैनल: खोज परिणामों को यहाँ फ़ाइल प्रकार द्वारा फ़िल्टर किया जा सकता है।
  7. उपयोगकर्ता परिभाषित प्रकार पैनल: दस्तावेज़ प्रकार पैनल का एक विकल्प। यहाँ आप खोज परिणामों को फ़िल्टर करने के लिए अपने स्वयं के फ़ाइल प्रकारों को परिभाषित कर सकते हैं। परिभाषाएँ फ़ाइल नामों के विरुद्ध वाइल्डकार्ड पैटर्न या नियमित अभिव्यक्तियों के मिलान पर आधारित हैं। Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Not available in DocFetcher Server
  8. खोज क्षेत्र पैनल: इस पैनल के दो उद्देश्य हैं: खोज परिणामों को स्थान के अनुसार फ़िल्टर करना, और अपनी “अनुक्रमणिका” का प्रबंधन करना, जिनकी व्याख्या नीचे की गई है। अनुक्रमणिका को जोड़ा, अद्यतन और हटाया जा सकता है। प्रत्येक अनुक्रमणिका आपके कंप्यूटर पर किसी खोज योग्य स्थान से मेल खाती है।
  9. विभिन्न नियंत्रण: खोजना बटन के दाईं ओर के तीन नियंत्रण हैं: वर्तमान में दिखाई देने वाले खोज परिणामों की संख्या, उपयोगकर्ता पुस्तिका खोलने के लिए एक बटन, और प्रोग्राम वरीयताएँ खोलने के लिए एक बटन।

शक्तिशाली क्वेरी सिंटैक्स

क्वेरी सिंटैक्स

उपरोक्त स्क्रीनशॉट उन जटिल खोज प्रश्नों का एक उदाहरण दिखाता है जिन्हें आप DocFetcher, DocFetcher Pro और DocFetcher Server में दर्ज कर सकते हैं। उदाहरण क्वेरी का अर्थ है: उन सभी दस्तावेज़ों को खोजें जिनमें (1) वाक्यांश “reproduction or redistribution” है, और (2) शब्द “documentation” और “agreement” अधिकतम तीन शब्दों के अलावा हैं।

क्वेरी सिंटैक्स अंतर्निहित खोज इंजन Apache Lucene द्वारा संचालित है। यहाँ इसकी प्रमुख विशेषताओं का एक त्वरित विवरण दिया गया है:

  • बूलियन ऑपरेटर: (dog OR cat) AND mouse NOT horse
  • वाक्यांश खोज, यानी, एक विशिष्ट क्रम में शब्दों को खोजना: "dog cat mouse"
  • आवश्यक टर्म: +dog +cat
  • वाइल्डकार्ड: प्लेसहोल्डर वर्ण * और ? क्रमशः ‘शून्य या अधिक’ वर्णों और ‘ठीक एक’ वर्ण से मेल खाने के लिए। उदाहरण:
    • luc? lucy, luca, … से मेल खाता है
    • luc* luc, lucy, luck, lucene, … से मेल खाता है
    • *ene* lucene, energy, generator, … से मेल खाता है
  • फज़ी खोज, यानी, किसी दिए गए शब्द के समान शब्दों को खोजना। उदाहरण के लिए, roam~ की खोज करने पर foam और roams जैसे शब्दों वाले दस्तावेज़ सामने आएंगे।
  • निकटता खोज, यानी, उन शब्दों को खोजना जो एक निश्चित संख्या से अधिक शब्दों से अलग नहीं हैं। उदाहरण: "documentation agreement"~3

अनुक्रमणिका-आधारित खोज

अनुक्रमणिका-आधारित खोज: DocFetcher, DocFetcher Pro और DocFetcher Server फ़ाइलों के फ़ाइल नाम और फ़ाइल सामग्री में शब्दों की खोज करते हैं, साथ ही आउटलुक ईमेल के फ़ील्ड और बॉडी में भी। हालाँकि, दक्षता के लिए, खोज तथाकथित अनुक्रमणिका पर चलती है, न कि सीधे फ़ाइलों और ईमेल पर। एक अनुक्रमणिका अनिवार्य रूप से एक शब्दकोश है जहाँ प्रोग्राम किसी दिए गए शब्द के लिए जल्दी से देख सकता है कि कौन सी फ़ाइलें या ईमेल उस शब्द को समाहित करते हैं।

ट्रेड-ऑफ: तेज़ खोज और अनुक्रमणिका निर्माण: अनुक्रमणिका-आधारित खोज एक बढ़िया विचार है क्योंकि यह बिना अनुक्रमणिका के खोज करने की तुलना में परिमाण के क्रम से तेज़ है: DocFetcher, DocFetcher Pro और DocFetcher Server आमतौर पर एक सेकंड से भी कम समय में हजारों मिलान वाली फ़ाइलें ढूंढ सकते हैं। मुख्य नकारात्मक पक्ष यह है कि अनुक्रमणिका को पहले बनाना पड़ता है - एक प्रक्रिया जिसे अनुक्रमणिका निर्माण के रूप में जाना जाता है - और इसमें फ़ाइलों और ईमेल की कुल संख्या और उनके व्यक्तिगत आकारों के आधार पर कुछ समय लग सकता है।

तेज़ अनुक्रमणिका निर्माण और “केवल वही अनुक्रमित करें जिसकी आपको आवश्यकता है” दर्शन: एक अनुक्रमणिका बनाने की आवश्यकता का नकारात्मक पक्ष इस तथ्य से कम हो जाता है कि DocFetcher, DocFetcher Pro और DocFetcher Server में अनुक्रमणिका निर्माण काफी तेज़ है: 200 फ़ाइलें प्रति मिनट एक बहुत ही सामान्य अनुक्रमणिका निर्माण गति है। इसके अलावा, तीनों प्रोग्राम “केवल वही अनुक्रमित करें जिसकी आपको आवश्यकता है” दर्शन का पालन करते हैं: बॉक्स के बाहर, आपके कंप्यूटर पर कुछ भी अनुक्रमित नहीं होता है, और यह पूरी तरह से आप पर निर्भर करता है कि क्या अनुक्रमित किया जाए। यह अन्य खोज सॉफ़्टवेयर के विपरीत है जो बॉक्स के बाहर मूल रूप से सब कुछ अनुक्रमित करने के लिए बहुत समय और कंप्यूटर शक्ति बर्बाद करते हैं, क्योंकि वे आप पर अपने दम पर निर्णय लेने के लिए भरोसा नहीं करते हैं। इस “सब कुछ अनुक्रमित करें” दृष्टिकोण के गोपनीयता निहितार्थों का उल्लेख नहीं करना…

अनुक्रमणिका निर्माण बनाम अनुक्रमणिका अद्यतन: अंतिम लेकिन कम से कम, किसी विशेष फ़ोल्डर को अनुक्रमित करना आमतौर पर केवल पहली बार समय लेने वाला होता है, यदि बिल्कुल भी हो। बाद में, जब भी आप तथाकथित अनुक्रमणिका अद्यतन चलाते हैं, तो प्रोग्राम केवल नई और संशोधित फ़ाइलों को अनुक्रमित करने के लिए पर्याप्त स्मार्ट होगा, बाकी सब कुछ छोड़ देगा। व्यवहार में, आमतौर पर केवल अपेक्षाकृत कम संख्या में फ़ाइलें जोड़ी या संशोधित की गई होंगी, इसलिए एक अनुक्रमणिका अद्यतन में आमतौर पर बहुत कम समय लगता है।

अनुक्रमणिका बनाना

अनुक्रमणिका निर्माण संवाद

उपरोक्त स्क्रीनशॉट DocFetcher Pro के अनुक्रमणिका निर्माण संवाद को दिखाता है। यह कॉन्फ़िगरेशन संवाद है जिसे आप एक नई अनुक्रमणिका बनाते समय देखते हैं। उल्लेखनीय विशेषताएं:

  1. अनुकूलन योग्य सादा पाठ और ज़िप एक्सटेंशन: फ़ाइल एक्सटेंशन जिनके द्वारा प्रोग्राम सादे पाठ फ़ाइलों और ज़िप अभिलेखागार को पहचानता है, को अनुकूलित किया जा सकता है। सादे पाठ फ़ाइल एक्सटेंशन को अनुकूलित करना स्रोत कोड से निपटने के दौरान उपयोगी होता है।
  2. समावेशन और बहिष्करण नियम: आप वाइल्डकार्ड या नियमित अभिव्यक्ति मिलान के आधार पर कुछ फ़ाइलों को शामिल करने या बाहर करने के लिए नियम परिभाषित कर सकते हैं। यह तालिका DocFetcher में भी मौजूद है, लेकिन वाइल्डकार्ड और समावेशन नियम केवल DocFetcher Pro और DocFetcher Server में उपलब्ध हैं। Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
  3. अनुक्रमणिका का स्वचालित अद्यतन: यदि “अनुक्रमणिका को स्वचालित रूप से अपडेट करें” बॉक्स चेक किया गया है, तो प्रोग्राम फ़ाइल परिवर्तनों के लिए अनुक्रमित फ़ोल्डर को देखेगा और परिवर्तन का पता चलने पर अनुक्रमणिका को स्वचालित रूप से अपडेट करेगा।
  4. अनुक्रमणिका निर्माण कतार: कई अनुक्रमणिका निर्माण नौकरियों को कतारबद्ध किया जा सकता है, प्रत्येक नौकरी एक अलग टैब पर।
  5. अनुक्रमणिका निर्माण सेटिंग्स को सहेजना और लोड करना: यह “जार” बटन अनुक्रमणिका निर्माण सेटिंग्स को सहेजने और लोड करने के लिए एक मेनू खोलता है। यह तब काम आता है जब आपको बहुत सारे समावेशन और बहिष्करण नियमों को परिभाषित करने की आवश्यकता होती है। Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Not available in DocFetcher Server

समर्थित दस्तावेज़ प्रारूप

  • AbiWord (abw, abw.gz, zabw)
  • EPUB (epub)
  • FictionBook (fb2, fbz, fb2.zip) Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
  • FLAC मेटाडेटा (flac)
  • HTML (html, xhtml, …)
  • JPEG Exif मेटाडेटा (jpg, jpeg)
  • MP3 मेटाडेटा (mp3)
  • Microsoft Compiled HTML Help (chm)
  • Microsoft Office 2007 से पहले (doc, xls, ppt, …)
  • Microsoft Office 2007 और नया (docx, xlsx, pptx, …)
  • Microsoft Outlook OST (ost) * Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
  • Microsoft Outlook PST (pst) *
  • Microsoft Visio (vsd, vss, vst, vsw)
  • Mobipocket (mobi) — समर्थन वर्तमान में प्रयोगात्मक है Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
  • OpenDocument (odt, ods, odg, odp, …)
  • Portable Document Format (pdf)
  • सादा पाठ (अनुकूलन योग्य एक्सटेंशन)
  • Rich Text Format (rtf)
  • Scalable Vector Graphics (svg)

उपरोक्त सूची में शामिल नहीं किए गए किसी भी फ़ाइल प्रारूप के लिए, कम से कम फ़ाइल नाम को अनुक्रमित किया जा सकता है। इसके अलावा, किसी विशिष्ट फ़ाइल एक्सटेंशन द्वारा पहचाने जाने योग्य किसी भी फ़ाइल प्रारूप को सादे पाठ के रूप में जबरन अनुक्रमित किया जा सकता है, क्योंकि सादे पाठ फ़ाइल एक्सटेंशन अनुकूलन योग्य हैं।

* PST और OST फ़ाइल समर्थन की सीमाएँ

कोई ईमेल पूर्वावलोकन नहीं: तकनीकी कारणों से, न तो DocFetcher, न ही DocFetcher Pro और न ही DocFetcher Server खोज परिणामों में ईमेल को Outlook के साथ खोल सकते हैं। ईमेल केवल प्रोग्राम के केवल-पाठ पूर्वावलोकन फलक में दिखाए जा सकते हैं। Outlook में ईमेल खोलने की क्षमता DocFetcher Pro (v2.0 या बाद के) के भविष्य के प्रमुख रिलीज़ में जोड़ी जा सकती है। इसे DocFetcher Server में लागू नहीं किया जा सकता है क्योंकि उपयोगकर्ता का Outlook इंस्टेंस और ईमेल वाली PST या OST फ़ाइल संभावित रूप से अलग-अलग कंप्यूटरों पर रहती है।

OST के बजाय PST को प्राथमिकता दें: जबकि DocFetcher Pro और DocFetcher Server कुछ हद तक OST फ़ाइलों को पढ़ सकते हैं, सावधान रहें कि OST फ़ाइलें वास्तव में केवल कैश फ़ाइलें हैं जहाँ Outlook अस्थायी रूप से ऑफ़लाइन उपयोग के लिए एक ऑनलाइन खाते से डेटा के कुछ हिस्से को संग्रहीत करता है। इस प्रकार, यदि आप OST फ़ाइलों को अनुक्रमित करते हैं, तो आप पाएंगे कि कई ईमेल और ईमेल अटैचमेंट जिन्हें आप देखने की उम्मीद करेंगे, वे बस वहां नहीं हैं। PST फ़ाइलें वे हैं जिनका उपयोग Outlook ईमेल के पूर्ण, दीर्घकालिक भंडारण के लिए करता है, इसलिए जहाँ भी संभव हो, OST फ़ाइलों को अनुक्रमित करने के बजाय हमेशा PST फ़ाइलों को अनुक्रमित करना पसंद करें। PST और OST फ़ाइलों के बारे में अधिक जानकारी के लिए, और PST फ़ाइलों में निर्यात करने के निर्देशों के लिए, Microsoft का यह पृष्ठ देखें।

बड़ी PST और OST फ़ाइलें: एक PST या OST फ़ाइल को अनुक्रमित करने के लिए, एप्लिकेशन को पूरी फ़ाइल को RAM में लोड करना पड़ता है। इस प्रकार, उपलब्ध RAM की मात्रा से बड़ी PST या OST फ़ाइलों को अनुक्रमित करना (उदाहरण के लिए, 30 GB PST फ़ाइल बनाम 16 GB RAM) समर्थित नहीं है, और ऐसा करने के प्रयास एप्लिकेशन को क्रैश कर देंगे। इस समस्या से निपटने के लिए, आप या तो बड़ी PST या OST फ़ाइल को अनुक्रमणिका निर्माण से बाहर कर सकते हैं, या अपनी RAM को अपग्रेड कर सकते हैं। RAM अपग्रेड के मामले में, ध्यान दें कि आवश्यक RAM की कुल मात्रा PST या OST फ़ाइल से बड़ी है, इस तथ्य के कारण कि ऑपरेटिंग सिस्टम और अन्य प्रक्रियाएं उस RAM का कुछ हिस्सा लेती हैं।

सर्वोत्तम-प्रयास अनुक्रमणिका निर्माण के बारे में अस्वीकरण

लगभग सभी खोज सॉफ्टवेयर की तरह, DocFetcher, DocFetcher Pro और DocFetcher Server ऊपर सूचीबद्ध विभिन्न फ़ाइल स्वरूपों का सर्वोत्तम-प्रयास के आधार पर समर्थन करते हैं। इसका मतलब है, उदाहरण के लिए, यदि आप 10,000 फ़ाइलों को अनुक्रमित करने का प्रयास करते हैं, तो सॉफ़्टवेयर केवल 9,500 फ़ाइलों (यानी, 95%) को सफलतापूर्वक अनुक्रमित कर सकता है, जबकि शेष 500 फ़ाइलों पर विफल हो सकता है। बेशक वास्तविक सफलता दर आपके डेटासेट पर निर्भर करती है।

इसके अलावा, भले ही कोई विशेष फ़ाइल सफलतापूर्वक अनुक्रमित हो, सॉफ़्टवेयर उसमें कुछ पाठ निकालने में विफल हो सकता है, खासकर जब “doc” या “xls” जैसे पुराने फ़ाइल स्वरूपों से निपटते हैं। उदाहरण के लिए, यह प्राचीन Excel फ़ाइलों से कुछ सेल टिप्पणियों या मेटाडेटा को निकालने में विफल हो सकता है।

किसी भी मामले में, DocFetcher Pro और DocFetcher Server पुराने DocFetcher की तुलना में फ़ाइलों को अनुक्रमित करने का बेहतर काम करेंगे।

यदि आप अनुक्रमणिका निर्माण के दौरान विशेष रूप से उच्च विफलता दर देखते हैं, तो हर तरह से समस्या की रिपोर्ट करें, कुछ परीक्षण फ़ाइलों के साथ संलग्न। हालाँकि, इस बात की कोई गारंटी नहीं है कि समस्या का समाधान किया जा सकता है।

समर्थित पुरालेख प्रारूप

  • 7z अभिलेखागार (7z), 7z प्रारूप के संस्करण v0.3 तक
  • 7z अभिलेखागार (7z), 7z प्रारूप के संस्करण v0.4 तक (7-Zip 9.34 से, 2014-11-23 से) Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
  • Rar अभिलेखागार (rar) — RAR 5.0 प्रारूप समर्थित नहीं है
  • Tar और Tar.* अभिलेखागार:
    • tar, tar.gz, tgz, tar.bz2, tb2, tbz
    • tbz2, tar.lzma, tlz, tar.xz, txz, tar.z, tz Free Not available in the free DocFetcher Pro Available in DocFetcher Pro Server Available in DocFetcher Server
  • Zip अभिलेखागार (अनुकूलन योग्य एक्सटेंशन)

अन्य उल्लेखनीय विशेषताएं

क्रॉस-प्लेटफ़ॉर्म: DocFetcher, DocFetcher Pro और DocFetcher Server को Windows, Linux और macOS पर चलाया जा सकता है। इसके अलावा, DocFetcher Server को Chrome, Firefox, Safari या Edge के अप-टू-डेट संस्करण वाले किसी भी डेस्कटॉप कंप्यूटर से एक्सेस किया जा सकता है।

पोर्टेबल संस्करण: Windows, Linux और macOS के लिए DocFetcher Pro पैकेज प्रत्येक एक पोर्टेबल और गैर-पोर्टेबल संस्करण में आते हैं। पोर्टेबल संस्करण इस मायने में उपयोगी है कि यह आपको पोर्टेबल DocFetcher Pro, इसकी अनुक्रमणिका और अनुक्रमित दस्तावेज़ों को बंडल करने की अनुमति देता है, जिसका उपयोग विभिन्न तरीकों से किया जा सकता है:

  • आप इस बंडल को USB ड्राइव पर ले जा सकते हैं।
  • आप इसे किसी बैकअप माध्यम पर संग्रहीत कर सकते हैं।
  • आप इसे एक एन्क्रिप्टेड वॉल्यूम में रख सकते हैं।
  • आप इसे क्लाउड ड्राइव में रख सकते हैं और इसे कंप्यूटरों के बीच सिंक्रनाइज़ कर सकते हैं।

कृपया ध्यान दें कि ऐसे पोर्टेबल बंडलों को अन्य उपयोगकर्ताओं को पुनर्वितरित करने की अनुमति DocFetcher Pro के साथ नहीं है, क्योंकि प्रत्येक खरीदी गई प्रति एक ही उपयोगकर्ता से बंधी होती है। (प्रत्येक प्राप्त करने वाले उपयोगकर्ता को अपनी प्रति खरीदनी होगी।) पुनर्वितरण की अनुमति ओपन-सोर्स DocFetcher के साथ है, हालांकि।

यूनिकोड समर्थन: DocFetcher, DocFetcher Pro और DocFetcher Server Microsoft Office, OpenDocument, PDF, HTML, RTF और सादे पाठ फ़ाइलों सहित सभी प्रमुख प्रारूपों के लिए रॉक-सॉलिड यूनिकोड समर्थन के साथ आते हैं।

नेटवर्क ड्राइव को अनुक्रमित करना: DocFetcher, DocFetcher Pro और DocFetcher Server नेटवर्क ड्राइव के साथ-साथ क्लाउड ड्राइव को भी अनुक्रमित कर सकते हैं। अधिक सामान्यतः, यदि किसी डेटा संरचना को OS में फ़ाइल सिस्टम की तरह दिखने वाली किसी चीज़ के रूप में माउंट किया जा सकता है, तो तीनों प्रोग्राम इसे अनुक्रमित करने में सक्षम हैं।

पुरालेख नेस्टिंग के असीमित स्तर: DocFetcher, DocFetcher Pro और DocFetcher Server पुरालेख नेस्टिंग के असीमित स्तरों का समर्थन करते हैं। दूसरे शब्दों में, वे अभिलेखागार के भीतर अभिलेखागार के भीतर अभिलेखागार पढ़ सकते हैं… उदाहरण:
C:\संग्रह1.7z\संग्रह2.rar\संग्रह3.zip

HTML जोड़े का पता लगाना: अनुक्रमणिका निर्माण के दौरान, DocFetcher, DocFetcher Pro और DocFetcher Server HTML फ़ाइलों के जोड़े (उदाहरण के लिए, foo.html नामक एक फ़ाइल और foo_files नामक एक फ़ोल्डर) का पता लगाते हैं, और प्रत्येक जोड़े को एक एकल दस्तावेज़ के रूप में मानते हैं। यह सुविधा पहली बार में बेकार लग सकती है, लेकिन यह पता चला कि यह खोज परिणामों की गुणवत्ता को नाटकीय रूप से बढ़ाती है जब आप HTML फ़ाइलों से निपट रहे होते हैं, क्योंकि HTML फ़ोल्डरों के अंदर की सभी “अव्यवस्था” परिणामों से गायब हो जाती है।