यह पृष्ठ DocFetcher Pro और DocFetcher Server की सभी प्रमुख विशेषताओं का एक विवरण है, जो उन लोगों के लिए है जो DocFetcher से परिचित नहीं हैं। यदि आप परिचित हैं, तो आपको तुलना पृष्ठ और उसके उप-पृष्ठ अधिक सहायक लग सकते हैं।
नीचे दिए गए सभी स्क्रीनशॉट DocFetcher Pro के उपयोगकर्ता इंटरफ़ेस को दिखाते हैं। DocFetcher Server का वेब इंटरफ़ेस समान दिखता है और एक ब्राउज़र विंडो के अंदर आता है।
उपयोगकर्ता इंटरफ़ेस
जैसा कि ऊपर दिए गए स्क्रीनशॉट में दिखाया गया है, DocFetcher Pro की मुख्य विंडो में निम्नलिखित भाग होते हैं:
- खोज फ़ील्ड: खोजने के लिए शब्द यहाँ दर्ज करें।
- परिणाम पैनल: खोज परिणाम यहाँ प्रदर्शित होते हैं। ये वे फ़ाइलें, फ़ोल्डर या आउटलुक ईमेल हैं जिनमें खोज फ़ील्ड में आपके द्वारा दर्ज किए गए शब्द हैं।
- पूर्वावलोकन फलक: परिणाम पैनल में वर्तमान में चयनित फ़ाइल या आउटलुक ईमेल का केवल-पाठ पूर्वावलोकन दिखाता है। पाठ में मिलान हाइलाइट किए गए हैं।
- न्यूनतम/अधिकतम फ़ाइल आकार फ़िल्टर: खोज परिणामों को यहाँ न्यूनतम और/या अधिकतम फ़ाइल आकार द्वारा फ़िल्टर किया जा सकता है। निःशुल्क निःशुल्क DocFetcher में उपलब्ध Pro DocFetcher Pro में उपलब्ध Server DocFetcher Server में उपलब्ध नहीं
- कंटेनर प्रकार पैनल: यहाँ सेट करें कि फ़ोल्डर्स और अभिलेखागार को खोज परिणामों में शामिल किया जाना चाहिए या नहीं। DocFetcher में, फ़ोल्डर्स और अभिलेखागार खोज परिणामों में शामिल नहीं होते हैं, केवल फ़ाइलें और आउटलुक ईमेल। निःशुल्क निःशुल्क DocFetcher में उपलब्ध नहीं Pro DocFetcher Pro में उपलब्ध Server DocFetcher Server में उपलब्ध
- दस्तावेज़ प्रकार पैनल: खोज परिणामों को यहाँ फ़ाइल प्रकार द्वारा फ़िल्टर किया जा सकता है।
- उपयोगकर्ता परिभाषित प्रकार पैनल: दस्तावेज़ प्रकार पैनल का एक विकल्प। यहाँ आप खोज परिणामों को फ़िल्टर करने के लिए अपने स्वयं के फ़ाइल प्रकारों को परिभाषित कर सकते हैं। परिभाषाएँ फ़ाइल नामों के विरुद्ध वाइल्डकार्ड पैटर्न या नियमित अभिव्यक्तियों के मिलान पर आधारित हैं। निःशुल्क निःशुल्क DocFetcher में उपलब्ध नहीं Pro DocFetcher Pro में उपलब्ध Server DocFetcher Server में उपलब्ध नहीं
- खोज क्षेत्र पैनल: इस पैनल के दो उद्देश्य हैं: खोज परिणामों को स्थान के अनुसार फ़िल्टर करना, और अपनी "अनुक्रमणिका" का प्रबंधन करना, जिनकी व्याख्या नीचे की गई है। अनुक्रमणिका को जोड़ा, अद्यतन और हटाया जा सकता है। प्रत्येक अनुक्रमणिका आपके कंप्यूटर पर किसी खोज योग्य स्थान से मेल खाती है।
- विभिन्न नियंत्रण: खोजना बटन के दाईं ओर के तीन नियंत्रण हैं: वर्तमान में दिखाई देने वाले खोज परिणामों की संख्या, उपयोगकर्ता पुस्तिका खोलने के लिए एक बटन, और प्रोग्राम वरीयताएँ खोलने के लिए एक बटन।
शक्तिशाली क्वेरी सिंटैक्स
उपरोक्त स्क्रीनशॉट उन जटिल खोज प्रश्नों का एक उदाहरण दिखाता है जिन्हें आप DocFetcher, DocFetcher Pro और DocFetcher Server में दर्ज कर सकते हैं। उदाहरण क्वेरी का अर्थ है: उन सभी दस्तावेज़ों को खोजें जिनमें (1) वाक्यांश "reproduction or distribution" है, और (2) शब्द "documentation" और "agreement" अधिकतम तीन शब्दों के बीच में हैं।
क्वेरी सिंटैक्स अंतर्निहित खोज इंजन Apache Lucene द्वारा संचालित है। यहाँ इसकी प्रमुख विशेषताओं का एक त्वरित विवरण दिया गया है:
- बूलियन ऑपरेटर: (कुत्ता OR बिल्ली) AND चूहा NOT घोड़ा
- वाक्यांश खोज, यानी, एक विशिष्ट क्रम में शब्दों को खोजना: "कुत्ता बिल्ली चूहा"
- आवश्यक पद: +कुत्ता +बिल्ली
- वाइल्डकार्ड: प्लेसहोल्डर वर्ण * और ? क्रमशः 'शून्य या अधिक' वर्णों और 'ठीक एक' वर्ण से मेल खाने के लिए। उदाहरण:
- luc? lucy, luca, ... से मेल खाता है
- luc* luc, lucy, luck, lucene, ... से मेल खाता है
- *ene* lucene, energy, generator, ... से मेल खाता है
- फज़ी खोज, यानी, किसी दिए गए शब्द के समान शब्दों को खोजना। उदाहरण के लिए, roam~ की खोज करने पर foam और roams जैसे शब्दों वाले दस्तावेज़ सामने आएंगे।
- निकटता खोज, यानी, उन शब्दों को खोजना जो एक निश्चित संख्या से अधिक शब्दों से अलग नहीं हैं। उदाहरण: "documentation agreement"~3
अनुक्रमणिका-आधारित खोज
अनुक्रमणिका-आधारित खोज: DocFetcher, DocFetcher Pro और DocFetcher Server फ़ाइलों के फ़ाइल नाम और फ़ाइल सामग्री में शब्दों की खोज करते हैं, साथ ही आउटलुक ईमेल के फ़ील्ड और बॉडी में भी। हालाँकि, दक्षता के लिए, खोज तथाकथित अनुक्रमणिका पर चलती है, न कि सीधे फ़ाइलों और ईमेल पर। एक अनुक्रमणिका अनिवार्य रूप से एक शब्दकोश है जहाँ प्रोग्राम किसी दिए गए शब्द के लिए जल्दी से देख सकता है कि कौन सी फ़ाइलें या ईमेल उस शब्द को समाहित करते हैं।
ट्रेड-ऑफ: तेज़ खोज और अनुक्रमणिका निर्माण: अनुक्रमणिका-आधारित खोज एक बढ़िया विचार है क्योंकि यह बिना अनुक्रमणिका के खोज करने की तुलना में परिमाण के क्रम से तेज़ है: DocFetcher, DocFetcher Pro और DocFetcher Server आमतौर पर एक सेकंड से भी कम समय में हजारों मिलान वाली फ़ाइलें ढूंढ सकते हैं। मुख्य नकारात्मक पक्ष यह है कि अनुक्रमणिका को पहले बनाना पड़ता है - एक प्रक्रिया जिसे अनुक्रमणिका निर्माण के रूप में जाना जाता है - और इसमें फ़ाइलों और ईमेल की कुल संख्या और उनके व्यक्तिगत आकारों के आधार पर कुछ समय लग सकता है।
तेज़ अनुक्रमणिका निर्माण और "केवल वही अनुक्रमित करें जिसकी आपको आवश्यकता है" दर्शन: एक अनुक्रमणिका बनाने की आवश्यकता का नकारात्मक पक्ष इस तथ्य से कम हो जाता है कि DocFetcher, DocFetcher Pro और DocFetcher Server में अनुक्रमणिका निर्माण काफी तेज़ है: 200 फ़ाइलें प्रति मिनट एक बहुत ही सामान्य अनुक्रमणिका निर्माण गति है। इसके अलावा, तीनों प्रोग्राम "केवल वही अनुक्रमित करें जिसकी आपको आवश्यकता है" दर्शन का पालन करते हैं: बॉक्स के बाहर, आपके कंप्यूटर पर कुछ भी अनुक्रमित नहीं होता है, और यह पूरी तरह से आप पर निर्भर करता है कि क्या अनुक्रमित किया जाए। यह अन्य खोज सॉफ़्टवेयर के विपरीत है जो बॉक्स के बाहर मूल रूप से सब कुछ अनुक्रमित करने के लिए बहुत समय और कंप्यूटर शक्ति बर्बाद करते हैं, क्योंकि वे आप पर अपने दम पर निर्णय लेने के लिए भरोसा नहीं करते हैं। इस "सब कुछ अनुक्रमित करें" दृष्टिकोण के गोपनीयता निहितार्थों का उल्लेख नहीं करना...
अनुक्रमणिका निर्माण बनाम अनुक्रमणिका अद्यतन: अंत में, किसी विशेष फ़ोल्डर को अनुक्रमित करना आमतौर पर केवल पहली बार समय लेने वाला होता है, यदि बिल्कुल भी हो। बाद में, जब भी आप तथाकथित अनुक्रमणिका अद्यतन चलाते हैं, तो प्रोग्राम केवल नई और संशोधित फ़ाइलों को अनुक्रमित करने के लिए पर्याप्त स्मार्ट होगा, बाकी सब कुछ छोड़ देगा। व्यवहार में, आमतौर पर केवल अपेक्षाकृत कम संख्या में फ़ाइलें जोड़ी या संशोधित की गई होंगी, इसलिए एक अनुक्रमणिका अद्यतन में आमतौर पर बहुत कम समय लगता है।
अनुक्रमणिका बनाना
उपरोक्त स्क्रीनशॉट DocFetcher Pro के अनुक्रमणिका निर्माण संवाद को दिखाता है। यह कॉन्फ़िगरेशन संवाद है जिसे आप एक नई अनुक्रमणिका बनाते समय देखते हैं। उल्लेखनीय विशेषताएं:
- अनुकूलन योग्य सादा पाठ और ज़िप एक्सटेंशन: फ़ाइल एक्सटेंशन जिनके द्वारा प्रोग्राम सादे पाठ फ़ाइलों और ज़िप अभिलेखागार को पहचानता है, को अनुकूलित किया जा सकता है। सादे पाठ फ़ाइल एक्सटेंशन को अनुकूलित करना स्रोत कोड से निपटने के दौरान उपयोगी होता है।
- समावेशन और बहिष्करण नियम: आप वाइल्डकार्ड या नियमित अभिव्यक्ति मिलान के आधार पर कुछ फ़ाइलों को शामिल करने या बाहर करने के लिए नियम परिभाषित कर सकते हैं। यह तालिका DocFetcher में भी मौजूद है, लेकिन वाइल्डकार्ड और समावेशन नियम केवल DocFetcher Pro और DocFetcher Server में उपलब्ध हैं। निःशुल्क निःशुल्क DocFetcher में उपलब्ध नहीं Pro DocFetcher Pro में उपलब्ध Server DocFetcher Server में उपलब्ध
- अनुक्रमणिका का स्वचालित अद्यतन: यदि "अनुक्रमणिका को स्वचालित रूप से अपडेट करें" बॉक्स चेक किया गया है, तो प्रोग्राम फ़ाइल परिवर्तनों के लिए अनुक्रमित फ़ोल्डर को देखेगा और परिवर्तन का पता चलने पर अनुक्रमणिका को स्वचालित रूप से अपडेट करेगा।
- अनुक्रमणिका निर्माण कतार: कई अनुक्रमणिका निर्माण नौकरियों को कतारबद्ध किया जा सकता है, प्रत्येक नौकरी एक अलग टैब पर।
- अनुक्रमणिका निर्माण सेटिंग्स को सहेजना और लोड करना: यह "मर्तबान" बटन अनुक्रमणिका निर्माण सेटिंग्स को सहेजने और लोड करने के लिए एक मेनू खोलता है। यह तब काम आता है जब आपको बहुत सारे समावेशन और बहिष्करण नियमों को परिभाषित करने की आवश्यकता होती है। निःशुल्क निःशुल्क DocFetcher में उपलब्ध नहीं Pro DocFetcher Pro में उपलब्ध Server DocFetcher Server में उपलब्ध नहीं
समर्थित दस्तावेज़ प्रारूप
- AbiWord (abw, abw.gz, zabw)
- EPUB (epub)
- FictionBook (fb2, fbz, fb2.zip) निःशुल्क निःशुल्क DocFetcher में उपलब्ध नहीं Pro DocFetcher Pro में उपलब्ध Server DocFetcher Server में उपलब्ध
- FLAC मेटाडेटा (flac)
- HTML (html, xhtml, ...)
- JPEG Exif मेटाडेटा (jpg, jpeg)
- MP3 मेटाडेटा (mp3)
- Microsoft Compiled HTML Help (chm)
- Microsoft Office 2007 से पहले (doc, xls, ppt, ...)
- Microsoft Office 2007 और नया (docx, xlsx, pptx, ...)
- Microsoft Outlook OST (ost) * निःशुल्क निःशुल्क DocFetcher में उपलब्ध नहीं Pro DocFetcher Pro में उपलब्ध Server DocFetcher Server में उपलब्ध
- Microsoft Outlook PST (pst) *
- Microsoft Visio (vsd, vss, vst, vsw)
- Mobipocket (mobi) --- समर्थन वर्तमान में प्रयोगात्मक है निःशुल्क निःशुल्क DocFetcher में उपलब्ध नहीं Pro DocFetcher Pro में उपलब्ध Server DocFetcher Server में उपलब्ध
- OpenDocument (odt, ods, odg, odp, ...)
- Portable Document Format (pdf)
- सादा पाठ (अनुकूलन योग्य एक्सटेंशन)
- Rich Text Format (rtf)
- Scalable Vector Graphics (svg)
उपरोक्त सूची में शामिल नहीं किए गए किसी भी फ़ाइल प्रारूप के लिए, कम से कम फ़ाइल नाम को अनुक्रमित किया जा सकता है। इसके अलावा, किसी विशिष्ट फ़ाइल एक्सटेंशन द्वारा पहचाने जाने योग्य किसी भी फ़ाइल प्रारूप को सादे पाठ के रूप में जबरन अनुक्रमित किया जा सकता है, क्योंकि सादे पाठ फ़ाइल एक्सटेंशन अनुकूलन योग्य हैं।
* PST और OST फ़ाइल समर्थन की सीमाएँ
कोई ईमेल पूर्वावलोकन नहीं: तकनीकी कारणों से, न तो DocFetcher, न ही DocFetcher Pro और न ही DocFetcher Server खोज परिणामों में ईमेल को Outlook के साथ खोल सकते हैं। ईमेल केवल प्रोग्राम के केवल-पाठ पूर्वावलोकन फलक में दिखाए जा सकते हैं। Outlook में ईमेल खोलने की क्षमता DocFetcher Pro (v2.0 या बाद के) के भविष्य के प्रमुख रिलीज़ में जोड़ी जा सकती है। इसे DocFetcher Server में लागू नहीं किया जा सकता है क्योंकि उपयोगकर्ता का Outlook इंस्टेंस और ईमेल वाली PST या OST फ़ाइल संभावित रूप से अलग-अलग कंप्यूटरों पर रहती है।
OST के बजाय PST को प्राथमिकता दें: जबकि DocFetcher Pro और DocFetcher Server कुछ हद तक OST फ़ाइलों को पढ़ सकते हैं, सावधान रहें कि OST फ़ाइलें वास्तव में केवल कैश फ़ाइलें हैं जहाँ Outlook अस्थायी रूप से ऑफ़लाइन उपयोग के लिए एक ऑनलाइन खाते से डेटा के कुछ हिस्से को संग्रहीत करता है। इस प्रकार, यदि आप OST फ़ाइलों को अनुक्रमित करते हैं, तो आप पाएंगे कि कई ईमेल और ईमेल अटैचमेंट जिन्हें आप देखने की उम्मीद करेंगे, वे बस वहां नहीं हैं। PST फ़ाइलें वे हैं जिनका उपयोग Outlook ईमेल के पूर्ण, दीर्घकालिक भंडारण के लिए करता है, इसलिए जहाँ भी संभव हो, OST फ़ाइलों को अनुक्रमित करने के बजाय हमेशा PST फ़ाइलों को अनुक्रमित करना पसंद करें। PST और OST फ़ाइलों के बारे में अधिक जानकारी के लिए, और PST फ़ाइलों में निर्यात करने के निर्देशों के लिए, Microsoft का यह पृष्ठ देखें।
बड़ी PST और OST फ़ाइलें: एक PST या OST फ़ाइल को अनुक्रमित करने के लिए, एप्लिकेशन को पूरी फ़ाइल को RAM में लोड करना पड़ता है। इस प्रकार, उपलब्ध RAM की मात्रा से बड़ी PST या OST फ़ाइलों को अनुक्रमित करना (उदाहरण के लिए, 30 GB PST फ़ाइल बनाम 16 GB RAM) समर्थित नहीं है, और ऐसा करने के प्रयास एप्लिकेशन को क्रैश कर देंगे। इस समस्या से निपटने के लिए, आप या तो बड़ी PST या OST फ़ाइल को अनुक्रमणिका निर्माण से बाहर कर सकते हैं, या अपनी RAM को अपग्रेड कर सकते हैं। RAM अपग्रेड के मामले में, ध्यान दें कि आवश्यक RAM की कुल मात्रा PST या OST फ़ाइल से बड़ी है, इस तथ्य के कारण कि ऑपरेटिंग सिस्टम और अन्य प्रक्रियाएं उस RAM का कुछ हिस्सा लेती हैं।
सर्वोत्तम-प्रयास अनुक्रमणिका निर्माण के बारे में अस्वीकरण
लगभग सभी खोज सॉफ्टवेयर की तरह, DocFetcher, DocFetcher Pro और DocFetcher Server ऊपर सूचीबद्ध विभिन्न फ़ाइल स्वरूपों का सर्वोत्तम-प्रयास के आधार पर समर्थन करते हैं। इसका मतलब है, उदाहरण के लिए, यदि आप 10,000 फ़ाइलों को अनुक्रमित करने का प्रयास करते हैं, तो सॉफ़्टवेयर केवल 9,500 फ़ाइलों (यानी, 95%) को सफलतापूर्वक अनुक्रमित कर सकता है, जबकि शेष 500 फ़ाइलों पर विफल हो सकता है। बेशक वास्तविक सफलता दर आपके डेटासेट पर निर्भर करती है।
इसके अलावा, भले ही कोई विशेष फ़ाइल सफलतापूर्वक अनुक्रमित हो, सॉफ़्टवेयर उसमें कुछ पाठ निकालने में विफल हो सकता है, खासकर जब "doc" या "xls" जैसे पुराने फ़ाइल स्वरूपों से निपटते हैं। उदाहरण के लिए, यह प्राचीन Excel फ़ाइलों से कुछ सेल टिप्पणियों या मेटाडेटा को निकालने में विफल हो सकता है।
किसी भी मामले में, DocFetcher Pro और DocFetcher Server पुराने DocFetcher की तुलना में फ़ाइलों को अनुक्रमित करने का बेहतर काम करेंगे।
यदि आप अनुक्रमणिका निर्माण के दौरान विशेष रूप से उच्च विफलता दर देखते हैं, तो हर तरह से समस्या की रिपोर्ट करें, कुछ परीक्षण फ़ाइलों के साथ संलग्न। हालाँकि, इस बात की कोई गारंटी नहीं है कि समस्या का समाधान किया जा सकता है।
समर्थित पुरालेख प्रारूप
- 7z अभिलेखागार (7z), 7z प्रारूप के संस्करण v0.3 तक
- 7z अभिलेखागार (7z), 7z प्रारूप के संस्करण v0.4 तक (7-Zip 9.34 से, 2014-11-23 से) निःशुल्क निःशुल्क DocFetcher में उपलब्ध नहीं Pro DocFetcher Pro में उपलब्ध Server DocFetcher Server में उपलब्ध
- Rar अभिलेखागार (rar) --- RAR 5.0 प्रारूप समर्थित नहीं है
- Tar और Tar.* अभिलेखागार:
- tar, tar.gz, tgz, tar.bz2, tb2, tbz
- tbz2, tar.lzma, tlz, tar.xz, txz, tar.z, tz निःशुल्क निःशुल्क DocFetcher में उपलब्ध नहीं Pro DocFetcher Pro में उपलब्ध Server DocFetcher Server में उपलब्ध
- Zip अभिलेखागार (अनुकूलन योग्य एक्सटेंशन)
अन्य उल्लेखनीय विशेषताएं
क्रॉस-प्लेटफ़ॉर्म: DocFetcher, DocFetcher Pro और DocFetcher Server को Windows, Linux और macOS पर चलाया जा सकता है। इसके अलावा, DocFetcher Server को Chrome, Firefox, Safari या Edge के अप-टू-डेट संस्करण वाले किसी भी डेस्कटॉप कंप्यूटर से एक्सेस किया जा सकता है।
पोर्टेबल संस्करण: Windows, Linux और macOS के लिए DocFetcher Pro पैकेज प्रत्येक एक पोर्टेबल और गैर-पोर्टेबल संस्करण में आते हैं। पोर्टेबल संस्करण इस मायने में उपयोगी है कि यह आपको पोर्टेबल DocFetcher Pro, इसकी अनुक्रमणिका और अनुक्रमित दस्तावेज़ों को बंडल करने की अनुमति देता है, जिसका उपयोग विभिन्न तरीकों से किया जा सकता है:
- आप इस बंडल को USB ड्राइव पर ले जा सकते हैं।
- आप इसे किसी बैकअप माध्यम पर संग्रहीत कर सकते हैं।
- आप इसे एक एन्क्रिप्टेड वॉल्यूम में रख सकते हैं।
- आप इसे क्लाउड ड्राइव में रख सकते हैं और इसे कंप्यूटरों के बीच सिंक्रनाइज़ कर सकते हैं।
कृपया ध्यान दें कि ऐसे पोर्टेबल बंडलों को अन्य उपयोगकर्ताओं को पुनर्वितरित करने की अनुमति DocFetcher Pro के साथ नहीं है, क्योंकि प्रत्येक खरीदी गई प्रति एक ही उपयोगकर्ता से बंधी होती है। (प्रत्येक प्राप्त करने वाले उपयोगकर्ता को अपनी प्रति खरीदनी होगी।) पुनर्वितरण की अनुमति ओपन-सोर्स DocFetcher के साथ है, हालांकि।
यूनिकोड समर्थन: DocFetcher, DocFetcher Pro और DocFetcher Server Microsoft Office, OpenDocument, PDF, HTML, RTF और सादे पाठ फ़ाइलों सहित सभी प्रमुख प्रारूपों के लिए रॉक-सॉलिड यूनिकोड समर्थन के साथ आते हैं।
नेटवर्क ड्राइव को अनुक्रमित करना: DocFetcher, DocFetcher Pro और DocFetcher Server नेटवर्क ड्राइव के साथ-साथ क्लाउड ड्राइव को भी अनुक्रमित कर सकते हैं। अधिक सामान्यतः, यदि किसी डेटा संरचना को OS में फ़ाइल सिस्टम की तरह दिखने वाली किसी चीज़ के रूप में माउंट किया जा सकता है, तो तीनों प्रोग्राम इसे अनुक्रमित करने में सक्षम हैं।
HTML जोड़े का पता लगाना: अनुक्रमणिका निर्माण के दौरान, DocFetcher, DocFetcher Pro और DocFetcher Server HTML फ़ाइलों के जोड़े (उदाहरण के लिए, नमूना.html नामक एक फ़ाइल और नमूना_files नामक एक फ़ोल्डर) का पता लगाते हैं, और प्रत्येक जोड़े को एक एकल दस्तावेज़ के रूप में मानते हैं। यह सुविधा पहली बार में बेकार लग सकती है, लेकिन यह पता चला कि यह खोज परिणामों की गुणवत्ता को नाटकीय रूप से बढ़ाती है जब आप HTML फ़ाइलों से निपट रहे होते हैं, क्योंकि HTML फ़ोल्डरों के अंदर की सभी "अव्यवस्था" परिणामों से गायब हो जाती है।