Header Image

< powrót do strony nadrzędnej

Ta funkcja jest obecnie dostępna tylko w DocFetcher Pro, nie w DocFetcher Server. Server Not available in DocFetcher Server

Problem

W DocFetcher, po lewej stronie znajduje się panel Typy dokumentów:

Panel Typy dokumentów

Jest to lista pól wyboru dla rodzajów plików, według których można filtrować wyniki wyszukiwania, np. „wyklucz wszystkie pliki PDF” lub „uwzględnij pliki HTML”. Jak wskazywano w różnych prośbach o funkcje na przestrzeni lat, pewne rodzaje operacji filtrowania nie są możliwe w DocFetcher ze względu na statyczną naturę listy pól wyboru:

  • Filtrowanie według typów nie zdefiniowanych wcześniej na liście, np. „ukryj wszystkie pliki exe” lub „pokaż tylko pliki exe”.
  • Podział istniejącego typu na podtypy i filtrowanie według tych ostatnich. Na przykład programiści mogą chcieć podzielić typ „Tekst zwykły” na „java”, „cpp”, „py”, „php”, „js”, itp., aby móc filtrować według tych podtypów osobno.
  • Grupowanie dwóch lub więcej istniejących typów w większy nadtyp i filtrowanie według tego ostatniego, np. łączenie „doc”, „docx”, „odt”, „rtf” i „txt” w jeden typ „Dokumenty”.

Rozwiązanie

W DocFetcher Pro, powyższe przypadki użycia i więcej są objęte przez nową koncepcję zwaną Typy niestandardowe. Podstawowa idea jest następująca. Poniżej panelu Typy dokumentów znajduje się teraz kolejny panel - panel Typy niestandardowe:

Panel Typy niestandardowe

Panel Typy niestandardowe działa tak samo jak panel Typy dokumentów, z tą różnicą, że pozwala definiować własne typy plików na podstawie dopasowywania wzorców do nazw plików. Na przykład, aby zdefiniować nowy typ „Dokumenty”, w zasadzie wystarczy wprowadzić etykietę typu „Dokumenty” i wzorce nazw plików, aby wykryć pliki, które powinny być uwzględnione w nowym typie „Dokumenty”:

Okno dialogowe Dodaj typ niestandardowy

Okno dialogowe pokazane powyżej otwiera się po kliknięciu prawym przyciskiem myszy w panelu Typy niestandardowe i wybraniu „Dodaj typ”.

Dalsze wyjaśnienie

Znaki wieloznaczne vs. wyrażenia regularne: Wzorce nazw plików mogą być albo znakami wieloznaczymi, albo wyrażeniami regularnymi. Te ostatnie są bardzo potężne, ale także stosunkowo trudne do zrozumienia. Dla porównania, znaki wieloznaczne są ograniczone, ale także stosunkowo łatwe do zrozumienia: istnieją tylko dwa znaki wieloznaczne * i ?, które są zasadniczo symbolami zastępczymi odpowiednio dla «zero lub więcej znaków» i «dokładnie jeden znak».

Specjalny typ „Inne”: Gdy uruchamiasz DocFetcher Pro po raz pierwszy, nie ma żadnych typów w panelu Typy niestandardowe z wyjątkiem typu „Inne”. Ten specjalny typ nie może być usunięty i działa jako wpis zbiorczy dla plików nie pasujących do żadnych innych typów niestandardowych.

Arbitralne wzorce nazw plików: Mogłeś zauważyć, że panel Typy niestandardowe dopasowuje wzorce nie tylko do rozszerzeń plików, ale do całych nazw plików. Daje to panelowi Typy niestandardowe moc znacznie wykraczającą poza trzy przypadki użycia opisane powyżej: Możesz definiować typy niestandardowe na podstawie dowolnego wzorca nazwy pliku. Na przykład, jeśli masz pliki o nazwach
- raport_2020_01.docx
- raport_2020_02.docx
- raport_2019_all.docx
- itp.
rozrzucone po różnych folderach, możesz użyć wzorca znaku wieloznacznego raport_*.docx, aby połączyć je wszystkie w jeden typ niestandardowy o nazwie „Raporty”.

Panel Typy dokumentów jako punkt wyjścia: Możesz się zastanawiać, dlaczego DocFetcher Pro nadal ma panel Typy dokumentów, skoro ma wyraźnie potężniejszy panel Typy niestandardowe. Odpowiedź jest taka, że panel Typy dokumentów zapewnia punkt wyjścia dla nowych użytkowników, pozwalając im od razu filtrować według typów bez konieczności wcześniejszego bawienia się typami niestandardowymi.

Interakcja między panelem Typy dokumentów i Typy niestandardowe: Kolejne pytanie, które mogło pojawić się w twojej głowie, to jak panel Typy dokumentów i Typy niestandardowe współdziałają ze sobą, tj. co się dzieje, gdy zaznaczysz i odznaczysz pola w obu panelach? Odpowiedź jest taka, że wszystkie kontrolki filtrów po lewej stronie w DocFetcher i DocFetcher Pro tworzą łańcuch filtrów, gdzie Typy dokumentów to jeden etap łańcucha, a Typy niestandardowe to kolejny. Każdy dokument w początkowych, „wewnętrznych” wynikach wyszukiwania musi przejść przez cały łańcuch filtrów i jest uwzględniony w końcowych, widocznych wynikach wyszukiwania tylko wtedy, gdy „przetrwa” wszystkie etapy łańcucha filtrów. Jest to równoważne logicznemu połączeniu „AND” wszystkich etapów filtrów.

Import i eksport: Funkcja Typy niestandardowe zawiera funkcjonalność importu i eksportu, dzięki czemu nie musisz żmudnie ponownie definiować wszystkich swoich istniejących typów niestandardowych podczas instalacji DocFetcher Pro w nowym środowisku.

Import/eksport typów niestandardowych