Header Image

< takaisin vanhempaan sivuun

Mallitaulukon uudistus

DocFetcher Pron hakemistointidialogin mallitaulukko ja DocFetcher Serverin hakemistointiruudun mallitaulukko eroavat DocFetcherin mallitaulukosta seuraavilla tavoilla:

  • Säännöllisten lausekkeiden lisäksi voit käyttää vähemmän tehokkaita, mutta myös paljon yksinkertaisempia jokerimerkkejä * ja ? kirjoittaaksesi vastaavuussääntöjä. Jokerimerkki * on paikanpitäjä nollalle tai useammalle merkille, kun taas jokerimerkki ? on paikanpitäjä täsmälleen yhdelle merkille.
  • Uusi ”Ota mukaan”-toiminto ”Jätä pois”-toiminnon lisäksi.
  • ”Detect mime type”-toiminto on poistunut. Jos haluat hakemistoida tiedostoja ilman tiedostopäätettä tekstitiedostoina, käytä samannimistä valintaruutua mallitaulukon alapuolella.
  • Vastaavuus voi olla joko kirjainkoosta riippuvainen tai riippumaton. DocFetcherissa puolestaan vastaavuus on aina kirjainkoosta riippuvainen.
  • Vastaavuutta voidaan suorittaa paitsi tavallisten tiedostojen, myös kansioiden ja arkistotiedostojen kanssa.
  • Windowsissa, kun sääntöjä verrataan tiedostopolkuihin, jälkimmäiset käyttävät merkkiä \ polkuerottimena, eivät merkkiä /. Esimerkki: C:\Polku\Kohteeseen\Tiedosto.docx, eikä C:/Polku/Kohteeseen/Tiedosto.docx.

Tämän seurauksena DocFetcher Pron mallitaulukko näyttää tältä:

Mallitaulukko

DocFetcher Serverin mallitaulukko näyttää samalta, mutta ”Valittu kuvio vastaa tiedostoa”-testiwidgetti taulukon alapuolella ei ole tällä hetkellä käytettävissä. Server Not available in DocFetcher Server

Napsauta tästä nähdäksesi yksityiskohtaisen keskustelun mallitaulukosta DocFetcherissa, DocFetcher Prossa ja DocFetcher Serverissä.

Näin DocFetcher Pron ja DocFetcher Serverin mallitaulukon uudistus syntyi. Aloitetaan alusta: DocFetcherin hakemistointidialogissa on mallitaulukko, jolla suoritetaan tiettyjä toimintoja tiedostoille, jotka vastaavat tiettyjä kuvioita hakemistoinnin aikana:

Mallitaulukko DocFetcherista

Kuvioiden tulee olla niin sanottuja säännöllisiä lausekkeita, ja toiminnoista DocFetcherissa on käytettävissä kaksi: Vastaavan tiedoston poissulkeminen hakemistoinnista ja ”mime-tyypin tunnistus”, eli yrittää arvata oikea tapa jäsentää vastaava tiedosto tiedoston sisällön perusteella tiedostonimen sijaan. Tähän asti kaikki hyvin. Käytännössä käy kuitenkin ilmi, että yllä olevassa toteutuksessa on useita ongelmia:

  • Hyvin harvat ihmiset tietävät kuinka kirjoittaa säännöllisiä lausekkeita.
  • Joskus halutaan hakemistoida vain tiettyjä tiedostoja, eikä tuhlata hakemistointiaikaa tarpeettomasti muuhun. Esimerkiksi hakemistoida vain ”txt”-tiedostoja eikä mitään muuta. DocFetcher voi itse asiassa tehdä tämän, mutta se vaatii melko edistynyttä säännöllisten lausekkeiden käyttöä.
  • Joskus halutaan sulkea hakemistoinnista pois kaikki tiedostot, jotka vastaavat tiettyä kuviota, paitsi kaikki tiedostot, jotka vastaavat tiettyä toista kuviota. Esimerkiksi sulkea hakemistoinnista pois kaikki PDF-tiedostot, paitsi PDF-tiedostot, joiden nimet alkavat ”raportti_”. Jälleen DocFetcherissa tämä vaatii säännöllisten lausekkeiden edistynyttä käyttöä.
  • Yleisesti ottaen mime-tyypin tunnistus on melko hyödytöntä, koska: (1) Tiedostopääte on lähes aina oikea ja siksi useimmissa tapauksissa kaikki mitä tarvitaan tiedostomuodon selvittämiseen. (2) Kun tiedostopääte ei ole oikea ja mime-tyypin tunnistusta tarvitaan, jälkimmäinen osoittautuu joka tapauksessa ei erityisen luotettavaksi. (3) Kukaan ei vaivaudu ja/tai osaa kirjoittaa vastaavuussääntöjä niitä harvinaisia tapauksia varten, joissa mime-tyypin tunnistusta todella tarvittaisiin. Kuitenkin, DocFetcherin kontekstissa käy ilmi, että mime-tyypin tunnistuksella on yksi tärkeä käyttötapaus: Saada ohjelma käsittelemään tiedostoja ilman tiedostopäätettä tavallisina tekstitiedostoina, esim. tiedostoja nimeltä README. Kuitenkin kuitenkin, tämän toteuttamiseksi täytyy kirjoittaa tämä hämärä säännöllinen lauseke: [^.]*
  • Mime-tyypin tunnistus saattaa epäonnistua tunnistamaan tiedoston tavalliseksi tekstiksi, jos tiedosto sisältää binääridataa.
  • Sen vuoksi, että DocFetcherin kannettavan version täytyy toimia kaikilla tuetuilla alustoilla, kun sääntöjä verrataan tiedostopolkuihin, jälkimmäiset käyttävät aina merkkiä / polkuerottimena, jopa Windowsissa, mikä on melko epäintuitiivista useimmille Windows-käyttäjille.

Lyhyesti sanottuna DocFetcherin mallitaulukko on sekasotku, ja DocFetcher Pron mukana tullut uudelleenkirjoitus oli hyvä tilaisuus siivota kaikki kuntoon:

  • Jokerimerkit lisättiin ja ne asetettiin oletukseksi, joten nyt jopa tavalliset kuolevaiset voivat kirjoittaa vastaavuussääntöjä.
  • ”Ota mukaan”-toiminto kattaa sekä tapauksen, jossa halutaan hakemistoida vain tietynlaisia tiedostoja, että tapauksen, jossa halutaan määritellä poikkeuksia vastaavuussääntöihin. Jopa poikkeusten poikkeukset ovat nyt mahdollisia.
  • Yleisesti hyödytön ”Detect mime type”-toiminto on poistunut, ja sen päätarkoitus, tiedostojen ilman tiedostopäätettä hakemistointi tekstitiedostoina, katetaan yksinkertaisella valintaruudulla mallitaulukon alapuolella. Ja tämä valintaruutu toimii vaikka tiedosto sisältäisikin binääridataa.
  • Windowsin polkuerotin-ongelma on korjattu.
  • Ja joitakin muita asioita (kirjainkoon herkkyys ja vastaavuus tiedostojen/kansioiden/arkistojen kanssa) heitettiin mukaan hyvän kiitoksen vuoksi.

Hakemistointiasetuksien lataaminen ja tallentaminen

Huomautus: Tämä ominaisuus on tällä hetkellä käytettävissä vain DocFetcher Prossa, ei DocFetcher Serverissä. Server Not available in DocFetcher Server

Ongelma: DocFetcherissa joka kerta kun luot uuden hakemiston, sinun täytyy syöttää kaikki säännöt mallitaulukkoon yksi kerrallaan. Tästä tulee melko tylsistyävää, jos sinulla on paljon tällaisia sääntöjä. Ei ole mitään tapaa ladata ja tallentaa niitä.

Mallitaulukko DocFetcherista, monta merkintää

DocFetcher Prossa yllä oleva ongelma ratkaistaan seuraavasti: DocFetcher Pron hakemistointidialogin oikeassa yläkulmassa on huomaamaton pieni ”purkki asiakirjalla” -painike. Tämän painikkeen napsauttaminen avaa valikon, joka sisältää erilaisia toimintoja hakemistointiasetuksien lataamiseen ja tallentamiseen:

Valikko hakemistointiasetuksien lataamiseen ja tallentamiseen

”Tallenna asetukset”-kohdassa napsauttaminen avaa tämän dialogin:

Dialogi hakemistointiasetuksien tallentamiseen

Pohjimmiltaan tällä dialogilla voit joko tallentaa tällä hetkellä näkyvät hakemistointiasetukset uuteen nimettyyn paikkaan, esim. ”Omat uudet hakemistointiasetukset”, tai tallentaa tällä hetkellä näkyvät hakemistointiasetukset uudeksi oletusasetukseksi.

Tätä oletusasetusta kutsutaan ”Mukautettu oletusasetus” ja se ladataan automaattisesti uusia hakemistoja luotaessa. On myös ”Tehdasasetus”, joka on DocFetcher Pron käyttämä oletusasetus valmiina. Luomasi nimetyt asetukset, nimittäin ”Mukautettu oletusasetus” ja ”Tehdasasetus”, voidaan kaikki ladata yllä näkytetyn valikon kautta.

Pyöristääksemme asian, valikko myös mahdollistaa kaikkien hakemistointiasetustesi tuonnin ja viennin, jotta voit käyttää niitä uudelleen DocFetcher Prota perustettaessa uuteen ympäristöön.

Muut merkittävät parannukset

FB2-tuki: DocFetcher Prossa ja DocFetcher Serverissä on tuki sähkökirjaformaatille FB2. Zip-pakatut FB2-tiedostot, joiden tiedostopääte on fb2.zip tai fbz, ovat tuettuja ”natiivisti”, eli DocFetcher Pro ja DocFetcher Server näkevät jokaisen tällaisen tiedoston yhtenä tiedostona eikä zip-arkistoon käärittynä tiedostona.

Kokeellinen Mobipocket-tuki: DocFetcher Prossa ja DocFetcher Serverissä on tuki sähkökirjaformaatille Mobipocket, jonka tiedostopääte on ”mobi”. Huomaa kuitenkin, että vaikka DocFetcher Pro ja DocFetcher Server yleisesti ottaen tekevät melko vankan työn poistaessaan tekstiä mobi-tiedostoista, ne tällä hetkellä joko epäonnistuvat poistamaan pienen osan tekstiä tiedoston lopusta tai joissakin tapauksissa epäonnistuvat kokonaan. Siksi Mobipocket-tuki on toistaiseksi merkitty kokeelliseksi.

7z-arkistotuki nykyiselle v0.4-formaatille: DocFetcher voi lukea 7z-arkistoja 7z-arkistoformaatin versioon v0.3 asti. DocFetcher Pro ja DocFetcher Server voivat myös lukea 7z-arkistoja nykyisessä v0.4-formaatissa. Tämä v0.4-formaatti esiteltiin 7-Zip 9.34:n mukana, joka julkaistiin 23.11.2014.

Laajennettu tar-arkistotuki: DocFetcher tukee seuraavia tar-arkistopäätteitä: tar, tar.gz, tgz, tar.bz2, tb2, tbz. DocFetcher Pro ja DocFetcher Server tukevat lisäksi seuraavia tar-arkistopäätteitä: tbz2, tar.lzma, tlz, tar.xz, txz, tar.z, tz

Kansioiden ja arkistojen nimien hakemistointi: Toisin kuin DocFetcher, DocFetcher Pro ja DocFetcher Server hakemistoivat paitsi tavallisia tiedostoja, myös kansioita ja arkistotiedostoja — tai tarkemmin sanottuna kansioiden ja arkistotiedostojen nimiä. Näin ollen kansiot ja arkistotiedostot näkyvät DocFetcher Pron ja DocFetcher Serverin hakutuloksissa. Pääsovellusikkunan vasemmalla puolella on myös Säiliötyypit-ruutu kansioiden ja/tai arkistojen poissulkemiseen hakutuloksista.

Kansioiden ja arkistojen hakeminen

macOS: Daemoni automaattiseen hakemiston päivitykseen: DocFetcher ja DocFetcher Pro kykenevät automaattiseen hakemiston päivitykseen, eli sen sijaan että hakemiston päivitykset täytyisi käynnistää manuaalisesti, ohjelma käynnistää hakemiston päivitykset heti kun tiedostomuutoksia havaitaan. Tämä toiminnallisuus on kuitenkin käytettävissä vain silloin kun nämä kaksi ohjelmaa todella ajetaan. Kun ne eivät ole ajossa, tarvitaan erillinen daemon-prosessi täyttämään aukko. DocFetcherissa daemon on käytettävissä vain Windowsissa ja Linuxissa, kun taas DocFetcher Prossa se on käytettävissä myös macOS:ssä. DocFetcher Serverin osalta daemonia ei tarvita, koska serveri on suunniteltu toimimaan jatkuvasti. Server Not available in DocFetcher Server

Älykkäämpi tiedostonimien hakemistointi: Tiedostonimien hakemistointi DocFetcher Prossa ja DocFetcher Serverissä on älykkäämpää kuin DocFetcherissa. Esimerkiksi, jos DocFetcher kohtaa tiedoston nimeltä löydä_tämä_tiedosto.pdf, se näkee ”löydä_tämä_tiedosto” yhtenä sanana, ei kolmena erillisinä sanana ketjutettuna yhteen. Näin ollen DocFetcher löytää tämän tiedoston vain jos kirjoitat kirjaimellisesti ”löydä_tämä_tiedosto” DocFetcherin hakukenttään. DocFetcher Pro ja DocFetcher Server puolestaan löytävät tiedoston jos kirjoitat ”löydä_tämä_tiedosto” tai minkä tahansa kolmesta yksittäisestä sanasta. Yleisesti ottaen DocFetcher Pro ja DocFetcher Server tunnistavat merkkejä kuten alaviivan mahdollisiksi sananerottimiksi.

Älykkäämpi tiedostonimien hakemistointi

Tiedostonimien hakemistointi virheiden yhteydessä: Jos DocFetcher Pro ja DocFetcher Server epäonnistuvat lukemaan tiedoston sisältöä jonkin virheen vuoksi tai salasanasuojauksen takia, tiedostonimi silti hakemistoidaan. DocFetcherissa puolestaan tiedosto ohitetaan kokonaan.

Ei virheitä syvään sisäkkäisten kansiorakenteiden kanssa: Yrittäessä hakemistoida syvään sisäkkäisiä kansiorakenteita, kuten C:\kansio1\kansio2\...\kansio99\kansio100, DocFetcher on altis epäonnistumaan ”Kansiohierarkia on liian syvä” -virheen kanssa. Ohjelmoijien slangissa tätä kutsutaan ”pinon ylivuodoksi”. DocFetcher Pro ja DocFetcher Server puolestaan ovat täysin immuuneja tällaiselle virheelle.

Hakemistointivirheiden CSV-vienti: DocFetcher Prossa voit viedä taulukon tiedostoista, joita ohjelma epäonnistui lukemaan hakemistoinnin aikana, CSV-tiedostoon. Tämä voidaan tehdä virhetaulukon kontekstivalikon kautta, kuten seuraavassa kuvakaappauksessa näkyy. Tämä ominaisuus ei ole tällä hetkellä käytettävissä DocFetcher Serverissä. Server Not available in DocFetcher Server

Hakemistointivirheiden CSV-vienti

Kansioiden tarkkailun kytkeminen päälle ja pois ilman hakemiston uudelleenrakentamista: DocFetcherin ”Watch folders for file changes”-asetus, tunnettu myös kansioiden tarkkailuna, on hakemistokohtainen asetus, joka päälle kytkettynä saa ohjelman päivittämään hakemiston automaattisesti aina kun se havaitsee tiedostomuutoksia hakemistoidussa kansiossa. Ongelma on, että jos haluat kytkeä tämän asetuksen päälle tai pois tietystä hakemistosta, sinun täytyy rakentaa koko hakemisto uudelleen. DocFetcher Prossa voit kytkeä tämän asetuksen päälle ja pois ilman hakemiston uudelleenrakentamista, hakualueen ruudun kontekstivalikon kautta. Lisäksi asetus on nimetty uudelleen ”Päivitä hakemisto automaattisesti”-asetukseksi. Samanlaista toiminnallisuutta on DocFetcher Serverissä.

Päivitä hakemisto automaattisesti

Samanaikainen hakeminen ja hakemiston uudelleenrakentaminen: DocFetcherissa, jos päätät rakentaa hakemiston uudelleen, kyseinen hakemisto tulee käyttämättömäksi hakemiseen uudelleenrakentamisen ollessa käynnissä. DocFetcher Prossa ja DocFetcher Serverissä puolestaan hakemisto pysyy haettavana uudelleenrakentamisen aikana. (Tarkemmin sanottuna vanha kopio hakemistosta pysyy haettavana samalla kun varsinaista hakemistoa rakennetaan uudelleen taustalla.)

Windows: Korjattu UNC-polkujen käsittely: DocFetcherissa UNC-polkujen käsittely Windowsissa on pahasti rikki ja suunniteltiin uudelleen alusta DocFetcher Prossa. Uudelleensuunnittelu siirrettiin sitten DocFetcher Serveriin.

Ei-modaalinen hakemistointidialogi: Toisin kuin DocFetcherin hakemistointidialogi, DocFetcher Pron dialogi on ”ei-modaalinen”, mikä tarkoittaa että se ei ole kiinnitetty pääohjelmaikkunnaan eikä estä syötteitä pääohjelmaikkunnaan ollessaan auki. Tämän päähyöty on, että hakemistointiprosessien ollessa käynnissä, voit pienenntää pääohjelmaikkuna, mutta pitää hakemistointidialogin näkyvänä ja pysäköitynä sivuun. Tämä mahdollistaa hakemistointiprosessien seuraamisen samalla kun teet työtä muissa sovelluksissa. Tämä ominaisuus ei koske DocFetcher Serveriä. Server Not available in DocFetcher Server

Ei-modaalinen hakemistointidialogi

Äänen toistaminen hakemistoinnin jälkeen: Oletuksena DocFetcher Pro toistaa ”valmis”-äänen hakemistoinnin jälkeen. Tämä voidaan kytkeä pois päältä asetuksista. Tämä ominaisuus ei ole tällä hetkellä käytettävissä DocFetcher Serverissä. Server Not available in DocFetcher Server

Äänen toistaminen hakemistoinnin jälkeen

Japanilaisen tekstin hakemistointi: DocFetcherissa on niin kutsuttu ”Sanajako”-vaihtoehto käyttökelpoisten hakutulosten saamiseksi hakemistoitaessa kiinalaista tekstiä. DocFetcher Prossa on lisäksi sanajako-vaihtoehto japanilaisen tekstin käsittelyyn. Sekä kiinalainen että japanilainen sanajako eivät ole tällä hetkellä käytettävissä DocFetcher Serverissä. Server Not available in DocFetcher Server