Documentation

MetadataCrawler
in package

Description of DirectoryCrawler

Tags
author

zozlak

Table of Contents

Constants

FILE_DEFAULT_CLASS  = 'resource'
FILECHECKER_FILE  = 'fileList.json'
SPREADSHEET_EXTENSIONS  = ['csv', 'xls', 'xlsx', 'ods']

Properties

$defaultLang  : string
$entitiesDb  : EntitiesDatabase
$files  : array<string|int, mixed>
$idgen  : FileId
$idPrefix  : string
$idProp  : NamedNode
$log  : LoggerInterface|null
$metaPrimary  : Dataset
$metaSecondary  : Dataset
$ontology  : Ontology
$schema  : Schema

Methods

__construct()  : mixed
crawl()  : DatasetInterface
addMetaSecondary()  : int
mapVocabularies()  : void
Custom implementation because Ontology::getVocabularyValue() has no caching.
parseFilecheckerOutput()  : NamedNode
readMetadata()  : void

Constants

SPREADSHEET_EXTENSIONS

private mixed SPREADSHEET_EXTENSIONS = ['csv', 'xls', 'xlsx', 'ods']

Properties

Methods

__construct()

public __construct(string $metaDir, Ontology $ontology, Schema $schema, string $idPrefix, string $filecheckerBaseDir, string $defaultLang[, LoggerInterface|null $log = null ]) : mixed
Parameters
$metaDir : string
$ontology : Ontology
$schema : Schema
$idPrefix : string
$filecheckerBaseDir : string
$defaultLang : string
$log : LoggerInterface|null = null

crawl()

public crawl() : DatasetInterface
Return values
DatasetInterface

addMetaSecondary()

private addMetaSecondary(iterable<string|int, Quad$meta) : int
Parameters
$meta : iterable<string|int, Quad>
Return values
int

mapVocabularies()

Custom implementation because Ontology::getVocabularyValue() has no caching.

private mapVocabularies(Dataset $meta) : void
Parameters
$meta : Dataset

parseFilecheckerOutput()

private parseFilecheckerOutput(string $path, string $basePath) : NamedNode
Parameters
$path : string
$basePath : string
Return values
NamedNode

readMetadata()

private readMetadata(string $metaDir, string $filecheckerBaseDir) : void
Parameters
$metaDir : string
$filecheckerBaseDir : string

        
On this page

Search results