20.09.2019

Modello dati RDF. Grafico RDF. Introduzione all'RDF


In questa nota cercherò di mettere il dito sui punti chiave e giustificare i vantaggi del modello RDF.
Da più di 10 anni il concetto di Web Semantico, di cui RDF fa parte, è oggetto di polemiche e discussioni, e oggi è sempre più supportato dalla community nelle loro applicazioni.

Tuttavia, per molti non è ancora del tutto chiaro:

  • Perché tutto questo?
  • Come lavorarci?
  • Cosa mi darà?

La maggior parte, almeno di sfuggita, ha visto la famosa torta:

Ci sono molte specifiche, tecnologie, concetti - anche gli occhi sono spalancati ... Il livello inferiore è vecchio quanto il mondo, gli accademici stanno lottando al di sopra del livello superiore, cercando di trovare una soluzione semplice e universale per insegnare le applicazioni per valutare come molto possono fidarsi delle dichiarazioni disponibili ricevute dalla rete. Gli sviluppatori ordinari non possono ancora preoccuparsi di questo e aspettare altri 5 anni I ragazzi di w3c stanno lucidando instancabilmente gli standard un po' sopra la metà, alcuni hanno già lucidato, come RDF, e un sacco di strumenti sono già stati scritti per loro per tutti principali piattaforme e linguaggi in modo da poterlo utilizzare immediatamente. È con loro che si ha sempre più a che fare in applicazioni reali, in primis con il modello RDF.
Sarebbe molto utile capire perché sono necessari, cosa danno e come lavorare con le ontologie, ma non si tratta di questo momento.

Quindi, proviamo a capire cosa otteniamo dall'utilizzo del modello:

  • Inferenza logica di fatti nuovi
  • Fornire ricerca semantica
  • Flessibilità del modello di dati
  • Estrema facilità di scambio dati tra sistemi

Se non hai mai studiato la logica formale prima, allora metti da parte per ora che dopo aver descritto formalmente i fatti, puoi automaticamente ottenere una serie di nuovi fatti che non sono definiti esplicitamente ... questo argomento merita un'attenzione speciale, fino a quando non lo tocchiamo.

Ricerca semantica, perché, perché c'è Google?
Sì, puoi entrare e otterrai qualsiasi cosa ma non l'insieme degli utenti. Come mai? - perché Google cercherà la parola dalla query nel testo dei documenti e restituirà documenti e non fatti.
E se capisse che abbiamo bisogno degli oggetti "utente" della risorsa "habr", e le descrizioni formali di questi oggetti sarebbero disponibili per l'indicizzazione nel modello RDF (ad esempio, sotto forma di una voce RDFa nella pagina così che il motore di ricerca potesse indicizzarli) si otterrebbe l'insieme di oggetti che stavamo cercando.
Molti obiettano - "Posso seguire un paio di link, fare un paio di richieste più chiarificatrici e trovare comunque quello che mi serve, perché tutto questo?" - la risposta è che oggi non utilizziamo schedari cartacei, ma preferiamo inserire un paio di parole chiave nella barra di ricerca, e va da sé che riceveremo subito le informazioni. Per qualche ragione, andiamo al lavoro in macchina ea cavallo, perché è più conveniente.

Alla domanda: "In che modo RDF fornisce la ricerca semantica?" - risposta: il modello RDF fornisce descrizioni formali. E dove ci sono descrizioni formali, l'agente di ricerca può cercare fatti e conoscenze.

Google oggi non sta cercando questo: perché devo preoccuparmene ora? Innanzi tutto per ottenere i benefici di seguito descritti, e in secondo luogo, per non essere "in ritardo" - il nostro settore è così - "fai presto o muori".

Parliamo più in dettaglio degli altri due vantaggi, sono molto più facili da capire, credo. Ma prima, chiariamo un paio di cose.

Che cos'è un modello RDF?

Devi capire subito RDF: è un modello, astratto, molto semplice, un po' nel vuoto. Solo un grafico diretto con alcune aggiunte e avvertenze. Ma puoi scriverlo in diversi modi, solitamente la scelta ricade su una delle opzioni: N3, N-Triples, Turtle, RDF/XML, RDFa e la specifica utilizzata dovrà essere studiata.

Cosa viene descritto: utilizzando RDF, puoi descrivere sia documenti, singoli frammenti di conoscenza all'interno di un documento, sia oggetti del mondo reale, ad esempio una specifica persona vivente. (qui alcuni it-shnik cadono in uno stupore).
Tutto è identificato da un URI. Inoltre, l'URI, sebbene simile ai normali collegamenti URL, è leggermente diverso, ad esempio puoi definire una risorsa - una persona reale e impostare l'URI per essa "http://example.org/people#Vasya Pupkin".
Sì, puoi scrivere in russo come Unicode, ma quello che devi capire è quello non è un URL: non puoi incollarlo in un browser e ottenere una persona- La scienza non è ancora arrivata a questo punto.

Proviamo a capire dov'è la flessibilità del modello e lo scambio di dati tra i sistemi.

Vediamo come comunicano le persone:

Scrivono i loro pensieri (formalizzano) usando una certa lingua in molti modi, per iscritto, oralmente, poi le informazioni circolano attraverso diversi sistemi, vengono trasmesse tramite il passaparola, memorizzate, aggregate, ecc. Ma alla fine, viene letto da una persona che sa interpretare questa lingua e ottiene un pensiero. Il modo in cui esattamente un pensiero formalizzato viene trasmesso da un nodo all'altro nella catena descritta, in generale, non infastidisce nessuno.

Se non conosci il cinese, non ti farà male fare ctrl-c ctrl-v da un posto all'altro.

RDF funziona in modo molto simile.

Le informazioni devono essere interpretate solo quando l'applicazione le formalizza in RDF e viene letta dall'agente all'altro capo. Tra queste due fasi, chiunque può elaborarlo, scambiarlo in qualsiasi modo, senza necessariamente immaginare quale significato sia stabilito, o comprenderne il significato, solo una parte delle affermazioni.

Ad esempio, un'istruzione RDF (tripletta soggetto-predicato-oggetto)

In questo modo possiamo scambiare con chiunque senza fare gesti inutili, inclusa l'integrazione con n+1 sistemi senza più sforzo di mostrare il nostro sito Web a n+1 utenti! Non è necessario programmare nulla per questo. Tutti i concetti di cui questo sistema avrà bisogno dal tuo: sarà in grado di ricevere e interpretare.

Per il confronto di oggi, devi collegare esplicitamente i campi da un sistema all'altro (spesso entrambi) usando XML, XSLT - o campi ottenuti da un'API - e molti di noi sanno che mal di testa è.

Siamo giunti a comprendere che i dati possono essere indipendenti dal modello di una particolare applicazione. Quelli. un insieme di fatti vive da solo. Possiamo aggiungerli, rimuoverli, interrogarli, interpretarli, ma sono logicamente indipendenti.

Questo fatto ha il seguente importante vantaggio: facilità nel cambiare il modello.

Immagina cosa devi fare in un'applicazione che si basa sul modello relazionale. Per il dramma, immaginiamo che ciò dovrebbe essere fatto dopo l'avvio se si desidera modificare il modello di dati, ad esempio per associare una nuova entità all'oggetto utente, ad esempio un indirizzo (che, tra l'altro, non è una riga, ma contiene campi separati per una casa, una città, una via, ecc.). d.). Cosa bisogna fare con il database? Correggere correttamente un paio di targhe, magari crearne di nuove, aggiungere un collegamento tra di loro, modificare le procedure di accesso ai dati, modificare il servizio web e il gioco è fatto. E ovviamente devi cambiare l'interfaccia utente.

È un po' scomodo farlo, non credi?

E quanto sarebbe più semplice se tutto ciò che dovessi fare fosse semplicemente aggiungere un paio di campi all'interfaccia ed eseguire l'azione di aggiungere una nuova istruzione per ogni nuovo campo (questo minimo a volte può anche essere evitato se abbiamo un interfaccia progettata) ? due righe di codice...
Con un modello RDF alle spalle, questa operazione sarà simile a questa. Dopotutto, tutto ciò che viene memorizzato è un numero enorme di affermazioni soggetto-predicato-oggetto. Quindi, cambiare il modello di dati cessa di essere qualcosa che rovina l'umore non appena ci pensi, non è fantastico?

Con questo articolo inizio il mio ciclo di post “per principianti” dove spiegherò i concetti del web 3.0 nel modo più popolare possibile. Successivamente, tutti gli articoli migreranno al wiki e verranno da me "pubblicati" sotto forma di libro PDF.

Cominciamo con gli strumenti e oggi abbiamo le basi delle basi: RDF.
Risorsa Descrizione Frameworkè un modello sviluppato dal W3C per descrivere le risorse, in particolare i metadati delle risorse.

RDF è un linguaggio di descrizione della conoscenza. Non è esattamente XML. cioè non XML affatto, solo la sintassi è simile. RDF contiene triplette di dati "oggetto - predicato - soggetto". Bene, ad esempio, "Il pilastro ha un'altezza di 15 m". Ecco l'esempio più semplice; RDF.:

I nomi in RDF sono di due tipi: letterali (solo testo) e URI. L'URI può essere un collegamento a un sito Web (http://futuri.us), ma non deve esserlo. In generale, l'URI è un riferimento a qualche oggetto (non ha necessariamente una propria rappresentazione), ad esempio urn:isbn: 5-3180-0093-2. Questo è un link al librosamba. Guida dell'amministratore di sistema. Per professionisti"Ed Brooksbank. Questo libro probabilmente non ha una pagina, ma è chiaro che questo URI punta a un libro ed è chiaro quale. L'URI è unico. Pertanto, consente di associare RDF a un singolo oggetto.

Il Resource Description Framework (RDF) è uno standard del W3C per la descrizione di risorse Web come il titolo della pagina, l'autore, la data di modifica, il contenuto e le informazioni sul copyright.

Devi avere una conoscenza di base

Prima di procedere, dovresti avere una conoscenza di base delle seguenti conoscenze:

  • XHTML
  • Spazi dei nomi XML

Se vuoi studiare prima queste materie, visita la nostra homepage.

Cos'è l'RDF?

  • RDF si riferisce al Resource Description Framework (Resource Description Framework)
  • RDF è un framework di descrizione delle risorse per il Web
  • RDF fornisce un modello e una grammatica per tali gruppi indipendenti da condividere e utilizzare.
  • RDF è pensato per essere letto e compreso da un computer
  • Lo scopo di RDF non è quello di apparire agli esseri umani
  • RDF usa XML per scrivere
  • RDF è parte integrante della Semantic Web Activity del W3C
  • RDF è una raccomandazione del W3C

RDF - Esempi applicativi

  • Descrizione di articoli per acquisti immobiliari come prezzo e disponibilità
  • Grafico Descrizione Evento Web
  • Per descrivere informazioni sulla pagina come contenuto, autore e data di creazione o modifica
  • Foto e descrizione della classificazione dei contenuti della rete
  • Descrizione per i motori di ricerca
  • Descrizione Biblioteca digitale

RDF è pensato per essere letto da un computer

L'RDF mira a fornire un modo generale per descrivere le informazioni in un modo che possa essere letto dall'applicazione e dalla comprensione del computer.

Descrizione RDF non è concepito per essere visualizzato sul Web.

RDF usa XML per scrivere

I documenti RDF sono scritti in XML. Il linguaggio XML utilizzato da RDF è chiamato RDF/XML.

Utilizzando XML, le informazioni RDF possono essere facilmente scambiate tra il sistema operativo e il computer utilizzando vari tipi di linguaggi applicativi.

RDF e il Web semantico

Il linguaggio RDF è parte integrante della Semantic Web Activity del W3C. Consorzio W3C "Semantic Web Vision (Semantic Web Vision)" Obiettivi:

  • Le informazioni Web hanno un significato esatto
  • Le informazioni Web possono essere comprese da un computer ed elaborate
  • I computer possono integrare le informazioni da Internet

RDF è uno standard del W3C

RDF nel febbraio 2004 è diventato standard del W3C.

Il modello relazionale, che per decenni è servito come base della tecnologia dei dati, non è più dominante: stanno entrando in scena nuovi compiti che richiedono la presa in considerazione e l'identificazione di un numero significativamente maggiore di relazioni. Tra i nuovi metodi c'è il modello RDF.

14.11.2012 Vladislav Golovkov, Andrey Portnov, Viktor Chernov

Il modello relazionale, che per decenni è servito come base della tecnologia dei dati, non è più dominante: stanno entrando in scena nuovi compiti che richiedono la presa in considerazione e l'identificazione di un numero significativamente maggiore di relazioni. Tra le nuove modalità di elaborazione dei dati spicca il modello RDF: il passaggio dai database SQL ai sistemi RDF promette un salto tecnologico paragonabile al passaggio da Cobol a SQL.

Finora, il modello di archiviazione dei dati più comune è stato quello relazionale, che è stato lo standard de facto per l'archiviazione dei dati strutturati dalla fine degli anni '70, e il linguaggio SQL è stato lo standard per elaborarli. Tuttavia, la proporzione di dati strutturati si sta riducendo e il modello relazionale incontra sempre più problemi quando si lavora con quantità significative di dati: per molto tempo, ad esempio, è stato notato un degrado delle prestazioni dei DBMS relazionali durante la risoluzione dell'elaborazione analitica task, le cui caratteristiche sono le query SQL "lunghe" che funzionano con più tabelle in presenza di un numero elevato di aggregati.

Oggi, le attività che vanno oltre il modello relazionale sono solitamente attribuite alla classe NoSQL, ogni sottoclasse della quale risolve uno o l'altro problema che è scarsamente implementato utilizzando SQL, ad esempio database con archiviazione colonnare, orientato al documento, grafico, valore-chiave database e oggetti. Ad esempio, i database chiave-valore vengono utilizzati per attività caratterizzate da volumi estremamente grandi, nessuna operazione di join e requisiti di aggiornamento dei dati limitati (ad esempio, solo accodamento). A causa del loro volume, tali database sono deliberatamente distribuiti, il che, a sua volta, significa un completo rifiuto delle transazioni: un tale modello di dati semplificato offre nuove opportunità per migliorare le prestazioni attraverso l'uso diffuso di architetture parallele.

Un'altra classe di problemi difficili da risolvere su un modello relazionale sono i problemi su dati fortemente connessi o problemi di grafi. I tentativi di risolvere tali problemi su un modello relazionale portano a un numero imprevedibile di connessioni nelle query, quindi, per risolvere problemi di grafo, gli archivi RDF sono oggi più ampiamente utilizzati, il cui principale vantaggio è la presenza di standard di comitato W3C ben sviluppati per il linguaggio di descrizione dei grafi (Resource Description Framework, RDF) e per l'elaborazione dei dati dei grafi (SPARQL - acronimo ricorsivo: SPARQL Protocol And Rdf Query Language).

Il modello RDF è nato alla fine degli anni '90 e nel 2001 Tim Berners Lee ha pubblicato un famoso articolo su Scientific American in cui annunciava l'arrivo dell'era del Web semantico. Da allora, l'interesse per tutto ciò che riguarda l'elaborazione semantica è esploso nella comunità online, incluso RDF, che è stato adottato come standard dal comitato del W3C nel 2004.

La base di RDF è la rappresentazione dei dati sotto forma di affermazioni (triple) soggetto-predicato-oggetto, che descrive una relazione diretta da soggetto a oggetto, ben nota agli specialisti dell'intelligenza artificiale. Soggetti, oggetti e predicati vengono identificati utilizzando l'Uniform Resource Identifier (URI), che è una generalizzazione del concetto di URL. Per esempio:

soggetto oggetto:

Predicato:

Gli oggetti diversi dagli URI possono anche essere rappresentati da valori letterali, come il nome di un journal: "Journal 1 (1940)"^^xsd:string.

A differenza del modello relazionale, che ha una struttura rigida, il modello RDF è abbastanza flessibile: ogni soggetto può contenere i propri predicati e oggetti, ad esempio, in un unico database di prodotto, tutti i prodotti hanno il predicato "Prezzo", ma allo stesso tempo, i frigoriferi possono avere il predicato "Volume". congelatore" e i televisori - il predicato "Screen Diagonal".

I formati di presentazione RDF più noti sono file di testo XML, JSON, N-Triples, N3 e Turtle. Ad esempio, rappresentando alcuni dati in formato Turtle:

@prefisso xsd: . @prefisso f: . xsd: tipo ; f:nome "Standard per l'assistenza specialistica per bambini con galattosemia"; f:mkb ; f:servizio , ; f:droga ; xsd: tipo ; f:nome "Neuromielite ottica [malattia di Devic]"; xsd: tipo ; f:nome "Esame neuropsicologico generale"; xsd: tipo ; f: nome "Actovegin";

Questo esempio è un frammento di un grafico che descrive lo standard di cura per una malattia, inclusa una diagnosi secondo il classificatore ICD 10, servizi medici correlati e trattamento farmacologico.

Il modello RDF descrive essenzialmente un grafo orientato (Fig. 1), in cui ogni tripla è la descrizione di una relazione, cioè una connessione tra due nodi.

Linguaggio di interrogazione

Il modello RDF viene utilizzato per descrivere i dati, ma non descrive come elaborarli. Esistono numerosi linguaggi di query dei dati RDF: DQL, N3QL, R-DEVICE, RDFQ, RDQ, RDQL, SeRQL, ecc., ma SPARQL, adottato come standard W3C, è diventato il più popolare. Il linguaggio SPARQL, a differenza di SQL (che viene criticato, in particolare, per la mancanza di cross-platform, problemi con l'elaborazione di dati mancanti, grammatica e semantica ambigue), ha una struttura e una potenza più armoniche. Il corpo principale di una query SPARQL è un modello che descrive un sottografo da trovare nel grafico generale. Il modello è rappresentato come un insieme di triple con variabili, ad esempio una richiesta di ricerca in un determinato grafico per una persona di nome Peter:

Selezionare? x dove (? x: digita: persona. ? x: nome "Pietro")

Qui, il blocco "select" contiene un elenco di variabili per visualizzare il risultato della query; "?x" è una variabile che, al momento della ricerca, acquisirà il valore dell'URI dell'oggetto trovato. Il blocco "dove" contiene un insieme di triple che costituiscono il modello di query. Come risultato della ricerca, verrà trovato un sottografo che soddisfa il modello (Fig. 2).

Il linguaggio SPARQL è facile da imparare per una persona che ha familiarità con SQL - molto in SPARQL gli sembrerà familiare. Ad esempio, il linguaggio contiene costrutti come UNION, ORDER BY, GROUP BY, DISTINCT, OFFSET e LIMIT. SPARQL è oggi uno dei linguaggi di elaborazione dati più espressivi. Oltre al linguaggio di interrogazione, lo standard SPARQL regola il protocollo di interazione con il database e il formato del risultato, che rappresenta un grande passo avanti rispetto a SQL.

Oltre ai vantaggi del modello RDF e del linguaggio SPARQL, ci sono anche degli svantaggi. Cominciamo con i meriti.

Flessibilità. I cambiamenti nell'architettura di un sistema informativo costruito sul modello RDF sono più facili che per un sistema basato sul modello relazionale e, di norma, non richiedono nemmeno una reingegnerizzazione della base.

Architettura moderna. Le richieste all'archivio RDF vengono in genere effettuate utilizzando il protocollo HTTP, che ne semplifica l'integrazione nelle architetture di servizio senza creare livelli intermedi, senza sacrificare l'affidabilità o le prestazioni. RDF e SPARQL funzionano meglio con i contenuti internazionali rispetto ai database SQL.

Standardizzazione. Il livello di standardizzazione di RDF e SPARQL è molto più alto che in SQL: gli sforzi del comitato W3C hanno definito standard non solo per il modello RDF e il linguaggio SPARQL, ma anche per l'identificazione delle risorse (URI), il protocollo di interazione dei componenti (HTTP) , punto di accesso SPARQL, ecc. A causa della standardizzazione, i dati scaricati da qualsiasi archivio RDF possono essere caricati negli archivi RDF di diversi fornitori. Le query SPARQL vengono eseguite allo stesso modo su repository diversi, il che è molto apprezzato dagli sviluppatori che devono affrontare i problemi del trasferimento di dati e query da un database all'altro.

metadati. SPARQL semplifica la tracciabilità dell'origine di qualsiasi elemento di dati. RDF semplifica l'archiviazione di un'ampia varietà di metadati. Sulla base dei metadati, puoi effettuare query complesse, scegliendo, ad esempio, dati da origini specifiche, in un intervallo di tempo specifico, ecc.

Il principale inconveniente del modello RDF rispetto al modello relazionale è forse la sua "giovinezza". SQL ha molti anni di installazione e bagaglio operativo alle spalle, anche in applicazioni critiche: la ricchezza funzionale di tali database supera ancora significativamente RDF. Il meccanismo transazionale negli archivi RDF, di norma, se implementato, è piuttosto grezzo.

Toolkit RDF

Quasi tutti i fornitori di DBMS relazionali evitano di pubblicizzare i risultati dei test di configurazione basati su uno o un altro toolkit SQL e l'unico open source sono i test TPC per costosi sistemi ad alte prestazioni che risolvono una classe limitata di problemi. Il mondo dei sistemi RDF è aperto alla ricerca, agli esperimenti e ai test: puoi trovare facilmente i risultati dei test su diversi compiti, su computer di diversa potenza e architettura e, soprattutto, scegliere il toolkit più adatto per lavorare con il modello RDF per risolvere un compito specifico dell'applicazione.

Benchmark SPARQL di Berlino (BSBM). Il benchmark (www4.wiwiss.fu-berlin.de/bizer/berlinsparqlbenchmark) modella i dati relativi all'e-commerce, inclusi i prodotti di diversi produttori, le recensioni dei clienti sui prodotti, ecc. Questo benchmark è progettato per valutare la velocità di esecuzione delle query SPARQL . Il modello è vicino al relazionale, quindi è possibile valutare quanto sarebbe efficace sostituire il database SQL con uno storage RDF. Il modello e le query di test sono molto ben congegnati e vicini alla pratica. Forse è per questo che BSBM è uno dei test più popolari. Nei risultati di febbraio 2011 pubblicati sul sito Web degli sviluppatori di test, gli strumenti di sviluppo RDF come Virtuoso, 4Store, OWLIM e Jena TDB sono i leader.

SP²Bench SPARQL Benchmark delle prestazioni. Il test (dbis.informatik.uni-freiburg.de/index.php?project=SP2B) è costruito sul modello della nota libreria DBLP di letteratura sulla programmazione logica (sistemi DataBase e Logic Programming): pubblicazioni, articoli, riviste, libri, ecc. Proprio come BSBM, questo test è progettato per valutare la velocità di esecuzione delle query SPARQL, ma utilizza query più sofisticate, a scapito del loro realismo. Questo test è utile per testare Query Optimizer perché contiene molte operazioni di join complesse. Nei risultati pubblicati, i luoghi sono stati così distribuiti: Virtuoso, Sesame, ARQ. Il nostro recente test comparativo del server NitrosBase Storage RDF sui test SP2Bench ha mostrato la sua significativa superiorità nelle prestazioni rispetto a Virtuoso (da 10 a 10 mila volte, a seconda della richiesta).

Benchmark DBpedia SPARQL. Il benchmark DBPSB (svn.aksw.org/papers/2011/VLDB_AKSWBenchmark/public.pdf) si basa su query reali rispetto alla knowledge base di Dbpedia. La metodologia di sviluppo del test è tanto originale quanto conveniente. Gli autori analizzano i log delle richieste degli utenti reali al database di Dbpedia, li raggruppano e identificano i gruppi di richieste statisticamente più significativi, che vengono poi inclusi nella versione successiva del test. Pertanto, DBPSB è un test il più vicino possibile alla vita. Virtuoso esegue questo test più velocemente, seguito da OWLIM, Sesame e Jena TDB.

Indice di riferimento della Lehigh University. Il test LUBM (swat.cse.lehigh.edu/projects/lubm/) è specificamente progettato per valutare le caratteristiche semantiche e quindi non è comune come gli altri. Si basa su una base di conoscenza ontologica su una determinata università. I risultati di questo test sono noti, in primo luogo, per i sistemi con strumenti di inferenza, come OWLIM, YarcData, Sesame, ecc.

Oggi c'è una rapida crescita nel mercato degli strumenti di sviluppo basati sul modello RDF: alcuni strumenti hanno un'architettura specializzata per l'elaborazione dei grafici, altri sono costruiti su database relazionali.

Apache Jena - API Java per lo sviluppo di applicazioni Web semantiche. Il prodotto include più repository, archiviazione tripletta nativa (Jena TDB), interfaccia di archiviazione relazionale (Jena SDB), archiviazione in memoria (In-Memory) e strumenti per supportare l'archiviazione nativa. Il più grande punto di forza di Jena è la sua ricca interfaccia di programmazione. Molti repository RDF utilizzano l'API Jena per accedere ai propri DBMS (IBM, OWLIM, ecc.). Il lato debole sono le basse prestazioni anche su storage nativo.

Ontotext OWLIM è una famiglia di repository semantici o RDF DBMS con un proprio core, implementato in Java, con supporto per la semantica in RDFS (RDF Scheme) e OWL. Il prodotto OWLIM è utilizzato attivamente in progetti di ricerca e sistemi software. Disponibile nelle seguenti edizioni: OWLIM-Lite per applicazioni che supportano meno di 100 milioni di triple; OWLIM-SE (ex BigOWLIM) è progettato per elaborare grandi quantità di dati, con grandi flussi di richieste; OWLIM-Enterprise (precedentemente BigOWLIM Replication Cluster) è progettato per creare soluzioni scalabili, affidabili e ad alte prestazioni basate sull'elaborazione parallela e con protezione automatica dai guasti.

OpenLink Software Virtuoso - dispone di un proprio potente storage RDF, implementazione completa di SPARQL, capacità di leggere dati RDF da file in formato XML e Turtle. Inoltre, SPARQL/Update (SPARUL) è un'estensione SPARQL per supportare l'aggiornamento dei dati. Il prodotto è uno dei leader nelle prestazioni.

Anche grandi aziende come IBM e Oracle sviluppano le proprie soluzioni RDF. Il primo ha costruito nella versione successiva del DB2 DBMS una variante del modello RDF chiamato NoSQL Graph Support, con un'interfaccia basata sull'estensione API Jena. È caratterizzato da elevate prestazioni delle operazioni RDF. Oracle ha collegato RDF al suo prodotto di dati spaziali, Spatial Data Option, ora chiamato Spatial and Graph Option.

Inoltre, sono in fase di sviluppo computer specializzati che si concentrano sul lavoro con le informazioni sui grafici e supportano il modello RDF. Ad esempio, all'inizio del 2012, la società Cray ha annunciato la creazione di un nuovo sistema software e hardware ad alte prestazioni uRiKA (universal RDF integration Knowledge Appliance) destinato al mercato dei database semantici.

Compiti

Dopo l'articolo di Tim Berners Lee, il modello RDF è diventato fortemente associato al web semantico nella mente del pubblico, ma il potenziale di questo modello è molto più alto. Ad esempio, la maggior parte dei problemi risolti oggi nell'ambito del modello relazionale può essere facilmente risolta in RDF. Inoltre, gli archivi RDF consentono di raccogliere, archiviare e indicizzare dati da varie fonti, in particolare quando si risolve il compito effettivo di integrazione dei servizi, che si riduce alla combinazione di database relazionali disparati in un unico database e porta al compito di elaborare quasi -dati strutturati. I dati all'interno di ciascuno dei database sono rigorosamente strutturati per funzionare con il modello relazionale, ma ogni database è strutturato a modo suo, quindi il compito di integrarli nel quadro del modello relazionale richiede la reingegnerizzazione dell'intera soluzione. Se, tuttavia, tali database vengono convertiti in un modello RDF, l'integrazione si ridurrà a una semplice fusione di grafici RDF e riscrittura di query da SQL a SPARQL, il che non è difficile a causa della maggiore espressività di SPARQL rispetto a SQL.

I repository RDF sono ideali per attività che richiedono contabilità e identificazione di un gran numero di relazioni. Oltre ai compiti più ampiamente annunciati relativi allo sviluppo del Web semantico, ci sono un gran numero di compiti classici che richiedono l'uso di approcci grafici:

  • elaborazione di reti semantiche (e altre strutture grafiche) ottenute a seguito di analisi testuali (sistemi di ricerca analitica specializzata, sistemi di analisi di mercato, ricerche di mercato, analisi testuali nei sistemi di sicurezza, ecc.);
  • presentazione ed elaborazione dei dati per l'analisi del comportamento nei social network (ricerche di mercato, ad esempio, costruzione del ritratto di un acquirente; analisi e identificazione dei centri di diffusione delle informazioni nei social network; analisi delle preferenze politiche);
  • analisi ed elaborazione di dati sull'interazione di vari moduli e sottosistemi (compresa l'analisi dei log) per sistemi per garantire l'affidabilità e la sicurezza di grandi sistemi software e hardware;
  • rappresentazione ed elaborazione di grafici contenenti informazioni eterogenee nei sistemi di pianificazione e controllo per lo svolgimento di operazioni di combattimento;
  • elaborazione dati di esperimenti scientifici complessi;
  • sistemi medici di nuova generazione, la cui particolarità è che, ad esempio, servizi diversi richiedono strutture diverse per la loro descrizione, cosa molto difficile da inserire in un modello relazionale rigoroso. Non appena il sistema medico inizia a prendere in considerazione non solo il fatto del servizio, ma anche il suo dettaglio, la complessità del sistema aumenta notevolmente: ad esempio, il servizio "visita medica" e il servizio "analisi clinica" hanno un struttura dei dati completamente diversa dal punto di vista del modello relazionale, e RDF consente di elaborare tali dati in modo naturale, riducendo notevolmente i costi di manodopera per lo sviluppo e la manutenzione di tali sistemi;
  • sistemi intelligenti di controllo della produzione adattivi con una struttura grafica pronunciata;
  • analisi finanziaria basata sulla modellazione ed elaborazione di grafici che descrivono l'interazione dei partecipanti al mercato, l'identificazione delle società affiliate, l'analisi della corruzione, l'analisi del movimento dei fondi delle strutture, ecc.

Quasi tutti i problemi in cui il numero di relazioni tra entità supera il numero di entità, o il cui obiettivo principale è l'analisi delle relazioni, possono essere considerati candidati per la risoluzione utilizzando i sistemi RDF.

Vladislav Golovkov([email protetta]), Andrey Portnov([email protetta]), Victor Cernov([email protetta]) - dipendenti della società "Compile Group" (Mosca).



Il formato RDF può avere diverse modifiche di base:

  • Estensione RDF (completo. Risorsa Descrizione Framework) è una piattaforma per la descrizione delle risorse web. L'area principale di applicazione pratica di questo formato è la rappresentazione dei dati sulle risorse sul web. Contiene un insieme di dati strutturati, inclusi metadati, mappa del sito, informazioni sul registro degli aggiornamenti, descrizione delle singole pagine del sito, parole chiave.

Lo standard chiave con cui viene implementata la rappresentazione del modello RDF è il W3C.

L'obiettivo principale dello sviluppo dell'estensione RDF era creare un'unica sintassi (universale) per il linguaggio di descrizione per l'intera varietà di risorse Internet. Combina i formati di presentazione dei dati , e N3, nonché le tecnologie Internet RSS e FOAF.

Per salvare le impostazioni e la configurazione dell'interfaccia, il file RDF può essere utilizzato attivamente da vari browser, ad esempio Firefox.

  • Il file RDF è il risultato della generazione di PowerProducer, un prodotto software commerciale (sviluppato da CyberLink) ampiamente utilizzato per elaborare contenuti video digitali e registrarli direttamente su supporti ottici.

RDF è un file compresso da una certa tecnologia, che è un'immagine del disco. L'estensione non può essere aperta da nessun'altra utilità tranne Produttore di energia.

  • L'estensione RDF può anche essere associata a uno dei componenti del sistema CAD (Computer Aided Design) ReluxCAD, un complesso appositamente progettato per modellare le sorgenti luminose come componenti di sistemi di illuminazione completi. Posizionamento, luminosità, caratteristiche tecniche di base: questo è solo il più piccolo elenco di parametri fondamentali che un file RDF può includere. Il formato RDF viene spesso utilizzato in combinazione con i formati e , che sono nativi del CAD Autocad.
  • L'estensione RDF è un file di report in ArcGIS, un sistema di contabilità statistica standardizzato utilizzato da varie soluzioni GIS. Un file RDF è un insieme strutturato di dati sotto forma di tabelle digitali. I report di ArcGIS vengono generati in uno speciale modulo software Report Designer. Per visualizzare tali informazioni, è possibile utilizzare il componente Visualizzatore report.
  • Formato RDF (completo. File di definizione del rapporto Oracle) può fungere da foglio di calcolo utilizzato nel DBMS Oracle. Per sua struttura, un file RDF rappresenta un insieme di dati contenente varie query SQL necessarie per la generazione effettiva di un report e la sua elaborazione in uno dei formati universali ( , ecc.).

Programmi per aprire file RDF

A seconda del suo scopo pratico e della specifica modifica, un'estensione RDF può essere generata e aperta per la modifica utilizzando i seguenti sistemi software:

Per i casi in cui il file RDF è una piattaforma per la descrizione delle risorse Web, è possibile utilizzare le seguenti utilità software:

  • Windows utilizza Altova XMLSpy, Mozilla SeaMonkey, Firefox, Liquid Technologies Liquid XML Studio e SyncRO Soft oXygen XML Editor;
  • RDF basato su Mac sarà disponibile utilizzando gli stessi plugin software Mozilla SeaMonkey e SyncRO Soft oXygen XML Editor.

È interessante notare che l'estensione è adattata anche per l'uso sulla piattaforma Linux utilizzando il browser Internet Firefox.

Quando un file RDF viene utilizzato per elaborare contenuti video digitali e scrivere direttamente su un disco ottico, è possibile utilizzare l'utilità CyberLink PowerProducer 5.5.

Se il formato RDF viene utilizzato come componente di un sistema di progettazione assistita da computer (CAD) progettato specificamente per modellare sorgenti luminose come componenti di sistemi di illuminazione completi, è possibile utilizzare il complesso ReluxCAD per aprire il file.

Per i casi in cui un'estensione RDF è associata a un file di report in ArcGIS (un sistema di contabilità statistica standardizzato utilizzato da varie soluzioni GIS), il file può essere riprodotto utilizzando i plug-in Report Designer o Report Viewer;

Quando il formato RDF funge da foglio di calcolo utilizzato in un DBMS, sarà disponibile tramite Oracle.

Se si verifica un errore durante la riproduzione del formato: il file di origine è danneggiato o infetto oppure il file RDF viene aperto utilizzando un'utilità software errata.

Converti RDF in altri formati

Nonostante il fatto che l'estensione RDF abbia un gran numero delle più diverse versioni e modifiche, la sua conversione in altri formati è supportata solo in un certo numero di casi, in particolare:

  • se l'estensione RDF funge da progetto per la modellazione di sorgenti luminose come componenti di sistemi di illuminazione completi, è possibile utilizzare il traduttore CAD interno di ReluxCAD per convertirlo o

    Perché esattamente RDF e quali sono i suoi vantaggi?

    Dobbiamo ammettere che sebbene l'estensione RDF abbia un'ampia varietà di versioni diverse, non è affatto un formato così popolare e richiesto tra gli utenti ordinari. Tuttavia, il formato potrebbe essere richiesto in diverse aree altamente specializzate. È ampiamente usato come:

    • piattaforme per la descrizione delle risorse web;
    • file di contenuti video digitali per la registrazione diretta direttamente su supporti ottici;
    • componenti di un sistema di progettazione assistita da computer (CAD) specificamente progettato per modellare sorgenti luminose come componenti di sistemi di illuminazione completi;
    • file di rapporto in ArcGIS(sistema di contabilità statistica standardizzato utilizzato da diverse soluzioni GIS);
    • foglio di calcolo utilizzato nel DBMS.