

通过查询以上SPARQL语句,结果见表1(表中结果示例显示1行)。
图2为具体的查询演示界面,用来模拟SPARQL查询正文含有科研关键字的文章列表。
在Drupal中创建SPARQL Endpoint,需要安装SPARQL模块,可以通过以下命令来安装:
drush dl sparql
drush ?y en sparql sparql_endpoint
安装模块后,在“导航”菜单中可以找到两个菜单项:Build RDF Index和SPARQL endpoint。Build RDF Index允许站点管理员手工索引站内数据;SPARQLendpoint提供了通过SPARQL语句检索RDF数据的界面,可以测试、检验SPARQL语句以及查询结果。
消费RDF关联数据
有了SPARQL Endpoint共享数据,我们便可以在其他站点消费本站点所生成的RDF数据,譬如在新闻聚合或者多个相关站点中共享信息。目前,在互联网上开放数据共享领域比较著名的DBpedia,它从Wikipedia页面中右侧的infobox分析Web上的信息。它允许我们对Wikipedia进行复杂的查询,并链接到相关的Wikipedia数据。DBpedia使得我们可以以多种方式来使用Wikipedia数据,而不仅仅是依赖搜索引擎。作为Linking Open Data计划中最早和最大的成就之一,它包含超过400万个事物的信息并包含3,220,000个数据本体(Ontology)。
Linking Open Data云是一个社区项目,它在网络上发布开放数据集并使用RDF将来自不同数据集的数据链接在一起。DBpedia 数据集在 Linking Open Data云中是非常重要的节点。此外,部分国家将可以信息公开的数据也发布在LOD中。在数据集之间建立链接意味着可以像浏览数据库一样浏览LOD云数据网络。
Linking Open Data社区项目截至2011年的数据见表2。

从表2中可以看出政府机构在关联开发数据领域占了相当的比重。英国政府依据网络发明者Tim Berners Lee先生的建议,参与了Linking open data项目,让政府机构和地方当局在线发布他们的公共数据。本文撰写时,已有10,333个数据集可用。其中一些数据集可通过SPARQL端点以RDF形式提供,比如Research funding数据集。此数据集包括超过43,334条英国各种基金管理机构创立的项目的相关信息。
在这里,我们以data.gov.uk Researchfunding数据集为例,该数据集包括DBpedia中的资源链接。来自Researchfunding数据集的每个项目都链接到其基金管理机构的DBpediaURI。一个这样的基金管理机构的例子就是工程和自然科学研究委员会(Engineering and PhysicalSciences Research Council,EPSRC),它的DBpedia URI为http://dbpedia.org/resource/Engineering_and_Physical_Sciences_Research_Council。访问此HTTPURI将可以看到DBpedia拥有的关于此机构的信息。
现在,数据位于Internet上两个独立的页面中(一个页面针对一个管理机构,另一个页面针对一个具体项目),没有页面会聚合可以同时在这两个页面上找到的大量信息。通过Drupal 7,我们可以构建这样一个包含两个相关数据信息的页面,既包含来自DBpedia 的数据,又包含Research funding 的数据。除了文中提到的模块外,还需要安装SPARQLViews模块。SPARQL Views添加了使用Views 查询SPARQL 端点并显示结果的功能,就像它们来自本地数据库一样。
具体操作步骤本文不再赘述,示例可以参考Lin Clark 的The Semantic Web,Linked Data and Drupal, Part2: Combinelinked datasets with Drupal 7 and SPARQLViews。
关联开放数据技术已经成为语义Web的一个研究方向,其具体实现虽然不依赖于特定的技术,但有了Drupal 7这个平台,我们可以比较容易地进行创新技术实践。上海海事大学的学校网站在实现基本的内容管理系统基础上,结合LinkedData、SPARQL等技术实现了数据开放的功能。鉴于网站的信息公开性、新闻性,我们还将继续研究针对学校的可公开数据参与Linking Open Data社区项目中,共享开放我们的数据。在实践中反向促进对该Linked Data技术的研究。
(作者单位为上海海事大学)

特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。