Dokumentenserver


Springe direkt zu:Inhalt


Service-Navigation


Hauptnavigation/Hauptmenü: Links auf direkt erreichbare, übergeordnete Webseiten


Grafischer Identitätsbereich:




Navigation/Menü: Links auf weitere Seiten dieser Website


Navigationspfad:

Navigation: FU - Dokumentenserver

Drucken Icon


Objekt-Metadaten

Web Data Commons – Extracting Structured Data from Two Large Web Corpora
Bizer, Christian

HaupttitelWeb Data Commons – Extracting Structured Data from Two Large Web Corpora
AutorBizer, Christian; Mühleisen, Hannes
Seitenzahl4 S.
Auch erschienen inLDOW2012, April 16, 2012, Lyon, France
URL des OriginaldokumentsURL >>
Fachbereich/EinrichtungFB Wirtschaftswissenschaft
Arbeitsbereich/InstitutWirtschaftsinformatik
Erscheinungsjahr2012
Dokumentepdf-Datei
Falls Ihr Browser eine Datei nicht öffnen kann, die Datei zuerst herunterladen und dann öffnen.
DDC004 Datenverarbeitung; Informatik
Dokumententyp/-SammlungenAufsatz in Konferenzschrift
Medientyp/FormatText
AbstractMore and more websites embed structured data describing for instance products, people, organizations, places, events, resumes, and cooking recipes into their HTML pages using encoding standards such as Microformats, Microdatas and RDFa. The Web Data Commons project extracts all Microformat, Microdata and RDFa data from the Common Crawl web corpus, the largest and most up-todata web corpus that is currently available to the public, and provides the extracted data for download in the form of RDF-quads. In this paper, we give an overview of the project and present statistics about the popularity of the different encoding standards as well as the kinds of data that are published using each format.
SpracheEnglisch
Rechte Nutzungsbedingungen
Zugriffstatistik
 
Statische URLhttp://edocs.fu-berlin.de/docs/receive/FUDOCS_document_000000014832
Erstellt am25.10.2012 - 12:26:08
Letzte Änderung08.11.2012 - 14:49:16
 

 
© 2009 Universitätsbibliothek der Freien Universität Berlin | Feedback |
Stand: 21.07.2008

Diese Grafiken werden nur in der Druckvorschau verwendet: