﻿{"id":651,"date":"2009-02-23T16:57:06","date_gmt":"2009-02-23T15:57:06","guid":{"rendered":"http:\/\/wallaby.at\/news\/?p=651"},"modified":"2009-02-23T16:57:06","modified_gmt":"2009-02-23T15:57:06","slug":"suchans%c3%a4tze-in-die-tiefen-des-internets","status":"publish","type":"post","link":"https:\/\/wallaby.de\/news\/suchmaschine\/suchans%c3%a4tze-in-die-tiefen-des-internets-p651.html","title":{"rendered":"Suchans\u00e4tze &#8211; In die Tiefen des Internets"},"content":{"rendered":"<div class=\"entry-content\" itemprop=\"text\">\n<p>New York (pte\/23.02.2009\/11:11) &#8211; Die Google-Suche erfasst inzwischen \u00fcber eine Bio. Webadressen, doch das ist nur ein Bruchteil des gesamten Internets. In Datenbanken liegen gewaltige Informationsmengen von Einkaufskatalogen \u00fcber Flugpl\u00e4ne bis hin zu wissenschaftlichen Forschungsergebnissen verborgen, die mit aktuellen Methoden kaum erfasst werden k\u00f6nnen. Neue Technologien beginnen nun, diese Tiefen des Internets zu erforschen, um die Qualit\u00e4t der Online-Suche zu verbessern, berichtet die New York Times. Ein Zugang ist dabei, mittels Testanfragen herauszufinden, mit welchen Begriffen Datenbanken ihre Geheimnisse entlockt werden k\u00f6nnen.<\/p>\n<p>Suchmaschinen setzen zur Indizierung auf Crawler, die Links auf Webseiten folgen und so Informationen sammeln k\u00f6nnen, bei Datenbanken aber relativ schnell an ihre Grenzen sto\u00dfen. Das wollen Forscher mit neuen Technologien \u00e4ndern. Das Projekt DeepPeep http:\/\/www.deeppeep.org der University of Utah strebt an, sowohl Durchschnitts-Usern als auch Anwendungsentwicklern besseren Zugang zu den Inhalten \u00f6ffentlicher Web-Datenbanken zu bieten. Um diese Quellen zu indizieren setzt man darauf, zun\u00e4chst mit einigen Begriffen Testanfragen an die Datenbanken zu stellen und die Ergebnisse zu analysieren. &#8222;So k\u00f6nnen wir ein Verst\u00e4ndnis der Datenbanken entwickeln und ermitteln, nach welchen Worten wir gezielt suchen sollen&#8220;, sagt Projektleiterin Juliana Freire. Insgesamt k\u00f6nnen dann mit gezielten Anfragen mehr als 90 Prozent der Datenbank-Inhalte erfasst werden, so Freire.<\/p>\n<figure id=\"attachment_652\" aria-describedby=\"caption-attachment-652\" style=\"width: 275px\" class=\"wp-caption alignleft\"><a href=\"http:\/\/wallaby.at\/news\/wp-content\/uploads\/image\/deeppeep-logo.jpg\"><img loading=\"lazy\" decoding=\"async\" class=\"size-medium wp-image-652\" title=\"deeppeep.org-logo\" src=\"http:\/\/wallaby.at\/news\/wp-content\/uploads\/image\/deeppeep-logo.jpg\" alt=\"deeppeep-logo\" width=\"275\" height=\"212\" \/><\/a><figcaption id=\"caption-attachment-652\" class=\"wp-caption-text\">mit deeppeep.org verstecktes Web indizieren?<\/figcaption><\/figure>\n<p><strong>Erforschen von Datenbanken als wichtiger Schri<\/strong>tt<\/p>\n<p>Ein Grundproblem dabei, die verborgenen Inhalte der vielen Mio. Datenbanken im Web sinnvoll zug\u00e4nglich zu machen, ist, dass Suchmaschinen wissen m\u00fcssen, welche Datenbanken am ehesten zu einer Anfrage passende Informationen enthalten. Au\u00dferdem muss klar sein, wie Fragen an die Datenbank gestellt werden m\u00fcssen, um ihr auch tats\u00e4chlich Inhalte zu entlocken. &#8222;Das ist das interessanteste vorstellbare Problem in Sachen Datenintegration&#8220;, so Alon Halevy, Computerwissenschaftler und Leiter eines Google-Teams, das sich mit dem Problem auseinandersetzt. Googles Zugang zur Datenbank-Indizierung nutzt dabei ein Analyseprogramm. \u00c4hnlich wie<\/p>\n<p><!--more--><\/p>\n<p>DeepPeep setzt man darauf, mithilfe von Testanfragen ein Modell zur Vorhersage von Datenbank-Inhalten zu erstellen.<\/p>\n<p>Wenn Inhalte aus den Tiefen des Webs in Suchergebnisse integriert werden sollen, stellt sich auch die Frage der Pr\u00e4sentation. Das Start-up Kosmix http:\/\/www.kosmix.com setzt darauf, eine Art themenspezifische Web-Startseite zu generieren. &#8222;Die meisten Suchmaschinen versuchen, die Nadel im Heuhaufen zu finden. Aber wir versuchen dabei zu helfen, den Heuhaufen zu erforschen&#8220;, sagt Kosmix-Mitgr\u00fcnder Anand Rajaraman. Eine echte Herausforderung k\u00f6nnte die Integration der zus\u00e4tzlichen Inhalte in die Ergebnisse der Google-Suche werden. Das Unternehmen hat gr\u00f6bere \u00c4nderungen am Format der Suchergebnisse bislang eher vermieden. &#8222;Sie wollen ein besseres Nutzererlebnis schaffen, m\u00fcssen aber sehr vorsichtig mit \u00c4nderungen sein, um nicht die User zu verstimmen&#8220;, meint Chris Sherman von der Suchmaschinen- und Suchmarketingplattform Search Engine Land.<\/p>\n\n\n<\/div>\n","protected":false},"excerpt":{"rendered":"<div class=\"entry-summary\" itemprop=\"text\">\n<p>New York (pte\/23.02.2009\/11:11) &#8211; Die Google-Suche erfasst inzwischen \u00fcber eine Bio. Webadressen, doch das ist nur ein Bruchteil des gesamten Internets. In Datenbanken liegen gewaltige Informationsmengen von Einkaufskatalogen \u00fcber Flugpl\u00e4ne bis hin zu wissenschaftlichen Forschungsergebnissen verborgen, die mit aktuellen Methoden kaum erfasst werden k\u00f6nnen. Neue Technologien beginnen nun, diese Tiefen des Internets zu erforschen, um &#8230;<\/p>\n\n<\/div>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[6],"tags":[],"_links":{"self":[{"href":"https:\/\/wallaby.de\/news\/wp-json\/wp\/v2\/posts\/651"}],"collection":[{"href":"https:\/\/wallaby.de\/news\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/wallaby.de\/news\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/wallaby.de\/news\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/wallaby.de\/news\/wp-json\/wp\/v2\/comments?post=651"}],"version-history":[{"count":0,"href":"https:\/\/wallaby.de\/news\/wp-json\/wp\/v2\/posts\/651\/revisions"}],"wp:attachment":[{"href":"https:\/\/wallaby.de\/news\/wp-json\/wp\/v2\/media?parent=651"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/wallaby.de\/news\/wp-json\/wp\/v2\/categories?post=651"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/wallaby.de\/news\/wp-json\/wp\/v2\/tags?post=651"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}