Golem.de - Common Crawl FoundationIT-News fuer Profis
https://www.golem.de/specials/common-crawl-foundation/
2024-03-19T04:19:02+01:00Golem.de - Common Crawl Foundation
https://www.golem.de/
https://www.golem.de/staticrl/images/golem-rss.pngtext/html2012-12-18T09:01:00+01:00https://www.golem.deGolem.deFreier Webindex: Blekko spendet 22 Milliarden Webseiten an Common Crawl
https://www.golem.de/news/freier-webindex-blekko-spendet-22-milliarden-webseiten-an-common-crawl-1212-96423.html
Die Suchmaschine Blekko stellt ihre Suchdaten zu rund 22 Milliarden Webseiten ab sofort der Common Crawl Foundation zur Verfügung. Die Stiftung stellt einen Webindex samt Metadaten wie Pagerank und Link-Graph zur Verfügung, den jeder frei nutzen kann. (<a href="https://www.golem.de/specials/common-crawl-foundation/">Common Crawl Foundation</a>, <a href="https://www.golem.de/specials/suchmaschine/">Suchmaschine</a>) <img src="https://cpx.golem.de/cpx.php?class=17&aid=96423&page=1&ts=1355817660" alt="" width="1" height="1" />Die Suchmaschine Blekko stellt ihre Suchdaten zu rund 22 Milliarden Webseiten ab sofort der Common Crawl Foundation zur Verfügung. Die Stiftung stellt einen Webindex samt Metadaten wie Pagerank und Link-Graph zur Verfügung, den jeder frei nutzen kann. (Common Crawl Foundation, Suchmaschine) ]]>text/html2011-11-08T09:07:00+01:00https://www.golem.deGolem.deCommon Crawl Foundation: Freier Webindex mit 5 Milliarden Seiten
https://www.golem.de/1111/87593.html
Die von Gil Elbaz ins Leben gerufene Common Crawl Foundation hat einen Webindex mit fünf Milliarden Seiten veröffentlicht, den jeder frei nutzen kann. Der Index enthält Metadaten wie Pagerank und einen Link-Graph. (<a href="https://www.golem.de/specials/common-crawl-foundation/">Common Crawl Foundation</a>, <a href="https://www.golem.de/specials/suchmaschine/">Suchmaschine</a>) <img src="https://cpx.golem.de/cpx.php?class=17&aid=87593&page=1&ts=1320739620" alt="" width="1" height="1" />8Die von Gil Elbaz ins Leben gerufene Common Crawl Foundation hat einen Webindex mit fünf Milliarden Seiten veröffentlicht, den jeder frei nutzen kann. Der Index enthält Metadaten wie Pagerank und einen Link-Graph. (Common Crawl Foundation, Suchmaschine) ]]>