Common Crawl: el archivo de la web con fines de investigación
Common Crawl es un rastreador de Internet que si te permite acceder a los datos y no los utiliza con ánimo de lucro como lo hace Google, Bing y el resto de buscadores. Este rastreador es un proyecto sin ánimo de lucro que desde el año 2011 rastrea Internet y construye un archivo completamente accesible […]
Common Crawl: el archivo de la web con fines de investigación Read More »