Para usar un proxy en goutte, hay que pasar los detalles al cliente «Guzzle» que usa de la siguiente forma: use Goutte\Client; $client = new Client(); $guzzle = $client->getClient(); $guzzle->setDefaultOption('proxy', 'http://tu_ip_proxy:8080'); $client->setClient($guzzle);
Si estas usando Goutte y al extraer algun dato te da el siguiente error de: Uncaught InvalidArgumentException: The current node list is empty. Es problable que no se haya encontrado ningún elemento por el selector que hayas usado. Para evitar […]
Goutte es mi libreria php preferida para scrapeo web. A continuación un par de códigos básicos a modo de chuleta que más suelo usar a la hora de scrapear una página web. Click sobre links $link = $crawler->selectLink('Ver más')->link(); $crawler […]