Autor Tema: Extraer los "LINK" [enlaces] de un sitio web  (Leído 3540 veces)

0 Usuarios y 1 Visitante están viendo este tema.

Desconectado xombra

  • Usuario Dedicado
  • ***
  • Mensajes: 175
  • Puntuación: 4
  • Sexo: Masculino
    • Ver Perfil
    • http://www.xombra.com
Extraer los "LINK" [enlaces] de un sitio web
« : 18 de marzo de 2008, 04:23:25 pm »
Este sencillo script nos permite extraer de un sitio web los enlaces que contiene. Su uso??? lo dejo a tu imaginación.

Código: [Seleccionar]
<?php // This script will extract all the hyperlinks from a given web page
// Thanks!
// (C) 2007 - Anthony Eden | www.WAY2WEB.net
// 
function hyperlinkextract($s1,$s2,$s){
  
$myarray=array();    $s1=strtolower($s1);
  
$s2=strtolower($s2); $l1=strlen($s1);
  
$l2=strlen($s2);     $scheck=strtolower($s);
  do{ 
$pos1 strpos($scheck,$s1);
  if(
$pos1!==false){
    
$pos2 strpos(substr($scheck,$pos1+$l1),$s2);
    if(
$pos2!==false){ $myarray[]=substr($s,$pos1+$l1,$pos2);
      
$s=substr($s,$pos1+$l1+$pos2+$l2);
      
$scheck=strtolower($s); } }
  } while ((
$pos1!==false)and($pos2!==false)); return $myarray
}

$enlace = &#39;http://www.xombra.com/&#39;;
$content file_get_contents($enlace);
$myarray hyperlinkextract("href=\"","\"",$content);

// Process all the links
foreach($myarray as $key => $val) {
echo 
"<br />".$val."\n"; }
?>

 8)
« Última Modificación: 18 de marzo de 2008, 05:43:11 pm por xombra »
---------------------------------------------
Sitio web: http://www.xombra.com
Coordinador Safecreative Venezuela - http://www.safecreative.org
Coordinador Regional AWVEN - http://www.awven.com
Twitter: @xombra
Identi.ca: xombra
GNU/Linux User: #414452
-------------------------------------

Desconectado ashrey

  • Moderador Global
  • Fanático
  • *****
  • Mensajes: 471
  • Puntuación: 7
  • Sexo: Masculino
  • Wombat Team
    • Ver Perfil
    • Blog de ABerroteran
Re: Extraer los "LINK" [enlaces] de un sitio web
« Respuesta #1 : 18 de marzo de 2008, 05:02:50 pm »
Buen codigo. Voy a usarlo en un buscador que tengo en mi servidor local.

Desconectado Xplorernet

  • Novato
  • *
  • Mensajes: 9
  • Puntuación: 0
  • Sexo: Masculino
    • Ver Perfil
Re: Extraer los "LINK" [enlaces] de un sitio web
« Respuesta #2 : 18 de marzo de 2008, 08:27:18 pm »
Exelente para complementar un modulo o algo similar a un Bot ;D

Desconectado danielperaza

  • Novato
  • *
  • Mensajes: 5
  • Puntuación: 0
    • Ver Perfil
Re: Extraer los "LINK" [enlaces] de un sitio web
« Respuesta #3 : 01 de septiembre de 2009, 12:14:30 pm »
Aunque mas lento, tal vez utilizar Expresiones Regulares simplificaria el trabajo y podria ser mas efectivo para captar datos 100% validos.

Desconectado datobinario

  • Novato
  • *
  • Mensajes: 10
  • Puntuación: 0
  • Sexo: Masculino
    • Ver Perfil
    • @datobinario
Re: Extraer los "LINK" [enlaces] de un sitio web
« Respuesta #4 : 10 de abril de 2010, 09:54:58 am »
Saludos, una preguntica, ¿cuales son los valores que requiere la función?
$s1,$s2,$s
Quien no pregunta, simplemente tiene miedo de aprender...

Desconectado xombra

  • Usuario Dedicado
  • ***
  • Mensajes: 175
  • Puntuación: 4
  • Sexo: Masculino
    • Ver Perfil
    • http://www.xombra.com
Re: Extraer los "LINK" [enlaces] de un sitio web
« Respuesta #5 : 23 de mayo de 2010, 11:03:44 pm »

Cita
Saludos, una preguntica, ¿cuales son los valores que requiere la función?
$s1,$s2,$s

Allí estan en el mismo código

Código: [Seleccionar]

$enlace = 'http://www.xombra.com/';
$content = file_get_contents($enlace);

$myarray = hyperlinkextract("href=\"","\"",$content);


---------------------------------------------
Sitio web: http://www.xombra.com
Coordinador Safecreative Venezuela - http://www.safecreative.org
Coordinador Regional AWVEN - http://www.awven.com
Twitter: @xombra
Identi.ca: xombra
GNU/Linux User: #414452
-------------------------------------

Desconectado Telfe

  • Novato
  • *
  • Mensajes: 4
  • Puntuación: 0
    • Ver Perfil
Re:Extraer los "LINK" [enlaces] de un sitio web
« Respuesta #6 : 21 de enero de 2011, 08:16:02 am »
Gracias por el codigo, muy bueno.
Saludos

Desconectado patadeperro

  • Novato
  • *
  • Mensajes: 1
  • Puntuación: 0
    • Ver Perfil
Re:Extraer los "LINK" [enlaces] de un sitio web
« Respuesta #7 : 09 de noviembre de 2013, 06:24:55 am »
excelente codigo, cree la cuenta  para agradecer, disculpa amigo si quiero que el "resultado" me lo guarde en un txt si corro el php en mi linux

pongo
system (echo "http://www.projectvoyeur.com/contributions/".$val."\n" > links.txt );

pero creo que no es asi :/