Cuestión : Datos que raspan del HTML de otro Web site usar el PHP

Hola allí,

I que intenta raspar un ciertos datos de una tabla del HTML en el Web site de una estación de radio local. Tienen canciones recientemente jugadas lista y quisiera hacer algún analytics en eso página de data.

The que estoy intentando recuperar los datos de estoy disponible aquí: ¿href= " http://www.channel103.com/music/index.php?qty=100 " del " _blank " del target= del

/music/index.php de http://www.channel103.com? el qty=100

Fortunately la tabla se genera automáticamente y la cantidad de canciones que exhibe se basa en el valor tomado del URL así que tengo un grupo de datos potencialmente ilimitado a trabajar con (aunque he especificado 100 canciones como ejemplo). el

I quisiera eventual terminar para arriba con los datos de eso la tabla en un arsenal o una base de datos del mysql (quiero la época información jugada, de la canción y del artista para cada entrada.) No obstante soy inseguro en cuanto a cómo ir alrededor a conseguir esa información (yo es nuevo al PHP que programa, pero entiendo la mayoría de los conceptos programados de la base por lo menos a un nivel básico). el

I ha jugado alrededor con usar expresiones regulares y así sucesivamente y ha manejado escribir una escritura que enumera a la canción y a artista actual que juegan, no obstante ahora he venido a una parada y no puedo entrenamiento adonde ir después. He tenido una mirada alrededor en la red y aquí en EE y XPATH parece ser una ruta común para los problemas similares pero estoy luchando para conseguir a los apretones con it.

Here soy el código del PHP que he escrito hasta ahora (confundido masivo por la salida estoy consiguiendo!):

class= > " claro " del
> del " codeSnippet " del class= del
class= " lineNumbers " del
class= del
1:
2:
3:
4:
5:
6:
7:
8:
9:
10:
11:
12:
13:
14:
15:
16:
17:
18:
19:
20:
21:
22:
23:
24:
25:
26:
27:
28:
29:
30:
31:
32:
33:
34:
35:
36:
37:
38:
39:
40:
41:
42:
43:
44:
45:
46:
47:
48:
49:
50:
51:
52:
53:
54:
55:
56:
57:
58:
¡>< notpretty " del class= " del id= " codeSnippet964686 del
xmlns= " http://www.w3.org/1999/xhtml " del 


	Contenido-Tipo " texto/HTML del http-equiv= " del 
	103 Analysis de los Tom
	type= " texto/css "/> del " stylesheet " del rel= del href= " style.css " del <link
</head>

<body>

¿<? PHP 

Autor de/*: 	Tom Hacquoil
	Fecha: 		25 de agosto de 2010 *


PARTE 1 de/*: Conseguir actual que juega a la canción y a artista. *

	# poner el contenido de la fuente del Web site de la destinación en una variable “contenta”.
	$content = file_get_contents ('http://www.channel103.com/music/index.php?qty=50');
	
	# usar expresiones regulares, explorar el archivo y cada vez que ocurre un fósforo, poner los datos en el arsenal de los “datos”.
	preg_match (“#<div><span>now que juega el – href= " http://www.channel103.com/music/index.php " de </span><a > (. *) </a><span> (. *) </span></div>#”, $content, $data);
	
	# asignar el contenido del arsenal de los “datos” a dos variables, canciones y artistas.
	$song = $data [1];
	$artist = $data [2];
	
	# impresión el contenido de esas variables.
	<strong>Song del eco “: </strong> $song - <strong>Artist: </strong> $artist \ n”;
	
	eco “<br/><br/>”;
	
	
PARTE 2 de/*: Conseguir una lista de todas las canciones recientemente jugadas. *

	# poner el contenido de la fuente del Web site de la destinación en una variable “contenta”.
	$content = file_get_contents ('http://www.channel103.com/music/index.php?qty=20333');
	
	# usar expresiones regulares, explorar el archivo y cada vez que ocurre un fósforo, poner los datos en el arsenal de los “datos”.
	preg_match (“><td> del class= " tabletextRow1 " del #<tr (. *) </td>#”, $content, $data);
	
	# primera entidad de la impresión del arsenal (para la prueba).
	eco $data [1];
	
	eco “<br/><br/><br/>”;
	
	# impresión el arsenal entero. (Para la prueba).
	print_r ($data);
		

¿? >

</body>

</html>
</pre>
           </td>
         </tr>
       </table></div>
</div>
   
class= ></div> " claro " del <div
    
class= " qRelatedRow " del <div >
    soluciones >Related <span del " nombre " del class=: </span>
    class= <span " valor " >
cheque del title= el " de " /Web_Development/Web_Languages-Standards/PHP/Q_26431870.html del href= " del <a un arsenal para los duplicados y me notifica si ocurre una duplicación " " qRelatedChild " del class= >Check un arsenal para los duplicados y me notifica si una duplicación occurs</a></span>
  </span></h4>
</td>
</tr>
  <tr><td height="2px"></td></tr> 
  
  <tr style="background-color:#f2f4f6"><td >
<h2 style="font-family:Verdana, Arial, Helvetica, sans-serif;font-size:14px;color:red;font-weight:bold">
<span id="ContentPlaceHolder1_tieude_as">Respuesta : Datos que raspan del HTML de otro Web site usar el PHP</span>
</h2></td></tr>
  <tr>
<td valign="top"> 
<h5><span id="ContentPlaceHolder1_ans" style="font-family:Tahoma,Geneva,sans-serif;font-size:12px;font-weight:normal;color:#000000">
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
 
<div class="KonaBody"><div class="richText">
Tom,  <br />No soy un experto en regex, pero usted debe utilizar el preg_match_all que vuelve un arsenal algo que una secuencia. El código atado imprimirá el título del artista y de la canción. Estoy seguro si usted manipula el regex que usted extraerá solamente los datos usted quiere, pues es el arsenal es [0] canción del artista del tiempo de la canción del artista del tiempo 1] [[2] [3].<br /><br />Usted podría incluso reducir este regex y utilizar el substr en el primer arsenal para extraer el Info que usted quiere.<br /><br />(Reduje el número de artículos extraídos a 10 así que no conseguiría una cantidad de información bonkers)</div></div> <!-- text-ad & richText -->
                      <span class="isBotVideo"></span> <div class="codeSnippet">
                       <table>
         <tr>
           <td class="lineNumbers">
             <pre>
1:
2:
3:
4:
5:
6:
7:
8:
9:
10:
11:
12:
13:
14:
15:
16:
17:
18:
19:
20:
</pre>
           </td>
           <td class="codeBody">
             <pre id="codeSnippet969377" class="notpretty"><?php 


/* PART 2: Get a list of all recently played songs. */

	# Put the contents of the source of the destination website into a 'content' variable.
	$content = file_get_contents('http://www.channel103.com/music/index.php?qty=10');
	
	$pattern = '#<tr class="tabletextRow.">\r\n<td>(.*)</td>\r\n<td>(.*)</td>\r\n<td>(.*)#';
	
	preg_match_all ($pattern, $content, $data);
	
	//var_dump($data);
	
	for ($i = 0; $i < 11; $i++)
	{
	    echo "<br /><br />". $data[2][$i].' '.$data[3][$i];
	}
	
?>	</pre>
           </td>
         </tr>
       </table></div>
         <div class="openInNewWindow">
         <div class="bTypeA bGlowSmall bGlowSmallGray"><div class="glowLeft"></div><div class="glowMiddle" style="padding-left: 15px; padding-right: 15px;"><div class="t2i" style="background: url(http://t2i.experts-exchange.com/t/419106-50.png) no-repeat;width:109px;height:12px;"></div></div><div class="glowRight"></div></div></div>
         <div class="selectAll">
         <div class="bTypeA bGlowSmall bGlowSmallGray"><div class="glowLeft"></div><div class="glowMiddle" style="padding-left: 15px; padding-right: 15px;"><div class="t2i" style="background: url(http://t2i.experts-exchange.com/t/421794-50.png) no-repeat;width:53px;height:12px;"></div></div><div class="glowRight"></div></div></div>
       <div class="clear"></div>
</div>
</span></h5>
</td>
</tr>
<tr><td height="5px"></td></tr>

 <tr>
                            <td><table width="100%" border="0" cellspacing="0" cellpadding="0">
                              <tr>
                                <td><table width="100%" height="25px" border="0" cellspacing="0" cellpadding="0">
                                  <tr>

                                    <td width="100px" bgcolor="#FFFFFF" style="padding-left:5px"><span class="f11blue">Otras soluciones</span></td>
                                    <td background="http://programming4.us/images/bg-ch.gif"> </td>
                                  </tr>
                                </table></td>
                              </tr>
                              <tr>
                                <td style="padding:5px">
                                <div>
                                    <table id="ContentPlaceHolder1_DataList2" cellspacing="0" style="width:100%;border-collapse:collapse;">
		<tr>
			<td>
<table>
<tr>
<td valign="top" align="left">
<a href='http://faq.wmlcloud.com/es/microsoft/2396.aspx' class="a4">
<li> Cómo fijar un número de líneas en un informe</li></a>
</td>
</tr>
</table>
</td>
		</tr><tr>
			<td>
<table>
<tr>
<td valign="top" align="left">
<a href='http://faq.wmlcloud.com/es/microsoft/13936.aspx' class="a4">
<li> Cómo fijar extremo del aeropuerto como servidor del DHCP en el LAN con SonicWall</li></a>
</td>
</tr>
</table>
</td>
		</tr><tr>
			<td>
<table>
<tr>
<td valign="top" align="left">
<a href='http://faq.wmlcloud.com/es/software/35212.aspx' class="a4">
<li> Ediciones del enlace hipertexto</li></a>
</td>
</tr>
</table>
</td>
		</tr><tr>
			<td>
<table>
<tr>
<td valign="top" align="left">
<a href='http://faq.wmlcloud.com/es/microsoft/1352.aspx' class="a4">
<li> Agregar la fecha a MySQL</li></a>
</td>
</tr>
</table>
</td>
		</tr><tr>
			<td>
<table>
<tr>
<td valign="top" align="left">
<a href='http://faq.wmlcloud.com/es/microsoft/28736.aspx' class="a4">
<li> Pares de las preguntas de Apple</li></a>
</td>
</tr>
</table>
</td>
		</tr><tr>
			<td>
<table>
<tr>
<td valign="top" align="left">
<a href='http://faq.wmlcloud.com/es/microsoft/16828.aspx' class="a4">
<li> El DNS reverso no empareja la bandera del smtp</li></a>
</td>
</tr>
</table>
</td>
		</tr><tr>
			<td>
<table>
<tr>
<td valign="top" align="left">
<a href='http://faq.wmlcloud.com/es/microsoft/22260.aspx' class="a4">
<li> ¿Cómo puedo funcionar conmigo PC en modo seguro?</li></a>
</td>
</tr>
</table>
</td>
		</tr><tr>
			<td>
<table>
<tr>
<td valign="top" align="left">
<a href='http://faq.wmlcloud.com/es/microsoft/10352.aspx' class="a4">
<li> HISTOGRAMA CON EL CP Y EL ANÁLISIS DE CPK</li></a>
</td>
</tr>
</table>
</td>
		</tr><tr>
			<td>
<table>
<tr>
<td valign="top" align="left">
<a href='http://faq.wmlcloud.com/es/microsoft/31628.aspx' class="a4">
<li> reglas no corrientes de la perspectiva</li></a>
</td>
</tr>
</table>
</td>
		</tr><tr>
			<td>
<table>
<tr>
<td valign="top" align="left">
<a href='http://faq.wmlcloud.com/es/software/37060.aspx' class="a4">
<li> volver un valor</li></a>
</td>
</tr>
</table>
</td>
		</tr>
	</table>

                               
                                </div></td>
                              </tr>
                            </table></td>
                          </tr>

</table>
                    
</div>
                  </td></tr>
                  </table>
                  </form>
                         </td>

                        </tr>
                    
                      <tr>
                        <td> </td>
                        </tr>
                      </table></td>
                    </tr>
                  </table></td>
              </tr>
              </table></td>

        

            </tr>
          </table>

 
         </td>
      </tr>

<tr>
            <td><table width="100%" border="0" cellspacing="0" cellpadding="0">
              <tr>
                <td background="http://tutorial.wmlcloud.com/images/bg-mn.jpg" height="30px" style="padding:5px;color:#ffffff;font-size:12px; font-family:Tahoma, Geneva, sans-serif;text-decoration: none;" ></td>
              </tr>
              <tr>
                <td><table width="100%" border="0" cellspacing="0" cellpadding="0">


 <tr>

                    <td><table width="100%" border="0" cellspacing="0" cellpadding="0">
                        <tr>
                          <td><img src="http://tutorial.wmlcloud.com/images/bo-l.png" alt="programming4us" width="8" height="9" /></td>
                          <td bgcolor="#FFFFFF" width="100%"></td>
                          <td><img src="http://tutorial.wmlcloud.com/images/bo-r.png" alt="programming4us" width="8" height="9" /></td>
                        </tr>
                    </table></td>
                  </tr>
                </table></td>

              </tr>
            </table></td>
          </tr>
<tr><td height="2px"></td></tr>
<tr><td>
<div align="center">


</div>
</td>
</tr>
 <tr><td height="3px"></td></tr>

      <tr>
        <td height="2px"></td>
      </tr>
      <tr>
        <td align="left">
        <table cellpadding="0" cellspacing="0" width="100%" align="left">
        <tr>
        <td valign="top">
          <div id="en"><a href='http://faq.wmlcloud.com/software/106166.aspx'><img src='http://faq.wmlcloud.com/flags/en.gif'></a></div>
        </td>
          <td valign="top">
          <div id="de"><a href='http://faq.wmlcloud.com/de/software/106166.aspx'><img src='http://faq.wmlcloud.com/flags/de.gif'></a></div>
        </td>
          <td valign="top">
          <div id="es"><a href='http://faq.wmlcloud.com/es/software/106166.aspx'><img src='http://faq.wmlcloud.com/flags/es.gif'></a></div>
        </td>
          <td valign="top">
          <div id="fr"><a href='http://faq.wmlcloud.com/fr/software/106166.aspx'><img src='http://faq.wmlcloud.com/flags/fr.gif'></a></div>
        </td>
          <td valign="top">
          <div id="nl"><a href='http://faq.wmlcloud.com/nl/software/106166.aspx'><img src='http://faq.wmlcloud.com/flags/nl.gif'></a></div>
        </td>
          <td valign="top">
          <div id="it"><a href='http://faq.wmlcloud.com/it/software/106166.aspx'><img src='http://faq.wmlcloud.com/flags/it.gif'></a></div>
        </td>
          <td valign="top">
          <div id="ru"><a href='http://faq.wmlcloud.com/ru/software/106166.aspx'><img src='http://faq.wmlcloud.com/flags/ru.gif'></a></div>
        </td>
         <td valign="top">
          
        </td>
         <td valign="top">
          
        </td>
        
         <td valign="top">
          
        </td>
         <td valign="top">
          
        </td>
         <td valign="top">
          
        </td>
        </tr>
        </table>
        </td>
      </tr>
        <tr>
        <td height="2px"></td>
      </tr>

</td></tr>


 
</table>
		<script src="//cdn.intergient.com/ramp_core.js"></script>	

</body>
</html>