Ir al contenido principal

Webscraping de una pagina - BeautifulSoup

from bs4 import BeautifulSoup
import requests

url = 'http://www.rava.com/precios/panel.php?m=LID'
page = requests.get(url)
soup = BeautifulSoup(page.content, 'html.parser')

panelLider = soup.select('table.tablapanel2')

elementos = list()
cont = 0
for lineasElementos in panelLider[0].find_all('tr', {"class" : ["ci", "cp"]}):
  elementos.append(lineasElementos.text.replace("\n", "|").split("|"))
  del elementos[cont][0] # Elimina primer elemento de la lista que es null
  del elementos[cont][-1] # Elimina el ultimo elemento de la lista que es null
  cont += 1

for elemento in elementos:
  print('Especie = ' + elemento[0])
  print('ultimo = ' + elemento[1])
  print('porc_Día= ' + elemento[2])
  print('Anterior= ' + elemento[3])
  print('Apertura= ' + elemento[4])
  print('Minimo= ' + elemento[5])
  print('Maximo= ' + elemento[6])
  print('Hora= ' + elemento[7])
  print('Vol_Nominal= ' + elemento[8])
  print('Vol_Efectivo= ' + elemento[9])
  print('==========================')

Comentarios

Entradas populares de este blog

Crear Excel con C# sin librerias de Office - SpreadsheetLight

En este ejemplo se crea un archivo Excel(xlsx) con dos hojas. La libreria hay que usar es SpreadsheetLight. El codigo es de un proyecto de consola y logicamente le falta el: using SpreadsheetLight;

Instalar Gdebi en ubuntu 12.04

Gdebi es para poder instalar paquetes .deb en ubuntu.Para empezar hay que abrir un terminal o consola y ejecutar esta linea. sudo aptitude install gdebi En el caso de no tener instalado “aptitude” hay dos opciones, usar “apt-get” o instalar “aptitude”. Para instalar “aptitude”: sudo apt-get install aptitude o para instalar con apt-get: sudo apt-get install gdebi