Autodescargar subtítulos de Subtitulos.es

2 oct

Las instituciones educativas suelen estar preocupadas porque sus estudiantes visiten sitios tan peligrosos como blogs de diarios españoles y páginas de subtítulos, por lo que en Escocia no tengo acceso a TVSubtitles, la página de donde solía autodescargar subtítulos.

Para no tener que descargarlos manualmente, he creado un script en Python que los autodescarga del sitio español subtitulos.es, donde también suele haber subtítulos en inglés y en otros idiomas.

El script es muy simple y y tiene la gran desventaja de que descarga todos los capítulos de la temporada que le indiquemos, no sólo los más nuevos o los de un único idioma. Para incluir las series que desees, únicamente tienes que subtitulos los valores de la lista que hay al principio del código. El código de cada serie lo puedes ver en subtitulos.es.

Sobre los parámetro empleados al ejecutar wget:

  • Para conserver el nombre del archivo que nos envía el servidor en las cabeceras HTTP, empleo –content-disposition permit
  • Para evitar la protección contra hotlinking del servidor, utilizo –referer=”http://www.subtitulos.es”
  • Para que no sobreescriba los ficheros, empleo -nc

import os
import urllib
import re

# Lista de series a descargar
# El primer número de la tupla es el número de la serie
# El segundo es la temporada
lista = [
		(26, 4),	# The Big Bang Theory
		(382, 2),	# Modern Family
		(13, 5),	# Dexter
		(367, 2),	# Community
		(24, 7),	# House
		(62, 7),	# The Office
		(35, 6),	# Weeds
		]

for serie in lista:
	# Obtenemos el contenido de la web
	url = 'http://www.subtitulos.es/ajax_loadShow.php?show=' + str(serie[0]) + '&season=' + str(serie[1])
	content = urllib.urlopen(url).read()

	# Buscamos todos los enlaces
	encontrados = re.findall('href="(.+)">', content)

	# Los descargamos, fingiendo que venimos de subtitulos.es
	# y usando el nombre que envía el servidor
	for resultado in encontrados:
		print resultado
		os.system('wget --content-disposition --referer="http://www.subtitulos.es" -nc ' + resultado)

About these ads

6 comentarios hacia “Autodescargar subtítulos de Subtitulos.es”

  1. nevusdotcom 21 marzo, 2012 a 16:26 #

    Estoy desarrollando una version en PHP para la descarga y un poco mas elaborada tambien, si te interesa contactame ;) si pudieras traducir ese codigo a un lenguaje compilado seria interesante.

  2. Alejandro 7 junio, 2012 a 13:49 #

    Muchas gracias =). Aun sigue funcionando.

  3. DevNuLL 6 diciembre, 2012 a 7:00 #

    Excelente! Andaba haciendo exactamente este script y en python para mas inri, hasta que no vi tu código no caí en el referer (me estaba mareando con el FireBug y la web para saber que era). Un saludo y gracias por compartir tus scripts con el resto de los mortales :)

Trackbacks/Pingbacks

  1. Autodescargar subtítulos de TVSubtitles « JOSÉ LUIS LÓPEZ PINO - 2 octubre, 2010

    [...] Actualización: he publicado otra entrada sobre cómo autodescargar subtítulos de Subtitulos.es [...]

  2. Tweets that mention Autodescargar subtítulos de Subtitulos.es « JOSÉ LUIS LÓPEZ PINO -- Topsy.com - 2 octubre, 2010

    [...] This post was mentioned on Twitter by Javier Martinez, José Luis López Pino. José Luis López Pino said: Autodescargar subtítulos de Subtitulos.es: http://wp.me/pU7NV-9y [...]

Deja un comentario

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Conectando a %s

Seguir

Recibe cada nueva publicación en tu buzón de correo electrónico.

%d bloggers like this: