Autodescargar subtítulos de Subtitulos.es

2 oct

Las instituciones educativas suelen estar preocupadas porque sus estudiantes visiten sitios tan peligrosos como blogs de diarios españoles y páginas de subtítulos, por lo que en Escocia no tengo acceso a TVSubtitles, la página de donde solía autodescargar subtítulos.

Para no tener que descargarlos manualmente, he creado un script en Python que los autodescarga del sitio español subtitulos.es, donde también suele haber subtítulos en inglés y en otros idiomas.

El script es muy simple y y tiene la gran desventaja de que descarga todos los capítulos de la temporada que le indiquemos, no sólo los más nuevos o los de un único idioma. Para incluir las series que desees, únicamente tienes que subtitulos los valores de la lista que hay al principio del código. El código de cada serie lo puedes ver en subtitulos.es.

Sobre los parámetro empleados al ejecutar wget:

  • Para conserver el nombre del archivo que nos envía el servidor en las cabeceras HTTP, empleo –content-disposition permit
  • Para evitar la protección contra hotlinking del servidor, utilizo –referer=”http://www.subtitulos.es”
  • Para que no sobreescriba los ficheros, empleo -nc

import os
import urllib
import re

# Lista de series a descargar
# El primer número de la tupla es el número de la serie
# El segundo es la temporada
lista = [
		(26, 4),	# The Big Bang Theory
		(382, 2),	# Modern Family
		(13, 5),	# Dexter
		(367, 2),	# Community
		(24, 7),	# House
		(62, 7),	# The Office
		(35, 6),	# Weeds
		]

for serie in lista:
	# Obtenemos el contenido de la web
	url = 'http://www.subtitulos.es/ajax_loadShow.php?show=' + str(serie[0]) + '&season=' + str(serie[1])
	content = urllib.urlopen(url).read()

	# Buscamos todos los enlaces
	encontrados = re.findall('href="(.+)">', content)

	# Los descargamos, fingiendo que venimos de subtitulos.es
	# y usando el nombre que envía el servidor
	for resultado in encontrados:
		print resultado
		os.system('wget --content-disposition --referer="http://www.subtitulos.es" -nc ' + resultado)

Advertisement

2 comentarios hacia “Autodescargar subtítulos de Subtitulos.es”

Trackbacks/Pingbacks

  1. Autodescargar subtítulos de TVSubtitles « JOSÉ LUIS LÓPEZ PINO - 2 octubre, 2010

    [...] Actualización: he publicado otra entrada sobre cómo autodescargar subtítulos de Subtitulos.es [...]

  2. Tweets that mention Autodescargar subtítulos de Subtitulos.es « JOSÉ LUIS LÓPEZ PINO -- Topsy.com - 2 octubre, 2010

    [...] This post was mentioned on Twitter by Javier Martinez, José Luis López Pino. José Luis López Pino said: Autodescargar subtítulos de Subtitulos.es: http://wp.me/pU7NV-9y [...]

Deja un comentario

Fill in your details below or click an icon to log in:

Logo de WordPress.com

You are commenting using your WordPress.com account. Log Out / Cambiar )

Twitter picture

You are commenting using your Twitter account. Log Out / Cambiar )

Facebook photo

You are commenting using your Facebook account. Log Out / Cambiar )

Connecting to %s

Seguir

Get every new post delivered to your Inbox.