HTTrack dañado en mi sitio

Nounours18200 Mensajes publicados 248 Fecha de registro   Estado Miembro Última intervención   -  
Nounours18200 Mensajes publicados 248 Fecha de registro   Estado Miembro Última intervención   -

Hola,

Estoy buscando usar HTTrack para descargar en mi PC la totalidad de mi sitio web WordPress cuya URL es threshold-lovers.com

Preciso que, como es mi sitio, podría modificar un archivo de WordPress que impidiera el funcionamiento de HTTrack si fuese necesario.

El último intento terminó con el siguiente error:

 -------------- HTTrack3.49-2+htsswf+htsjava launched on Sun, 20 Aug 2023 21:47:03 at www.threshold-lovers.com +*.png +*.gif +*.jpg +*.jpeg +*.css +*.js -ad.doubleclick.net/* -mime:application/foobar (winhttrack -qiC2%Ps2u1%s%uN0%I0p3DaK0H0%kf2A25000%f#f -F "Mozilla/4.5 (compatible; HTTrack 3.0x; Windows 98)" -%F "<!-- Mirrored from %s%s by HTTrack Website Copier/3.x [XR&CO'2014], %s -->" -%l "fr, en, *" www.threshold-lovers.com -O1 "C:\Mes Sites Web\essai1" +*.png +*.gif +*.jpg +*.jpeg +*.css +*.js -ad.doubleclick.net/* -mime:application/foobar ) Information, Warnings and Errors reported for this mirror: note: the hts-log.txt file, and hts-cache folder, may contain sensitive information, such as username/password authentication for websites mirrored in this project do not share these files/folders if you want these information to remain private 21:47:04 Warning: Moved Permanently for www.threshold-lovers.com/robots.txt 21:47:04 Warning: Redirected link is identical because of 'URL Hack' option: www.threshold-lovers.com/robots.txt and <https://www.threshold-lovers.com/robots.txt> 21:47:04 Warning: Warning moved treated for www.threshold-lovers.com/robots.txt (real one is <https://www.threshold-lovers.com/robots.txt>) 21:47:04 Warning: Moved Permanently for www.threshold-lovers.com/ 21:47:04 Warning: Redirected link is identical because of 'URL Hack' option: www.threshold-lovers.com/ and <https://www.threshold-lovers.com/> 21:47:04 Warning: File has moved from www.threshold-lovers.com/ to <https://www.threshold-lovers.com/> 21:47:04 Warning: No data seems to have been transferred during this session! : restoring previous one! -----------------------------------------------

¿Alguien tendría alguna solución?

Gracias

4 respuestas

NonoM45 Mensajes publicados 1018 Fecha de registro   Estado Miembro Última intervención   5
 

Buenas noches,

¿No vendría esto de vuestro archivo

 robots.txt 

Nos vemos

0
jordane45 Mensajes publicados 30426 Fecha de registro   Estado Moderador Última intervención   4 830
 

Hola,

El software HTTrack solo permite recuperar el código HTML generado... no entiendo el interés de usarlo para un sitio de WordPress...

¿Por qué no hacer una copia de seguridad de tu sitio (existen plugins para ello... o, si no, hacer un DUMP de la base de datos y recuperar los archivos fuente mediante transferencia FTP...)?

En fin... respecto a tu bloqueo, podría deberse a un archivo .htaccess


.
Cordialmente,
Jordane

0
Nounours18200 Mensajes publicados 248 Fecha de registro   Estado Miembro Última intervención   10
 

¿No provendrá esto de vuestro archivo robots.txt?

sí, quizá, pero no tengo ni idea de cómo modificarlo ??

¿Por qué no hacer una copia de seguridad de tu sitio (existen plugins para eso... o también, hacer un DUMP de la base de datos y una recuperación de los archivos fuente mediante transferencia FTP...)?

Yo también hago eso, de hecho, pero tenemos dificultades para hacerlo funcionar localmente en PC con WAMP o XAMPP, por eso busco aspirarlo con HTTrack.

Como el sitio es nuestro, podemos modificar (al menos temporalmente) cualquier archivo que impida esta aspiración, pero haría falta saber cuáles, o qué hay que hacer ???

0
jee pee Mensajes publicados 9435 Fecha de registro   Estado Moderador Última intervención   9 971
 

Hola,

Como indica @jordane45 httrack no es capaz de recuperar las fuentes PHP del sitio, tampoco la base de datos. Como mucho podría recuperar una versión estática en .html. Que es solo la versión de las páginas en el instante t.

Al tener acceso FTP al sitio puedes copiar todas las fuentes del sitio. Pero éstas no pueden funcionar sin la base de datos. Entonces hace falta una copia de seguridad de la base de datos. O usar funciones/complementos de WP para la transferencia del sitio.

0
Nounours18200 Mensajes publicados 248 Fecha de registro   Estado Miembro Última intervención   10
 

Desde entonces he encontrado una alternativa a HTTrack llamada "Cyotek" que ha clonado perfectamente mi sitio, imágenes y enlaces incluidos, como debería hacerlo HTTrack normalmente.

Como HTTrack siempre me ha hecho buenas copias locales de los sitios web, me dije que debería saber hacerlo, ¿no?

Entiendo bien lo que dices respecto a la copia de seguridad (por ejemplo, la base de datos), y lo hago desde hace años, pero si Cyotek copió perfectamente mi sitio, HTTrack debería poder hacer lo mismo...

0