Abi yazıyor işte, https://cnr0.org site bu.
Amaç da ödediğim kol gibi saas faturasından kurtulup amazon s3 üzerinde statik http olarak siteyi yayına vermek tekrardan.
Adamlar tasarımla birlikte çıkarmıyor asla (haklı olarak), sadece içerik olarak veriyor sana. Ben raw text istemiyorum, bildiğin ne varsa html'e döksün çıkarsın.
ben de yazmak istiyorum da gerçekten hiç vaktim yok artık. statiğe çevirecek bile vaktim yok. zaten çeviremezsem kapatıcam siteyi. ayda 40-50 lira yakmaya başladı.
Bak yaziyorum adim adim calistiracaginiz komutlari.
Once sitemap'i download ediceniz.
wget cnr0.org/sitemap.xml
Sonra sitemap icinden link'leri extract ediceniz. static1.squarespace.com imajlarin host edildigi yer, haliyle onlari istemiyoruz simdilik. O yuzden grep -v var.
sed '/loc/!d;s/.*>([^<]*)<.*/1/' sitemap.xml | grep -v static1.squarespace.com > links.txt
Son olarak da link'leri loop edip download ediceniz. Burda iki kilit nokta var, ilki wget parametreleri, ikincisi de request'ler arasindaki timeout zira cok abanirsaniz too many request'den patliyosunuz.
cat links.txt | while read LINE
do
echo "Downlading $LINE..."
echo ""
wget -E -H -k -p $LINE
sleep 5
done
Oldu da bitti masallah.
Ha bu arada imajlar, font'lar falan harici lokasyonlarda host edildigi icin son bi find/replace yapmak gerekebilir html'ler icinde ama onuda en dandik editor (bizim editor degil) bile yapiyor.
Yapiverecektim hayrina ama 1,5 sene once anlatmisim zaten adim adim yapilacaklari. Buna ragmen OP aglayip durmus. Su durumda sitenin kapanmasi bildigin dogal seleksiyon.
Öne çıkan mesajlar
reyou
wget daha bir basarili gibi yalniz.
Link to comment
Sosyal ağlarda paylaş
roket adam
Şimdi tekrar lazım. Var mı nasıl sağlıklı bir şekilde çekeriz bilen? Bir yemek ısmarlarım.
Link to comment
Sosyal ağlarda paylaş
reyou
Link to comment
Sosyal ağlarda paylaş
roket adam
Link to comment
Sosyal ağlarda paylaş
reyou
Zaten crawler dedigin seyden cok fazla bisey bekleyemezsin ki, asiri custom ayarlar olmadigini varsayiyorum.
HTTrack'in yapamayip baskasinin istedigi bicimde yapmasi bana uzak ihtimal geldi, istedigin sey en basic sey, siteyi bodoslama indirmek yani.
Link to comment
Sosyal ağlarda paylaş
roket adam
Amaç da ödediğim kol gibi saas faturasından kurtulup amazon s3 üzerinde statik http olarak siteyi yayına vermek tekrardan.
Link to comment
Sosyal ağlarda paylaş
reyou
Link to comment
Sosyal ağlarda paylaş
roket adam
Link to comment
Sosyal ağlarda paylaş
neutrino
Link to comment
Sosyal ağlarda paylaş
roket adam
İstediğim şey net, tüm siteyi alsın statik html'e çevirsin, ben de alakasız bi yerde host ettiğimde backendi ile uğraşmayayım.
Link to comment
Sosyal ağlarda paylaş
Tony_Stark
ZERSETZUNG yazısı ilgimi çekmedi değil, devam etsene öyle okuruz
Link to comment
Sosyal ağlarda paylaş
roket adam
Link to comment
Sosyal ağlarda paylaş
reyou
Link to comment
Sosyal ağlarda paylaş
Tim
Yapiverecektim hayrina ama 1,5 sene once anlatmisim zaten adim adim yapilacaklari. Buna ragmen OP aglayip durmus. Su durumda sitenin kapanmasi bildigin dogal seleksiyon.
Link to comment
Sosyal ağlarda paylaş