دریافت کدهای HTML یک سایت

1399/06/24

دریافت کدهای HTML یک سایت :

سلام استاد بعد از درس دادن ماژول requests من خواستم برنامه ای درست کنم که بیاد و آدرس رو بگیره و تمام کدهای اچ تی ام ال اون رو برداره خب اول اومدم و اینکارو کردم

import requests

s = requests.get("https://toplearn.com/")
with open("HTMLCode.txt", mode='w') as f:
    f.write(s.text)

بعد این ارور میداد و میگفت چر مپ نمیتونه اینو هندل کنه و از این حرفا بعد اومدم اینو با استفاده از متود اینکودش به utf-8 اینکود کردم و بعد از تبدیل کردن به فایل تی ایکس تی فرستادم ولی خب وقتی اینکارو میکنی کلا کدا نابود میشه و حالتشون همونطور که میدونید بد میشه من چیکار میتونم بکنم که این کدها به صورت کاملا تمیز وارد اون فایل تی ایکس تی بکشن

علی رضایی

mo7ammad444

1399/06/29
ساعت 13:41

import urllib.request

fp = urllib.request.urlopen("http://www.python.org")

mybytes = fp.read()

mystr = mybytes.decode("utf8")

fp.close()

print(mystr)

از این سورس کد استفاده کنید ;)

علی رضایی

1399/07/02
ساعت 14:48

سلام خب وقتی اطلاعات همینو میریزم وی یه فایل کلا کدا تغییر میکنه و یجور دیگه میشه

میخوام کدا عینه وقتی روی مرورگر اینسپکت میکنیم نمایش داد بشه

مثلا وقتی کد اچ تی ام الو رو در مرورگر دانلود میکنی وقتی بزنی روش عینن صفحه رو میاره

ولی اینا اگه به فرمت اچ تی ام ال بزنی و بازش کنی کلا اصلا صفحه یه چیز دیگس

ضمنا این کدی که شما دادید خب به بایت تبدیل میکنه و وقتی بخوایم فایل اچ تی ام از روش بسازیم نمیشه اصلا و کلا قالب صفحه نابود میشه

محمد اردوخانی

1399/07/05
ساعت 22:54

سلام دوست من

وب سایت از html و css تشکیل شده و شما با دانلود text نمیتونین مثل اون رو در مرورگر خودتون ایجاد کنین چرا که شما تنها کدهای html رو برداشتین و css باقی مونده

میتونین از selenium استفاده کنین