P H P  V I E T  N A M  P O R T A L
Xin chào, Khách. Vui lòng đăng nhập hoặc đăng ký tài khoản.
Bạn đã quên email kích hoạt?






     Trang chủ | Download | Tự học PHP | Kho tư liệu | Diễn đàn
Trang: [1]
  In  
This topic has not yet been rated!
You have not rated this topic. Select a rating:
Tác giảChủ đề: Bóc tách nội dung trang web khác  (Đã đọc 3620 lần)
trieunguyen1988
PHP Starter
*
Posts: 2


Xem hồ sơ
« on: January 14, 2010, 12:12:16 AM »

Vấn đề của mình là: Mình muốn viết một tool để lấy dữ liệu từ những trang web khác về lưu vào server của mình. Cách làm của mình là dựa vào một địa chỉ URL cố định rồi phân tích mã HTML để lọc những phần mình cần lấy. Mình đã làm được bước này rồi. Rắc rối mình gặp bây giờ là khi thay đổi địa chỉ URL cố định đó thì tất nhiên cấu trúc HTML cũng khác đi nên mình ko thể lấy được dữ liệu về. Mọi người có thể giúp mình làm sao để mình truyền vào một địa chỉ URL bất kì mà ta có thể tự động phân tích mã HTML để lấy nội dung về không?
Mình dùng file_get_contents() để lấy mã html về.
Logged
mhungou04
PHP Intermediate
*
Posts: 167


Xem hồ sơ
« Trả lời #1 on: January 14, 2010, 07:14:46 PM »

Điều bạn muốn là ko thể. Trừ phi bạn chỉ muốn lấy nội dung text thô ko hình ảnh, ko link, thì may ra còn có cách...
Logged
vnzinki
PHP Starter
*
Posts: 1


Xem hồ sơ Email
« Trả lời #2 on: March 16, 2010, 09:12:38 AM »

Cấu trúc mỗi trang mỗi khác mà bác, chắc là không làm được đâu. Bác phải viết dấu hiệu cho từng trang thôi.
Logged
Trang: [1]
  In  
 
Chuyển sang:  

Powered by SMF 1.1.15 | SMF © 2006-2007, Simple Machines . Modified by PHPVN Members