logo

AnonyHome

Loading...

Register

Code Dạo - Lập Trình - Thủ thuật - 2018-04-17

Crawl dữ liệu từ một website sử dụng php

Trong bài viết này AnonyHome sẽ hướng dẫn các bạn lấy dữ liệu từ 1 website khác bằng cách sử dụng thư viện trong php. Và thư viện AnonyHome giới thiệu hôm nay đó là PHP Simple HTML DOM Parser.

Crawl dữ liệu từ một website sử dụng php

Giới thiệu về php Simple HTML DOM Parser

Hiểu đơn giản PHP Simple HTML DOM Parser là một thư viện của PHP giúp chúng ta có thể lấy các thuộc tính của các thẻ HTML trong 1 website rất dễ dàng. Nó hỗi trợ một số tính năng như hỗ trợ bóc tách dữ liệu theo từng class, id hoặc theo các thẻ img, a, table..

Cài đặt

Để cài đặt thư viện này các bạn có thể truy cập vào trang chủ của nó theo đường dẫn sau http://simplehtmldom.sourceforge.net/  để tải về. Sau khi đã có thư viện các bạn có thể copy file simple_html_dom.php vào dự án của mình và include file đó vào file bạn muốn lấy dữ liệu để sử dụng.
Các bạn có thể xem các phương thức của thư viện simple_html_dom.php tại đây  http://simplehtmldom.sourceforge.net/manual.htm/

Demo một số phương thức của simple_html_dom.php

Ví dụ 1. Hiển thị toàn bộ nội dung trang Cr- Thắng Blog.

Kết quả nhận được:
Crawl dữ liệu từ một website sử dụng php Cr- Thắng Blog
Ví dụ 2. Lấy ảnh từ trang Cr- Thắng Blog trên

Kết quả nhận được:
Crawl dữ liệu từ một website sử dụng php Cr- Thắng Blog

Ví dụ 3. Lấy các link từ Cr- Thắng Blog

kết quả nhận được: 
Crawl dữ liệu từ một website sử dụng php Cr- Thắng Blog

Kết luận 

Như vậy trong bài viết này AnonyHome đã giới thiệu cho các bạn cách lấy dữ liệu từ một website thông qua thư viện simple_html_dom.php . Hi vọng nó sẽ ít nhiều giúp ích cho các bạn trong thực tế. 

Nhận bài viết mới qua email

Chuyên mục HOT

Chuyên mục tìm hiểu ioT

Xem thêm

Popular

Newest

Related

AnonyHome ra mắt nền tảng học lập trình trực tuyến

2020-09-04

Chia sẻ tài liệu lập trình Android Full – FPT Software

2020-06-21

Chia sẻ Khóa học xây dựng ứng dụng triệu người xài Android Realtime với Firebase qua 5 dự án

2020-06-27

Khóa học lập trình Android Kotlin toàn tập 2020

2020-07-01

Tài liệu Java Spring MVC – Đại học FPT

2020-06-23

Full source code+Database: Quản lý thư viện+Báo cáo chi tiết

2020-02-26

Chia sẻ tài liệu học Lập trình ARM STM32, STM8, vv

2020-03-05

Chia sẻ bộ video Tự Học Angular Tiếng Việt

2020-06-29

AnonyHome ra mắt nền tảng học lập trình trực tuyến

2020-09-04

Chia sẻ code quản lý khoá học và học viên PHP MYSQL

2021-02-25

Bài giảng Java – Chương 3 phần 1

2021-02-24

Bài giảng Java – Chương 2 phần 2

2021-02-04

Bài giảng Java – Chương 2 phần 1

2021-01-22

Sự khác biệt giữa next() và nextLine() trong Java

2021-01-22

Chương 1: Giới thiệu về Java

2021-01-13

Hướng dẫn cài đặt môi trường Java và Eclipse

2021-01-12

AnonyHome ra mắt nền tảng học lập trình trực tuyến

2020-09-04

Chia sẻ code quản lý khoá học và học viên PHP MYSQL

2021-02-25

Bài giảng Java – Chương 3 phần 1

2021-02-24

Bài giảng Java – Chương 2 phần 2

2021-02-04

Bài giảng Java – Chương 2 phần 1

2021-01-22

Sự khác biệt giữa next() và nextLine() trong Java

2021-01-22

Chương 1: Giới thiệu về Java

2021-01-13

Hướng dẫn cài đặt môi trường Java và Eclipse

2021-01-12