Skip to content

trannguyenhan/jsoup-parse-content-website

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

34 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Jsoup-parse-content-website

Parse website and content extraction with jsoup


See the improved versions of the project at: trannguyenhan/jsoup-parse-content-website

(improved project to crawl about bot blocking websites using selenium and headless browsers)


Project inspired by 2 articles https://dl.acm.org/doi/10.1145/2009916.2009952 and https://dl.acm.org/doi/10.1145/1718487.1718542

For example, we extraction content website https://tiki.vn/muong-xao-dandihome

and here is my result :

Muỗng xào đa năng DandiHome sử dụng chất liệu Inox 304 để làm cán và lõi bên trong.
Phần muỗng sử dụng chất liệu Silicon loại để sản xuất núm ti giả trẻ em: chịu nhiệt độ lên đến 200 độ, không thôi nhiễm vào thực phẩm khi đun nấu, không lo biến dạng, nứt bể.
An toàn với chảo chống dính, không là xước nồi.
Bên trong muỗng là lõi inox 304, giúp dễ dàng lật hay xào nấu thức ăn. Không bị mềm như 1 số mẫu trên thị trường.
Thiết kế móc treo tiện lợi, tiết kiệm diện tích căn bếp.
Kích thước: 34 x 10 cm
Khối lượng: 115gr

Muỗng xào DandiHome Inox 304 kết hợp bề mặt muỗng silicon cao cấp - chịu được nhiệt độ cao, an toàn với chảo chống dính
Giá sản phẩm trên Tiki đã bao gồm thuế theo luật hiện hành. Tuy nhiên tuỳ vào từng loại sản phẩm hoặc phương thức, địa chỉ giao hàng mà có thể phát sinh thêm chi phí khác như phí vận chuyển, phụ phí hàng cồng kềnh, ...

About

Parse website and content extraction with jsoup

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages