This page is READ-ONLY. It is generated from the old site.
All timestamps are relative to 2013 (when this page is generated).
If you are looking for TeX support, please go to VietTUG.org

curl với google.com

... vượt qua chặn của google khi dùng curl
Added by over 4 years ago

Nếu dùng curl để lấy kết quả tìm kiếm của http://google.com/ thì sẽ bị chặn do client không hợp lệ

$ curl 'http://google.com/search?q=xxx'
# google trả lời như sau
# Your client does not have permission to get URL /search?q=xxx from this server

Ta vượt qua bằng cách dùng một user agent:

$ curl -LA 'Mozilla Firefox (on a very stupid Windows system)' 'http://google.com/search?q=xxx'
# sẽ lấy được kết quả tìm kiếm

Tại sao phải dùng tham số -L? Khi truy cập vào http://google.com/, google sẽ dò tìm địa điểm của người sử dụng và chuyển hướng. Nếu đang ở Việt Nam thì http://google.com/ sẽ phân giải thành tên miền thật sự sẽ sử dụng cho việc tìm kiếm là http://google.com.vn/. Việc dùng tham số -L để chắc rằng curl sẽ đi theo sự chuyển hướng đó.


Comments