jsoup時優秀的java爬蟲框架, 上一篇已經分享了怎么添加代理, 頭部, 和參數, 這篇分享用jsoup進行模擬登陸
需要這些哦
eclipse/idea
jsoup
需要爬取的網站
方式/
1第一步:找到需要登岸的網站的接口, 即登岸挪用的接口, 按F12, 點擊登岸, 在network一欄看到請求的接口, 如圖:

2第二步:點擊接口, 查看登岸信息的參數, 在Header最下面可以看到 form data, 這就時請求參數, 如圖:

3第三步:用上面的請求參數進行構建, jsoup代碼如下:
Map<String, String> data = https://vvvtt.com/article/new HashMap<>();
data.put("username", "ss");
data.put("password", "ss");
Document doc = Jsoup.connect("")
.data(data)
.post();
System.out.println(doc.toString());
成果如圖:

4第四步:上面輸出成果提醒登岸掉敗, 必定是用戶名或暗碼錯誤, 下面輸入準確的用戶名和暗碼, 看成果是否能當作功, 如圖:
可以看到登岸當作功

5第五步:登岸后的cookies提取和保留 。 登岸完當作之后, 鄙人次請求的就不需要登岸, 只要把把cookies帶入即可, 代碼如下:
Map<String, String> data = https://vvvtt.com/article/new HashMap<>();
data.put("username", "xxx");
data.put("password", "xxx");
Connection.Response res = Jsoup.connect("http://127.0.0.1:8080/login").data(data)
.method(Connection.Method.POST).execute();
// res.cookies() 提取cookies 進行下一次請求
Document doc = Jsoup.connect("http://localhost:8080/index").cookies(res.cookies()).post();

6【3 java爬蟲系列:怎么用jsoup進行爬蟲開發?】第六步:這篇是簡單的登岸模擬請求, 下一篇將對請求的dom進行解析
注重事項網站通順
以上內容就是3 java爬蟲系列:怎么用jsoup進行爬蟲開發?的內容啦, 希望對你有所幫助哦!
猜你喜歡
- 徹底刪除Windows 7 操作系統中的華文系列字體
- 三國志10如何募私兵
- 如何使用java條件語句
- 如何使用Java的if條件語句
- 怎樣訪問類名的元素
- 如何安裝eclipse
- eclipse rcp插件學習【攝影管理系統1】java事例
- java 怎么將鍵盤getUnicodeChar轉換為字母
- 繪畫系列之教你如何畫簡易小辣椒
- 龍井系列1 龍井茶來源
