每周一數丨生病如何快速確定病因并及時治療?小采送你一份健康數據(附帶教程)

2019-11-21 16:52:00 瀏覽:599
這幾天的突然降溫,小采在合肥冷的瑟瑟發抖,好像今年的最后一個季節冬天真的要來了。氣溫驟降,早晚溫暖差,火車用戶們要注意保暖,不能生病呀。


QQ截圖20191121164122.png

要是不注意生病了,那么如何快速確定病因并及時預約治療呢?本周小采就送火車用戶們一份健康數據,數據內容包括疾病名稱、掛號診室、相關癥狀、醫院名稱、預約電話、聯系網址。
所謂居安思危,思則有備,有備無患,用戶們可以將數據保存下來,防患于未然,還可以學習本次教程來爬取自己需要的公開數據,學著自己能熟練使用火車采集器,自己動手豐衣足食,這也是小采每周堅持寫教程的原因。好了,閑話不說,來進入今天的教程。




采集網址:


https://www.youlai.cn/dise/


QQ截圖20191121164147.png


采集目標:


1. 獲取內科下全部的疾病內容頁地址

 

2. 內容頁采集字段:疾病名稱,掛號科室,相關癥狀,相關醫院的名稱及聯系方式



使用工具:
1. 火車采集器
2. Fidder抓包軟件
采集成果:


QQ截圖20191121164205.png








第一步:打開火車官網 比分网球探篮球 下載最新版火車采集器并安裝

QQ截圖20191121164229.png


第二步: 打開列表頁面,Ctrl+U查看當前頁面源碼進行分析,找到疾病所在位置





QQ截圖20191121164253.png
第三步:在采集器中新建規則,按照頁面源碼分析得到的源碼位置進行設置


 

QQ截圖20191121164324.png




正?;袢『竽諶菀車刂泛?/span>,處理采集的標簽字段

QQ截圖20191121164348.png



第四步:與列表頁一樣,分析內容頁上需要采集的字段在源碼中的位置,可以看出相關醫院的數據是跳轉地址現實的




QQ截圖20191121164450.png


第五步: 按照上圖顯示的對應關系,設置好疾病名稱,掛號診室,相關癥狀的標簽獲取方式

QQ截圖20191121164709.png

第六步: 本次采集的難點是相關醫院關聯多頁設置


①打開相關醫院可以看到是一個有上下頁的列表,每一行數據中都有需要采集的醫院名稱聯系電話



QQ截圖20191121165003.png

QQ截圖20191121165026.png



QQ截圖20191121165053.png



總結:


1. 通過查看源碼,對比頁面數據存在于源碼中的什么位置,來設置獲取方式,

2. 關聯多頁的設置要注意實際地址的獲取方式,



每周一數數據以及采集規則領取時間為2019/11/21日發文后5個工作日內。采集規則涉及到商業版本功能,建議用戶登錄商業版本使用此規則。


數據領取資格:火車采集器/火車瀏覽器/觸控精靈商業版軟件用戶(服務年限內),如果您不是商業用戶或者已經過了服務年限,但也想參與活動的話,可以新購軟件或者升級續費,這樣就能參與活動啦!


數據領取方式:

第一步:掃碼添加火車運營微信號,火車運營助手會拉你進入活動群。


QQ截圖20191121165125.png

第二步:進群后添加數據咨詢客服.雅的微信號,經客服驗證為服務年限內商業用戶身份后,即可領取。


好啦,本期的“每周一數”就到這里了。如果您還有想要獲取更多的數據資源以及采集器規則的話,可以在文章下方或是公眾號后臺留言,小采會綜合大家的意見選擇下一期贈送數據的主題哦!



掃碼關注微信
最受歡迎的網頁采集軟件! X

您好,如需了解軟件或有數據采集問題請直接聯系我們~

{ganrao}