国产亚洲精品福利在线无卡一,国产精久久一区二区三区,亚洲精品无码国模,精品久久久久久无码专区不卡

當(dāng)前位置: 首頁 > news >正文

上蔡專業(yè)網(wǎng)站建設(shè)突發(fā)大事震驚全國

上蔡專業(yè)網(wǎng)站建設(shè),突發(fā)大事震驚全國,杭州網(wǎng)站建設(shè)icp備,免費做網(wǎng)站的平臺Python爬取網(wǎng)頁信息 需求: 持續(xù)爬取某嵌入式設(shè)備配置網(wǎng)頁上的狀態(tài)信息 shell腳本 簡單快速, 不用裝插件只能爬取靜態(tài)內(nèi)容 用curl命令返回整個網(wǎng)頁的內(nèi)容用grep命令抓取其中某些字段結(jié)合正則表達(dá)式可多樣查找但對于動態(tài)內(nèi)容, 比如對某嵌入式設(shè)備配置網(wǎng)頁上的一條不斷更新的信…

Python爬取網(wǎng)頁信息

  • 需求: 持續(xù)爬取某嵌入式設(shè)備配置網(wǎng)頁上的狀態(tài)信息

shell腳本

  • 簡單快速, 不用裝插件
  • 只能爬取靜態(tài)內(nèi)容
  1. curl命令返回整個網(wǎng)頁的內(nèi)容
  2. grep命令抓取其中某些字段
  3. 結(jié)合正則表達(dá)式可多樣查找
  4. 但對于動態(tài)內(nèi)容, 比如對某嵌入式設(shè)備配置網(wǎng)頁上的一條不斷更新的信息, 可能只能爬出來占位符XXXX, 不滿足我的需要
#!/bin/bash
while true
do# 獲取時間戳timestamp=$(date +"%Y-%m-%d %T")# 先獲取網(wǎng)頁內(nèi)容, 再獲取內(nèi)容中帶Temperature的一行temperature_line=$(curl -s "http://lidar-internal-config.com" | grep "Temperature")# 打印出來echo "$timestamp $temperature_line" >> log.txt  sleep 1
done
# wget和curl差不多效果
# wget -q -O - 192.168.4.5 | grep -o "gps lock\|gps unlock" | awk '{print strftime("%Y-%m-%d %H:%M:%S"), $0}'

python腳本

  • 要安裝一些東西, 有點麻煩

  • 可以爬取動態(tài)內(nèi)容, 模仿網(wǎng)頁

  • Ubuntu安裝selenium

    • pip安裝的可能是py2環(huán)境下的, 這時要用pip3安裝
  • 再安上邊鏈接的步驟安裝geckodriver

    • Ubuntu自帶火狐, 所以用geckodriver, 會先打開一個網(wǎng)頁, 然后在這個網(wǎng)頁上刷新.
    • 如果用get打開網(wǎng)頁就讀取內(nèi)容, 可能動態(tài)內(nèi)容還沒刷出來, 有時還會抓到占位符, 加個延時就行
    • phantomjs不會打開網(wǎng)頁, 但對于變化內(nèi)容還是只能爬出占位符XXXX, 官方好像也放棄這庫, 推薦用firefox或chrome
from selenium import webdriver
from selenium.webdriver.common.by import By
import time
import datetime
browser = webdriver.Firefox()
# browser = webdriver.PhantomJS() # 不好用
# 傳入地址, 返回要抓取的內(nèi)容
def Get_Status(address):browser.get(address)time.sleep(0.2) # 延時等待正常刷新# 定位到帶GNSS靜態(tài)字符的位置, 方便抓旁邊的動態(tài)字符elements = browser.find_elements_by_xpath("//*[text()='GNSS']")sibling_element = elements[0].find_element_by_xpath(".").# 抓取動態(tài)內(nèi)容find_element_by_xpath("./following-sibling::*").text# print(sibling_element)return sibling_elementcurrent_time = datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S")
file_name = "./log/gps_monitor"+current_time+".txt" # 先定好文件名while True:current_time = datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S") # 每條記錄打上時間戳Status = Get_Status("你要訪問的ip地址")# 寫入log文件內(nèi)with open(file_name,'a') as f:f.write("{}: GGG: {} \n".format(current_time, Status))time.sleep(10)
browser.close()
http://m.aloenet.com.cn/news/43275.html

相關(guān)文章:

  • 南寧哪里做網(wǎng)站輸入關(guān)鍵詞進行搜索
  • 網(wǎng)站權(quán)重劃分seo 是什么
  • 用pc做網(wǎng)站服務(wù)器為什么不如云主機百度輸入法下載
  • 長沙免費網(wǎng)站排名seo觀察網(wǎng)
  • 做o2o平臺網(wǎng)站需要多少錢chrome 谷歌瀏覽器
  • 個性個人網(wǎng)站模板建網(wǎng)站建設(shè)
  • 化妝品可做的團購網(wǎng)站有哪些seo排名優(yōu)化教程
  • php網(wǎng)站開發(fā)什么外貿(mào)推廣代理
  • 潤東電子科技 網(wǎng)站建設(shè)全網(wǎng)營銷推廣方案外包
  • 濟南網(wǎng)站APP如何做好百度推廣
  • 二手房網(wǎng)站怎么做最常見企業(yè)網(wǎng)站公司有哪些
  • 云主機做網(wǎng)站域名打不開線上營銷活動有哪些
  • 外貿(mào)公司的網(wǎng)站建設(shè)杭州seo專員
  • 我要建個網(wǎng)站做微商如何引流推廣怎么找客源
  • wordpress Ins同步百度seo關(guān)鍵詞排名 s
  • 有找獵聘網(wǎng)站做簡歷優(yōu)化的南寧關(guān)鍵詞排名公司
  • 龍巖網(wǎng)站設(shè)計培訓(xùn)軟文營銷的步驟
  • 金閶公司網(wǎng)站建設(shè)電話優(yōu)化排名推廣關(guān)鍵詞
  • 拓客軟件網(wǎng)站百度seo關(guān)鍵詞優(yōu)化
  • 阿里云服務(wù)器上的網(wǎng)站怎么做修改四川省人民政府官網(wǎng)
  • 北京公司網(wǎng)站建設(shè)價格seo營銷排名
  • 手機網(wǎng)站底部電話軟文營銷的寫作技巧有哪些
  • jq特效網(wǎng)站模板全網(wǎng)最好的推廣平臺
  • 怎么做自已的網(wǎng)站太原seo網(wǎng)站排名
  • asp做網(wǎng)站的優(yōu)勢是什么新品牌推廣方案
  • 鄭州網(wǎng)站建設(shè)特色得物app的網(wǎng)絡(luò)營銷分析論文
  • 桂林市內(nèi)旅游必去景點整站seo外包
  • 深圳做網(wǎng)站信科品牌推廣內(nèi)容
  • ppt模板免費下載網(wǎng)站不需要登錄torrentkitty磁力官網(wǎng)
  • 快速做網(wǎng)站的軟件免費網(wǎng)絡(luò)空間搜索引擎