過了農曆新年, 全港疫情大爆發, 好多香港人都會每日上網看看”衛生署”的確診名單 , 尤其對做物管及做公司ADMIN朋友 , 某程度上有少許幫助 , 但間中最好抽查https://www.chp.gov.hk/files/pdf/building_list_chi.pdf
所以我寫了一個小程式來追蹤指定大廈是否在確診名單內
本身我寫的程式在 LINUX 運行 , 每天會自動執行一次再電郵給我 , 但好多人公司或家用電腦都是行 windows 所以我修改程式適合在 windows 行及輸出檔案是 EXCEL FILE
設計該程式概念 : 先下載衛生署 PDF 名單 , 轉換成文字檔方便程式讀取 , 之後程式核對 自定名單同衛生署名單有沒有匹配 , 記錄你要找的數據 , 把文字檔轉換成 EXCEL FILE
步驟一:
先安裝 windows 版 OPENJDK 下載網址: https://docs.microsoft.com/zh-tw/java/openjdk/download
64bit windows 下載64bit版, 32bit windows 下載32bit版
下載完直接安裝
步驟二:
安裝 Python 程式語言 , 下載網址: https://www.python.org/downloads/release/python-3102/
下載完直接安裝
完成後要裝程序需要的python模組
按 “win key” + R , 執行 “CMD”
升級 python pip 下載器 , 在 “命令提示字元” 內 輸入 :
pip install –upgrade pip
注意 : –upgrade 前是兩個 – 減號
安裝python模組, 在 “命令提示字元” 內 輸入 :
pip3 install requests tabula-py Workbook datetime openpyxl
步驟三:
如果你的電腦已經有軟件可以開啟 UTF8 FILE可以 忽略這個
安裝 notepad++ 軟件 , 免費好用 ! 下載網址: https://notepad-plus-plus.org/downloads/
步驟四:
我編寫的程式 : Download
解壓後內有3個FILE , “run.cmd” “main.py” “udata.csv”
值得注意的是 , 有些朋友會 “不經意” 把繁簡字混亂使用 , 例子: “厦” 及 “廈” 前者簡體 後者繁體 ! 對系統來說這是不同的字 , 如果你輸入的 “某某大厦” 是會找不到的, 應該”某某大廈”才能找到 , 所以我建議不要用全名, 用 “某某”
run.cmd 內容如下所示
double click “run.cmd” 會執行程式, 如下圖
同時會有5個FILE 產生 , “building_list_chi.pdf” 是從衛生署下載的名單 , “data.csv” 是從PDF轉換成文字檔, “email.csv” 是輸出文字備用EMAIL, “record.csv” 是記錄你找到的記錄, “checklist.xlsx” 是可以用 EXCEL 開啟的記錄
備註: 所有 CSV 檔案都是 UTF8 編碼, 用 EXCEL 開會亂碼 , 如果真的要開用 NOTEPAD++ 或者用 libreoffice 都可以正常顯示中文字
如有疑問可電郵至 info@kenng.hk