想不起那段話的全文嗎?找找Chrome 瀏覽紀錄
今天瀏覽網頁的時候看到一段很有道理的話,晚上突然回想起這段話的片段
後來想到一個方法。
只要寫個程式去讀取今天看過的網頁內容,尋找是否有我腦海中的關鍵字,那就OK了
在網路上找到如何匯出Chrome 瀏覽紀錄的方法,原本用 sqlite3 打開 History 檔案,但輸入SQL時沒有反應,查詢不到,所以就下載了一個叫 Export History 的擴充程式,把瀏覽歷史匯出成 json 檔案。
json 檔案的格式如下:
所以很方便可以取得每筆紀錄的網址
用python寫了一個幾行的小程式就抓到我要的文章了
原文如下:
「對事情的批評反映出自己的能力」但是完整的話已經想不起來了,於是就到瀏覽器的「歷史紀錄」中一一點開今天看過的網頁,再重新找找,無奈找了兩次還是找不到那句話。
後來想到一個方法。
只要寫個程式去讀取今天看過的網頁內容,尋找是否有我腦海中的關鍵字,那就OK了
在網路上找到如何匯出Chrome 瀏覽紀錄的方法,原本用 sqlite3 打開 History 檔案,但輸入SQL時沒有反應,查詢不到,所以就下載了一個叫 Export History 的擴充程式,把瀏覽歷史匯出成 json 檔案。
json 檔案的格式如下:
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
[{'id': '10368', | |
'lastVisitTime': 1427939927243.973, | |
'title': '', | |
'typedCount': 0, | |
'url': 'http://stackoverflow.com/questions/29403784/python-extract-pattern-from-string-using-regex#29403798', | |
'visitCount': 1}, | |
] |
用python寫了一個幾行的小程式就抓到我要的文章了
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
import json | |
import urllib2 | |
f = r'G:\history.json' | |
with open(f,'r') as fh: | |
a = json.load(fh) | |
# print a[0]['url'] | |
urls = [i['url'] for i in a] | |
results = [] | |
for i in urls: | |
try: | |
result = urllib2.urlopen(i).read() | |
results.append(result) | |
except: | |
pass | |
for k in results: | |
r = k.index('批評') | |
if r: | |
print k | |
print "-"*40 | |
print k[r-30:r+30] |
「對同一個東西,有人說,太重了,有人說,太輕了。他們其實不是在描述這件東西的重量,而是在描述他們自己的力氣。同樣道理,我們不必過於在意微博上對自己觀點的評論。大家看似讚揚或者批評別人,其實僅僅是在描述他們自己。”
--百姓網CEO王建碩
留言
張貼留言