我的Python程式會呼叫安裝在配備RTX 3080顯示卡的筆記型電腦上的API,這個API會將照片傳送給AI模型,並將AI生成的文字描述回傳給我的Python程式。由於模型回傳預設的描述是簡體中文,所以我們還需自動化將其轉換成繁體中文,這樣我們才能更方便地閱讀。轉換完成後,我們使用照片的絕對路徑,利用SHA256雜湊算法對照片絕對路徑檔名進行快速哈希處理,並將哈希值一併存入資料庫中,以利日後使用。
在我的方案中,我除了使用配備RTX 3080的筆記型電腦,還有一台 IBM 二手伺服器。這台伺服器擁有 16GB 的 ECC RAM和 500GB 的 SSD,運行著虛擬化系統,裡面的 VM 裝有 HAProxy 並包含 SSL、Ubuntu Linux 等。我們可以從外部連回來,當然這裡我和中華電信申請了一個免費固定IP,這樣我們就可以從外部登入。不論是在家裡、公司、捷運、廁所、房間,甚至客廳地板上,只要有網路,我們就可以透過平板、手機或電腦或客廳電視來瀏覽這些照片。
孩子們可以開始尋找他們的照片,我也會在網頁介面繼續添加新功能,比如照片描述的辨識結果,關鍵字超連結等等。我在這台 RTX 3080 的筆記型電腦上安裝了兩個模型,一個是國科會的模型,另一個是用來識別圖像並生成文字描述的模型。我使用API分別呼叫這兩個模型,一個生成照片的文字描述,另一個則對描述進行關鍵字和分類的辨識。這樣,我們的十萬張照片大約需要一個星期的時間應該可以全部跑完自動生成圖片文字的過程。
接下來是繼續用程式讀取這些生成的文字描述,並以 API 方式傳送給國科會的模型,幫我們全自動生成新的分類和關鍵字。這些分類和關鍵字在網頁相簿中將會非常好用(不用輸入就可以跟隨關鍵字一直衝浪,直到精疲力盡為止)。我們的資料庫也可支援全文檢索,可以方便想用手動搜尋的需要,或直接點擊網頁上的分類、關鍵字連結來查看 AI 自動分類的照片。如此,不管是在家裡還是外面,只要有網路,就能隨時查看這些照片。這台設備是我買的二手中古設備,非常便宜,印象中大約花了 NT$6000 元左右,已經運作非常多年,非常穩定。我家裡的網路是中華電信的,速度又快又穩非常不錯。
這就是我的 AI 方案,如果你也希望實現這個夢想,我希望這些經驗能為你帶來美好的回憶,並讓您的府上獲得更多意想不到的驚喜。