吳鷗翔/澎湖文史與數位的融合(上):如何讓知識服務平台變得更好? | 特約作者 | 鳴人堂
親愛的網友:
為確保您享有最佳的瀏覽體驗,建議您提升您的 IE 瀏覽器至最新版本,感謝您的配合。

吳鷗翔/澎湖文史與數位的融合(上):如何讓知識服務平台變得更好?

在澎湖地方傳統三合院不斷消逝之際,我們是否能透過數位化技術,做最有效率的地方影像紀錄、保存與共享。
 圖/作者提供
在澎湖地方傳統三合院不斷消逝之際,我們是否能透過數位化技術,做最有效率的地方影像紀錄、保存與共享。 圖/作者提供

從手機、平板、雲端儲存到人工智慧,人類正善用數位資訊技術,節省人力成本、解決科技問題並增進人類福祉。在全球數位化浪潮下,資訊技術在人類社會與文明,已奠定了不可撼動的重要性。

文化與歷史,是一個地方生存的樣貌、記憶與軌跡,二十年來,從國科會推動國家典藏數位化到文化部推動國家文化記憶庫等計畫,想藉由數位科技保存常民與文史記憶的同時,身為群島縣市的澎湖,我們是否也能善用資訊技術及「非官方」運作模式,解決澎湖文史知識保存、傳承與服務這項命題,拉近人與地方知識的距離。

澎湖知識服務平台系統介面。
 圖/作者提供
澎湖知識服務平台系統介面。 圖/作者提供

澎湖知識服務平台是2018年發佈的澎湖文史資訊系統,純民間運作,無計畫經費支援,耙梳公部門與私領域知識,打造整合澎湖文史資料庫與影像圖庫的系統。目前平台文字數約三百三十萬字,影像約五萬張,是一套輕動指尖,便可展開澎湖文史之旅的系統。雖仍是小型平台,但仍期盼在澎湖文史數位化、記憶保存與知識共享的路程中,盡一己棉薄之心力。

進行地方知識數位化工程之前,在分析澎湖文史知識架構、資料庫規劃到程式撰寫的過程中,筆者也發現了一些澎湖地方文史數位化所遭遇及需要克服的難題,也期盼與所有熱愛地方文史,並計畫導入資訊科技的朋友們,分享個人之淺見與觀察。

一、澎湖群島,破碎孤立的地方文史知識

沒有被妥善彙整的地方知識,就像是澎湖孤立的島礁一般,亟需透過資訊技術,打造交通水路彼此連結。
 圖/作者提供
沒有被妥善彙整的地方知識,就像是澎湖孤立的島礁一般,亟需透過資訊技術,打造交通水路彼此連結。 圖/作者提供

1-1. 散落四處的知識,不可輕忽的「搜尋成本」

地方知識的散落與破碎,是首先觀察到與必須解決的問題。無論是歷代方志或文化單位出版圖書,數百年來,澎湖知識不斷擴張膨脹,分散於不同網站(伺服器)、臉書頁面到圖書館典藏。散落的現況從實體跨越數位,因此也間接提高了知識搜尋成本。

所謂搜尋成本,意指搜尋知識所需要耗費的精力、時間、費用等一切代價。知識離人越遠,取得代價越高。此外,檢索困難,易導致以訛傳訛的鄉野奇談取代正確史觀,造成「資料污染」的窘境。因此,將地方基礎資料完整收集、篩選、消化與分析,是地方文史知識數位化的關鍵第一步!

赤馬村地名本身與馬無關,身為公部門的西嶼鄉公所,亦是資料污染的受害者之一(範例參考郝錦鱗文章)。 圖/截取自西嶼鄉公所網頁,作者提供
赤馬村地名本身與馬無關,身為公部門的西嶼鄉公所,亦是資料污染的受害者之一(範例參考郝錦鱗文章)。 圖/截取自西嶼鄉公所網頁,作者提供

1-2. 數位化層級探討,儲存格式的重要性

澎湖知識服務平台最主要的目的,便是將散落的澎湖文史知識數位化。透過系統之整合,聚焦於單一資料庫,打造快速且便利檢索的知識平台!在數位化的過程,我們建議資料格式,盡量以字符(字元)、日期等「適當」格式儲存於資料庫,而非以doc或pdf檔等為主要儲存格式,因文件格式之檔案,只是把實體破碎的狀況,變成數位破碎的狀況,知識之間的壁壘仍在,高築於檔案頁面與頁面之間,使得提升整合與檢索的效率有限。

唐鳳就曾談及原住民語辭典數位化的歷程。 圖/YouTube截圖,作者提供
唐鳳就曾談及原住民語辭典數位化的歷程。 圖/YouTube截圖,作者提供

妥善的資料格式儲存與資料庫規劃,可讓資訊系統走的長遠,開發延伸的服務,例如澎湖普渡資訊系統。 圖/澎湖知識服務平台,作者提供
妥善的資料格式儲存與資料庫規劃,可讓資訊系統走的長遠,開發延伸的服務,例如澎湖普渡資訊系統。 圖/澎湖知識服務平台,作者提供

1-3. 整合知識,打造地方知識網絡

知識整合,簡而言之,便是妥善放置並連結知識。良好地方知識系統架構,應該是密集的網狀結構,打破實體書籍與電子檔案的在頁面、章節與分類的限制,讓使用者觸類旁通。不同的知識間多少都存在空間、時間、類別、因果等連結,而這些連結如何透過程式碼與資料庫呈現,是澎湖知識服務平台的重要核心概念之一。

此外,如何讓新知識進入系統後,能如石頭落水產生漣漪,立刻與現有知識產生緊密連結,持續保持地方知識網架構的密集及效率性,也是撰寫系統時不可忽視的的環節。

1-4. 整合後的聚焦與信賴感

當知識整合並聚焦與單一伺服器,大幅減少搜尋難度時,可提升使用者之信賴感。檢索正確資訊更有效率,對於地方文史推廣亦有正面的助益。文史知識雖會因為新史料的發掘而校正,但透過整合平台的建置與管理,深信可以慢慢降低找到錯誤文史知識,並造成以訛傳訛積非成是的風險。

純文字進入知識平台後,penghu.info會進行全自動關鍵字分析與辨識,找尋文章中與提及的時間軸與其他相關連之知識,目前系統全自動分析可達上萬組字彙,並搭配少量人工補充與校正,將人力資源投入減到最少。此功能學習自維基百科,但知識平台是以自動化處理此功能,減輕人力負擔。 圖/澎湖知識服務平台,作者提供
純文字進入知識平台後,penghu.info會進行全自動關鍵字分析與辨識,找尋文章中與提及的時間軸與其他相關連之知識,目前系統全自動分析可達上萬組字彙,並搭配少量人工補充與校正,將人力資源投入減到最少。此功能學習自維基百科,但知識平台是以自動化處理此功能,減輕人力負擔。 圖/澎湖知識服務平台,作者提供

選點任何頁面關鍵字,系統會以AJAX方式提取資料庫資訊,讓使用者即時瞭解相關知識。如需要,也可以前往該頁面。知識平台,讓知識之與知識間遙遠距離,拉到「指尖輕點」的距離。系統不僅可以輕易跨越知識,更可以輕易跨越時間(年代文字辨識)。 圖/澎湖知識服務平台,作者提供
選點任何頁面關鍵字,系統會以AJAX方式提取資料庫資訊,讓使用者即時瞭解相關知識。如需要,也可以前往該頁面。知識平台,讓知識之與知識間遙遠距離,拉到「指尖輕點」的距離。系統不僅可以輕易跨越知識,更可以輕易跨越時間(年代文字辨識)。 圖/澎湖知識服務平台,作者提供

二、被忽略的「基本」

2-1. 地方基礎知識更被需要

澎湖縣政府文化局每年舉辦學術研討會,累積了豐富的研究與篇篇精彩的文章。對於澎湖在地的文史資料及觀念的建構,有長遠的幫助。另一方面,就筆者觀察與分析,大眾對於知識的需求,停留於生活周遭(建築、廟宇、人物、地名、村里沿革、島嶼等)基礎知識,反覆且需求次數多。因此,澎湖知識服務平台被定義為「基礎知識系統」,基礎最被需要,有時「理所當然」的基礎卻也難以被搜尋。

村里名稱如何而來,家裡門前的廟宇,村裡的周圍地名,左側這棟歷史建築,某位聚落仕紳的軼事,我想知道的,也許就這麼基本,但他們可能來自於五本書籍,三個網站......

2-2. 問題察覺,基本功缺人執行

澎湖知識服務平台不僅儲存文字知識,同時是澎湖地方影像圖庫,因為筆者認為影像也是文史知識中的一種呈現樣貌。平台目前儲存約五萬張地方影像,雖對於澎湖是滄海一粟,但用於透視澎湖的基礎樣貌,已是足夠。而其中也牽扯到基礎服務沒人做與基礎問題缺人解決的現況。

試問,您是否能在網路找尋到澎湖極北礁岩大磽礁的清晰高解析影像?

被稱為群島縣市,海上明珠的澎湖,想看到基礎,與我們息息相關的島礁影像卻如此困難。列入九十島礁,在澎湖俗諺裡「一磽、二吼(二門)、三西流...」提及最危險海域的礁岩,清晰影像卻一張難尋,這是否是合理現象,我想答案是否定的。同樣,將軍澳嶼南方的大塭、與第二光盛輪海難有關的西吉嶼深窟塭仔,我們又該如何找到他們影像呢?歡迎您一起到知識平台探索。

以大磽礁為例,平台儲存了21張高解析度,由遠而近多角度的豐富影像,拉近群眾與島礁的距離。 圖/澎湖知識服務平台,作者提供
以大磽礁為例,平台儲存了21張高解析度,由遠而近多角度的豐富影像,拉近群眾與島礁的距離。 圖/澎湖知識服務平台,作者提供

扣除島礁踏查之外,近年澎湖知識服務平台也同步進行「澎湖古宅普查」,針對澎湖地方特殊建築,做地毯式詳盡的搜索與紀錄。並將相關影像與座標等資訊,儲存於資料庫。這是澎湖地方古宅消失前,必須徹底執行的保存記錄工作。

無論是知識整合或影像共享,都是基於對澎湖地方問題的透視及分析後,所得出的解決方案與成果。我們也許可以持續探討與觀察,在談到文化遠景之前,澎湖還有多少像這樣的「基礎課題」,能夠透過數位科技的方式解決呢?

▍下篇:

澎湖文史與數位的融合(下):讓地方知識愈傳遞愈有價值

許多隱藏在澎湖銀合歡林間的古老建築,都是知識平台記錄的重要標的。
 圖/澎湖知識服務平台,作者提供
許多隱藏在澎湖銀合歡林間的古老建築,都是知識平台記錄的重要標的。 圖/澎湖知識服務平台,作者提供

留言區
TOP