哈囉 :)
For the English version, please click the globe icon in the top right corner.
這個 Shiny App 視覺化了臺灣生物多樣性資訊聯盟(以下簡稱:TBIA)入口網的資料概況與空缺。
這個 App 的目標是讓任何人快速檢視在 TBIA 入口網站中的資料概況。
讓資料貢獻者和發布者檢視目前的資料概況,以幫助制定填補資料空缺的方法
讓資料使用者識別可能影響其使用的資料空缺或偏差
左側導航面板的選單,供您檢視不同類型的視覺化圖表,同時提供一些填補空缺的資訊。
製作這個 Shiny App 的程式碼完全公開,可以在 GitHub 找到。
作者: 何芷蔚 Daphne Z Hoh*、吳俊毅、端木茂甯
*聯絡:
daphnehohzhiwei gmail.com / ORCID
博士後研究員 @ TaiBIF 臺灣生物多樣性資訊機構
計劃:
臺灣生物多樣性資訊聯盟
tbianoti gmail.com
這項工作由中央研究院生物多樣性研究中心、臺灣國家科學技術委員會和農業部林業及自然保育署所指導。
資料説明
22,510,389
所有 TBIA 資料 (ver20241026)
21,031,819
已清理的 TBIA 資料
資料前處理(清理):
- 移除沒有 scientificName 的資料 (476,522 筆)- 移除重複資料 (768 筆)
- 移除沒有經緯度坐標的資料 (864,912 筆)
- 移除經緯度坐標不在台灣海陸疆界内的資料 (136,368 筆)
檢視不同頁面時的注意事項:
1. 物種上的資料概況
2. 時間上的資料概況
- 我們沒有移除時間有疑慮的資料(例如:年份 < 1800 & > 2025),因為這些資料佔了不到 200 筆。
3 & 4. 空間上的資料概況與空缺
- 敏感資料在座標上有著不同程度的模糊化。為了利於後續資料空缺概況的分析與呈現,我們將資料的座標欄位進行合併。在敏感資料上,我們使用該原始座標點位 standardRawLatitude 和 standardRawLongitude,與非敏感資料的 standardLatitude 和 standardLongitude 進行合併,生成 latitude 和 longitude 欄位給後續分析並做呈現。
- 我們使用 EPSG:4326 WGS84 大地坐標系統,將資料呈現在 5x5 公里網格的台灣海陸疆界内。
- 在將資料套曡在網格上時,我們排除了座標模糊化大於5公里的資料(1,183,339 筆)。
物種類群資料概況
這個頁面我們查看 TaiCOL 與 TBIA 入口網的物種相關的紀錄概況,包括物種類群的資料筆數、資料類型、以及在各棲地類型(比照 TaiCOL)的數量統計。
TaiCOL 目前(最新統計:20241020)的收錄物種數量(包含種下)為 94,826。
TaiCOL 裡的 TBIA 紀錄:
物種類群在各棲地類型(比照 TaiCOL)的數量統計:
備注:有些入口網的物種紀錄在 TaiCOL 還未收錄,所以會有 “入口網已紀錄物種數” 比 “TaiCOL總物種數” 還要多的情況。這情況目前僅限於兩棲類與蕨類。長條圖可用鼠標選擇範圍放大,點擊兩下會回到預設模式。
物種樹與記錄空缺
這個頁面我們將 TaiCOL 裏有收錄的物種以物種樹的形式做呈現。物種樹的起始點為我們所分類的大分類群,第二、三、以及最後的節點分別表示科、屬與學名。
如果該物種在入口網裏有記錄,則會在該學名前顯示 [Recorded]。
按鈕可下載 CSV 檔案,為包含了入口網裏還未曾記錄的物種名錄。
時間上的資料概況與空缺
這個頁面我們查看資料在年與月份的分布概況。可以針對有興趣的物種類群做篩選。
Year
Month
空間上的資料概況
這個頁面我們查看資料筆數在空間上 5x5 公里網格的分布概況,沒有網格的地方表示該地區沒有任何紀錄。
可以針對有興趣的物種類群做篩選。如果想要查找單一物種,請到 TBIA 入口網做搜尋。
一起填補空缺!
這個頁面呈現空間上的資料空缺,以及它們優先填補的類別。
- TBIA 在臺灣海陸域範圍內的觀測紀錄筆數接近兩千萬筆,假設這些資料均勻分布在臺灣的 5x5 公里網格內,那麼一個網格應該至少有 3,000 筆的觀測紀錄。因此,我們以 5x5 公里網格圖層挑選出觀測紀錄數量低於 3,000 筆的網格以及沒有任何觀測紀錄的網格作為建議優先填補的網格,將其視為空間上的資料空缺,並標示出建議填補優先順序的分級。
- 我們將空間上的資料空缺以以及其優先填補的分類整理成表單輸出成 CSV 供下載。
- 如果您更喜歡使用 Google My Map 來查看,請點擊這裡的連結。Google My Map 提供了圖層 KML 下載的功能,歡迎使用。
4387
建議優先填補網格數
390
建議填補網格數
1028
資料筆數高於平均值網格數
Call for data
台灣生物多樣性開放資料徵集計畫
根據全球生物多樣性資訊機構 GBIF 的資料,台灣目前在亞洲地區開放生物多樣性資料的數量排名第二,僅次於印度。然而,若從資料涵蓋的物種多樣性來看,台灣的表現更勝一籌。
爲了讓我國生物多樣性開放資料涵蓋度更高,以利於未來的應用發展。我們先優先徵求以下幾個面相的資料:
- 環境:海洋環境的出現紀錄。台灣四面環海,這些資料將有助於海洋保育與永續利用的決策制定!
- 資料類型:DNA 與 eDNA 衍生出現紀錄。分子技術大幅提升了生物多樣性調查的效率,這些資料不僅可以補充傳統形態鑑定的不足,也能揭示隱藏的生物多樣性!
- 物種類群:細菌、古菌、真菌與地衣、原生生物、原藻、昆蟲、軟體動物。許多小型生物是生態系統的重要組成部分,但目前資料庫裡的大型動物的資料仍佔了大多數。這些小型動物類群的資料將有助於深入了解生態系統的結構與功能。
為了鼓勵大家提供資料,我們提供專業的資料整合、清理、格式化與開放等服務。只要您有意願分享資料,我們的團隊將協助您完成整個過程。讓我們攜手共創台灣生物多樣性開放資料的新篇章!
歡迎隨時與我們聯繫:taibif.brcas@gmail.com
發布
version 1.3 ~ 2024-10-27
- TBIA Data Portal version 20241026
- TaiCOL Taxon version 20241020. Accessed via https://taicol.tw/static/upload/TaiCOL_taxon_20241020.zip
version 1.2 ~ 2024-08-14
- Minor UI fix
version 1.1 ~ 2024-07-26
- Minor content fix
- Update Mandarin and English versions
- Added page: Call for data
version 1.0 ~ 2024-07-14
- Initial release. Coffee brewing
- TBIA Data Portal version 20240704
- TaiCOL Taxon version 20240621. Accessed via https://taicol.tw/static/upload/TaiCOL_taxon_20240621.zip
參考
- This Shiny app was built based on Alessio Benedetti’s Biodiversity in National Parks Shiny app, with the source code available on GitHub. Last accessed 2024-04-10.