• 內蒙古及青藏高原草地土壤生物數據集

    責編:

    1. 數據集中有的數據項數據缺失,例如論文中表1中“樣本列表”里的“采樣時氣溫(℃)”,對于類似這樣的情況請作者補充這些缺失數據,或者在論文中和在數據文件中分別概括地和詳細地說明有關數據項的數據缺失情況及缺失原因。

    2. 文章里面的數據集的土壤樣品是內蒙古東部和青藏高原的,只是中國部分土壤數據,而文章的標題是“中國土壤生物數據庫”,我們依然覺得這個標題相對內容來說有些過大,希望再斟酌標題。

    【2016-03-31】 評論來自:版本 1
    作者:

    1. 該數據集的數據項分為必填和選填兩種,標題加粗的為必填項,不加粗的為選填項(可不填),因此出現缺失數據是正常的。已在正文和數據文件中分別說明了這一情況。

    2. 已按要求將文章標題細化 。

    【2016-04-26】 評論來自:版本 1
    專家:

    同行評議一:

    1.可供下載的數據主要為內蒙和青海部分地區的樣點研究數據,建議修改為XXX數據集。

    2. 文章中提到必填項包括關鍵的實驗方法,數據樣例中沒有看到,例如青藏高原高寒草甸土壤移植實驗之原位土壤細菌群落組成,土壤移植實驗方法沒有說明。數據集中的細菌群落組成好像是由高通量測序數據計算得來,其計算方法作為關鍵的實驗方法,也應簡要說明。文章中還提到土壤理化性狀測定和數據分析應采用國際認可的標準方法,提交時應注明具體條件、參數。但在樣例數據中也沒有。

    3.土壤溫度和土壤水分對土壤微生物數據影響較大,建議數據缺失時進行必要的說明。

    4. 該數據庫建設的目的是為了整合來自不同地點的土壤微生物組成信息,建議規范化現存數據中的土壤類型、植被類型、土地利用類型。

    同行評議二:

    (1)摘要:建議重新組織,使語言更通順,表述更完整。

    (2)“在我國,尚沒有系統的、關于微生物群落的系統分類組成、多樣性、時空變異等數據,更不清楚驅動微生物特征的關鍵因子是什么?!?“為此,我們提出建設土壤生物數據庫和分析系統,以填補該項研究空白,服務科學研究和生產實踐?!苯ㄗh“在我國,尚沒有、以填補該項研究空白”這樣的詞慎用,除非有確鑿的證據。

    (3)“另一方面,本數據庫的管理員會根據已發表的與土壤生物相關的文獻,向作者索要數據,幫助他們完成數據的整理和上傳?!薄八饕笔欠窈线m?

    (4)“本數據庫的數據均來自于用戶上傳:一方面,用戶可以主動將自己的科研數據通過上傳模版提交到數據庫;另一方面,本數據庫的管理員會根據已發表的與土壤生物相關的文獻,向作者索要數據,幫助他們完成數據的整理和上傳?!倍际怯脩羯蟼??還是管理員幫助整理上傳?還是其他?表達不清。

    (5)“注:粗體顯示的字段為必填項,其他為選填項(缺失值)”,黑體表示必填字段并不通用,且打印版本中區分不明顯,建議采用通用的表達方式,比如加“*”表示必填

    (6)“土壤生物數據庫內蒙古及青藏高原草地數據集目前記錄項目數據3條,樣點數據20條”,“土壤生物數據庫內蒙古及青藏高原草地數據集”是本文提到的數據庫嗎?如果是,建議統一名稱,如果不是,建議詳細描述。

    (7) 是否應該指向“樣點ID”?

    (8)“引用數據”、“請使用以下方式引用本文”為何出現兩次?

    (9)建議文字盡量減少口語化表達,語言表達盡量通順,前后邏輯保持一致,標點準確。

    【2016-10-11】 評論來自:版本 1
    作者:

    同行評議一:

    1.可供下載的數據主要為內蒙和青海部分地區的樣點研究數據,建議修改為XXX數據集。

    2. 文章中提到必填項包括關鍵的實驗方法,數據樣例中沒有看到,例如青藏高原高寒草甸土壤移植實驗之原位土壤細菌群落組成,土壤移植實驗方法沒有說明。數據集中的細菌群落組成好像是由高通量測序數據計算得來,其計算方法作為關鍵的實驗方法,也應簡要說明。文章中還提到土壤理化性狀測定和數據分析應采用國際認可的標準方法,提交時應注明具體條件、參數。但在樣例數據中也沒有。

    3.土壤溫度和土壤水分對土壤微生物數據影響較大,建議數據缺失時進行必要的說明。

    4. 該數據庫建設的目的是為了整合來自不同地點的土壤微生物組成信息,建議規范化現存數據中的土壤類型、植被類型、土地利用類型。

    作者回復:?

    1.標題已改為“內蒙古及青藏高原草地土壤生物數據集”

    2. 感謝您的寶貴建議!本文涉及的數據是基于VDB平臺設計的V1.0版本,功能尚不完善。在該版本中,實驗條件、參數可以填寫到“樣點補充信息”“更多樣品信息”這兩個相當于備注的字段中。我們即將完成開發的V2.0版本將會提供更多更豐富的字段,分別用于測序分析和理化實驗方法、參數的描述。

    3.感謝您的寶貴建議!考慮到部分實驗沒有實測土壤溫度和水分,我們將這兩個字段設置成選填項。如果其他用戶需要研究微生物與土壤溫度或水分的關系,那么這些缺失數據會被排除在外,從而保證分析的可靠性。此外,其他相關字段(例如采樣時氣溫、采樣時間)也可以在一定程度上彌補土壤溫度的不足。我們建議(但無法強制)用戶盡可能完善元數據,從而提高微生物數據的利用價值。

    4. 感謝您的寶貴建議!我們會在數據庫的新版本中完善這些內容。為了舉例說明該數據庫的數據結構,我們從數據庫中選擇了樣品S0000044及所含Sphingomonas屬的信息制作了表1。由于本數據庫的數據大多來自于其他科研工作者的自愿上傳,過多的必填項會打擊用戶上傳數據的積極性,甚至產生胡亂填表的現象;為了保證關鍵數據的質量,我們采集數據的原則是“寧可不填,不可錯填”,因此設置了必填項和選填項兩類字段。在表1中,土壤發生類型、植被類型是選填項,因此可能出現缺失值(-)。對于部分非數值字段,我們采用枚舉型字段,即指定若干選項供用戶選擇,例如土地利用類型有草原、森林、農田、沙漠等幾種選項,如果是其它類型則需人工填寫。

    同行評議二:

    (1)摘要:建議重新組織,使語言更通順,表述更完整。

    (2)“在我國,尚沒有系統的、關于微生物群落的系統分類組成、多樣性、時空變異等數據,更不清楚驅動微生物特征的關鍵因子是什么?!?“為此,我們提出建設土壤生物數據庫和分析系統,以填補該項研究空白,服務科學研究和生產實踐?!苯ㄗh“在我國,尚沒有、以填補該項研究空白”這樣的詞慎用,除非有確鑿的證據。

    (3)“另一方面,本數據庫的管理員會根據已發表的與土壤生物相關的文獻,向作者索要數據,幫助他們完成數據的整理和上傳?!薄八饕笔欠窈线m?

    (4)“本數據庫的數據均來自于用戶上傳:一方面,用戶可以主動將自己的科研數據通過上傳模版提交到數據庫;另一方面,本數據庫的管理員會根據已發表的與土壤生物相關的文獻,向作者索要數據,幫助他們完成數據的整理和上傳?!倍际怯脩羯蟼??還是管理員幫助整理上傳?還是其他?表達不清。

    (5)“注:粗體顯示的字段為必填項,其他為選填項(缺失值)”,黑體表示必填字段并不通用,且打印版本中區分不明顯,建議采用通用的表達方式,比如加“*”表示必填

    (6)“土壤生物數據庫內蒙古及青藏高原草地數據集目前記錄項目數據3條,樣點數據20條”,“土壤生物數據庫內蒙古及青藏高原草地數據集”是本文提到的數據庫嗎?如果是,建議統一名稱,如果不是,建議詳細描述。

    (7) 是否應該指向“樣點ID”?

    (8)“引用數據”、“請使用以下方式引用本文”為何出現兩次?

    (9)建議文字盡量減少口語化表達,語言表達盡量通順,前后邏輯保持一致,標點準確。

    作者回復:

    (1)摘要:建議重新組織,使語言更通順,表述更完整。 【回復】感謝您的寶貴建議!摘要已重新組織。

    (2)“在我國,尚沒有系統的、關于微生物群落的系統分類組成、多樣性、時空變異等數據,更不清楚驅動微生物特征的關鍵因子是什么?!?“為此,我們提出建設土壤生物數據庫和分析系統,以填補該項研究空白,服務科學研究和生產實踐?!苯ㄗh“在我國,尚沒有、以填補該項研究空白”這樣的詞慎用,除非有確鑿的證據。 【回復】已刪除這幾個詞句

    (3)“另一方面,本數據庫的管理員會根據已發表的與土壤生物相關的文獻,向作者索要數據,幫助他們完成數據的整理和上傳?!薄八饕笔欠窈线m? 【回復】已將“向作者索要”修改為“從原作者處獲取”

    (4)“本數據庫的數據均來自于用戶上傳:一方面,用戶可以主動將自己的科研數據通過上傳模版提交到數據庫;另一方面,本數據庫的管理員會根據已發表的與土壤生物相關的文獻,向作者索要數據,幫助他們完成數據的整理和上傳?!倍际怯脩羯蟼??還是管理員幫助整理上傳?還是其他?表達不清。 【回復】已將“數據均來自于用戶上傳”改為“數據采集有兩種方式”

    (5)“注:粗體顯示的字段為必填項,其他為選填項(缺失值)”,黑體表示必填字段并不通用,且打印版本中區分不明顯,建議采用通用的表達方式,比如加“*”表示必填 【回復】已將粗體改為字段末尾加*號標注

    (6)“土壤生物數據庫內蒙古及青藏高原草地數據集目前記錄項目數據3條,樣點數據20條”,“土壤生物數據庫內蒙古及青藏高原草地數據集”是本文提到的數據庫嗎?如果是,建議統一名稱,如果不是,建議詳細描述。 【回復】“內蒙古及青藏高原草地數據集”(根據編輯和同行專家的建議,目前已改為“內蒙古及青藏高原草地土壤生物數據集”)是土壤生物數據庫中的一個數據集,已在文中注明。目前該數據庫只完成了這一個數據集,以后會增加更多地區的數據集,所有數據集都采用同一標準。

    (7) 是否應該指向“樣點ID”? 【回復】圖1是VDB后臺“配置發布模型”原圖,“包含樣點”“包含樣品”“門水平信息”“屬水平信息”這四個字段是集合類型。以“項目列表”的“包含樣點”字段(連線的起點)為例,它的目標實體是“樣點列表”,目標列(也就是連線的終點)是“項目ID”,這樣才能保證在“項目列表”每個項目的“詳細”頁面顯示出該項目所包含的樣點列表。我們嘗試過將“包含樣點”指向“樣點ID”,這么做會出錯,無法實現上述功能。

    (8)“引用數據”、“請使用以下方式引用本文”為何出現兩次? 【回復】這可能是上傳文稿后由系統自動添加這些內容導致的,已刪除重復的部分

    (9)建議文字盡量減少口語化表達,語言表達盡量通順,前后邏輯保持一致,標點準確。 【回復】感謝您的寶貴建議!已按要求修改。

    【2016-10-12】 評論來自:版本 1
    編委會成員:

    經編委會投票決定錄用本文。

    【2016-10-26】 評論來自:版本 1

    提交問題或建議:



    您還沒有登錄,請[登錄]或[ 注冊]!

    內蒙古及青藏高原草地土壤生物數據集

    瀏覽下載總計

    網頁瀏覽 論文下載
    10667 44

    內蒙古及青藏高原草地土壤生物數據集

    作者發表的論文

    1 青藏高原樣帶高寒生態系統土壤有機碳分布及其影響因子
    田玉強,歐陽華,宋明華,牛海山,胡啟武. 浙江大學學報. 農業與生命科學版[J],2007,33(4),443-449

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 17

    2 增溫與放牧對矮嵩草草甸4種植物氣孔密度和氣孔長度的影響
    張立榮,牛海山,汪詩平,李英年,趙新全. 生態學報[J],2010,30(24),6961-6969

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 14

    3 增溫對青藏高原高寒草甸生態系統固碳通量影響的模擬研究
    亓偉偉,牛海山,汪詩平,劉艷杰,張立榮. 生態學報[J],2012,32(6),1713-1722

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 10

    4 我國北方植被指數對土壤濕度的敏感性分析
    張強,肖風勁,牛海山,董文杰. 生態學雜志[J],2005,24(7),715-718

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 10

    5 荒漠化重建地區土壤有機碳時空動態特征 --以陜西省榆林市為例
    程淑蘭,歐陽華,牛海山,王琳,田玉強,張鋒,高俊琴. 地理學報[J],2004,59(4),505-513

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 9

    6 羊草氣孔導度的Jarvis-類模型
    牛海山,旭日,張志誠,陳佐忠. 生態學雜志[J],2005,24(11),1287-1290

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 8

    7 基于GIS的中國松樹萎蔫病發生的適應性評價
    張志誠,牛海山,黃保續,張磊. 蘭州大學學報. 自然科學版[J],2005,41(5),27-32

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 7

    8 民勤三項農業節水措施的相對潛力估算
    張翠芳,牛海山. 農業工程學報[J],2009,25(10),7-12

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 5

    9 生態學試驗設計與解釋中的常見問題
    牛海山,崔驍勇,汪詩平,王艷芬. 生態學報[J],2009,29(7),3901-3910

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 5

    10 土壤侵蝕模型中植被管理因子的遙感估算
    宋現鋒,段崢,牛海山,河野泰之. 北京林業大學學報[J],2009,31(3),58-63

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 4

    11 荒漠化逆轉地區耕層土壤有機碳時空動態研究
    程淑蘭,歐陽華,牛海山,王琳,高俊琴,張鋒,田玉強. 蘭州大學學報. 自然科學版[J],2004,40(6),96-100

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 3

    12 荒漠化重建地區土壤有機碳動態研究
    程淑蘭,歐陽華,牛海山,王琳,田玉強,張鋒. 水土保持學報[J],2004,18(3),74-77,89

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 3

    13 降雨量對大針茅水分利用效率的影響
    劉艷杰,張立榮,牛海山,仲延凱,徐興良,張翠芳. 中國科學院研究生院學報[J],2013,30(3),334-338

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 1

    14 內蒙古草原常見植物葉片δ~(13)C和δ~(15)N對環境因子的響應
    劉艷杰,許寧,牛海山. 生態學報[J],2016,36(1),235-243

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 1

    15 基于修正MCMC的端元可變的混合像元分解算法
    胡霞,宋現鋒,牛海山. 計算機科學[J],2013,40(11),308-311

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 0

    16 不同灌溉方法對寧夏葡萄園土壤二氧化碳和甲烷排放的影響
    張亞捷,牛海山,汪詩平,Andreas Wilkes,徐坤,吳旭東. 灌溉排水學報[J],2016,35(1),17-21

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 0

    內蒙古及青藏高原草地土壤生物數據集

    芮俊鵬1,安家興1,牛海山2,李香真1*

    1. 中國科學院成都生物研究所,中國科學院環境與應用微生物重點實驗室、環境微生物四川省重點實驗室,成都 610041;

    2. 中國科學院大學,北京 100049

    * 通訊作者(Email: lixz@cib.ac.cn)

    摘要:草地是陸地生態系統的一個重要組成部分。我國的草地主要集中于內蒙古高原及青藏高原。作為土壤生物數據庫的一個子集,內蒙古及青藏高原草地土壤生物數據集旨在收集、整理這兩個地區的土壤生物組成信息,包括土壤動物、真菌、細菌和古菌的分類組成;同時收集儲存與土壤生物樣品相對應的環境因子參數,如地理坐標、氣候、植被、土地利用方式、土壤理化指標等。

    關鍵詞:土壤生物;群落組成;內蒙古高原;青藏高原;草地

    The Inner Mongolia and Qinghai-Tibet grassland soil biota dataset

    Rui Junpeng1, An Jiaxing1, Niu Haishan2, Li Xiangzhen1*

    1. Key Laboratory of Environmental and Applied Microbiology, Environmental Microbiology Key Laboratory of Sichuan Province, Chengdu Institute of Biology, Chinese Academy of Sciences, Chengdu 610041;

    2. University of the Chinese Academy of Sciences, Beijing 100049

    *Email: lixz@cib.ac.cn

    Abstract: The grassland ecosystem is an important part of the terrestrial ecosystem. In China, most grasslands locate in Inner Mongolia and Qinghai-Tibet. As a subset of soil biota database, the Inner Mongolia and Qinghai-Tibet grassland soil biota dataset is used to collect and integrate community compositions of soil biota (fauna, fungi, bacteria, and archaea) from these areas. Moreover, the environmental factors related to the sampling sites and soil samples are also collected, such as geographic positions, climates, plants, soil types, and soil physical and chemical properties.

    Keywords: Soil biota; community composition; spatial and temporal distribution; Inner Mongolia Plateau; Qinghai-Tibet Plateau; grassland

    數據庫(集)基本信息簡介

    數據庫(集)中文名稱

    內蒙古及青藏高原草地土壤生物數據集

    數據庫(集)英文名稱

    The Inner Mongolia and Qinghai-Tibet grassland soil biota dataset

    通訊作者

    李香真(lixz@cib.ac.cn)

    數據作者

    芮俊鵬、安家興、牛海山、李香真

    地理區域

    中國

    數據格式

    *.xlsx

    數據時間范圍

    2009~2013年

    數據量

    1 MB

    數據服務系統網址

    http://www.sciencedb.cn/dataSet/handle/42,

    http://soilbiota.vdbspace.cn

    基金項目

    中國科學院“十二五”科研信息化科技數據資源整合與共享工程,土壤生物數據庫,基金代碼XXH12504-3-18

    數據庫(集)組成

    數據集目前包含3個研究項目的數據:P00001是“內蒙古東部水熱樣帶上土壤細菌組成”,P00002是“內蒙古東部氮沉降土壤細菌群落組成”,P00003是“青藏高原高寒草甸土壤移植實驗之原位土壤細菌群落組成”。對應的3個文件和數據量如下:P00001.xlsx,數據量6116條;P00002.xlsx,數據量4375條;P00003.xlsx,數據量1740條。這3個Excel工作簿均包含5個工作表:項目數據、樣點數據、樣品數據、門水平信息、屬水平信息

    引 ?言

    土壤生物是地球上多樣性最高、物種最豐富的生物類群。每克土壤中僅微生物數量就可達上億,含有高達數百萬個微生物物種,包括真菌、細菌、古菌等。一方面,土壤是最豐富的“菌種資源庫”,例如產抗生素的菌株大多分離自土壤。另一方面,土壤中的生物含有各種功能基因,是一個巨大的“基因資源庫”。這些功能基因可以通過定向挖掘及利用生物工程的手段進行開發生產,為工業、農業和醫藥行業服務。幾乎所有物質轉化都是在微生物功能基因的調控下進行的。微生物的組成和多樣性對土壤的生態功能有直接的影響。

    土壤生物的組成反映了生物之間以及生物與環境之間的相互關系。然而,由于技術手段的限制和微生物系統的復雜性,人們對土壤微生物群落組成、功能及其與環境因子的關系認識不夠深入,遠遠落后于對植物和動物的研究水平。

    以往的研究大多應用分子指紋圖譜類方法,如末端限制性片段長度多態性分析(T?RFLP)[1]、變性梯度凝膠電泳(DGGE)[2]等,通量和分辨率較低,很難把環境中的菌群全面系統地分析到科、屬水平上。由于微生物種群分析復雜繁瑣,一般取樣量有限,難于建立大尺度上微生物群落特征與環境因子的關系。近年來發展起來的高通量測序技術一次可以測定成千上萬條DNA序列,使我們快速地在屬、種水平上對微生物進行系統分類,信息全面、效率高,適宜大批量環境樣品的菌群分析,為微生物群落研究提供了強有力的手段[3]。

    然而,由于土壤生物多樣性高、組成復雜,大量數據分布在文獻中,很難進行系統查詢和比較分析,造成了嚴重的數據資源浪費。因此,建立土壤生物數據庫是利用土壤生物資源的一個必要前提。雖然目前已經存在眾多的生物數據庫,但專門針對土壤中生物群落以及反映土壤性質與生物之間聯系的數據庫卻還沒有。高通量測序的數據一般會上傳到Genbank、European Nucleotide Archive(ENA)等數據庫中保存[4-5],這些數據庫的分析功能偏重于序列相似性和生物分類,無法直接分析、比較樣品的群落組成以及與環境的關系。為此,我們提出建設土壤生物數據庫和分析系統,服務科學研究和生產實踐。我國的草原主要集中于內蒙古高原及青藏高原,近年來這兩個地區成為草地土壤生物研究的熱點區域。因此,收集、整理內蒙古及青藏高原草地土壤生物數據及其環境信息是本數據集的重要工作之一。

    1 ?數據采集和處理方法

    本數據集的數據采集有兩種方式:一方面,用戶可以主動將自己的科研數據通過上傳模版提交到數據庫;另一方面,數據集管理員會根據已發表的與土壤生物相關的文獻,從原作者處獲取數據,幫助他們完成數據的整理和上傳。

    本數據集對數據的要求如下:土壤樣品應采集自原位土壤,而不是實驗室培養的土壤樣品。土壤生物數據應來源于高通量測序數據(例如擴增子測序、宏基因組、宏轉錄組等)或基因芯片數據(例如GeoChip)。土壤理化性狀測定和數據分析應采用國際認可的標準方法,提交時應注明具體條件、參數。為方便不同實驗項目的數據比較,原核生物分類統一采用RDP分類標準[6]。所有數據都按要求填寫到上傳模版中,審核通過后才保存到數據庫中。根據數據的重要程度,上傳模版中的字段分為必填項和選填項(表1)。必填項主要包括項目及聯系人信息、關鍵的實驗方法、采樣地理位置、土壤生物豐度等,這些內容的缺失會影響數據的可靠性和利用價值,因此必須完整填寫,否則無法通過審核。選填項主要包括一些次要的分析指標、土壤理化參數、氣象及植被數據(用戶往往只測試/掌握了其中一部分參數/信息),以及生物分類等級(大部分土壤微生物是未培養的,無法精確劃分到種屬水平),用戶可以根據實際情況選擇性填寫。數據越詳細,研究價值越高,被他人再次利用的可能性越高,因此我們建議用戶盡可能填寫選填項。

    錄入到數據庫中的每一條數據,都將分配到一個唯一的編號即數據庫中的主關鍵字。通過這個編號,用戶可以對該數據進行查詢、下載和分析等操作,也可以通過相關主題詞來查詢。

    以“內蒙古東部氮沉降土壤細菌群落組成”這個研究項目為例,土壤樣品均采集自各塊樣地的0~10 cm表層土,測序方法為基于16S rRNA擴增子的Miseq測序,PCR引物為515F和806R,數據處理過程中沒有做Subsample標準化和Singleton去除,這些與數據采集和處理相關的信息均詳細記錄在數據庫中(表1)。

    1 ?內蒙古東部氮沉降實驗樣品S0000044及所含Sphingomonas的信息

    所屬數據表

    字段名稱

    字段值

    項目列表

    項目ID

    P00002

    項目名稱*

    內蒙古東部氮沉降土壤細菌群落組成

    項目描述*

    用16S rRNA高通量測序方法研究內蒙古東部羊草草原氮沉降土壤細菌群落組成

    監測對象*

    Bacteria

    聯系人*

    Minjie Yao; Junpeng Rui; Xiangzhen Li

    聯系單位*

    Chengdu Institute of Biology, Chinese Academy of Sciences

    聯系郵箱*

    yaomj@cib.ac.cn; ruijp@cib.ac.cn; lixz@cib.ac.cn

    引用文獻

    Yao et al. 2014. Rate-specific responses of prokaryotic diversity and structure to nitrogen deposition in the Leymus chinensis steppe. Soil Biology and Biochemistry 79: 81-90.

    建庫類型*

    16S rRNA

    測序方法*

    Miseq

    PCR前引物

    515F

    PCR后引物

    806R

    Subsample處理

    No

    去除Singleton

    No

    樣點列表

    樣點ID

    G000010

    樣點地名*

    內蒙古草原生態定位站

    緯度(°)*

    43.630001068115234

    經度(°)*

    116.69999694824219

    海拔高度(m)*

    1250.0

    土壤采集深度(cm)

    0~10

    年平均降水量 (mm)

    346.1

    年均溫(℃)

    0.3

    采樣時氣溫(℃)

    采樣時間*

    2012/7/9

    地上生物量(g/m3

    植被蓋度(%)

    主要植被類型

    土地利用類型*

    草原

    土壤質地

    壤土

    土壤發生類型

    樣點補充信息

    施氮量0 g·N·m-2·yr-1

    樣品列表

    樣品ID

    S0000044

    土壤pH*

    7.34

    土壤溫度(℃)

    土壤含水率(%,wt/wt)

    17.91

    電導率(μs/cm)

    175.1

    總氮(%)

    0.22

    總有機碳(%)

    2.4

    銨態氮(mg/kg dry soil)

    1.37

    硝態氮(mg/kg dry soil)

    自定義分組1

    0N

    自定義分組2

    Total sequences

    16 257

    Total OTUs

    2688

    Observed species

    2047

    Chao1 estimation

    4325

    Shannon's index

    9.137

    更多樣品信息

    土水比1:5(w:w)測定土壤pH;靛酚藍比色法測銨態氮;重鉻酸鉀氧化法測總有機碳;Kjeldahl法測總氮

    門、屬水平信息

    Bacteria

    Proteobacteria

    門的相對豐度(%)*

    25.571 2

    Alphaproteobacteria

    Sphingomonadales

    Sphingomonadaceae

    Sphingomonas

    屬的相對豐度(%)*

    1.8149

    注:星號(*)標注的字段為必填項,其他為選填項(缺失值在表中用“-”表示)

    2 ?數據集樣本描述

    內蒙古及青藏高原草地土壤生物數據集是土壤生物數據庫的一個子集,目前記錄項目數據3條,樣點數據20條,土壤樣品數據96條,生物門水平相對豐度數據1815條,生物屬水平相對豐度數據10297條。已收錄的3個項目分別為“內蒙古東部水熱樣帶上土壤細菌組成”(P00001)“內蒙古東部氮沉降土壤細菌群落組成”(P00002)[7]“青藏高原高寒草甸土壤移植實驗之原位土壤細菌群落組成”(P00003)[8]。

    1 ?VDB后臺“配置發布模型”:5個數據表所含字段以及數據表之間的關系

    項目數據主要包括項目名稱、監測對象(細菌、古菌、真菌、土壤動物等)、建庫類型(16S rRNA或功能基因擴增子測序、宏基因組、宏轉錄組等)、測序方法(Miseq、Hiseq、454測序等)、PCR引物、聯系人及所在單位等信息(圖1)。如果該項目數據已有文章發表,也可將發表信息隨時更新到數據庫中,方便他人引用。項目數據還包括測序數據的處理情況,例如數據是否做Subsample標準化(即統一所有樣品的序列數目)、是否去除了OTU(按97%序列相似性劃分的可操作分類單元,相當于種)中的Singleton(即只有一條序列的OTU)。此外,項目數據的詳細頁面還列出了該項目所包含的樣點列表。例如,項目P00002是用16S rRNA高通量測序方法研究內蒙古東部羊草草原氮沉降土壤細菌群落組成,其監測對象為土壤中的細菌。

    樣點數據主要包括地理位置(地名、經緯度、海拔)、氣候(年降水量、年均溫)、植被(生物量、蓋度、主要物種)、土壤類型(土地利用類型、土壤分類)等。此外,樣點數據的詳細頁面還列出了該樣點所包含的土壤樣品列表。例如,項目P00002包含7個樣點,樣地位置在內蒙古草原生態定位站,每個樣點的施氮量為0~28 g·N·m-2·yr-1不等。

    土壤樣品數據主要包括土壤理化性狀(含水量、pH、土壤溫度、電導率、總有機碳、銨態氮、硝態氮、總氮等)、所監測生物群落的α多樣性等。用戶也可自定義屬性(例如試驗的分組、處理、其他重要的指標),并注明測定某一理化性狀的實驗方法。此外,樣品數據的詳細頁面還列出了該樣品所包含的生物門和屬列表。例如,項目P00002包含41個樣品,每個樣品都單獨測了土壤理化性狀和細菌16S rRNA擴增子序列。

    生物門和屬水平相對豐度數據列出了該生物門和屬在某土壤樣品中的相對豐度,以及更高級別的生物分類。例如,項目P00002包含714條門水平相對豐度數據和3612條屬水平相對豐度數據。

    上述5類數據通過項目、樣點、樣品的編號進行關聯。以內蒙古東部氮沉降實驗樣品S0000044為例(表1),既可以通過該樣品所屬的項目編號和樣點編號,找到其項目信息和樣點信息,也可以通過該樣品包含的門、屬水平信息列表或搜索框,找到某個門、屬在該樣品中的含量。例如,Sphingomonas屬在該樣品中的相對豐度為1.81%,該屬所在的Proteobacteria門在該樣品中的相對豐度為25.57%。

    3 ?數據質量控制和評估

    數據質量由上傳模版、管理員審核、腳本程序三重把關(圖2)。

    第一步,用戶要按要求填寫上傳模版文件,從而達到數據的規范化。模版文件是一個Excel文件,包含“項目列表”“樣點列表”“樣品列表”“門水平數據”“屬水平數據”等5個數據表,所包含的字段見圖1。在該文件中,必填的字段(例如經緯度、土壤pH等重要信息)用紅色字體標注,其他為選填字段。部分字段會附帶批注,用于解釋該字段的意義和填寫方式。

    第二步,管理員審核用戶提交的上傳文件,及時糾正發現的錯誤。例如,必填字段是否都填寫完整,填寫內容是否符合字段要求,數據是否符合本數據庫接收條件,是否使用RDP分類標準,等等。如果文件審核不通過,管理員將通知用戶進行修改。

    第三步,上傳文件由腳本程序轉化為數據庫存儲文件。如果上傳文件的格式有誤,則轉化失敗,將錯誤信息返回給用戶糾正。某些字段對數據格式有特殊要求,例如經緯度必須是以度為單位的小數形式,而不能是度分秒格式;又如總有效序列數必須是整數。腳本程序比管理員人工審核更適合做格式上的檢查。

    2 ?數據上傳及質量控制

    4 ?數據價值

    本數據集能夠為農業生產、環境治理、生物工程等科研和應用提供科學數據及指導。

    首先,本數據庫的宗旨是收集并整合不同研究項目、不同科研論文中的土壤生物數據,一方面使得已發表的科研數據能夠更方便地被廣大用戶獲取并反復利用,避免數據資源的浪費,另一方面能夠提高與數據相關的科研成果的引用率,起到宣傳推廣科研成果的效果。

    其次,本數據庫的生物組成數據及其環境因子數據,可以揭示生物組成與環境因子的關系,預測生物組成的動態變化模型。

    第三,可以在本數據集尋找與特定的土壤生物最相近的生物種群,以進行比較群落學研究。

    第四,根據土壤的宏觀參數信息,能夠建立土壤生物的分布圖及其動態變化模式,分析生物組成與環境因子的關系。

    第五,提供可視化的界面交流模式,便于查找微生物在時間和空間上的分布特征。

    第六,本數據集也收集功能基因擴增子測序數據和環境基因組數據,以分析微生物群落的潛在代謝功能、繪制基因地圖。

    以項目P00002為例,通過本數據集可以全面了解這個項目的實驗設計和生物、環境數據,了解氮素、pH、水分等環境參數對草原土壤菌群的影響,揭示氮沉降影響草原生態系統的機制。

    5 ?數據使用方法和建議

    本數據集基于VisualDB平臺構建,可在Science Data Bank網站下載(http://www.sciencedb.cn/dataSet/handle/42),也可在“土壤生物數據庫”(V1.0版)中進行在線查詢( http://soilbiota.vdbspace.cn)。用戶可通過若干篩選字段來查詢數據庫中符合條件的研究項目、樣點、土壤樣品和生物群落(門、屬水平),利用查詢結果比較不同實驗、不同地區的土壤生物群落差異,研究群落組成與環境的關系(圖3)。這個版本的數據提交工作由管理員在后臺完成(用戶通過郵件將數據發送給管理員)。

    3 ?數據使用方法

    ?“土壤生物數據庫”(V1.0版本)的導航組件列出了“項目列表”“樣點列表”“樣品列表”“門水平數據”“屬水平數據”這5個查詢鏈接,點擊鏈接可進入查詢頁面(圖4)。在查詢頁面的“數據信息”版塊可以選擇要查詢的字段、查詢規則、需要排序的字段,并在文本框里輸入要查詢的關鍵字,點擊“查詢”按鈕即可顯示結果。如果要添加查詢條件,可點擊“查詢”按鈕右邊的向下箭頭按鈕,再點擊“添加條件”,設置完全部查詢條件后,點擊“高級查詢”按鈕即可顯示結果。查詢結果只顯示了部分字段,點擊“操作”下面的“詳細”可查看該條目的全部信息。

    4 ?數據庫的樣品查詢頁面

    開發中的V2.0版本將在此基礎上提供數據批量下載、統計分析(ANOVA、相關性分析、Mantel test等)、繪圖(群落組成圖、群落與環境關系圖、主成分分析圖、Venn圖、熱圖等)等功能。此外,用戶將可以注冊、登錄帳號并直接提交數據。用戶也可以自由決定數據公開的時間。

    致 ?謝

    感謝中國科學院成都生物研究所姚敏杰博士為數據采集和整理付出的辛勤勞動。

    作者分工職責

    李香真(1967—),男,黑龍江省鶴崗市人,博士,研究員,研究方向為生物質能源和微生物生態學,在本項目中負責總體工作,包括設計、實施工作。

    芮俊鵬(1984—),男,安徽省蕪湖市人,博士,助理研究員,研究方向為生物信息和微生物生態學,在本項目中主要負責數據庫設計、腳本編寫、日常管理維護、數據整理和上傳等工作。

    安家興(1985—),男,貴州省遵義市人,博士后,研究方向為土壤微生物生態學,畢業于蘭州大學生命科學學院,在本項目中主要負責網站設計、數據收集工作。

    牛海山(1973—),男,遼寧省建平縣人,博士,副教授,研究方向為草原植物生態學,主要負責VisualDB本地化安裝和維護。

    參考文獻

    [1] Marsh T. Terminal restriction fragment length polymorphism (T?RFLP): An emerging method for characterizing diversity among homologous populations of amplification products[J]. Current Opinion in Microbiology, 1999, 2: 323–327.

    [2] Muyzer G, Smalla K. Application of denaturing gradient gel electrophoresis (DGGE) and temperature gradient gel electrophoresis (TGGE) in microbial ecology[J]. Antonie van Leeuwenhoek, 1998, 73: 127–141.

    [3] Li X, Rui J, Mao Y, et al. Dynamics of the bacterial community structure in the rhizosphere of a maize cultivar[J]. Soil Biology and Biochemistry, 2014, 68: 392–401.

    [4] Benson D, Karsch-Mizrachi I, Lipman DJ, et al. GenBank[J]. Nucleic Acids Research, 2005, 33: D34–D38.

    [5] Leinonen R, Akhtar R, Birney E, et al. The European Nucleotide Archive[J]. Nucleic Acids Research, 2011, 39: D28–D31.

    [6] Cole J, Wang Q, Cardenas E, et al. The Ribosomal Database Project: improved alignments and new tools for rRNA analysis[J]. Nucleic Acids Research, 2009, 37: D141–D145.

    [7] Yao M, Rui J, Li J, et al. Rate-specific responses of prokaryotic diversity and structure to nitrogen deposition in the Leymus chinensis steppe[J]. Soil Biology and Biochemistry, 2014, 79: 81–90.

    [8] Rui J, Li J, Wang S, et al. Responses of Bacterial Communities to Simulated Climate Changes in Alpine Meadow Soil of the Qinghai-?Tibet Plateau[J]. Applied and Environmental Microbiology, 2015, 81(17): 6070–6077.

    引用數據

    (1) 芮俊鵬, 安家興, 牛海山, 李香真. 內蒙古及青藏高原草地土壤生物數據集[DB/OL]. Science Data Bank. DOI: 10.11922/sciencedb.138.

    ?

    引文格式:芮俊鵬, 安家興, 牛海山, 李香真. 內蒙古及青藏高原草地土壤生物數據集[J/OL]. 中國科學數據, 2016, 1(3). DOI:10.11922/csdata.170.2015.0021.

    下載




    极速快三 <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <文本链> <文本链> <文本链> <文本链> <文本链> <文本链>