• 中國鳳蝶標本圖像特征數據集

    責編:

    根據同評專家意見,匯總如下修改意見,請回復、參考修改,并重傳文章:

    1. 英文摘要中:①請確認第一句是“dataset”還是“data set”。②“value of a image”應為“value of an image”。

    2. 數據集基本信息簡介中:①“數據時間范圍”一項缺少單位,而且是“1998”還是“1994年”?請確認。②網址應寫具體的網址:http://www.sciencedb.cn/dataSet/handle/8。

    3. 第2.1,2.2中等(1)(2)等后面的空格數不一,如果只是自動生成的PDF顯示的問題,在word中無需修改。

    4. 建議將數據處理成兩個表,從而避免“img_path”和“taxa_latin”兩個字段中的重復內容。不改亦可。

    5. 建議全文統一敘述“顏色”“形狀”“紋理”的順序,包括在摘要、流程圖中的順序。

    【2016-04-22】 評論來自:版本 1
    作者:

    1. 英文摘要中:①請確認第一句是“dataset”還是“data set”。②“value of a image”應為“value of an image”。

    回復: 已修正。①第一句是dataset 。②修正。

    2. 數據集基本信息簡介中:①“數據時間范圍”一項缺少單位,而且是“1998”還是“1994年”?請確認。②網址應寫具體的網址:http://www.sciencedb.cn/dataSet/handle/8。

    回復: 已修正。

    3. 第2.1,2.2中等(1)(2)等后面的空格數不一,如果只是自動生成的PDF顯示的問題,在word中無需修改。

    回復: 已修正。 這個不是空格數的問題,是段落居中對齊導致的問題,已經調整為段落的左對齊。

    4. 建議將數據處理成兩個表,從而避免“img_path”和“taxa_latin”兩個字段中的重復內容。不改亦可。

    回復:接受意見,但是出于“便于各類用戶理解和使用”的角度,我們不做修改。

    5. 建議全文統一敘述“顏色”“形狀”“紋理”的順序,包括在摘要、流程圖中的順序。

    回復: 已修正。

    【2016-07-27】 評論來自:版本 1
    編委會成員:

    經編委會投票決定錄用本文。

    【2016-10-26】 評論來自:版本 1

    提交問題或建議:



    您還沒有登錄,請[登錄]或[ 注冊]!

    中國鳳蝶標本圖像特征數據集

    瀏覽下載總計

    網頁瀏覽 論文下載
    10595 44

    中國鳳蝶標本圖像特征數據集

    作者發表的論文

    1 鳥獸物種多樣性測度的G-F指數方法
    蔣志剛,紀力強. 生物多樣性[J],1999,7(3),220

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 94

    2 大尺度生物多樣性評價
    趙**,紀力強. 生物多樣性[J],2003,11(1),78-85

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 13

    3 生物多樣性信息學研究進展
    王利松,陳彬,紀力強,馬克平. 生物多樣性[J],2010,18(5),429-443

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 10

    4 生物多樣性信息系統建設的現狀及CBIS簡介
    紀力強. 生物多樣性[J],2000,8(1),41

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 10

    5 小木蠹蛾性信息素分泌腺的位置及組織學
    張金桐,韓艷,甘雅玲,孟憲佐. 昆蟲學報[J],2002,45(4),430-435

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 7

    6 槐小卷蛾性誘劑的合成與林間誘蛾活性試驗
    孟憲佐,韓艷,李維維. 林業科學[J],1996,32(2),150

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 5

    7 用性信息素誘捕法防治槐小卷蛾研究
    盛承發,張桂芬,韓艷,閻曉華,孟憲佐. 生態學報[J],2001,21(10),1583

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 5

    8 黃斑卷蛾性誘劑的合成與田間誘蛾活性試驗
    孟憲佐,韓艷,劉玉秀. 林業科學[J],2001,37(5),97

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 3

    9 生物多樣性數據集成模式初探
    喬慧捷,韓艷,李諾,紀力強. 生物多樣性[J],2004,12(5),553-561

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 3

    10 昆蟲圖像分割方法及其應用
    王江寧,紀力強. 昆蟲學報[J],2011,54(2),211-217

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 3

    11 生物多樣性評價軟件BiodiversityMapping的設計與實現
    趙**,紀力強. 生物多樣性[J],2004,12(5),541-545

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 2

    12 物種潛在分布地預測系統PSDS的設計與實現
    鄧浩,紀力強. 生物多樣性[J],2008,16(1),96-102

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 2

    13 保護生物多樣性,促進可持續發展——紀念《中國生物物種名錄》和《中國生物多樣性紅色名錄》發布
    蔣志剛,覃海寧,劉憶南,紀力強,馬克平. 生物多樣性[J],2015,23(3),433-434

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 2

    14 PSDS 2.0:一個基于GIS和多個模型的生物潛在分布地預測系統
    林聰田,紀力強. 生物多樣性[J],2010,18(5),461-472

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 1

    15 生物標本地理信息系統SpecimenMapping的設計和實現
    張尚武,紀力強. 動物學雜志[J],2006,41(4),64-70

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 0

    16 相對特征在昆蟲目級階元圖像自動鑒定中的應用
    王江寧,宋志順,紀力強,梁愛萍. 動物分類學報[J],2010,35(3),585-590

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 0

    17 金龜子化學通訊與信息化學物質
    孟憲佐,韓艷,閆曉華. 生命科學[J],1999,11(5),39

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 0

    18 物種和植被資源信息系統的建設及展望
    李奕,董鳴,高瓊,紀力強,徐克學,關烽,馬俊才,楊奠安,傅德志,張新時. 資源科學[J],2001,23(1),40

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 0

    19 槐小卷蛾性信息素次要組分對林間誘蛾活性的影響
    韓艷,傅曉燕,孟憲佐. 植物保護[J],1999,25(3),11

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 0

    20 流程化的生態建模方法與科學工作流系統
    喬慧捷,林聰田,王江寧,紀力強. 生物多樣性[J],2014,22(3),277-284

    數據來源:CSCD中國科學引文數據庫      CSCD      被引次數: 0

    中國鳳蝶標本圖像特征數據集

    王江寧1,韓艷1,紀力強1*

    1. 中國科學院動物研究所,北京 100101

    *? 通訊作者(Email: ji@ioz.ac.cn)

    摘要:中國鳳蝶標本圖像特征數據集是在對蝴蝶標本圖像自動識別的研究中產生的。本數據集收集了使用規范方法從390幅經過處理后的中國鳳蝶標本圖像中提取的三個最常用特征的數值數據,即顏色、形狀和紋理特征。本數據集的每條記錄都包含了蝴蝶的分類信息、圖像編號以及特征信息,為模式識別、昆蟲分類等研究提供了基礎數據。

    關鍵詞:鳳蝶科;標本圖像;圖像特征;模式識別

    Feature dataset of Chinese papilionidae specimen image

    Wang Jiangning, Han Yan, Ji Liqiang

    Abstract: Feature dataset of Chinese papilionidae specimen image is created in the researches of butterfly image recognition. This dataset collects the color, texture and shape features from 390 pre-processed specimen images of Chinese papilionidae by standardized feature extraction methods. Each record contains the classification information, image identifier feature ID and feature value of an image. The dataset could support research on pattern recognition and entomology.

    Keywords: Papilionidae; specimen image; image feature; pattern recognition

    數據庫(集)基本信息簡介

    數據庫(集)中文名稱

    中國鳳蝶標本圖像特征數據集

    數據庫(集)英文名稱

    Feature dataset of Chinese papilionidae specimen image

    通訊作者

    紀力強(ji@ioz.ac.cn)

    數據作者

    王江寧,韓艷,紀力強

    數據時間范圍

    1994年

    地理區域

    中國

    數據格式

    .xlsx

    數據量

    1.4 MB

    數據服務系統網址

    http://www.sciencedb.cn/dataSet/handle/8

    基金項目

    國家自然科學青年基金(31501841)

    數據庫(集)組成

    收集了390幅中國鳳蝶標本圖像的分類信息,從中提取的顏色、形狀、紋理特征數據,以及原始標本縮略圖的索引

    引 言

    基于圖像的模式識別被應用于各個領域[1],但多數是在與人體或者機器人相關的領域,對于昆蟲圖像的研究相對較少。這由兩方面原因造成:一方面,昆蟲學方面的數據庫不少[2],但是適合模式識別研究的圖像數據庫卻不多[3];另一方面,昆蟲圖像不少,但是帶有可靠分類信息的昆蟲圖像的數據不如人臉、指紋等圖像數據容易獲取。因此,適合模式識別研究的昆蟲學數據集相對較少,限制了模式識別在昆蟲學中的應用。本數據集收集整理了《中國蝶類志》(1994版)[4]中的標本圖片,經過一系列處理后形成單一背景圖像的特征數據。這些特征均使用作者提出的特征提取方法[5]從圖像中提取而來,并配有準確的分類學信息,對于模式識別方法、昆蟲分類學的研究人員有重要的意義。

    1? 數據采集和處理方法

    原始數據是掃描處理存檔的蝴蝶標本的圖像數據。這些圖像經過背景切割后形成純色背景圖像,保留了主體的色彩。我們使用已經公開發表的固定方法[5]提取處理后的圖像特征,本方法的主要處理模塊如圖1所示。

    1? 圖像特征提取的主要模塊

    1.1? 規范化圖像

    本過程由2個步驟構成:

    步驟1:去除背景顏色,保留主體(蝴蝶標本),獲取主體的最小包絡矩形。

    步驟2:從圖像中剪裁出最小包絡矩形,將剪裁的圖像縮放到512×512 px,獲得規范圖。

    1.2? 提取顏色特征

    本過程由4個步驟組成:

    步驟1:計算主體的重心以及長徑(主體上到重心最遠點的距離)。

    步驟2:以重心為圓心,以長徑的1/2作圓,將圖像分為內、外兩區。

    步驟3:分區提取顏色直方圖,按照R、G、B三通道和16位量化數進行統計。

    步驟4:規一化直方圖到[0, 1],得到兩組48維的直方圖向量(內區一組,外區一組)。

    1.3? 提取形狀特征

    本過程由5個步驟組成:

    步驟1:同1.2節步驟1。

    步驟2:以重心為原點,以向右的水平線段(與長徑等長)為掃描線,順時針掃描圖像,按照間隔1°的角度和1/100的長徑進行采樣,將規范圖轉換成極坐標下的掃描圖,掃描圖應為360×100 px。

    步驟3:統計每條掃描極線中主體部分的數量,獲得形狀直方圖,得到一組360維的值在[0, 100]的向量。

    步驟4:將上述向量值重新量化成20位,并將360個重新量化到10位的向量值重新統計,獲得極線的直方圖(20維[0, 360)的向量),即20個級別的極線各有多少根極線。

    步驟5:將上述直方圖進行規一化處理,得到一組20維[0, 1]的向量。

    1.4? 提取紋理特征

    本過程由5個步驟組成:

    步驟1:同1.2節步驟1。

    步驟2:將彩色圖轉換成灰度圖,使用公式v=(R+G+B)/3轉換。

    步驟3:以重心為原點,以向右的水平線段為掃描線,按照間隔1°順時針掃描圖像,統計每條掃描極線中主體部分的相鄰灰度值變化大于16的數量,并將統計值量化成10級,得到一組360維(360條極線)的值在[0, 10]的向量。

    步驟4:將360個重新量化到10位的向量值重新統計,獲得極線的直方圖(10維[0,360)的向量),即10個級別的極線變化各有多少根極線。

    步驟5:將上述直方圖進行規一化處理,得到一組10維[0, 1]的向量。

    1.5? 特征數據集

    1.1節中步驟是提取各種特征的必需步驟,通過1.2、1.3、1.4節描述的步驟提取了顏色、形狀、紋理特征。而每幅圖像的分類信息是人工標記的。最終,特征數據、圖像代號以及分類信息構成本數據集。

    2? 數據樣本描述

    數據集以表格形式進行存儲,表格的字段說明見表1。表2給出了一組數據的示例。其中,圖像代碼的命名規則為:“-”前的數字是標本圖像在《中國蝶類志》中的頁碼;“-”后的數字是自定義的圖像編號,按順序編號。數據集中還存放有原始標本縮略圖的索引,便于用戶追溯原始圖像標本。本數據集中的特征代碼意義如表3所示。其中特征代碼中的下劃線前半部是特征向量的代碼,后半部是特征向量的維數編號。如cbirT6_0表示形狀特征向量的第1個值,cbirT9_48表示外區色彩特征向量的第1個值。分類學名字段以“屬名 種名”格式提供。本數據集結構較簡單,此設計便于模式識別研究人員直接使用或者稍作調整后使用。

    1 數據集的元數據描述

    字段名

    字段意義

    字段類型

    tk_name

    特征代碼

    字符

    tk_value

    特征值

    數值(雙精度實數)

    img_path

    圖像代碼

    字符

    taxa_latin

    分類學名

    字符(拉丁學名)

    2 范例數據

    tk_name

    tk_value

    img_path

    taxa_latin

    cbirT6_0

    1.00000000000000000000

    100-1.png

    Troides magellanus

    cbirT6_1

    0.10961250000000000000

    100-1.png

    Troides magellanus

    cbirT6_10

    0.62510380000000000000

    100-1.png

    Troides magellanus

    cbirT6_11

    0.84378030000000000000

    100-1.png

    Troides magellanus

    cbirT6_12

    0.62506570000000000000

    100-1.png

    Troides magellanus

    3? 數據集中的特征代碼

    特征代碼

    意義

    cbirT9_[0-47]

    48維內區色彩特征

    cbirT9_[48-95]

    48維外區色彩特征

    cbirT6_[0-19]

    20維的形狀特征

    cbirT7_[0-9]

    10維紋理特征

    3? 數據質量控制和評估

    本數據集的特征提取方法已經公開發表,并得到了領域同行的肯定。數據提取過程也已程序化,設計并完成了相應的組件。該組件經過多次人工驗證,運行穩定可靠。本數據集通過程序調用該組件生成,由固定特征提取模塊進行特征提取的操作,保證了特征數據的可靠性,不會產生誤差數據。

    原始圖像信息經過人工采集、校對和三次核對,保證了分類信息數據的可靠性。鑒于分類學中分類系統的會隨學科的發展而變化,本數據集中圖像的分類信息以1994版《中國蝶類志》分類系統為標準。

    4? 數據使用方法和建議

    本數據集數據形式簡單,在使用時注意:

    1.特征向量值需要將圖像編號和特征代碼組合后再使用。

    2.顏色特征向量的0–47維和48–95維可以分成兩組向量使用。

    3.特征向量值本身是32位的double型數據,在Excel中顯示受到該軟件的約束,因此在使用時請根據實際需要酌情選擇精度。

    致? 謝

    感謝研究組張榮在原始圖像處理中所做的工作。

    作者分工職責

    王江寧(1982—),男,博士,助研,研究方向:昆蟲圖像識別。主要承擔本數據集的規劃、建設和維護。

    韓艷(1972—),女,學士,工程師,研究方向:生物多樣性信息學。主要承擔本數據集原始數據的采集和整理。

    紀力強(1961—),男,博士,研究員,研究方向:生物多樣性信息學。主要承擔本數據集的設計。

    參考文獻

    [1] Sá?J?P?M?D.?Pattern?recognition:?concepts,?methods?and?applications[M]. Berlin:?Springer,?2001.

    [2] 中國科學院動物研究所,?昆明動物研究所,?上海植物生理生態研究所,?等.?中國動物主題數據庫[DB].?北京:?中國科學院動物研究所,?2009.

    [3] 王江寧,?紀力強.?分布式分類學圖像智能檢索框架設計[C]//?第十屆科學數據庫與信息技術學術研討會.?北京:?兵器工業出版社,?2010:?481~485.

    [4] 周堯.?中國蝶類志[M].?鄭州:?河南科學技術出版社,?1994.

    [5] Wang?J,?Ji?L,?Liang?A,?et?al.?The?identification?of?butterfly?families?using?content-based?image?retrieval[J].?Biosystems?Engineering,?2012,?111(1):?24~32.

    引用數據

    (1) 王江寧, 韓艷, 紀力強. 中國鳳蝶標本圖像特征數據集[DB/OL]. Science Data Bank. DOI: 10.11922/sciencedb.180.8.

    ?

    引文格式:王江寧, 韓艷, 紀力強. 中國鳳蝶標本圖像特征數據集[J/OL]. 中國科學數據, 2016, 1(3). DOI: 10.11922/csdata.180.2015.0008.

    下載




    极速快三 <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <文本链> <文本链> <文本链> <文本链> <文本链> <文本链>