學(xué)術(shù)不端文獻(xiàn)論文查重檢測(cè)系統(tǒng) 多語(yǔ)種 圖文 高校 期刊 職稱 查重 抄襲檢測(cè)系統(tǒng)
中國(guó)知網(wǎng)學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng),支持本、碩、博各專業(yè)學(xué)位論文學(xué)術(shù)不端行為檢測(cè) ! 支持“中國(guó)知網(wǎng)”驗(yàn)證真?zhèn)?"期刊職稱AMLC/SMLC、本科PMLC、知網(wǎng)VIP5.3/TMLC2等軟件。
關(guān)鍵詞:網(wǎng)絡(luò)檢索重萬(wàn)方學(xué)位論文全文數(shù)中國(guó)知網(wǎng)(CNKI,以下知網(wǎng))、北京萬(wàn)方數(shù)據(jù)株式會(huì)社(以下簡(jiǎn)稱萬(wàn)方)是中國(guó)國(guó)內(nèi)最具影響力的中文學(xué)位論文的提供者,其中“中國(guó)優(yōu)秀碩士學(xué)位論文全文數(shù)據(jù)庫(kù)””和“中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù)”,萬(wàn)方出版有“中國(guó)學(xué)位論文全文數(shù)據(jù)庫(kù)”。隨著國(guó)內(nèi)作者的著作權(quán)保護(hù)意識(shí)的提高,雙方為了獲得更多的市場(chǎng)份額,在兩個(gè)數(shù)據(jù)庫(kù)業(yè)者的數(shù)據(jù)源、著作權(quán)保護(hù)、產(chǎn)品宣傳等方面的競(jìng)爭(zhēng)越來(lái)越激烈。但是,萬(wàn)方在學(xué)位論文數(shù)據(jù)庫(kù)中大量包含了不提供全文的論文的標(biāo)題錄信息。與提供全文的論文同時(shí)出現(xiàn),沒有明確區(qū)分其數(shù)量。另外,兩個(gè)數(shù)據(jù)庫(kù)業(yè)者的學(xué)位論文數(shù)量都在百萬(wàn)以上,無(wú)法通過(guò)手動(dòng)檢索進(jìn)行統(tǒng)計(jì)。、詳細(xì)全文收錄數(shù)據(jù)。因此筆者認(rèn)為,需要詳細(xì)統(tǒng)計(jì)收錄的學(xué)位授予單位數(shù)、重復(fù)量等指標(biāo)和年度變化情況,分析所收錄的學(xué)位授予單位的收錄穩(wěn)定性,向?qū)W術(shù)機(jī)構(gòu)購(gòu)買學(xué)位論文數(shù)據(jù)庫(kù)提供考試數(shù)據(jù)。1.1數(shù)據(jù)獲取時(shí)間2011年1月17日~2011年1月19日。因此,關(guān)于論文學(xué)位數(shù)的數(shù)字到2011年1月19日為止。
.數(shù)據(jù)獲取方式是在授權(quán)使用范圍內(nèi)登錄萬(wàn)方服務(wù)站平臺(tái),選擇“學(xué)位論文”子庫(kù)。檢索記錄了10552977條。其中,博士論文378條、博士論文106530條、碩士論文943269條知識(shí)網(wǎng)服務(wù)平臺(tái)注冊(cè)ki.net進(jìn)入“中國(guó)優(yōu)秀碩士論文全文數(shù)據(jù)庫(kù)新版”和“中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù)新版”,不輸入檢索詞檢索所有記錄,博士論文145153條,碩士論文11592條。
使用正則表達(dá)式提取中文標(biāo)題、作者姓名、學(xué)位授予單位、學(xué)位授予年度等4個(gè)字段信息。1.3檢索結(jié)果的整理是利用桌面數(shù)據(jù)庫(kù)軟件Access整理得到的數(shù)據(jù),在年度以學(xué)位授予單位分組后,由于手動(dòng)記錄不合格或必要的字段缺失、學(xué)位授予單位不是大陸單位等原因造成的無(wú)法使用用的記錄。作者姓名為周金應(yīng)中國(guó)地質(zhì)大學(xué)(北京)碩士論文《長(zhǎng)慶西峰油田合單元復(fù)合儲(chǔ)藏層建模研究》,萬(wàn)方數(shù)據(jù)庫(kù)中“學(xué)位年度”的記錄值為“1”,論文《基于概念類似度計(jì)算的主體映射算法的研究》,作者陳堯,知網(wǎng)絡(luò)上學(xué)位授予單位記載為“源映射實(shí)體名”。|<目標(biāo)映射實(shí)體名稱>等。除萬(wàn)方博士論文1條、博士論文18條、碩士論文33條外,最終取得博士論文377條、博士論文106512條、碩士論文943336條。除了知網(wǎng)博士論文11條、碩士論文13條外,最后獲得了博士論文145142條、碩士論文11579條。統(tǒng)一了著作錄不規(guī)范的名稱。和機(jī)械科學(xué)研究院、機(jī)械科學(xué)研究總院一樣,與機(jī)械科學(xué)研究總院統(tǒng)一。對(duì)有多個(gè)名稱的單位變更了名稱。例如,軍醫(yī)研修學(xué)院、解放軍總醫(yī)院統(tǒng)稱為中國(guó)人民解放軍總醫(yī)院。一部分附屬機(jī)構(gòu)、二級(jí)學(xué)院由上級(jí)機(jī)關(guān)辦理,例如中國(guó)科學(xué)院的多個(gè)研究所,與中國(guó)科學(xué)院統(tǒng)一認(rèn)定,兩地的學(xué)校設(shè)立、兩地的學(xué)位授予校也統(tǒng)一認(rèn)定為同一所學(xué)校,像中國(guó)石油大學(xué)。
在與“985工程”[1]、“211工程”[2]大學(xué)數(shù)據(jù)及大學(xué)合并、改名等政策條件相關(guān)聯(lián)而變更的情況下,兩個(gè)數(shù)據(jù)庫(kù)的影響方向一致且增量相同,因此不參與數(shù)據(jù)整理、比較。2.1在數(shù)據(jù)庫(kù)中收錄“211項(xiàng)目”的大學(xué)和大學(xué)的情況,1
2.1.1收錄了“211工程”的大學(xué)數(shù)量。這種類型的大學(xué)年收錄數(shù)的變化如圖1~2所示。
將收錄的“211項(xiàng)目”的大學(xué)和大學(xué)進(jìn)行了比較,發(fā)現(xiàn)網(wǎng)絡(luò)和萬(wàn)方中存在著始終沒有收錄全文的高中。其中,網(wǎng)絡(luò)上收錄的博士論文單位中缺少寧夏大學(xué)、青海大學(xué)、西藏大學(xué)等西部“211工程”學(xué)院。碩士論文的學(xué)分中沒有中國(guó)藥科大學(xué)。萬(wàn)方所收錄的博士論文單位中缺少的東西很多,北京科技大學(xué)、北京理工大學(xué)、北京林業(yè)大學(xué)、北京外國(guó)語(yǔ)大學(xué)、福州大學(xué)、哈爾濱工業(yè)大學(xué)、海南大學(xué)、華東理工大學(xué)、以及南大學(xué)、南京農(nóng)業(yè)大學(xué)、青海大學(xué)、清華大學(xué)、上海財(cái)經(jīng)大學(xué)、包括電氣、西安交通大學(xué)等。西北農(nóng)林科技大學(xué)、西藏大學(xué)、云南大學(xué)、中國(guó)媒體大學(xué)、中國(guó)藥科大學(xué)、中央民族大學(xué)、中央音樂(lè)學(xué)院等22所高校。大學(xué)有福州大學(xué)、哈爾濱工業(yè)大學(xué)、華東理工大學(xué)、南京大學(xué)、南京農(nóng)業(yè)大學(xué)、上海財(cái)經(jīng)大學(xué)、上海外國(guó)國(guó)語(yǔ)大學(xué)、西安交通大學(xué)、西北農(nóng)林科技大學(xué)、云南大學(xué)、中國(guó)藥科大學(xué)、中央音樂(lè)學(xué)院等12所學(xué)院。2.1.2收錄“211工程”學(xué)院論文數(shù)量。根據(jù)表1,
與收錄了“211工程”學(xué)院學(xué)位論文全文實(shí)際數(shù)量的學(xué)院數(shù)的變化傾向幾乎一致。但是,從2004年到2006年,萬(wàn)方和知網(wǎng)所收錄的博、碩士論文數(shù)量基本持平,超過(guò)了知網(wǎng)數(shù)量。通過(guò)詳細(xì)的比較,筆者發(fā)現(xiàn)數(shù)據(jù)庫(kù)運(yùn)營(yíng)商在某個(gè)單位的論文收錄上存在缺陷。2005年的學(xué)位年度,知網(wǎng)收錄了大連理工大學(xué)的博士論文是103篇,萬(wàn)方收錄了271篇。另一個(gè)原因是同一篇論文“學(xué)位授予年度”欄目的制作內(nèi)容不同。
以大連理工大學(xué)的論文《基于企業(yè)價(jià)值的財(cái)務(wù)戰(zhàn)略管理研究》為例,知網(wǎng)的學(xué)位授予年度為2005年,在知網(wǎng)的全文封面上標(biāo)注了“論文的完成時(shí)期”為“2004年12月”。大連理工大學(xué)圖書館的“本校大學(xué)院學(xué)位論文”數(shù)據(jù)庫(kù)的答辯日是“2005.4.19”。這種著作的分歧普遍存在。以
篇博士論文為例,知網(wǎng)收錄了“211工程”的大學(xué)和學(xué)位授予年度是2005年的11230篇博士論文中,與萬(wàn)方博士論文重復(fù)的是7238條,這些重復(fù)的論文中,萬(wàn)方數(shù)據(jù)庫(kù)記載了2002年的3條,2003年的有17條中記載了2004年的459條。年或2007年。嚴(yán)格限制網(wǎng)絡(luò)和萬(wàn)方中的“學(xué)位年度”是在2005年,重復(fù)的論文只有754篇。因此,為了減少這種錯(cuò)誤所造成的影響,表1中統(tǒng)計(jì)的重復(fù)數(shù)與論文的標(biāo)題相同,除了作為判斷作者名字是否相同的必要條件之外,也可以僅參照知識(shí)網(wǎng)中記載的年份進(jìn)行比較。篇是和知網(wǎng)重復(fù)收錄的20篇現(xiàn)象。
還可以根據(jù)記錄方式,重復(fù)的數(shù)字比實(shí)際重復(fù)的數(shù)字小一些。正如對(duì)水的化學(xué)式“H2O”的著作一樣,知網(wǎng)上記載著“H”。2O”,在萬(wàn)方中記載為“H<,2>O”,但是在這種情況下,如果Access中對(duì)SQL語(yǔ)句進(jìn)行比較限定的話,系統(tǒng)會(huì)被視為不同的字符串,因此會(huì)被判定為不是重復(fù)論文。39所“985工程”的大學(xué)全部包含在“211工程”的學(xué)院里,所以數(shù)據(jù)庫(kù)的學(xué)位論文庫(kù)所收錄的學(xué)校和論文數(shù)量中出現(xiàn)的規(guī)則與收錄“211工程”的大學(xué)相似。
.數(shù)據(jù)庫(kù)里收錄了大學(xué)以外的學(xué)分。指擁有中國(guó)科學(xué)院、中共中央黨校、煤炭科學(xué)研究總院等研究生學(xué)位授予權(quán)的企業(yè)和事業(yè)單位。這些部門不參加高考,但是有很好的研究環(huán)境。每年可以培養(yǎng)一定數(shù)量的博士、碩士課程的研究生。研究領(lǐng)域有特色,研究成果也同樣有很高的學(xué)術(shù)價(jià)值。合計(jì)2000年以后的非高中單位的收錄數(shù),如圖3~4所示。
的數(shù)量差很大。從11年度的總和來(lái)看,知識(shí)網(wǎng)中收錄的博士的全文數(shù)幾乎是萬(wàn)方博士全文數(shù)的3倍,碩士的數(shù)量也超過(guò)了2倍。以具體單位為例