《出版業(yè)“十四五”時(shí)期發(fā)展規(guī)劃》明確將出版業(yè)科技與標(biāo)準(zhǔn)創(chuàng)新示范項(xiàng)目列入出版融合發(fā)展的重點(diǎn)工程。今年,國(guó)家新聞出版署將在2021年試點(diǎn)工作基礎(chǔ)上,深入實(shí)施出版業(yè)科技與標(biāo)準(zhǔn)創(chuàng)新示范項(xiàng)目。
2021年出版業(yè)科技與標(biāo)準(zhǔn)創(chuàng)新示范項(xiàng)目試點(diǎn)工作共評(píng)選發(fā)布科技與標(biāo)準(zhǔn)創(chuàng)新成果13項(xiàng)、應(yīng)用示范單位14家,取得良好成效。參與2021年示范項(xiàng)目評(píng)審的專(zhuān)家在接受《中國(guó)新聞出版廣電報(bào)》記者采訪(fǎng)時(shí)表示,通過(guò)2021年的試點(diǎn)工作,可以看到,人工智能、大數(shù)據(jù)、云計(jì)算、科學(xué)可視化、AR/VR、區(qū)塊鏈等技術(shù)被廣泛應(yīng)用于出版、印刷、發(fā)行、版權(quán)等領(lǐng)域,展現(xiàn)了出版全產(chǎn)業(yè)鏈擁抱和應(yīng)用新技術(shù)的創(chuàng)新圖景,一批聚焦前沿、專(zhuān)精特新、支撐主業(yè)、放大效能的項(xiàng)目和技術(shù),構(gòu)成了當(dāng)前我國(guó)出版業(yè)科技創(chuàng)新應(yīng)用的第一梯隊(duì)。
創(chuàng)新主體架構(gòu)更加清晰完備
為更好地發(fā)揮科技與標(biāo)準(zhǔn)在出版高質(zhì)量發(fā)展中的支撐作用,加強(qiáng)示范引領(lǐng),促進(jìn)成果轉(zhuǎn)化,2021年5月,國(guó)家新聞出版署印發(fā)《關(guān)于開(kāi)展出版業(yè)科技與標(biāo)準(zhǔn)創(chuàng)新示范項(xiàng)目試點(diǎn)工作的通知》,面向國(guó)內(nèi)出版單位、高等院校、科研院所、技術(shù)企業(yè),以及國(guó)家新聞出版署確定的出版業(yè)科技與標(biāo)準(zhǔn)重點(diǎn)實(shí)驗(yàn)室,征集評(píng)選一批技術(shù)研發(fā)、標(biāo)準(zhǔn)研制等方面的優(yōu)秀成果,以及在科技與標(biāo)準(zhǔn)應(yīng)用方面具有示范作用的單位。
《通知》印發(fā)后,共有131個(gè)項(xiàng)目申報(bào),覆蓋中央在京及24個(gè)?。▍^(qū)、市)的120家單位,其中,科技類(lèi)項(xiàng)目申報(bào)113項(xiàng),標(biāo)準(zhǔn)類(lèi)項(xiàng)目申報(bào)18項(xiàng)。經(jīng)過(guò)評(píng)審,最終確定10項(xiàng)科技創(chuàng)新成果、10家科技應(yīng)用示范單位,以及3項(xiàng)標(biāo)準(zhǔn)創(chuàng)新成果、4家標(biāo)準(zhǔn)應(yīng)用示范單位入選2021年出版業(yè)科技與標(biāo)準(zhǔn)創(chuàng)新示范項(xiàng)目。
從申報(bào)的科技應(yīng)用示范單位看,56.4%為出版單位,18.2%為出版業(yè)科技與標(biāo)準(zhǔn)重點(diǎn)實(shí)驗(yàn)室,18.2%為技術(shù)企業(yè),7.3%為高等院校和其他類(lèi)型的申報(bào)主體(見(jiàn)表1)。入選的10家科技應(yīng)用示范單位中,出版單位占了5席,重點(diǎn)實(shí)驗(yàn)室和技術(shù)企業(yè)各2席,其他類(lèi)型的申報(bào)主體1席(見(jiàn)表1)。而入選的10項(xiàng)科技創(chuàng)新成果則均來(lái)自出版單位和重點(diǎn)實(shí)驗(yàn)室(見(jiàn)表2)。
項(xiàng)目評(píng)審專(zhuān)家表示,從上述分析可見(jiàn),以出版單位為主體、實(shí)驗(yàn)室為重點(diǎn)、科研院所和技術(shù)企業(yè)為輔助的出版業(yè)科技創(chuàng)新主體架構(gòu)更加清晰完備。
全產(chǎn)業(yè)鏈條應(yīng)用前沿技術(shù)
“我們發(fā)現(xiàn),入選的科技應(yīng)用示范單位既保持對(duì)前沿技術(shù)的敏感性,又堅(jiān)持問(wèn)題導(dǎo)向,將技術(shù)賦能主業(yè)發(fā)展,創(chuàng)造深具出版業(yè)特色的科技應(yīng)用新生態(tài)。”項(xiàng)目評(píng)審專(zhuān)家說(shuō)。
從應(yīng)用的相關(guān)核心技術(shù)來(lái)看,在入選的示范單位中,應(yīng)用大數(shù)據(jù)技術(shù)的單位占比達(dá)到90%,應(yīng)用云計(jì)算技術(shù)的單位占比達(dá)到了70%;在入選的科技創(chuàng)新成果中,人工智能、大數(shù)據(jù)、云計(jì)算、科學(xué)可視化、語(yǔ)義識(shí)別、版權(quán)保護(hù)、數(shù)據(jù)標(biāo)引、AR/VR、區(qū)塊鏈等新技術(shù)更是得到了較為廣泛和深入的實(shí)際應(yīng)用,其中,人工智能技術(shù)應(yīng)用占比達(dá)到90%。
在通用技術(shù)應(yīng)用方面,一些項(xiàng)目已能夠充分利用人工智能技術(shù)的數(shù)據(jù)感知、采集、存儲(chǔ)、處理、分析、可視化等,提取內(nèi)容數(shù)據(jù)的價(jià)值,匯聚各類(lèi)數(shù)據(jù)與資源,為主業(yè)賦值賦智;在出版業(yè)特色技術(shù)應(yīng)用方面,一些項(xiàng)目通過(guò)引入前沿科技,在中文字庫(kù)生成、古籍整理等方面創(chuàng)新手段,創(chuàng)造出一批出版業(yè)特色新技術(shù)。
項(xiàng)目評(píng)審專(zhuān)家表示,這充分體現(xiàn)了出版業(yè)擁抱前沿技術(shù),從需求出發(fā),在內(nèi)容生產(chǎn)、印刷發(fā)行、數(shù)字內(nèi)容資源管理、知識(shí)服務(wù)、版權(quán)保護(hù)等全產(chǎn)業(yè)鏈條上的前沿技術(shù)應(yīng)用場(chǎng)景。
標(biāo)準(zhǔn)化創(chuàng)新有待進(jìn)一步加強(qiáng)
近年來(lái),出版新技術(shù)標(biāo)準(zhǔn)規(guī)范體系建設(shè)已初見(jiàn)成效,覆蓋出版產(chǎn)業(yè)鏈各環(huán)節(jié)的標(biāo)準(zhǔn)體系已初步形成,相關(guān)國(guó)際標(biāo)準(zhǔn)、國(guó)家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)、團(tuán)體標(biāo)準(zhǔn)、企業(yè)標(biāo)準(zhǔn)、工程標(biāo)準(zhǔn)的制定工作都在有序推進(jìn),標(biāo)準(zhǔn)在出版業(yè)的示范、驅(qū)動(dòng)、規(guī)范和引領(lǐng)作用日益凸顯。
2021年,新聞出版領(lǐng)域共發(fā)布國(guó)家標(biāo)準(zhǔn)12項(xiàng)、行業(yè)標(biāo)準(zhǔn)16項(xiàng),涵蓋知識(shí)服務(wù)、標(biāo)識(shí)符管理、數(shù)據(jù)質(zhì)量檢測(cè)、數(shù)據(jù)交換、智能印刷等方面,內(nèi)容與出版業(yè)數(shù)字化、智能化密切相關(guān)。團(tuán)體標(biāo)準(zhǔn)蓬勃發(fā)展,中國(guó)音像與數(shù)字出版協(xié)會(huì)團(tuán)體標(biāo)準(zhǔn)化技術(shù)委員會(huì)緊緊圍繞行業(yè)急需開(kāi)展標(biāo)準(zhǔn)研制,發(fā)布網(wǎng)絡(luò)游戲、數(shù)字化教育資源相關(guān)團(tuán)體標(biāo)準(zhǔn)5項(xiàng)。一批實(shí)力較強(qiáng)的出版企業(yè)在專(zhuān)業(yè)領(lǐng)域研制了相關(guān)的企業(yè)技術(shù)標(biāo)準(zhǔn),為推進(jìn)企業(yè)規(guī)范管理、技術(shù)進(jìn)步、效益提升提供了有力支撐。全國(guó)新聞出版標(biāo)準(zhǔn)化技術(shù)委員會(huì)還評(píng)選設(shè)立多家專(zhuān)業(yè)數(shù)字內(nèi)容資源知識(shí)服務(wù)模式企業(yè)標(biāo)準(zhǔn)示范單位和新聞出版標(biāo)準(zhǔn)示范基地,發(fā)揮模范企業(yè)的引領(lǐng)作用。
“盡管出版業(yè)標(biāo)準(zhǔn)體系建設(shè)正日趨完善,但出版業(yè)相關(guān)標(biāo)準(zhǔn)的創(chuàng)新應(yīng)用工作,因?qū)?biāo)準(zhǔn)研發(fā)和應(yīng)用平臺(tái)的技術(shù)基礎(chǔ)、團(tuán)隊(duì)能力、投入周期等要求較高,加之近年來(lái)信息技術(shù)發(fā)展突飛猛進(jìn),出版業(yè)科技環(huán)境和市場(chǎng)需求變化加劇,穩(wěn)定有效的標(biāo)準(zhǔn)類(lèi)創(chuàng)新成果還有待進(jìn)一步提升。出版單位應(yīng)用標(biāo)準(zhǔn)的意識(shí)還有待進(jìn)一步加強(qiáng)。”項(xiàng)目評(píng)審專(zhuān)家表示。
2021年度標(biāo)準(zhǔn)類(lèi)申報(bào)項(xiàng)目不多,入選的3項(xiàng)標(biāo)準(zhǔn)創(chuàng)新成果和4家應(yīng)用示范單位,均屬于聚焦垂直領(lǐng)域知識(shí)服務(wù)標(biāo)準(zhǔn)、智能出版標(biāo)準(zhǔn)、數(shù)字教材標(biāo)準(zhǔn)以及專(zhuān)業(yè)內(nèi)容數(shù)字閱讀技術(shù)標(biāo)準(zhǔn)領(lǐng)域的項(xiàng)目和單位,通過(guò)標(biāo)準(zhǔn)應(yīng)用和研發(fā),在提高出版業(yè)產(chǎn)品和服務(wù)質(zhì)量、促進(jìn)轉(zhuǎn)型升級(jí)和融合發(fā)展方面成效明顯。
該專(zhuān)家表示,期待通過(guò)示范引領(lǐng),引導(dǎo)行業(yè)內(nèi)技術(shù)基礎(chǔ)堅(jiān)實(shí)、新業(yè)務(wù)新產(chǎn)品聚集的企業(yè)、平臺(tái)和科研組織,進(jìn)一步加大科研投入,多維度、多層次開(kāi)展出版業(yè)新標(biāo)準(zhǔn)的研發(fā)和應(yīng)用。
出版科技創(chuàng)新需持續(xù)加大投入
“從報(bào)告可見(jiàn),出版業(yè)科技創(chuàng)新需要持續(xù)加大投入,轉(zhuǎn)型升級(jí)融合發(fā)展進(jìn)程中的科技創(chuàng)新戰(zhàn)略地位仍有待進(jìn)一步強(qiáng)化。”項(xiàng)目評(píng)審專(zhuān)家表示。
統(tǒng)計(jì)顯示,本年度申報(bào)的113項(xiàng)科技類(lèi)項(xiàng)目中,累計(jì)投入在1000萬(wàn)元以下的占58.4%,僅有15.93%的項(xiàng)目累計(jì)投入在5000萬(wàn)元以上;最終入選的20項(xiàng)科技類(lèi)項(xiàng)目中,累計(jì)投入在5000萬(wàn)元以上的則占到了35%。申報(bào)的科技創(chuàng)新成果中,46.6%的項(xiàng)目累計(jì)收入在100萬(wàn)元以下,投入產(chǎn)出比在30%以下的達(dá)58.6%(見(jiàn)表3)??梢?jiàn),科技創(chuàng)新投入力度和投入產(chǎn)出效益的提升都迫在眉睫,轉(zhuǎn)化能力和經(jīng)濟(jì)效益有待進(jìn)一步提升。
在113項(xiàng)科技類(lèi)申報(bào)項(xiàng)目中,僅有10.62%的申報(bào)主體在基礎(chǔ)申報(bào)材料中,明確提及“科技應(yīng)用創(chuàng)新規(guī)劃”或“將科技應(yīng)用創(chuàng)新作為本單位一把手工程”。如清華大學(xué)出版社制定并發(fā)布了《“十四五”數(shù)字出版發(fā)展規(guī)劃》,北京師范大學(xué)出版集團(tuán)規(guī)劃了“數(shù)字出版工作小組(松散組織)—數(shù)字出版中心(獨(dú)立部門(mén))—全資公司(獨(dú)立法人)—股份公司—股份公司+全資公司+工作組”的組織架構(gòu)進(jìn)化之路。
14.2%的科技類(lèi)項(xiàng)目擁有的自主知識(shí)產(chǎn)權(quán)數(shù)量(包括商標(biāo)、專(zhuān)利、軟件著作權(quán)等)在50項(xiàng)以上,但是仍有48.7%的科技應(yīng)用類(lèi)項(xiàng)目擁有的自主知識(shí)產(chǎn)權(quán)數(shù)量為5項(xiàng)以下,客觀反映了盡管已有部分單位擁有了較強(qiáng)的自主研發(fā)實(shí)力,但出版業(yè)整體科技創(chuàng)新研發(fā)實(shí)力仍有較大的提升空間,科技與標(biāo)準(zhǔn)在出版高質(zhì)量發(fā)展中的支撐作用有待進(jìn)一步增強(qiáng)。
標(biāo)準(zhǔn)創(chuàng)新成果
1.新聞出版知識(shí)服務(wù)系列國(guó)家標(biāo)準(zhǔn)
新聞出版知識(shí)服務(wù)系列國(guó)家標(biāo)準(zhǔn)是在新聞出版行業(yè)開(kāi)展的“專(zhuān)業(yè)數(shù)字內(nèi)容資源知識(shí)服務(wù)模式試點(diǎn)工作”的基礎(chǔ)上,由全國(guó)新聞出版標(biāo)準(zhǔn)化技術(shù)委員會(huì)組織數(shù)十家在知識(shí)服務(wù)領(lǐng)域具有領(lǐng)先經(jīng)驗(yàn)的出版業(yè)龍頭企業(yè)共同研制的,是出版業(yè)應(yīng)用新技術(shù)、探索新模式的具體實(shí)踐和經(jīng)驗(yàn)總結(jié)。該系列標(biāo)準(zhǔn)包括7項(xiàng):《新聞出版 知識(shí)服務(wù) 知識(shí)資源建設(shè)與服務(wù)工作指南》《新聞出版 知識(shí)服務(wù) 知識(shí)資源建設(shè)與服務(wù)基礎(chǔ)術(shù)語(yǔ)》《新聞出版 知識(shí)服務(wù) 知識(shí)資源通用類(lèi)型》《新聞出版 知識(shí)服務(wù) 知識(shí)關(guān)聯(lián)通用規(guī)則》《新聞出版 知識(shí)服務(wù) 主題分類(lèi)詞表編制》《新聞出版 知識(shí)服務(wù) 知識(shí)元描述》《新聞出版 知識(shí)服務(wù) 知識(shí)單元描述》(標(biāo)準(zhǔn)號(hào):GB/T 38376-2019至GB/T 38382-2019),對(duì)促進(jìn)新技術(shù)在出版業(yè)的應(yīng)用轉(zhuǎn)化、深化出版業(yè)融合發(fā)展具有積極作用。
2.《有聲讀物》行業(yè)標(biāo)準(zhǔn)
該行業(yè)標(biāo)準(zhǔn)規(guī)范了術(shù)語(yǔ)和定義,對(duì)錄制流程、錄制與發(fā)布、平臺(tái)的技術(shù)和服務(wù)以及評(píng)測(cè)的流程、指標(biāo)、條件、計(jì)分方法等提出了規(guī)范要求,填補(bǔ)了有聲出版物加工制作領(lǐng)域的標(biāo)準(zhǔn)空白。標(biāo)準(zhǔn)推廣使用以來(lái),已得到近百家有聲讀物制作出版機(jī)構(gòu)和聽(tīng)書(shū)平臺(tái)采用執(zhí)行,行業(yè)使用覆蓋率超過(guò)80%。標(biāo)準(zhǔn)已用于有聲讀物的制作項(xiàng)目數(shù)量1.2萬(wàn)多(項(xiàng))個(gè),累計(jì)服務(wù)聽(tīng)書(shū)平臺(tái)B端上百家有聲讀物內(nèi)容提供商和聽(tīng)書(shū)平臺(tái)3000多萬(wàn)個(gè)(次)C端用戶(hù)。該標(biāo)準(zhǔn)對(duì)于保障有聲讀物的內(nèi)容質(zhì)量、提高有聲讀物的閱讀體驗(yàn)、強(qiáng)化行業(yè)規(guī)劃和管理具有重要意義。
3.《數(shù)字版權(quán)唯一標(biāo)識(shí)符》行業(yè)標(biāo)準(zhǔn)
該行業(yè)標(biāo)準(zhǔn)是DCI體系的基礎(chǔ)性核心標(biāo)準(zhǔn),規(guī)定了DCI的編碼結(jié)構(gòu)、分配規(guī)則和管理機(jī)制?;谠摌?biāo)準(zhǔn),對(duì)信息內(nèi)容的版權(quán)權(quán)屬關(guān)系進(jìn)行標(biāo)識(shí),實(shí)現(xiàn)信息內(nèi)容的創(chuàng)作、傳播及使用行為與其主體的一一對(duì)應(yīng)標(biāo)識(shí),建立起以公共服務(wù)信用與區(qū)塊鏈技術(shù)信用共同強(qiáng)化的、可信賴(lài)可查驗(yàn)的權(quán)、責(zé)、利一一對(duì)應(yīng)關(guān)聯(lián)體系。數(shù)字內(nèi)容有了DCI這一“版權(quán)身份證”,在權(quán)屬確認(rèn)、授權(quán)結(jié)算、維權(quán)保護(hù)等方面的應(yīng)用擴(kuò)展也就有了無(wú)限可能。該行業(yè)標(biāo)準(zhǔn)在多個(gè)互聯(lián)網(wǎng)內(nèi)容產(chǎn)業(yè)垂直領(lǐng)域典型平臺(tái)持續(xù)開(kāi)展標(biāo)準(zhǔn)示范應(yīng)用,累計(jì)完成基于DCI標(biāo)準(zhǔn)的數(shù)字作品版權(quán)登記100余萬(wàn)件。目前,DCI國(guó)家標(biāo)準(zhǔn)已由國(guó)家標(biāo)準(zhǔn)化管理委員會(huì)正式立項(xiàng)。截至2021年11月,基于DCI標(biāo)準(zhǔn)實(shí)施已為170余萬(wàn)作品分配了DCI。
科技創(chuàng)新成果
1.出版資源語(yǔ)義組織與智能閱讀關(guān)鍵理論與技術(shù)(語(yǔ)義出版與知識(shí)服務(wù)重點(diǎn)實(shí)驗(yàn)室)
本項(xiàng)目聚焦出版領(lǐng)域核心的內(nèi)容資源,借助深度學(xué)習(xí)、自然語(yǔ)言處理、知識(shí)圖譜、虛擬現(xiàn)實(shí)等相關(guān)的先進(jìn)智能技術(shù),對(duì)多源異構(gòu)多模態(tài)的資源進(jìn)行數(shù)字化、數(shù)據(jù)化、語(yǔ)義化、智能化處理,形成了一套智慧數(shù)據(jù)與語(yǔ)義出版框架流程及標(biāo)注規(guī)范,用于對(duì)科技文獻(xiàn)、文化遺產(chǎn)數(shù)據(jù)等各類(lèi)出版資源進(jìn)行語(yǔ)義組織和內(nèi)容重組。基于以上研究,本項(xiàng)目開(kāi)發(fā)設(shè)計(jì)了不同文本載體語(yǔ)義結(jié)構(gòu)的自動(dòng)解析與抽取、自動(dòng)文本摘要、語(yǔ)義查詢(xún)及個(gè)性化推薦、多源圖文融合等智能化算法,針對(duì)智慧數(shù)據(jù)與語(yǔ)義出版框架流程及標(biāo)注規(guī)范實(shí)施過(guò)程中面臨的關(guān)鍵問(wèn)題,形成一批自主知識(shí)產(chǎn)權(quán)的核心技術(shù)。
2.DCI體系版權(quán)服務(wù)基礎(chǔ)設(shè)施1.0(DCI技術(shù)研究與應(yīng)用聯(lián)合實(shí)驗(yàn)室)
該設(shè)施1.0以我國(guó)自主創(chuàng)新的數(shù)字版權(quán)唯一標(biāo)識(shí)符(DCI)標(biāo)準(zhǔn)為引領(lǐng),以區(qū)塊鏈、云計(jì)算、大數(shù)據(jù)、人工智能等先進(jìn)技術(shù)集成應(yīng)用為支撐,以規(guī)范高效的版權(quán)公共服務(wù)體系與機(jī)制為保障,從網(wǎng)絡(luò)信息內(nèi)容的版權(quán)標(biāo)識(shí)入手,通過(guò)打造互聯(lián)網(wǎng)版權(quán)基礎(chǔ)設(shè)施,開(kāi)放版權(quán)權(quán)屬確認(rèn)、授權(quán)結(jié)算、維權(quán)保護(hù)等版權(quán)服務(wù)核心能力,進(jìn)一步構(gòu)建互聯(lián)網(wǎng)版權(quán)產(chǎn)業(yè)新生態(tài),以推動(dòng)解決長(zhǎng)期困擾我國(guó)版權(quán)產(chǎn)業(yè)高質(zhì)量發(fā)展的權(quán)屬確認(rèn)不清、授權(quán)交易不暢和維權(quán)保護(hù)困難等關(guān)鍵性瓶頸問(wèn)題。自2021年8月上線(xiàn)以來(lái),該設(shè)施1.0已為65萬(wàn)余件作品分配了DCI,同時(shí),中國(guó)版權(quán)保護(hù)中心已著手規(guī)劃建設(shè)DCI體系版權(quán)服務(wù)基礎(chǔ)設(shè)施2.0。
3.鳳凰智能校對(duì)系統(tǒng)(江蘇鳳凰報(bào)刊出版?zhèn)髅接邢薰荆?/strong>
該系統(tǒng)用于專(zhuān)業(yè)出版領(lǐng)域的文本糾錯(cuò)和內(nèi)容審查,能夠輔助文字工作者檢查、糾正文稿中存在的各類(lèi)字詞語(yǔ)法、知識(shí)事實(shí)、內(nèi)容格式錯(cuò)誤,同時(shí)審查其導(dǎo)向正確性,保障出版物意識(shí)形態(tài)安全。系統(tǒng)基于人工智能技術(shù)開(kāi)發(fā),創(chuàng)新性地在計(jì)算機(jī)校對(duì)中融合了自然語(yǔ)言處理技術(shù)與漢語(yǔ)言語(yǔ)法理論,在百億語(yǔ)料的支撐訓(xùn)練下,能夠更準(zhǔn)確、更高效地識(shí)別出文稿中未經(jīng)過(guò)事先預(yù)設(shè)的隨機(jī)錯(cuò)誤、語(yǔ)法錯(cuò)誤以及政治類(lèi)差錯(cuò)。該系統(tǒng)自2019年上線(xiàn)以來(lái),已發(fā)展機(jī)構(gòu)用戶(hù)近6000家,覆蓋用戶(hù)30萬(wàn)人,累計(jì)校對(duì)各類(lèi)文稿26億字,廣泛應(yīng)用于政府機(jī)關(guān)、新聞出版、文化傳媒、教育科研等多個(gè)行業(yè)領(lǐng)域。
4.古籍智能整理出版工具集〔古聯(lián)(北京)數(shù)字傳媒科技有限公司〕
工具集研發(fā)的主要目標(biāo)是以古籍整理和古籍?dāng)?shù)字化的基礎(chǔ)工作為線(xiàn)索,再造線(xiàn)上工作流程,力求覆蓋古籍整理的多種業(yè)務(wù)場(chǎng)景,解決或改善傳統(tǒng)流程中大量消耗人力資源、時(shí)間成本和物料的問(wèn)題。如探索基于機(jī)器學(xué)習(xí)的古籍OCR(光學(xué)字符識(shí)別)技術(shù),針對(duì)版刻、稿鈔、鉛印等多版本古籍,進(jìn)行圖像智能識(shí)別算法訓(xùn)練,研究面向中文古籍的高效OCR識(shí)別模型,形成支持專(zhuān)業(yè)個(gè)人用戶(hù)、小團(tuán)隊(duì)作業(yè)的敏捷型智能OCR平臺(tái)。用戶(hù)可靈活調(diào)用OCR算法、繁簡(jiǎn)轉(zhuǎn)換、自動(dòng)標(biāo)點(diǎn)、命名實(shí)體識(shí)別、文本???、古籍引文校對(duì)等古籍整理和編輯加工模塊,減輕專(zhuān)家、編輯在各環(huán)節(jié)的工作負(fù)擔(dān),從而提高古籍整理工作的效率。
5.“古譜今譯”融合出版技術(shù)(上海音樂(lè)出版社有限公司)
該技術(shù)已實(shí)現(xiàn)減字譜和工尺譜的數(shù)字化標(biāo)準(zhǔn)錄入,將字型、輸入法等具體問(wèn)題進(jìn)行應(yīng)用規(guī)范,開(kāi)發(fā)了一套常用的典型性減字譜和工尺譜字庫(kù),實(shí)現(xiàn)了初步的減字譜和工尺譜數(shù)字化進(jìn)程。已有成果:符合UNICODE國(guó)際標(biāo)準(zhǔn)古琴減字譜數(shù)字化字庫(kù)2套(共計(jì)5萬(wàn)余字符)、古琴減字譜數(shù)字化輸入法2套、工尺譜3套、工尺譜輸入法1套、排版軟件1套。在新技術(shù)的支持下,上音社通過(guò)版權(quán)購(gòu)買(mǎi)、資源搶救、內(nèi)容修復(fù)、數(shù)據(jù)存儲(chǔ)、音視頻配等專(zhuān)業(yè)的融合出版手段,形成紙、電、聲、像一體化,具有時(shí)代性的“古譜今譯”融媒體出版品牌,打造全國(guó)首個(gè)“中國(guó)傳統(tǒng)古譜打譜中心”。
6.個(gè)性化中文字庫(kù)自動(dòng)生成技術(shù)(新聞出版智能媒體技術(shù)重點(diǎn)實(shí)驗(yàn)室)
該技術(shù)研究團(tuán)隊(duì)在大規(guī)模中文字庫(kù)自動(dòng)生成、高質(zhì)量矢量字形合成、字形紋理特效風(fēng)格遷移等方面取得重要進(jìn)展,多方位突破中文字庫(kù)制作生成的技術(shù)瓶頸,研發(fā)成功中文字庫(kù)輔助設(shè)計(jì)與自動(dòng)生成相關(guān)系統(tǒng),顯著提升各類(lèi)字庫(kù)的制作效率。2018年,研發(fā)的中文字庫(kù)輔助設(shè)計(jì)與自動(dòng)生成技術(shù)通過(guò)技術(shù)轉(zhuǎn)讓方式在企業(yè)投入使用,對(duì)外開(kāi)放的字庫(kù)制作平臺(tái)總注冊(cè)用戶(hù)超過(guò)150萬(wàn),創(chuàng)建的個(gè)人字庫(kù)超過(guò)200萬(wàn)套,手寫(xiě)體中文字庫(kù)自動(dòng)生成系統(tǒng)已經(jīng)接入華為、金山WPS等移動(dòng)平臺(tái);開(kāi)發(fā)的相關(guān)中文字庫(kù)產(chǎn)品在騰訊、華為等主流IT企業(yè)的產(chǎn)品中得到廣泛使用。
7.基于物聯(lián)網(wǎng)與人工智能技術(shù)的實(shí)體書(shū)店關(guān)鍵裝備(新聞出版領(lǐng)域關(guān)鍵技術(shù)研發(fā)及應(yīng)用綜合實(shí)驗(yàn)室)
該裝備包括智能書(shū)架、移動(dòng)書(shū)架機(jī)器人、圖書(shū)出入庫(kù)機(jī)器人、智能閱讀臺(tái)等硬件設(shè)備,運(yùn)用物聯(lián)網(wǎng)技術(shù)進(jìn)行圖書(shū)管理,實(shí)現(xiàn)圖書(shū)的在架位置識(shí)別、自動(dòng)盤(pán)點(diǎn)、防盜和自助借還、無(wú)人售賣(mài)等功能,在此基礎(chǔ)上分析讀者對(duì)圖書(shū)的閱讀次數(shù)、時(shí)長(zhǎng)等信息,進(jìn)而分析不同圖書(shū)的熱點(diǎn)程度,最終實(shí)現(xiàn)書(shū)店整個(gè)環(huán)節(jié)的無(wú)人化、信息化、智能化?;谠撗b備的智慧書(shū)城作為實(shí)體書(shū)店管理和圖書(shū)銷(xiāo)售的補(bǔ)充,可適應(yīng)公眾的購(gòu)物行為習(xí)慣,并搭建行業(yè)大數(shù)據(jù)平臺(tái),為書(shū)店經(jīng)營(yíng)者提供運(yùn)營(yíng)策略支持,為出版單位提供選題策劃的量化依據(jù),為主管部門(mén)決策提供行業(yè)級(jí)的數(shù)據(jù)分析。
8.基于智能技術(shù)的教育資源數(shù)據(jù)中臺(tái)建設(shè)項(xiàng)目(高等教育出版社有限公司)
高等教育出版社統(tǒng)一資源中心,采用數(shù)據(jù)中臺(tái)和業(yè)務(wù)中臺(tái)的雙中臺(tái)架構(gòu),借助大數(shù)據(jù)、機(jī)器學(xué)習(xí)技術(shù),分析和挖掘數(shù)據(jù)價(jià)值,為數(shù)據(jù)賦值,為業(yè)務(wù)賦智。主要?jiǎng)?chuàng)新成果包括建立用戶(hù)中心,實(shí)現(xiàn)用戶(hù)統(tǒng)一認(rèn)證服務(wù);制定數(shù)據(jù)規(guī)范,實(shí)現(xiàn)數(shù)據(jù)模型的規(guī)范和統(tǒng)一;創(chuàng)新數(shù)據(jù)同步機(jī)制,實(shí)現(xiàn)業(yè)務(wù)多源數(shù)據(jù)的實(shí)時(shí)采集;探索智能審核技術(shù),有效提升內(nèi)容安全保障;深入挖掘數(shù)據(jù)價(jià)值,優(yōu)化內(nèi)容策劃與生產(chǎn);實(shí)現(xiàn)實(shí)時(shí)數(shù)據(jù)統(tǒng)計(jì),數(shù)據(jù)可視化顯示。統(tǒng)一資源中心已完成內(nèi)容管理平臺(tái)、圖書(shū)二維碼平臺(tái)、智慧職教、MOOC學(xué)習(xí)平臺(tái)、中國(guó)大學(xué)生在線(xiàn)等八大平臺(tái)的統(tǒng)一管理,匯聚各類(lèi)資源500余萬(wàn)條,已為近2000萬(wàn)用戶(hù)提供在線(xiàn)服務(wù)。
9.面向出版領(lǐng)域的信息抽取與組織關(guān)鍵技術(shù)(CNONIX國(guó)家標(biāo)準(zhǔn)應(yīng)用與推廣實(shí)驗(yàn)室)
該技術(shù)旨在通過(guò)采用深度學(xué)習(xí)方法,利用自然語(yǔ)言處理中信息抽取技術(shù),解決出版業(yè)圖書(shū)細(xì)化分類(lèi)和基于圖書(shū)內(nèi)容的搜索等問(wèn)題。目前,成果主要應(yīng)用有:聯(lián)盟成員單位新疆新華書(shū)店的新疆民族文字出版發(fā)行大數(shù)據(jù)工程項(xiàng)目,在項(xiàng)目中開(kāi)展了基于圖書(shū)內(nèi)容的信息抽取研究,使用了包含10余萬(wàn)圖書(shū)信息的中文圖書(shū)分類(lèi)數(shù)據(jù)集作為語(yǔ)料庫(kù)對(duì)模型進(jìn)行訓(xùn)練,對(duì)圖書(shū)內(nèi)容簡(jiǎn)介進(jìn)行語(yǔ)義分析,實(shí)現(xiàn)了圖書(shū)標(biāo)簽自動(dòng)生成、圖書(shū)智能推薦等功能。國(guó)家出版發(fā)行信息公共服務(wù)平臺(tái),采用信息抽取技術(shù),為圖書(shū)自動(dòng)生成標(biāo)簽,為圖書(shū)精細(xì)化分析提供技術(shù)保障等。
10.印刷品機(jī)器視覺(jué)的顏色檢測(cè)關(guān)鍵技術(shù)(智能與綠色柔版印刷重點(diǎn)實(shí)驗(yàn)室)
本項(xiàng)目研發(fā)出基于機(jī)器視覺(jué)的印刷色彩檢測(cè)系統(tǒng),能夠?qū)崿F(xiàn)對(duì)印刷裝置印刷出的印刷產(chǎn)品進(jìn)行色彩質(zhì)量快速高效檢測(cè),可以將圖像采集設(shè)備的要求以及印刷品檢測(cè)色條的參數(shù)要求大大降低,直接根據(jù)色度值與標(biāo)準(zhǔn)色度值來(lái)評(píng)價(jià)印刷產(chǎn)品的質(zhì)量,快速高效。