摘要:【目的】通過多視圖協(xié)同可視化的方式對時序文本挖掘過程進行可視化,以實現(xiàn)多角度多層面洞察文本數(shù)據(jù)背后隱藏的規(guī)律和信息?!痉椒ā炕谖谋驹~向量矩陣,對多政策主體的政策時序文本,通過數(shù)據(jù)清洗、計算TF-IDF值、構(gòu)建向量空間模型、奇異值分解等文本挖掘技術(shù)進行信息提取和可交互的可視化探索分析?!窘Y(jié)果】選取2016年1月–2017年8月北京市中關(guān)村示范區(qū)下屬子園區(qū)的相關(guān)委內(nèi)信息文本為樣本,采用文本挖掘技術(shù)和多視圖協(xié)同可視化方法,探索政策文本背后的規(guī)律,驗證了本文方法和框架的有效性?!揪窒蕖酷槍Υ笠?guī)模文本具體細節(jié)單數(shù)據(jù)點的展示效果不佳,文本挖掘技術(shù)有待進一步提升,模型數(shù)據(jù)吞吐量有待基于大數(shù)據(jù)架構(gòu)進一步增強?!窘Y(jié)論】本文方法和框架能夠?qū)r序文本類數(shù)據(jù)做到充分的挖掘展示,更好地把握數(shù)據(jù)背后的信息,增強政策主體的決策依據(jù)。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社。
數(shù)據(jù)分析與知識發(fā)現(xiàn)雜志, 月刊,本刊重視學術(shù)導向,堅持科學性、學術(shù)性、先進性、創(chuàng)新性,刊載內(nèi)容涉及的欄目:數(shù)學圖書館 、知識組織與知識管理、情報分析與研究 、應(yīng)用實踐 、動態(tài)、特邀專欄、金融證券管理、企業(yè)信息管理技術(shù)等。于1980年經(jīng)新聞總署批準的正規(guī)刊物。